RAID Redundant Array of Independent Disks
Gliederung Was ist RAID? Erfindung von RAID Arten RAID-Levels Probleme Workaround Literatur und Quellenverzeichnis
What is RAID: http://www.pcstats.com/articleview.cfm?articleID=830 Was ist RAID? RAID ist Zusammenschluss mehrerer physischer Festplatten zu einem Verbund What is RAID: http://www.pcstats.com/articleview.cfm?articleID=830
Erfindung von RAID 1987 durch David A. Patterson, Garth A. Gibson und Randy H. Katz „erfunden“ eigentlich Redundant Array of Inexpensive Disks damals viele kleine HDDs günstiger als eine große HDD suchten deshalb nach Methode viele kleine HDDs als eine große zu verwenden (JBOD)
Nutzungsgründe Aufbau großer logischer Laufwerke Austausch von Speichermedien (auch während des Betriebes) Vergrößern des Speichers (auch während des Betriebs) Erhöhung der Ausfallsicherheit (Redundanz) Schnellere Datenübertragungsrate (Leistung) Kostenreduktion durch Einsatz mehrerer kleiner, preiswerter Medien
Arten Software-RAID Hardware-RAID Host-RAID
Hardware-RAID weil RAID-Verbund durch Hardware-Komponente (RAID-Controller) organisiert wird In Rechenzentren meist in Storage-Attached-Networks untergebracht Im hochprofessionellem Umfeld haben Controller eigene CPUs und große batteriegepufferte Caches Bei Stromausfall-- Zu-Ende-Schreiben der Daten Entlasten des Hauptprozessors durchdachte Handhabung sorgt für bestmögliche Unterstützung des Systemadministrators Raid Controller: http://www.starline.de/produkte/raid-controller/highpoint-raid-controller/sas-raid-controller/
Host-RAID sehr günstige, im untersten Preissegment der RAID-Systeme eig. ausschließlich für ÍDE/ATA und SATA-HDDs sowohl als Controller als auch in Mainboards integriert um so günstig wie möglich zu halten, meist nur als Software in Treiber integriert Verzicht auf aktive Komponenten Für große Datenmengen ungeeignet, durch starke Belastung der Host-CPU Durch starke Bindung an ganz bestimmte Hardware, HOHES Datenverlustrisiko FAKE-RAID
Software-RAID RAID durch Software organisiert erst über JBOD organisiert, anschließend als RAID Pro Contra kein teurer Controller benötigt Starke Belastung aller PC-Komponenten Funktion so, dass HDD auch ohne Software ausgelesen werden können (Disaster-Recovery) Deutliche Verringerung der Systemleistung Kein Stromausfallchache Änderungsausfall durch Softwarefehler
Probleme Nicht alle Systeme durch weitere Festplatten erweiterbar Grund dafür: Verstreuung der Paritionen über alle Festplatten Aufwendige Reorganisation Wenn nicht möglich, nur sichern der Dateien, Erweitern des Systemes und Daten wiederherstellen, so auch verkleinern möglich
RAID-Recovery: Wikimedia-Commons User Hg6996 ausgefallener Datenträger muss durch exakt gleichgroßen oder größeren ausgetauscht werden ausgefallene Controller isind ein großes Problem (Siehe LinusTechTips „All of our Data is Gone“ https://youtu.be/gSrnXgAmK8k) meist nur mit gleichem Controller oder Controllerfamilie wieder lesbar durch fehlerhafte Produktionsserien Ausfall mehrerer Platten RAID-Recovery: Wikimedia-Commons User Hg6996
RAID-Level RAID 0 RAID 1 RAID 5 RAID 10 „Bei der Präsenz von 3 Platten à 1 TB, die jeweils eine Ausfallwahrscheinlichkeit von 1 % in einem gegebenen Zeitraum haben, gilt: RAID 0 stellt 3 TB zur Verfügung. Die Ausfallwahrscheinlichkeit des RAIDs beträgt 2,9701 % (1 in 34 Fällen). RAID 1 stellt 1 TB zur Verfügung. Die Ausfallwahrscheinlichkeit des RAIDs beträgt 0,0100 % (1 in 10 000 Fällen). RAID 5 stellt 2 TB zur Verfügung. Die Ausfallwahrscheinlichkeit des RAIDs beträgt 0,0298 % (1 in 3 356 Fällen).“ RAID 0 RAID 1 RAID 5 RAID 10
RAID 0 Geschwindigkeitsoptimierung ohne Redundanz auch Striping genannt Zugriffe erfolgen Parallel Bei Ausfall, Daten nicht rekonstruierbrar (unwiederbringlich verloren) Ausfallwahrscheinlichkeit des RAIDs von: n=Festplatten p=Ausfallwahrscheinlichkeit der mechanischen Platten RAID0. Wikimedia-Commons-User Cburnett, Lizenz in Volltext : http://www.gnu.org/copyleft/fdl.html
RAID 1 1 zu 1 Kopie maximale Größe=Größe kleinster beteiligter HDD In verschiedenen Systemen vollständig lesbar unverzichtbar in sicherheitskritischen Echtzeit-Systemen Ausfallwahrscheinlichkeit des RAIDs von: n=Festplatten p=Ausfallwahrscheinlichkeit der mechanischen Platten
RAID 5 bietet höherer Durchsatz, als auch Redundanz geringere Kosten, dadurch beliebt in schreibintensiven Umgebungen nicht zu empfehlen RAID 10 evtl. Kostengünstiger Versagen zwei Platten gleichzeitig, Verlust ALLER Daten nutzbare Gesamtkapazität aus Formel: (Anzahl der Festplatten − 1) × (Kapazität der kleinsten Festplatte) Ausfallwahrscheinlichkeit des RAIDs von: n=Festplatten p=Ausfallwahrscheinlichkeit der mechanischen Platten
RAID 10 ist ein RAID 0 über mehrere RAID 1 Eigenschaften beider RAIDs kombiniert: Sicherheit und gesteigerte Schreib-/Lesegeschwindigkeit benötigt mindestens vier Festplatten RAID-1-Schicht einer RAID-0+1-Implementation nicht in der Lage, untergeordneten RAID 0 differenziert den einzelnen Festplatten zuzuordnen, bietet RAID 1+0 gegenüber RAID 0+1 eine bessere Ausfallsicherheit und schnellere Rekonstruktion nach Plattenausfall, da nur ein Teil der Daten rekonstruiert werden muss Auch hier hat man wie bei RAID 0+1 nur die Hälfte der gesamten Festplattenkapazität zur Verfügung Ausfallwahrscheinlichkeit des RAIDs von: n=Festplatten p=Ausfallwahrscheinlichkeit der mechanischen Platten
Hot Spare Hot-Spare-Laufwerk ist ein unbenutztes Reservelaufwerk Fällt Laufwerk aus, wird es durch Hot Spare ersetzt während automatischer Rebuildphase keine Redundanz gegeben
Workaround
Literatur- u. Quellverzeichnis: Informationen: https://de.wikipedia.org/wiki/RAID Hintergrund: http://www.dualmon.com/images/home/bg/servers-blue.jpg Tabellarischer Vergleich der RAIDs: https://de.wikipedia.org/wiki/RAID#Zusammenfassung