Raid1, drei oder mehr Laufwerke, Lösung für Setups mit mehreren Terrabyte in kleinen Unternehmen?

410
John S.

Da das Festplatten-Kosten-Verhältnis der Festplatten zu Kapazitäten führt, die eine zunehmende Herausforderung für Paritäts-Raid-Systeme darstellen (URE-Wahrscheinlichkeit, mehrtägige Umbauten, die Laufwerke belasten und einen Sekundärausfall riskieren), ist der Fall zu geben, dass sie auch eine Chance / Empfehlung für Multi-Disk (> 2) RAID-1-Konfigurationen für den Einsatz zu Hause und in kleinen Unternehmen? Das heißt, Raid1 Raum im Vergleich ‚Abfälle‘ zu einem Paritätsschema, aber mit billigen mutli-Terabyte - Laufwerken ist der Raum nicht die Ware wohl haben wir auf mit dem Speicher verglichen verschwenden, Bandbreite, CPU - Takt, Ausfallzeiten usw. in Striping erforderlich, neu erstellt usw. .

Wenn ich die Technologie richtig verstehe, eine Konfiguration von Raid 1 (> 2):

  • ..kann nicht fehlgeschlagen werden, solange auf ein Laufwerk zugegriffen werden kann, auch auf die Dateien.
  • ..bietet eine höhere Sicherheit in Bezug auf die Anzahl der Laufwerke. Es ist im Grunde eine Umkehrung des Verhältnisses richtig? Raid5 auf drei Festplatten bietet 66% nutzbare Kapazität und kann einen Ausfall von 33% (1 Laufwerk) aushalten. Raid1 bietet nur 33% Kapazität, aber 66% Ausfall (2 Laufwerke).
  • .. hat einen einfacheren und stabileren Wiederherstellungsmechanismus. In schwierigen Situationen muss der Raid nicht neu aufgebaut werden, um auf die Daten zuzugreifen. Laufwerke können zwischen verschiedenen Systemen migriert werden.

Dieser letzte Punkt fühlt sich der unraid-Philosophie an, bei der Dateien auf Laufwerken gespeichert und nicht gestreift werden, und der zweite Punkt schlägt mir etwas attraktiver für ein kleines Unternehmen vor. Priorisierung der Datensicherheit gegenüber der Datenkapazität. Was bringt es, wenn mehr Daten gespeichert werden können, wenn sie einem höheren Risiko ausgesetzt sind?

Fragen:

  1. Würde eine Strategie des "manuellen Spiegelns" des Inhalts im Gegensatz zu Raid1 zum Zeitpunkt des Schreibens potenzielle Probleme mit einer Nicht-ECC-Speicherbeschädigung vermeiden? Da das Schreiben auf jede Platte ein eindeutiger Prozess wäre, würde derselbe Speicherfehler, der bei einem Schreibvorgang auftritt, theoretisch bei einem anderen nicht auftreten.

  2. Gibt es eine Raid1-Software / -Hardware, die für mehr als zwei Laufwerke ausgelegt ist, und daher mit traditionellen, Raid1-ähnlichen Verhaltensweisen wie Bit-Rot, URE usw. umgehen kann? Wenn bei einem herkömmlichen Festplattenspiegelungssetup A von A eine 0 und von B von 1 eine A gemeldet wird, haben Sie keine Ahnung, wer umgedreht wurde, aber bei einer Lösung mit drei oder mehr Datenträgern könnten Sie die ungerade Diskette nicht korrigieren? A = 0, B = 1, C = 0, B muss also umgedreht worden sein?

  3. Würde eine solche Raid1-Lösung parallele Lesevorgänge von mehr als zwei Festplatten unterstützen, um die Lesegeschwindigkeit zu beschleunigen? Dies ist besonders wichtig, da ich mir vorstellen kann, dass es viele Unternehmen gibt, die dieselben Daten viel öfter lesen, als sie bearbeiten.

  4. RAID ist keine Backup-Lösung. Wenn Sie sich also an die bewährten Verfahren halten und zwischen 2-3 Speicherstandorten haben, ist nur beabsichtigt, dass nur einer von ihnen über ein RAID-System vor Laufwerksausfällen geschützt wird, oder würden Sie davon ausgehen, dass ein zweiter externer Standort auch eine Multidisk-Redundanz hat? Wird angenommen, dass sogar ein einzelnes Laufwerk, das an einem anderen Ort gespeichert ist, vor einem Geräteausfall geschützt ist, weil es zu den Laufwerken an den anderen Standorten in einer 'effektiven' Spiegelbeziehung steht? Wenn nicht, bietet Raid1 keine Redundanz für die niedrigste Mindestanzahl von Laufwerken (2)?

Aktualisieren:

Zu Punkt 1 ist, wie einige darauf hingewiesen haben, eine fehlerfreie Datenquelle erforderlich. Dies ist jedoch für so ziemlich jede Speicher- / Sicherungsstrategie der Fall. In unseren NAS / SAN-Lösungen verwenden wir möglicherweise ausgefeilte Systeme für die Datenintegrität. Die darin gespeicherten Daten werden jedoch normalerweise von Arbeitsstationen und Geräten ohne solche Maßnahmen generiert. Die meisten Produktions-PCs sind entweder für Kosten oder für Geschwindigkeit ausgelegt. Sehr unwahrscheinlich, besonders in einem kleinen Unternehmen, dass der Computer, auf dem Sie CAD oder Finanzen oder Powerpoint ausführen, ZFS-formatierte Laufwerke und ECC-Speicher verwendet.

In meinem speziellen Beispiel wird eines der Dinge, die ich speichern möchte, die Ausgabe einer Kamera sein. Ich muss davon ausgehen, dass die Fotos und Videos, die auf der SD-Karte gespeichert werden, „richtig“ sind, und es gibt nicht viel, was ich tun kann, wenn die Beschädigung an der Stelle in der Datenkette auftritt.

Vorschlag:

Wenn diese Strategie auf RAID-Ebene nicht unterstützt wird, gibt es Softwarepakete, mit denen einige der Aktivitäten, von denen ich spreche, manuell ausgeführt werden? Kopieren von Kopien über anstehende, diskrete Rysnc-Aufgaben? Ein Bash-Skript könnte ein periodisches Bit-Rot-Scrub durchführen? Kontrollieren Sie einfach alle Kopien einer bestimmten Datei auf allen Datenträgern und überschreiben Sie dann die Kopie auf einem Datenträger mit der falschen Prüfsumme. Verwenden Sie dabei die Kopie auf einem korrekten Datenträger.

0
Ich vermisse vielleicht den Punkt / die Absicht Ihrer Unterfrage Nr. 1. Wenn beim Schreiben auf Ihre (erste) Hauptfestplatte Daten beschädigt werden und Sie die Datei dann auf eine zweite Festplatte kopiert haben, kopieren Sie dann nicht die beschädigten Daten, die auf die erste Festplatte geschrieben wurden? Scott vor 5 Jahren 0
Dass es eine Menge Fragen gibt ... Siehe https://superuser.com/questions/489793/can-raid-1-have-more-than-zwo-drives für ein mögliches Duplikat. Pimp Juice IT vor 5 Jahren 1
RAID 6 bietet auch 2 Laufwerksausfälle. Der Overhead von RAID 5 beträgt +1 und RAID 6 beträgt +2. Der Overhead sinkt also, wenn Sie die Anzahl der Laufwerke erhöhen. Da die Gesamtzahl der zusätzlichen Laufwerke gleich bleibt. cybernard vor 5 Jahren 0
Wenn Sie Ihre Schreibvorgänge verkettet haben, wären Sie richtig. Schreiben Sie also von Quelle auf Platte 1, dann würde Platte 1 auf Platte 2 usw. den Fehler aufrechterhalten. Wenn Sie jedoch jeden Datenträger separat lesen und auf die Festplatte schreiben, vermeiden Sie möglicherweise dieses Problem. Offensichtlich muss die Quelle, die die ursprünglichen Daten enthält, korrekt sein. John S. vor 5 Jahren 0
Entschuldigung für die vielen Fragen. Hier gibt es einige Themen, die potenzielle Duplikate sind, aber keines, das ich gesehen habe, das diese speziellen Fragen ansprach. Am besten habe ich festgestellt, dass niemand bisher einen Hardware-Controller nennen kann, der diese Funktionalität bereitstellt und dass Linux-mdadm Raid1 mit mehr als zwei Laufwerken handhabt, jedoch keine zusätzliche Funktionalität bei> 2-Konfigurationen bietet. John S. vor 5 Jahren 0
Punkt 3. Wenn Sie wirklich Geschwindigkeit wollen, lesen Sie 500-550mb / s und 450mb / s. Eine M.2-SSD ist 2000-3000 schreiben und 1500-2500 schreiben. Diese Geschwindigkeiten werden weit über das hinausgehen, was Sie für ein günstiges RAID erhalten können. Sie können sie jedoch für noch erstaunlichere Geschwindigkeiten mit RAID versehen. cybernard vor 5 Jahren 0
Raid6 bietet zwei Laufwerksausfälle, jedoch mit einer höheren Mindestanzahl an Laufwerken und mit Paritätsberechnung und Striping, die ein höheres Risiko beim Wiederaufbau verursachen. ein Problem, das durch größere Kapazitäten noch verschärft wurde, und das war der Kern meiner Anfrage. Es geht nicht nur darum, wie viele Laufwerke ausfallen können, sondern auch, was passiert, wenn sie ausfallen. Ich wurde von diesem Artikel aufgefordert: https://www.zdnet.com/article/why-raid-6-stops-working-in-2019/ John S. vor 5 Jahren 0
Schnelligkeit ist nur ein Bonus für ein zentrales Speichersystem. Offensichtlich ist Raid1 / 5/6 in einem NAS normalerweise für die Datensicherheit gedacht, und trotz der Entwicklung von SSDs werden solche Systeme aus Gründen der Robustheit und Größe immer noch dazu verwendet, 3,5-Platten-Laufwerke zu verwenden. John S. vor 5 Jahren 0
@ Johns. SSD hat auch keinen Motor zum Versagen, und ich hatte viele Festplatten mit Motorausfall. Daher sind sie auch zuverlässiger und nicht empfindlich gegen normalerweise auftretende Vibrationen. Immer mehr Unternehmen wechseln. cybernard vor 5 Jahren 0

2 Antworten auf die Frage

0
davidgo

Um die Fragen zu beantworten

  1. Durch das manuelle Spiegeln des Inhalts werden einige potenzielle Probleme im Zusammenhang mit der ECC umgangen, andere könnten jedoch eingeführt werden. Es wird auch davon ausgegangen, dass die Quelldaten nicht durch einen früheren Fehler beschädigt wurden.

  2. Dies ist abhängig von der Hardware / Software. Ich könnte mir vorstellen, dass die meisten RAID1-Implementierungen Bitrot nicht aufnehmen würden, aber URE handhaben würden. Das Lesen eines Datenelements wird im Allgemeinen nur von einem der Laufwerke durchgeführt, nicht von allen - was insgesamt ein schnelleres Lesen ermöglicht.

  3. Wenn RAID1 alle 3 Festplatten unterstützt, sind Parallell-Lesevorgänge bei mehr Festplatten schneller. AFAIK wird in mdadm (dh auf Linux-Software-Raid-basierten Lösungen) nicht unterstützt, da das dritte Laufwerk als Ersatzlaufwerk behandelt wird.

  4. Ob Sie Ihren Offsite-Standort auf RAID setzen, ist eine Frage der Robustheit und Zuverlässigkeit. Es wäre eine Best Practice, aber keine absolute Notwendigkeit. In meinen Augen sind Festplatten Verschleißteile - mit RAID können Ausfälle ersetzt werden, ohne dass Wiederherstellungen nötig sind UND die Haltbarkeit erhöht wird. Dies wäre wirklich eine Kosten-Nutzen-Diskussion.

Ein Gedanke (aber keine Antwort) - Haben Sie alternative Technologien zu RAID in Betracht gezogen? ZFS (ideal für Snapshots / Pitr- und Off-Site-Replikationen), MooseFS oder ähnliches sollte Ziegel mit verteilter Redundanz, aber weniger Hardware ermöglichen. Selbst LVM kann Spiegelungen bereitstellen - in Verbindung mit MDADM könnte dies eine RAID1-Lösung über 3 Festplatten bieten. davidgo vor 5 Jahren 0
Vielen Dank für diese umfassende Antwort. Können Sie erläutern, welche Arten von Problemen durch manuelles Spiegeln auftreten könnten und wie Sie sich die Handhabung einer URE vorstellen würden? Einfach, da der Controller versucht, von einem Datenträger zu lesen und den Lesevorgang automatisch auf einen anderen zu verschieben, falls er auf eine URE trifft? John S. vor 5 Jahren 0
Es stimmt, dass in ZFS ein gespiegeltes vdev Prüfsummen und Anordnungen mit mehreren Festplatten unterstützt (http://www.zfsbuild.com/2010/05/26/zfs-raid-levels/). Es wäre interessant zu erfahren, ob diese Anordnung einen geringeren Overhead hat (ZFS ist sehr RAM-intensiv) als die weitaus üblicheren Anordnungen von RaidZ, RaidZ2 und RaidZ3. John S. vor 5 Jahren 0
0
Hennes

Beginnen wir mit den Annahmen:

Wenn ich die Technologie richtig verstehe, eine Konfiguration von Raid 1 (> 2):

..kann nicht fehlgeschlagen werden, solange auf ein Laufwerk zugegriffen werden kann, auch auf die Dateien.

Dies ist richtig, schützt jedoch nicht vor Blitzeinschlägen, Diebstahl, Überschwemmungen usw. Wenn Sie also ein Risiko reduzieren, benötigen Sie noch Off-Site-Backups.

..bietet eine höhere Sicherheit in Bezug auf die Anzahl der Laufwerke. Es ist im Grunde eine Umkehrung des Verhältnisses richtig? RAID5 auf drei Festplatten bietet 66% nutzbare Kapazität und kann einen Ausfall von 33% (1 Laufwerk) aushalten. Raid1 bietet nur 33% Kapazität, aber 66% Ausfall (2 Laufwerke).

Dies setzt voraus, dass ein Laufwerkausfall unabhängig ist. Bei SAS kann dies der Fall sein (sofern das Laufwerk nicht spektakulär ausfällt und auch andere Laufwerke beschädigt), bei PATA oder SATA jedoch nicht. Normalerweise bedeutet eine nicht funktionierende Festplatte, dass alle Laufwerke auf diesem Controller hängen bleiben. Sie haben immer noch Ihre Daten, aber Sie haben auch Ausfallzeiten.

.. hat einen einfacheren und stabileren Wiederherstellungsmechanismus. In schwierigen Situationen muss das RAID nicht neu aufgebaut werden, um auf die Daten zuzugreifen.

Meist ist der Umbau kein Problem. Niemand baut RAID-Arrays neu auf. Bei Terabyte-Festplatten ist es schneller, die Festplatte zu ersetzen, die Arrays mit Ihren Daten neu zu erstellen und aus dem Backup wiederherzustellen.

Aus geschäftlicher Sicht besteht das mittlere Ziel von RAID darin, das System bis 17:00 Uhr aufrechtzuerhalten und dann sicherzustellen, dass Ihre tägliche Sicherung funktioniert, gefolgt von einer neuen Festplatte, einem neuen RAID-Array und einer Wiederherstellung von der Sicherung.

Laufwerke können zwischen verschiedenen Systemen migriert werden

Dies hängt stark von der RAID-Implementierung ab. Es kann funktionieren. Es darf nicht.


Würde eine Strategie des "manuellen Spiegelns" des Inhalts im Gegensatz zum Kopieren zum Zeitpunkt des Schreibens durch RAID1 potenzielle Probleme mit einer Nicht-ECC-Speicherbeschädigung vermeiden? Da das Schreiben auf jede Platte ein eindeutiger Prozess wäre, würde derselbe Speicherfehler, der bei einem Schreibvorgang auftritt, theoretisch bei einem anderen nicht auftreten.

Wenn du Glück hast. Aber was würde Sie davon abhalten, eine korrupte Datei erfolgreich und ohne Probleme zu kopieren?

Gibt es eine RAID1-Software / -Hardware, die für mehr als zwei Laufwerke ausgelegt ist, und daher mit traditionellen, Raid1-ähnlichen Verhaltensweisen wie Bit-Rot, URE usw. umgehen kann? Wenn bei einem herkömmlichen Festplattenspiegelungssetup A von A eine 0 und von B von 1 eine A gemeldet wird, haben Sie keine Ahnung, wer umgedreht wurde, aber bei einer Lösung mit drei oder mehr Datenträgern könnten Sie die ungerade Diskette nicht korrigieren? A = 0, B = 1, C = 0, B muss also umgedreht worden sein?

Es gibt die RAID1-Variante namens RAID5.

Im Ernst, mir fallen RAID3, 4,5 und RAID6 ein. Keine Notwendigkeit, einen Spiegel in etwas anderes zu zwingen.

Würde eine solche RAID1-Lösung parallele Lesevorgänge von mehr als zwei Festplatten unterstützen, um die Lesegeschwindigkeit zu erhöhen? Dies ist besonders wichtig, da ich mir vorstellen kann, dass es viele Unternehmen gibt, die dieselben Daten viel öfter lesen, als sie bearbeiten.

RAID 5 würde. Und RAID 6 und ...

RAID ist keine Sicherungslösung. Wenn Sie sich also an die bewährten Verfahren halten und zwischen zwei bis drei Speicherorten haben, ist nur beabsichtigt, dass nur einer von ihnen über ein RAID-Schema vor Laufwerksausfällen geschützt wird, oder würden Sie davon ausgehen, dass ein zweiter externer Standort auch eine Multidisk-Redundanz hat?

Ich möchte eine Offline- Sicherung. Man ist nicht über das Internet und an einem physisch anderen Ort erreichbar. Ein zweites Backup, das täglich erreichbar und aktualisiert wird, ist ebenfalls schön. Meist aber im Brandfall und ähnlichem.

Mothly Backups auf wirklich sichere Offline und täglich auf Band / Disk / Cloud wären eine gute Ergänzung.

Wird angenommen, dass sogar ein einzelnes Laufwerk, das an einem anderen Ort gespeichert ist, vor einem Geräteausfall geschützt ist, weil es zu den Laufwerken an den anderen Standorten in einer 'effektiven' Spiegelbeziehung steht?

RAID ist kein Backup. Ein Teil eines RAIDs ist keine ordnungsgemäße Sicherung. Nicht einmal eine Platte aus einem Multidisk-Spiegel. Abhängig von Ihrer RAID-Implementierung kann es funktionieren oder nicht. Eine ordnungsgemäße Sicherung funktioniert immer. Auch nach einem Update der Software (zB RAID-Treiber).

Wenn nicht, bietet RAID1 keine Redundanz für die niedrigste Mindestanzahl von Laufwerken (2)?

Es bietet Redudanz für einen Nicht-Reable-Sektor oder eine beschädigte Diskette.

Und das ist alles, was normalerweise benötigt wird. Genügend Redundanz, um die Dinge am Laufen zu halten, bis Sie die Notfallwartung durchführen können.