Warum kann ein RAID-Controller keine Aktionen eines Laufwerkcontrollers auf einer URE nachahmen?

396
Damon

Es gibt eine Tatsache: Eine URE stellt ein gesamtes Mitglied eines RAID-Arrays als schlecht dar, aber eine URE macht ein gesamtes Laufwerk NICHT außerhalb eines Arrays als fehlerhaft. Was ist der technische Unterschied, der dies verursacht? Beide werden auf Betriebssystemebene in einer ähnlichen Weise gesehen, daher muss es etwas unterhalb des Betriebssystems und der Formatierung liegen.

Soweit ich weiß, fängt der RAID-Controller bei Ausfall eines einzelnen Mitglieds eines RAID 5 an, eine ersetzte Festplatte neu zu erstellen, indem er die anderen Werte zusammen mit der Parität vergleicht, um den korrekten Wert auf die neue Festplatte zu schreiben. Wenn eine URE auftritt, "erkennt" sie "beschädigte Daten" über den "Lesefehler", "kann" den "Lesefehler" nicht korrigieren, der Aufbau wird abgebrochen und das zweite Element wird als fehlerhaft markiert. Wenn Sie über eine einzige Redundanz verfügen, ist das Array dadurch unbrauchbar.

Warum ist das ENTIRE-Array bei einer URE unbrauchbar? Warum nicht nur diesen Informationsstreifen? Es scheint, dass der Speicherort im Array leicht bemerkt werden konnte, die Dateitabelle geprüft und die Dateien beschädigt aufgeführt wurden, sodass die beschädigten Dateien aus Sicherungen erneut zum Array hinzugefügt werden konnten.

Auf einer einzelnen Festplatte würde der Laufwerkscontroller beispielsweise den Sektor als fehlerhaft markieren und weitermachen. Der Laufwerkscontroller markiert NICHT das gesamte Laufwerk und die Partitionen darin als "schlecht". Warum kann ein RAID-Controller das nicht nachahmen und dasselbe oder ein ähnliches Ergebnis haben?

Eine sekundäre Frage für den Hintergrund, die sich möglicherweise auf den Hintergrund bezieht, ist ein URE, ein "harter Fehler", bei dem jeder Lesevorgang desselben Sektors ausfällt (platterbezogen) oder ein "weicher Lesefehler", der einmal aufgetreten ist (datentransferbezogen), jedoch die Daten auf dem Platte ist immer noch gut? Bei Letzterem würde die Frage aufkommen, warum nicht einfach noch einmal gelesen werden. Oder ist es das erstere?

Warum kann ein RAID-Controller keine Aktionen eines Laufwerkcontrollers auf einer URE nachahmen?

Tl; Dr

Diese Frage ist eigentlich die gleiche Frage, aber der Rant schien die Antwort und den Ton des gesamten Threads zur Seite zu werfen. Die "Antworten" von "Das Ziel von RAID ist es, das Dateisystem auch nach dem Verfall einer Festplatte nutzbar zu halten. Eine Sicherung nicht zu ersetzen, um eine erfolgreiche Wiederherstellung zu gewährleisten." und "Ein nicht behebbarer Lesefehler beim Lesen der Quelle, aus der Sie erstellt haben. Dann kann das Array aus dieser beschädigten Quelle nicht ordnungsgemäß neu erstellt werden." Beantworte diese Frage nicht.

Kein Schrei hier. Es muss ein grundlegender technischer Unterschied bestehen, wenn der RAID-Controller die Dinge im Vergleich zu einem einzelnen Laufwerk "sieht", das dieses Verhalten verursachen muss. Was ist das für ein technischer Unterschied? Ich kann meine eigene Frage logisch beantworten. Ein RAID-Controller betrachtet das Array als eine einzige Einheit, in der ein Laufwerk die einzelnen Sektoren betrachtet. Es scheint jedoch, dass eine Umgehung dieses Problems ähnlich wie bei einer einzelnen Festplatte durchgeführt werden kann und die Dinge wieder verwendbar sind, sodass ich etwas vermissen muss.

Dieser Thread bei Spiceworks weist darauf hin, dass UREs ein echtes Problem darstellen, aber es ist verworren. Viele Links im Thread folgen jedoch.

0
Ein richtiger RAID-Controller tritt auf keinen Fall auf, weil er auf einen nicht behebbaren Lesefehler stößt. Beruht Ihre Frage auf Erfahrung oder Vermutung? Twisty Impersonator vor 6 Jahren 0
@ TwistyImpersonator "Vermutung". Es gibt viele Artikel und Berichte zu einer URE, die ein RAID 5-Array aus "einigen" Gründen unbrauchbar machen. Daher ist die gut publizierte Abkehr von RAID 5 aufgrund von UREs der Fall. Ich bin jedoch immer offen für Irrtümer! Damon vor 6 Jahren 0
Meinetwegen. Der häufigste Grund, warum ein RAID-Controller ein Laufwerk wegen eines "nicht korrigierbaren Fehlers" kickt, ist, wenn das Laufwerk keine RAID-freundliche Firmware hat. In diesem Fall versucht das Laufwerk, den Fehler zu korrigieren. Dies kann bis zu 30 Sekunden dauern. In dieser Zeit wird der RAID-Controller (der erwartet, dass solche Fehler gemeldet, aber nicht vom Laufwerk behoben werden) auf dem Laufwerk "aufgeben" und treten Sie es aus dem Array und glauben Sie, dass die gesamte Einheit ausgefallen ist. Twisty Impersonator vor 6 Jahren 0
Es wäre hilfreich, eine oder zwei der zuverlässigsten Quellen zu verknüpfen, auf denen Ihre Frage basiert. Twisty Impersonator vor 6 Jahren 0
@TwistyImpersonator Link zur Frage hinzugefügt. Damon vor 6 Jahren 0
Ich habe einen Teil des verlinkten Posts gelesen, und es scheint, dass jemand die Behauptung, dass * RAID 5-Arrays fast immer bei einem ** Umbau fehlschlagen werden, herausfordert. Wie sehen Sie, dass dies zu Ihrer Frage beiträgt? Twisty Impersonator vor 6 Jahren 0
Weiter werden im Thread erwähnt, dass beide UREs nicht als solche "herausgefordert" werden; Zum Beispiel ist es manchmal ein unbekanntes System oder ein fehlgeschlagener Umbau. Das Laufwerk scheint jedoch in Ordnung zu sein. Punkt ist, dass URE's passieren, aber wir wissen nicht wirklich wann und können scheinbar keine guten Beweise dafür bekommen, was, warum und was gibt. Damon vor 6 Jahren 0

0 Antworten auf die Frage