Wenn eine Festplatte einen fehlerhaften Sektor entwickelt, sollte sie ersetzt werden?

6692
Nate Eldredge

Ich habe kürzlich einen E / A-Fehler beim Lesen einer Datei auf meiner Festplatte festgestellt. Eine Untersuchung der SMART-Daten zeigt, dass das Laufwerk einen fehlerhaften Sektor hat (der Current_Pending_Sector-Zähler ist 1). Die Datei wurde kürzlich erstellt (vor einigen Stunden), daher muss dieser Fehler ziemlich aktuell sein.

Eine Möglichkeit ist, das Laufwerk sofort auszutauschen. Eine andere Möglichkeit besteht darin, die unlesbare Datei einfach aus Sicherungen wiederherzustellen. Das Umschreiben des Sektors führt dazu, dass er einem anderen physischen Sektor zugeordnet wird. Dies würde die Kosten und den Aufwand für den Austausch des Laufwerks sparen. Aber wenn der schlechte Sektor darauf hindeutet, dass ein weiteres Versagen bald eintreten wird, wird das Unvermeidliche nur verschoben.

Ist das Auftreten eines einzelnen fehlerhaften Sektors ein Beleg dafür, dass das Laufwerk ausfällt und ersetzt werden muss?

Anders ausgedrückt, stellen Sie sich vor, ich habe zwei identische Festplatten. Laufwerk A hat 0 fehlerhafte Sektoren. Laufwerk B hat gerade einen schlechten Sektor entwickelt. Ist Drive B in naher Zukunft wesentlich wahrscheinlicher als Drive A, um weitere fehlerhafte Sektoren zu entwickeln oder auf andere Weise zu versagen?

Wenn möglich, würde ich mir wünschen, dass Antworten eher von umfangreichen Daten oder Statistiken als von Meinungen oder Anekdoten unterstützt werden. Es gibt viel Pseudowissenschaft und Fehlinformationen bezüglich Festplattenausfällen. Ich möchte sicher gehen, dass ich meine Entscheidung auf Fakten stütze.

Ich verstehe, dass ein "fehlerhafter Sektor" bedeutet, dass ein bestimmter Sektor auf der Festplatte entweder nicht sinnvoll von der Hardware gelesen werden kann oder Daten enthält, die nicht mit der auf dem Laufwerk gespeicherten Prüfsumme übereinstimmen. Aus irgendeinem Grund enthält der Sektor tatsächlich nicht mehr die Daten, die dort ursprünglich geschrieben wurden. Ich kann mir eine Reihe von möglichen Ursachen für einen solchen Fehler vorstellen. Einige von ihnen weisen darauf hin, dass das Scheitern wahrscheinlich fortschreitet, andere nicht. Vielleicht hat ein kosmischer Strahl in diesem Sektor ein paar Bits gedreht; In diesem Fall war der Fehler völlig zufällig, und es besteht kein Grund zu der Annahme, dass dieses Laufwerk mit größerer Wahrscheinlichkeit weitere Ausfälle hat als ein neues Laufwerk. Oder vielleicht kaut ein kleiner Wurm durch die magnetischen Domänen auf der Platte; es hat gerade einen Sektor gegessen und wird jetzt etwas mehr essen, daher steht mehr Datenverlust bevor. :-) In der Praxis ist ein Szenario weitaus häufiger als das andere?

Wenn es relevant ist, handelt es sich bei dem fraglichen Laufwerk um ein 2,5-Zoll-SATA-Magnetlaufwerk mit einer Kapazität von 650 GB, das von Samsung verkauft wird, und ist ungefähr 5 Jahre alt. Die Datei, die den fehlerhaften Sektor enthält, wurde vor weniger als einem Tag erstellt. Das Betriebssystem ist Ubuntu 14.04. Alle wichtigen Daten werden gesichert, sodass ein Laufwerkausfall nur ein kurzfristiges Anlegen eines neuen Laufwerks, Ausfallzeiten zum Ersetzen des Laufwerks und möglicherweise den Verlust einiger aktueller Daten bedeutet. Das System ist ein Home-Server, daher sind Ausfallzeiten unbequem, aber nicht ernsthaft teuer.

4
Sry - hat nicht den ganzen Beitrag gelesen, aber ich hatte Festplatten gesehen, die mit ~ 15% fehlerhaften Sektoren funktionieren. Wenn es nur eine ist - vergiss es. Die Rotation der HDD aus schlechten Sektoren zu verhindern, ist kaum möglich. Die Festplatten verfügen über eine native (Hardwareebene) Lösung für fehlerhafte Sektoren, aber wenn sie zu viele sind, schlägt dies fehl. Sie können die gesamte Festplatte mit etwas Software scannen. Ifch0o1 vor 8 Jahren 0
In dieser Situation sollten Sie die Verwendung von mdadm RAID1 oder ZFS mirror mit den Festplatten A und B in Erwägung ziehen, während beide Laufwerke noch verwendbar sind. Wenn einer von ihnen versagt, ist dies nicht so unbequem. Stellen Sie nur sicher, dass regelmäßige Scrubs des Arrays ausgeführt werden, damit der Raid-Controller dem Laufwerk mitteilen kann, welche Daten er in diesem Block haben soll, wenn eine Platte einen Lesefehler meldet, und die Festplatte kann den Block bei Bedarf neu zuordnen. Sie können auch die HDD-Studie zu intelligenten Statistiken unter https://www.backblaze.com/blog/hard-drive-smart-stats/ abrufen. BeowulfNode42 vor 7 Jahren 0
@ BeowulfNode42: Leider hat dieser Rechner nur einen Laufwerkschacht und keine einfache Möglichkeit, externe SATA anzuschließen. Nate Eldredge vor 7 Jahren 0

4 Antworten auf die Frage

5
DustinRS

Mit einem einzigen schlechten Sektor und angesichts des Alters der Festplatte wäre ich besorgt. Sie sagen jedoch, dass es keine große Sache sein wird, wenn es abstürzt und Sie eine gute Backup-Strategie verfolgen. Ich habe also das Gefühl, dass es Ihnen gut geht, darauf zu warten, dass es seine Sache erledigt.

Das kann morgen passieren oder in 10 Jahren. Es kann vorkommen, dass weitere fehlerhafte Sektoren entwickelt wurden, oder es kann nie passieren. Sie erwähnen kosmische Strahlen - das ist genau das Richtige -, es könnte alles gewesen sein, was den einen Sektor zum Erliegen brachte. Lassen Sie die Festplatte und das Betriebssystem den Sektor als schlecht einstufen und machen Sie weiter, was Sie bis zu Backups getan haben. Wenn Sie die Zeit und die Ressourcen haben, um das Laufwerk auszutauschen, tun Sie es, aber ich muss mir keine Sorgen machen, es als Priorität festzulegen.

3
Rahul Dahiya

Ich bin mit dieser Situation konfrontiert. Bei schlechten Sektoren können Sie nach einiger Zeit keine Daten mehr von der Festplatte mit schlechtem Sektor zurückkopieren. Nach einiger Zeit werden Sie mit langsamen Problemen konfrontiert, die letztendlich zum Absturz des Betriebssystems führen .
Kurz gesagt, ersetzen Sie einfach das Laufwerk und riskieren Sie nicht Ihre Daten.

Das beantwortet meine Frage nicht wirklich. Ich bin mir der Folgen fehlerhafter Sektoren bewusst. Das Lesen der Datei führt zu einer Verzögerung, während die Datei erneut gelesen wird, und letztendlich ein E / A-Fehler. Der vorliegende Fehler lässt sich leicht beheben, indem ich die Datei umschreibe. Ich verstehe, dass weitere Fehler ein Problem darstellen würden - ich möchte wissen, wie wahrscheinlich es ist, dass sie tatsächlich auftreten. Ich bin bereit, ein gewisses Risiko einzugehen, da ich, wie gesagt, Backups habe, aber ich möchte das Risiko quantifizieren, das ich tatsächlich eingehen. Nate Eldredge vor 8 Jahren 0
Da schlechte Sektoren ein Zeichen dafür sind, dass Ihre Festplatte ausfällt, werden sie weiter zunehmen (ich habe versucht, meine als extern zu verwenden, nachdem sie ersetzt wurde, aber kläglich gescheitert ist). Rahul Dahiya vor 8 Jahren 0
"Ich möchte wissen, wie wahrscheinlich es ist, dass sie tatsächlich auftreten." - Sehr wahrscheinlich. Es könnte ein Tag oder ein Jahr sein. Eine Festplatte verfügt nur über eine bestimmte Anzahl von Ersatzsektoren, wenn diese ausgehen und Sie Daten verlieren. Ramhound vor 8 Jahren 0
Eigentlich hängt es von der Nutzung der Festplatte ab, wenn Sie die Festplatte stark verwenden (was ich getan habe, ich installiere Windows immer wieder neu, wenn es nicht geladen wird und es nicht länger als einen Monat gedauert hat), glaube ich nicht Es wird mehr als einen Monat dauern. Das Windows-Dateisystem hat das Problem, dass es keine fortlaufenden Daten speichert. Wenn Sie also an einem bestimmten Ort einen fehlerhaften Sektor haben, werden die Fenster immer wieder auf sie stoßen, wenn Sie weiter schreiben und lesen Daten von der Festplatte, die zu Verlangsamung und letztendlich zum Absturz führen. Rahul Dahiya vor 8 Jahren 0
1
BillDOe

Ich würde vorschlagen, die Anzahl der schlechten Sektoren im Auge zu behalten. Wenn es für einen längeren Zeitraum gleich bleibt, sagen wir einen Monat, dann geht es Ihnen gut. Der Fehler war wahrscheinlich ein Herstellungsproblem oder ein anderes zufälliges Ereignis. Wenn die Anzahl der fehlerhaften Sektoren jedoch weiter steigt, haben Sie definitiv Probleme und müssen das Laufwerk ersetzen.

Bearbeiten: Aktualisierung meiner Antwort, um anzugeben, dass das fragliche Laufwerk täglich überprüft werden muss. Wenn nach einem Monat keine neuen fehlerhaften Sektoren vorhanden sind, ist das Laufwerk fast sicher in Ordnung, aber wenn Sie jeden Tag neue sehen, muss das Laufwerk so schnell wie möglich ersetzt werden. Sie müssen auch sicherstellen, dass sich das Laufwerk oder der Computer auf einer festen Oberfläche befindet, die sich nicht leicht stoßen lässt.

Dies ist ein vernünftiger Hinweis (und sollte nicht als IMO bewertet worden sein), es sei denn, Sie sind paranoid. Wenn es sich um ein externes Laufwerk oder einen Laptop handelt, ist es weniger wahrscheinlich, dass es sich um einen Herstellungsfehler handelt und möglicherweise das Ergebnis eines Schocks / einer Vibration ist. sawdust vor 8 Jahren 0
1
Journeyman Geek

Schließlich

Laufwerke sind jedoch so ausgelegt, dass sie für fehlerhafte Sektoren unempfindlich sind, und viele Laufwerke laufen noch eine Weile mit fehlerhaften Sektoren. Ihr Laufwerk verfügt über Ersatzsektoren, um diese Probleme zu bewältigen, und sie müssen das Gesamtbild betrachten, wenn Sie sich für den Austausch des Laufwerks entscheiden.

Ich schätze, Sie betrachten Smart Data und Syslog. In letzterem gibt es bestimmte Fehler - das würde anzeigen, was genau falsch ist, und wäre hier hilfreich. Suchen Sie nach korrigierbaren Fehlern (die etwas beängstigend sind, aber nicht so sehr) und nicht korrigierbaren Fehlern (die ein Zeichen eines bevorstehenden Untergangs sind). Ich kann mich nicht an die Fehler in meinem Kopf erinnern.

Die Tatsache, dass es sich um eine ausstehende Branche handelt, ist besorgniserregend. Der Sektor sollte posthaste ersetzt werden. Ich würde auch "Uncorrectable Sector Count" und alles andere, was hier auf der Wikipedia-Seite pink ist, über intelligente Attribute betrachten . Es gibt auch ein intelligentes Attribut, das die wachsende Anzahl fehlerhafter Sektoren anzeigt. Senken Sie die besseren dort, aber es ist ein Zeichen des allmählichen Versagens, anstatt tot zu fallen.

Es gibt hier ein paar Gefahrenzeichen

  1. Sektoren werden noch nicht ersetzt. Zugegeben, es ist eine sehr niedrige Zahl und Sie sollten für eine Weile in Ordnung sein

  2. Die Fahrt ist 5 Jahre alt. Es steht kurz vor einem längeren Garantiezyklus / einem typischen Lebenszyklus eines Computers.

Es gibt ein paar Dinge, die beruhigen. Sie wissen, dass das Laufwerk jederzeit sterben könnte und haben gesichert und sind für Datenverlust vorbereitet. Ich würde nicht sagen, dass jetzt ein Laufwerk ausgeht und ein Laufwerk gekauft wird, aber es wäre klug, bald ein Ersatzlaufwerk zu planen . Sie können das alte Laufwerk immer für temporäre Daten verwenden, bis es stirbt.