Mittlere Lebensdauer von SATA-Laufwerken?

1621
Damon

Was ist die durchschnittliche Lebensdauer eines SATA-Festplattenlaufwerks?

Fast alle Daten, die ich finden kann, geben Ausfallraten für die ersten 0-5 Jahre an, aber keine scheint das Ende der Lebensdauer der Laufwerke zu finden.

Die Berichte, Diagramme und Studien von Google, Backblaze und dergleichen erzählen nur einen Teil der Geschichte, da sie sich auf die ersten 5 Jahre +/- konzentrieren.

Hypothetisch zu sagen, dass 50% der Antriebe in 8 Jahren sterben, lässt die anderen 50% nicht in 16 Jahren sterben. Gibt es ein Diagramm, das 100% einer Reihe von Laufwerken zu ihrem Tod führt und die Ergebnisse liefert? Oder etwas, das gleichwertige Informationen liefert?

Wie hoch ist die durchschnittliche Lebensdauer einer Festplatte, wenn man davon ausgeht, dass die Verbraucherlaufwerke in einem typischen, klimatisch kontrollierten Heim / Büro stark belastet werden ? Wiederum keine Ausfallraten bei (kurzer) eingestellter Lebensdauer.

Die Ergebnisse der realen Welt sind für uns: Wir hatten in 10 Jahren weniger als 10% Laufwerksausfälle und nie Ausfälle nahe beieinander. Ich kann mich also gut mit alten Laufwerken auskennen, möchte aber gerne informiert werden, wo immer dies möglich ist. Die derzeitige Anzahl von Laufwerken reicht von 0 bis 8 (laufenden) Jahren und liegt im Durchschnitt bei etwa 3 bis 4 Jahren. Der jüngste Fehler war ein 5-jähriger Lauf. Weiter haben wir ein 40gb und 80gb Laufwerk, die jeweils gut über 10 Jahre (Herstellungsdatum) alt sind und trotzdem hier und da zuverlässig eingesetzt werden. Genügend Daten, um zu sagen, dass SATA-Festplatten zuverlässig über einen Zeitraum von mehr als fünf Jahren hinausgehen, aber nicht genug, um einen Trend zu zeigen, wie lange.

Hintergrund:

Wir ziehen in ein OBR10-Setup für ein kleines Unternehmen mit älteren SATA-Laufwerken von 4-6 Jahren über, und ich versuche herauszufinden, wie umsichtig es wäre, auf eine 3-Kopie-MD-RAID 10-vs-2-Kopie umzusteigen.

Bei täglichen Datenspiegeln und vollständigen Sicherungen wäre es nicht schädlich, einen vollständigen Verlust des primären Arrays zu haben und aus Backups wiederherzustellen und wiederherzustellen. Ich würde jedoch gerne ein solches Szenario vermeiden. Allerdings kann ich nicht scheinen, Daten zu finden, die weit über das Alter unserer aktuellen Laufwerke aussehen . und es gibt keine Anzeichen dafür, dass sie in Scharen an der 5 +/- Jahresmarke versagen, wo die Daten scheinbar aufhören.

0
Sie neigen dazu, durch Gebrauch zu versagen, nicht durch Alter. Es hängt also wirklich von der Arbeitsbelastung ab. Die besten Daten, die ich mir vorstellen kann, sind die, die von Backblaze bereitgestellt werden. https://www.backblaze.com/blog/hard-drive-failure-rates-q2-2016/ - Niemand, der mir bekannt ist, veröffentlicht irgendetwas in der Nähe. djsmiley2k vor 7 Jahren 3
@ djsmiley2k Jährliche Ausfallraten für Laufwerke von 0 bis 5 Jahren haben nichts mit der durchschnittlichen Lebensdauer von Laufwerken zu tun und auch nichts mit Ausfallraten nach 5 Jahren. Ich stimme zu, dass die Lebensdauer ohne entsprechende annualisierte Ausfallraten für eine bestimmte Gruppe auch für Entscheidungen problematisch ist, aber wo liegen die Daten für 5-10 Jahre +? Es muss viele Millionen Laufwerke geben, wenn nicht Milliarden älter als 5 Jahre, die noch zuverlässig laufen. Ich gehe davon aus, dass jemand irgendwo einen Einblick hat. Damon vor 7 Jahren 2
Die andere Sache, die Sie beachten sollten, ist, wenn Sie ein 10-jähriges Laufwerk haben. SATA 1 läuft wahrscheinlich? Irgendwann wird es schwieriger, Ersatzlaufwerke sozusagen "vor Ort" zu finden, und (falls erforderlich) auch teurer, um Daten von diesen Laufwerken wiederherzustellen. djsmiley2k vor 7 Jahren 0
@ djsmiley2k Ich bin mir nicht sicher, ob ich damit einverstanden bin. SATA Ich arbeite immer noch mit neuer Hardware (SATA III) und sie haben das Umschalten so oft verlangsamt. Ganz zu schweigen davon, ein altes ausgefallenes Laufwerk durch ein neues Laufwerk an der neuen SATA-Schnittstelle zu ersetzen und es dem Array hinzuzufügen, ist kein Problem. Außerdem müssen wir kein Laufwerk desselben Jahrgangs finden, um ein ausgefallenes Laufwerk zu mildern, also kein Problem. Bei Spiegeln und Sicherungen ist auch keine Datenwiederherstellung erforderlich. Damon vor 7 Jahren 0
dann stellt sich die Frage "Warum kümmert es Sie, wenn die Festplatte ausfällt?" djsmiley2k vor 7 Jahren 0
@ djsmiley2k Nämlich Ausfallzeiten, Möglichkeit eines Benutzerfehlers während der Wiederherstellung, Abschwächung der Zeitspanne, die das Array in einem verschlechterten Zustand verbringt. Wir kümmern uns um die Daten, wir arbeiten nur mit einem Budget, treffen gerne fundierte Entscheidungen und haben derzeit keine Informationen zu der Frage. Damon vor 7 Jahren 0
Lassen Sie uns [diese Diskussion im Chat fortsetzen] (http://chat.stackexchange.com/rooms/51062/discussion-between-djsmiley2k-and-damon). djsmiley2k vor 7 Jahren 0
Ok, Auto-Anologie-Zeit - Autos aus den 1920er Jahren laufen noch. Würdest du dich ihnen anvertrauen? Die Tatsache, dass es keine 10-Jahres-Daten gibt, liegt auch an den Gründen, auf die ich hingewiesen habe. Die Leute, die groß genug testen, um diese Daten zu generieren (google, backblaze), führen die Hardware nicht so lange aus, weil dies keinen Sinn macht zu tun Schnittstellen und technologische Änderungen bedeuten, dass sie zu neueren Versionen wechseln, bevor die Hardware diesen 10-Jahres-Punkt erreicht. djsmiley2k vor 7 Jahren 0

1 Antwort auf die Frage

8
Journeyman Geek

TLDR: Es ist unmöglich, eine durchschnittliche Anzahl von Festplattenlaufwerken anzugeben, da dies zu kompliziert ist.

Es gibt kein wirkliches Maß für die durchschnittliche Lebensdauer, da es stark von einer ganzen Reihe verschiedener Faktoren abhängt. Es ist ein bisschen wie die Frage, wie lang eine Schnur ist . Für ein bestimmtes Laufwerk kann ein Datenblatt einige relevante Informationen enthalten, auch wenn dies noch ein grober Hinweis ist, der möglicherweise mit einer Prise Salz und Teeblättern interpretiert werden muss.

Zunächst einmal ist ein Ausfall eines einzelnen Laufwerks, wenn Sie ein Laufwerk haben, eine Tragödie, bei der ein Laufwerk eines überfallenen Arrays, das Teil eines Cluster von Arrays ist, eine Statistik ist. Man kann sich kein bestimmtes Laufwerk ansehen und sagen: "Dies wird sicherlich ein Jahrzehnt dauern ". Man kann sagen "Dieser Antrieb sollte 5 Jahre dauern" und plant, ihn planmäßig zu ersetzen.

Ich möchte auch darauf hinweisen, dass Backblaze und Google und die meisten Branchen mit durchschnittlichen Ausfallraten und Zuverlässigkeit über die Lebensdauer eines Laufwerks unter bestimmten Bedingungen befasst sind . Sie wollen eine große Anzahl von Laufwerken kaufen, sie so kostengünstig und effizient wie möglich betreiben und sich bis zum geplanten Austausch nicht wirklich sorgen. Es ist sogar noch besser zu wissen, "dies sind die Anzeichen, die ein Laufwerk sterben wird", als sie sterben zu lassen, und in der Lage zu sein, die Kosten für die Kühlung eines Ortes mit den Hardwarekosten durch das Braten frischer Festplatten auszugleichen.

Festplatten sind praktisch Standardgeräte - und in der Regel wird die Zuverlässigkeit der meisten Orte nicht berücksichtigt. Erst kürzlich (relativ!) Haben große Unternehmen begonnen, gigantische Flotten dieser Laufwerke einzusetzen und ihre Zuverlässigkeitsinformationen zu teilen.

Es gibt einen guten Grund, dass der Fokus auf prädiktive Fehleranalyse und Auswahlmodelle für Zuverlässigkeit und langfristige Zuverlässigkeit liegt . Die gesamte Hardware stirbt einfach und es ist "billiger" in Bezug auf Arbeitskraft, Ausfallzeiten und sogar in einigen Fällen, um Laufwerke auszutauschen, bevor sie an einem mechanischen Ausfall sterben.

Bei bestimmten Laufwerken kann es zu Problemen kommen - der Seagate 7200.11 war beispielsweise dafür bekannt, aufgrund von fehlerhafter Firmware zufällig zu sterben, und wurde später behoben. Andere Laufwerksmarken und -modelle haben möglicherweise eine lächerliche Zuverlässigkeit. Ich habe buchstäblich noch nie ein HGST-Desktop-Laufwerk ausgefallen.

Man könnte die mittlere Zeit bis zum Scheitern des Modells nachschlagen - was mit der durchschnittlichen Lebensdauer der Fahrt korrelieren sollte, aber die moderne Literatur scheint es für eine Last von Pferdehockey zu halten. Seagate ist trotzdem auf AFR umgestellt .

Beim Nachschlagen stieß ich auf diese großartigen Folien von jemandem aus WD. Sie sind sich nicht sicher, ob die zugehörige Vorlesung online ist.

Es gibt einen hervorragenden Hinweis auf die Mindestzuverlässigkeit / Lebensdauer, die ein großer Festplattenhersteller erwartet.

Vermeiden Sie eine unüberschaubare Katastrophe auf halbem Weg (oder darüber hinaus) während der Garantiezeit eines Produkts

Die typische Garantie für ein Unternehmensgerät und ältere Festplattenlaufwerke beträgt 5 Jahre. Es ist 3 Jahre für neuere Laufwerke. Ihr Festplattenhersteller geht also davon aus, dass seine Laufwerke nicht vor 5 Jahren ausfallen werden, da sie dafür Geld kosten. Sie gehen daher davon aus, dass Sie entweder das Risiko übernehmen oder es nach Ablauf der Zeit ersetzen.

Der Rest der Präsentation ist eine gute Lektüre, überspringt jedoch den Großteil der Physik.

Dies ist eine einfache kleine Grafik, die alle Elemente zeigt, die für die Zuverlässigkeit der Festplatte verantwortlich sind, und zwar aus den gleichen Folien

enter image description here

Und während die klassische Bathub-Kurve das ist, worüber die Leute mit Laufwerkszuverlässigkeit sprechen, sind Dinge wie der tatsächliche Arbeitszyklus, wenn Schreibvorgänge einem Laufwerk passieren, und Temperaturaspekte zusätzlich zu all diesen Design- und Umgebungsfaktoren. Es ist einfach zu komplex, um es zu erraten.

Ist auf jeden Fall sinnvoll, obwohl es bei allen Variablen kein echtes Vorhersagemodell gibt. Ich glaube, ich hatte ein Konzept, dass jemand mit den bereitgestellten Milliarden von Laufwerken sie bis zu ihrem Tod benutzt und auf einer grundlegenden Ebene ihre realen Ergebnisse dokumentiert hätte. Ich konnte zwar feststellen, dass die Fehlerkurve für Hitachi-Laufwerke gegenüber einer Marke wie Seagate-Laufwerken, die 15 Jahre aus dem Markt genommen wurde, drastisch anders sein würde, was bedeutet, dass Verallgemeinerungen zusammenbrechen würden, wenn die Daten nicht genügend Vielfalt hätten. Vielen Dank für Ihre Einsicht! Damon vor 7 Jahren 0
Ich denke, wir werden auf das Nachrichtenkonzept "Gute Nachricht" gehen. Ich suchte nach Daten oder Informationen, die besagten, dass Laufwerke nach 5 Jahren nicht oder nicht viel versagen, und erhielt keine konkrete Antwort auf den Punkt, was wahrscheinlich bedeutet, dass es sich nicht um eine Klippe von Ausfällen bei der 8-Jahres-Marke oder etwas handelt. Wir haben einen kleinen Datensatz zu den von uns verwendeten Laufwerken, daher denke ich, ich werde die Antriebsmodelle, das Alter und die Betriebsjahre nachverfolgen und sehen, ob wir Trends über einen längeren Zeitraum finden können. Wir kaufen Hitachi-Laufwerke speziell aufgrund der uns vorliegenden Daten, obwohl sich die Trends bei HGST, das WD gehört, ändern werden. Damon vor 7 Jahren 0