Was ist wahrscheinlicher? Speicherbit rot (egURE) oder RAM Speicherbit rot?

647
humanityANDpeace

Der Hintergrund der Frage ist, dass auf den meisten Computersystemen Daten an mehreren Stellen beschädigt werden können. Die Frage fragt nach den relativen Problemen, die mit zwei Stellen einer solchen Datenfäule / Datenverfälschung verbunden sind

  1. im Hauptspeicher - speziell für Laptops (kein ECC-Speicher verfügbar)
  2. auf dem Speichermedium - z. B. magnetische Festplatte oder SSDs, und möglicherweise sogar stumm (das ist keine URE )

Die Idee zu der Frage ist, dass die Daten meistens nicht an beiden Stellen der potenziellen Korruption passieren müssen, das heißt, sie werden im Speicher gespeichert (siehe 1) und aus dem Massenspeicher abgerufen und abgerufen (siehe 2).

Gibt es eine Möglichkeit, zu ermitteln, welche der beiden Verfälschungen (über Bit Rot) wahrscheinlicher ist?

Die Zahlen, die ich gefunden habe, sind für mich nicht leicht zu finden und die Beantwortung der Frage würde genau dies tun.

Abbildung für jede Form von Bitfäule

  1. Speicher / RAM-Bit-Flipping: Ich las "25.000 bis 70.000 Fehler pro Milliarde Gerätestunden pro Megabit" von Wikipedia / Google . Eine andere Quelle besagt eindeutig, dass alle 3 Tage (72 Stunden) ein Bitflip-Fehler auftritt.
  2. Massenspeicher Ich habe gelesen, dass ein nicht behebbarer Lesefehler auf Verbraucherfestplatten mit "URE wird für 1 in 10 ^ 14 Bits" von https://en.wikipedia.org/wiki/RAID#URE erwartet wird

Das zeigt mir nun, dass man sich leicht Fälle vorstellen kann, in denen die Gefahr besteht, dass einer der zwei Bitfäule szenarisch die Höhe ist:

für 1) könnte man aber Daten in RAM und sehr sehr lange warten, da es fast zu gewissen Korruption kommt. für 2) man könnte viele Daten in den Speicher schreiben und lesen, um die Menge genug zu machen, da es fast sicher ist, dass Korruption dort zwei auftritt.

Die Frage stellt daher mehr für das Standardszenario des Schreibens von Daten (dh Fotos auf Platte und Backups). Ein Fall, in dem ich erwarte, dass der RAM das geringere der beiden Übel ist (z. B. für ein Backup, dh das Kopieren der RAM-Zeit ist weniger als in Bezug auf den betreffenden Speicherplatz).

Ich habe sogar eine Einschätzung vorgenommen, um diese Frage beantworten zu können, indem nur die folgenden Überlegungen bestätigt werden:

Szenario 1 Backup von 1 TB von einer Festplatte auf eine andere. Die Annahme ist, dass sowohl Speicher als auch Speicher beteiligt sind. Für den Speicher ist die Schätzung von Bit rot relativ zur benötigten Zeit. Es wird angenommen, dass die benötigte Zeit relativ zu den Schreibgeschwindigkeiten des Massenspeichers ist (1 MB / s USB1 bis 100 MB / s sata-hdd bis 500 MB / s sata-ssd sind vernünftige Werte, 50 MB / s werden gewählt).

Dann sind die Werte in der Schätzung:

  • 1 TB = 10 ^ 12 Bytes = 10 ^ 15 Bits
  • benötigte Zeit bei 50 MB / s = 1 TB / (50 MB / s) = 20000 Sekunden = 5,5 Stunden
  • Speicherbit rot für 1 TB mit einer Rate von 1 Bit rot je 10 ^ 14 Bit = 10 Bit rotiert
  • Speicherbit rot geschätzt mit (1 Bit rot alle 72 Stunden) = 5,5 / 72 Bit rotiert = 0,07638 Bit rotiert

Ich gehe dann davon aus, dass, wenn der Speicher zu Beginn nicht defekt ist (dh memcheck86 oder memtest86 nicht sagt, dass Ihr RAM defekt ist) und nur die 5.5.Stunden in Betracht gezogen werden, der Hauptgrund für Korruption die Massen sind Lager.

Folglich ist Massenspeicherbitfäule (in einer Sicherungssituation) wahrscheinlicher als Nicht-ECC-Speicherbitfäule!

Ich freue mich auf eine bestätigende oder korrigierende Antwort, die ein wenig Licht auf die relativen Risiken der Bitfäule im Stößel oder im Massenspeicher werfen kann

0
Es ist wahrscheinlicher, dass Sie alle kopierten / verschobenen Daten mit einer Vergleichsroutine vergleichen, da dies sowohl die RAM-Probleme des Transports als auch den Speicher zu diesem Zeitpunkt abdeckt. Dann haben Sie 2 Backups (die verglichen wurden) für Zirkulardaten. Vergleichen Sie nun die beiden Backups :-) Jede der oben genannten Möglichkeiten kann passieren, scheint jedoch nicht zu passieren, wenn alles perfekt läuft, es passiert nur (und dann auch alles :-), wenn es schief geht. Wenn ich vergleiche, wie perfekt alles normal funktioniert, wie schlecht die Dinge werden können, werden die wirklichen Probleme in Megs und Gigs und Terra aufgelistet, nicht in Bit. Psycogeek vor 8 Jahren 0
@Psycogeek Ich freue mich über Ihre Ratschläge und Hinweise, wie Sie die Frage nicht beantworten müssen. Ich weiß nichts über diesen Rat, aber die Frage, die ich absichtlich gestellt habe, und ein Weg, um die Frage überhaupt zu vermeiden, ist nicht der beste Weg, um die Frage zu beantworten. Scheint die vorgeschlagene Einschätzung für Sie vernünftig zu sein? humanityANDpeace vor 8 Jahren 0
Ich bekomme einfach nicht die gleichen Ergebnisse wie das Wiki, aus dem Sie die Mathematik bekommen. Andererseits bin ich nicht in einer industriellen Umgebung, die Strom für eine kleine Stadt zieht, und ich benutze eine gut regulierte USV, alles ist cool und ich stehe hinter einem Stuck (Beton) und einem Hühnerdrahtkäfig. Jemand könnte meine (wie Glas behandelten) Festplatten anstoßen, meine Kraft erhöhen und meine Werte 100 Mal im Nu ändern, obwohl die meisten getesteten Arbeitsmaterialien diese Anzahl von Fehlern in 2010 und darüber hinaus nicht erreichen. Vergleichen Sie ganze Terrabytes und sehen Sie. Psycogeek vor 8 Jahren 0

0 Antworten auf die Frage