Wie groß ist die Wahrscheinlichkeit, dass ein unkorrigierter Bitfehler auftritt und nicht erfasst wird?

759
Sidney

Also habe ich heute ein Setup-Exe von einem NAS-Laufwerk gleichzeitig auf zwei separate Computer kopiert, und beide hatten die gleichen Probleme. Das Setup-Programm wurde aus Zeitgründen (zumindest länger als in dieser Firma) ohne Probleme verwendet, das war es nicht, und die Computer waren buchstäblich brandneue Installationen von Fenstern.

Nach einigem Fummeln mit dem Computer stellte AI fest, dass das Löschen des Exe und das erneutes Kopieren und das erneute Installieren der App das Problem lösten, und dasselbe gilt für B.

Die einzige Schlussfolgerung, zu der ich kommen kann, ist, dass während des Lesevorgangs der ursprünglichen Festplatte eine Art Bit-Fehler aufgetreten ist. Beide Computer haben die zwischengespeicherte Kopie erhalten, die fehlerhaft (identisch) war, und beide antworteten auf dieselbe Weise.

Da gibt es noch etwas, was so etwas bewirken könnte, würde ich gerne wissen, sonst wie ist die Wahrscheinlichkeit, dass dies tatsächlich geschieht?

1
Es wird etwa einmal pro 74 TB der gelesenen Daten ein nicht abgerufener / nicht erkannter Bitfehler angezeigt. Für mich entspricht dies ungefähr zwei Mal pro Monat auf meinem Home-Desktop. Aus diesem Grund verwenden Server ECC-registrierte Speicher (was diese Probleme viel besser erkennen kann) und ich verwende Prüfsummen-Dateisysteme (wie ZFS) zur Datenspeicherung. Darth Android vor 10 Jahren 1
Nur neugierig, warum 74 TB? In meinen Computervernetzungskursen wurde allerhand über Paritätsbits, Prüfsummen und Hashes und dergleichen gesprochen, um Fehler zu vermeiden, aber der generelle Ton der Vorlesungen schien zu sein, dass es niemals unabsichtliche Fehler gab oder dass sie so ungewöhnlich waren (und 1 Bit von 650910883643392 ist ziemlich ungewöhnlich) sie waren nicht der Rede wert. Sidney vor 10 Jahren 0
@Sidney - Gehen Sie voran und konvertieren Sie diesen Bitwert in TB. ** Es ist um 75.776 TB, wenn Sie sich fragen. ** Ramhound vor 10 Jahren 1
@DarthAndroid, warum ist das keine Antwort? Es scheint, als hätten Sie das Thema auf den Kopf gestellt. Michael Frank vor 10 Jahren 0

1 Antwort auf die Frage

2
Darth Android

Es wird etwa einmal pro 74 TB der gelesenen Daten ein nicht abgerufener / nicht erkannter Bitfehler angezeigt. Auf meinem Home-Desktop entspricht dies ungefähr zweimal im Monat.

Aus diesem Grund verwenden Server ECC-Speicher (dies ist viel besser, um diese Probleme zu erkennen und zu beheben) und ich verwende Prüfsummen-Dateisysteme (wie ZFS) zur Datenspeicherung. Wenn Sie nur Daten in Partitionen auf Ihrer Festplatte speichern, können Sie nicht überprüfen, ob die Daten nicht geändert wurden. Es reicht nicht aus, eine Kopie der Daten (RAID 1) oder Paritätsdaten (RAID 5) zu haben. Es sagt Ihnen, dass sich etwas geändert hat, aber Sie können nicht sagen, wie der ursprüngliche Wert war. Dateisysteme, die die korrekte Überprüfung von Summen und Redundanz unterstützen, können nicht nur feststellen, welche Daten beschädigt / umgedreht wurden, sondern sie können sie automatisch aus der redundanten Kopie wiederherstellen.

Vor ein paar Jahren, 1 Bit aus 650910883643392 war ziemlich ungewöhnlich. Mit Cloud-Speicher und der ständig steigenden Medienqualität (4K-Video steht vor der Tür) ist es jedoch immer häufiger geworden.

ECC / Nicht-ECC und registrierte / nicht registrierte sind nicht die gleiche Frage. Ich denke, die einzige Kombination, die Sie nicht sehen, ist registriertes Nicht-ECC (im Allgemeinen wird registriertes oder gepuffertes nur für große Speichermodulbanken verwendet, aber ECC kann auch mit einzelnen Speichermodulen ausgeführt werden). Mein Heimsystem verwendet beispielsweise nicht registrierte ECC-RAM. a CVn vor 10 Jahren 0
Ich glaube auch, dass diese Antwort von einer Quelle für die 1 / (6.5e14) -Zahl profitieren würde. Es ist erwähnenswert, dass höhergradige HDDs * nicht korrigierbare Lesefehler * Raten von * statistisch * einem Sektorfehler pro 1e15 gelesenen Bits melden, der sich in der Nachbarschaft befindet. Nicht korrigierbare Lesefehler werden jedoch per Definition erkannt. a CVn vor 10 Jahren 0