Unterschied zwischen regulärem RAM und ECC-RAM

2694
soandos

Mögliches Duplizieren:
Soll ich ECC-RAM für den nächsten Computer verwenden, den ich baue?

Wie oft macht regelmäßiger Arbeitsspeicher einen Fehler?

Wie hoch ist die Wahrscheinlichkeit, dass es tatsächlich irgendetwas beeinflusst (einschließlich stiller Datenkorruption, aber ohne Änderungen an Daten, die niemals gelesen werden können)?

EDIT: Ich würde auch gerne wissen, ob es in dieser Hinsicht Unterschiede zwischen DDR2 und DDR3 gibt.

0
@ techie007 stimme ich nicht zu. Mir ist egal, was schneller ist und welche Motherboards dies unterstützen. In dieser Antwort fehlen auch Zahlen, wie oft diese Probleme auftreten. Alles, was er in anekdotischen Beweisen hat, dass es hilft. soandos vor 12 Jahren 0
@ techie007 Auch das PDF, zu dem er verlinkt, ist zwar interessant, gibt jedoch keine genaue Zahl dafür an, wie viele Fehler der reguläre Arbeitsspeicher (vor allem heute, im Gegensatz zu 2009) macht oder warum es solche Abweichungen gibt (Zeichen für schlechte Daten?). ). Es behandelt auch nur Fehler, die korrigierbar sind. Was ist der Unterschied zwischen dem und dem Gesamtwert? soandos vor 12 Jahren 0
Was ist die eigentliche Frage? "Was ist der Unterschied zwischen ECC- und Nicht-ECC-RAM?" (Was Sie auf Wikipedia zumindest herausfinden können, bin ich mir sicher), oder "Was ist die Wahrscheinlichkeit, dass ein 1-Bit-RAM-Fehler die ECC hätte fangen können?" Ƭᴇcʜιᴇ007 vor 12 Jahren 0
Mehr eine Modifikation des zweiten. Was sind die ungeraden Ich wird durch einen Fehler beeinflusst, abzüglich der Wahrscheinlichkeit, dass ich durch einen Fehler unter Verwendung von ECC RAM beeinflusst wird. soandos vor 12 Jahren 0
Der ECC-Speicher kann nur 1-Bit-Fehler korrigieren. Daher müssen Sie sich zumindest Gedanken darüber machen, ob Sie von Ihrem Gesamtwert abziehen müssen. ;) Sie möchten also wissen, wie viel mehr "1-Bit-Fehler" Sie haben, wenn Sie nicht ECC haben? Ƭᴇcʜιᴇ007 vor 12 Jahren 0
Sowas in der Art. Ich denke, es gibt auch einen kleinen Prozentsatz (1-Bit-Fehlerquadrat), bei dem es keinen 1-Bit-Fehler gibt soandos vor 12 Jahren 0
Ein anderes verwandtes: [Wie häufig sind DRAM-Fehler?] (Http://superuser.com/questions/26493/how-frequent-are-dram-fehlern) Ƭᴇcʜιᴇ007 vor 12 Jahren 0
Das in diesem Artikel verlinkte Papier ist das gleiche, das in der anderen Frage zitiert wurde, die Sie als verbunden markiert haben. soandos vor 12 Jahren 0
Das bedeutet nicht, dass Sie (zumindest teilweise) nicht dieselbe Frage stellen wie Sie. Ƭᴇcʜιᴇ007 vor 12 Jahren 0
Ich denke, die Kernfrage ist immer noch "Lohnt es sich, in ECC RAM zu investieren?" und die Antwort spiegelt das wider. Das interessiert mich überhaupt nicht. soandos vor 12 Jahren 0
Nun, ein System, das einen Speichervorgang pro Stunde ausführt, hat eine viel geringere Chance, die Art des Speicherfehlers zu erhalten, den ECC verhindert, als derselbe Computer, der 10000 Operationen pro Sekunde ausführt. :) Ƭᴇcʜιᴇ007 vor 12 Jahren 0
Warum ist das so? soandos vor 12 Jahren 0

1 Antwort auf die Frage

1
Tom Wijsman

Sie suchen nach der mittleren Zeit zwischen dem Ausfall (mtbf) und der mittleren Zeit bis zum Ausfall (mttf).

Beides ist abhängig von der Qualität (Fehler sind möglich) des Arbeitsspeichers sowie seiner Ausfallrate. Die Ausfallrate ist hauptsächlich abhängig von den gesamten Gerätestunden und einem Beschleunigungsfaktor, bei dem die Zellen ausfallen. Weitere Parameter sind Temperatur, Betriebszeit und Energie.

Ein ausführliches Dokument hierzu ist Hybrid Memory Products Ltd - SRAM-Modul - MTBF-Analyse . In diesem Beispiel hat der verwendete Speicher eine Lebensdauer von hunderten von Jahren. Sie können sehen, dass verschiedene Speicherhersteller dasselbe berichten, hier ein Beispiel von Kingston :

Unser Prozess funktioniert so gut, dass unsere mittlere Zeitspanne zwischen Ausfällen 500 Jahre überschreitet!

Der Grundgedanke dabei ist, dass ECC dazu dient, Hardwarefehler oder extreme Auslastung zu vertuschen. Dies ist der Grund, warum Sie es häufig auf Servern installiert sehen, da sie keinen fehlerhaften Speicher riskieren möchten.


Von der anderen Frage gibt es dazu eine Studie, die andere Ergebnisse zeigt, nämlich 50 - 167 Fehler pro Monat, als einen Fehler nach langer Lebensdauer. Nun, wer spricht die Wahrheit? Hat Google MemTest ordnungsgemäß verwendet?

Google ist zu diesem Thema in Schwung gekommen. Unter http://blogs.zdnet.com/storage/?p=638 erfahren Sie, wie sich dies auf moderne Systeme wirklich auswirkt.

Dies basiert jedoch auf Daten aus den Jahren davor aus dem Jahr 2009, daher könnte es heutzutage anders sein.

Wenn Hardwarefehler auftreten, werden sie nicht schnell mit memtest angezeigt? soandos vor 12 Jahren 0
@soandos: Sie können oder nicht, es hängt davon ab, wie lange Sie scannen. Manche Leute können es sich nicht leisten, so viel Zeit darauf zu verwenden, zu bestätigen, dass alle ihre Hardwarekomponenten in Ordnung sind. Ich denke, dass dies auf professionellem Niveau geschieht, aber oft wird es einfach ausgeführt und ausgeführt, wenn Speicherfehler vermutet werden. Tom Wijsman vor 12 Jahren 0
Wenn es sich um einen Hardwaredefekt handelt, würde es nicht zu 100% ausfallen, wenn der RAM-Bereich in den RAM-Speicher geschrieben / gelesen wird. soandos vor 12 Jahren 0
Ein-Bit-Speicherfehler können auch dann auftreten, wenn der RAM nicht fehlerhaft ist und praktisch spontan vorkommt ("Elektrische oder magnetische Interferenzen in einem Computersystem können dazu führen, dass ein einzelnes Bit eines dynamischen Direktzugriffsspeichers (DRAM) spontan zu dem RAM-Speicher wechselt entgegengesetzter Zustand. "). ECC für das Abfangen dieser einmaligen Systemfehler, damit es nicht funktioniert, wenn der RAM kaputt ist (dafür ist "ChipKill" gedacht). Ƭᴇcʜιᴇ007 vor 12 Jahren 0
@ techie007: Wie gesagt, andere Parameter haben einen Einfluss. Interferenzen sollten bei den meisten heutigen Motherboards in Ordnung sein, und dies ist wiederum ein Hardwaredefekt, wenn er regelmäßig auftritt. Daher deckt ECC diese Hardwarefehler auf ... Tom Wijsman vor 12 Jahren 0
@soandos: Nicht wirklich, ein schlechter Kontakt oder zwei Zellen, die zu nahe beieinander liegen, können zu zufälligem Verhalten führen. Tom Wijsman vor 12 Jahren 0
Die passieren gelegentlich? soandos vor 12 Jahren 0
@soandos: Was passiert zeitweise? Außerdem habe ich meinen vorherigen Kommentar leicht aktualisiert ... Tom Wijsman vor 12 Jahren 0
Schlechte Kontakte oder zwei nahe beieinander liegende Zellen. soandos vor 12 Jahren 0
@soandos: Ja, Umweltparameter beeinflussen dies. Die Temperatur kann eine Abstandsänderung verursachen, mehr / weniger Energie (Spannung) kann die Ausbreitung des Bits erleichtern / erschweren. Die durch einen Defekt verursachte magnetische Interferenz hängt davon ab, ob positive / negative Bits gesetzt sind. Letzteres ist einer der Gründe, warum beim Testen unterschiedliche Muster verwendet werden ... :) Tom Wijsman vor 12 Jahren 0