Maschinencheck-Ausnahme - wie kann man es lesen und verstehen?

3181
bwDraco

Mein Computer verhält sich seltsam - manchmal wird er spontan neu gestartet, manchmal möchte er nicht booten. Wenn ich den Befehl "mcelog" eingebe, erhalte ich folgende Informationen:

HARDWARE ERROR. This is *NOT* a software problem! Please contact your hardware vendor MCE 0 CPU 0 BANK 0  MISC 61f80000500010e ADDR cf9  TIME 1305836650 Thu May 19 22:24:10 2011 MCG status: MCi status: Uncorrected error MCi_MISC register valid MCi_ADDR register valid Processor context corrupt MCA: BUS Level-3 Observed-error-as-third-party Generic Memory-access Request-did-not-timeout Error Model:Response hard fail STATUS ae00030010020c03 MCGSTATUS 0 MCGCAP c0204 APICID 0 SOCKETID 0  CPUID Vendor Intel Family 15 Model 4 

Wie kann ich es lesen und verstehen? Könnte mich jemand auf eine Dokumentation verweisen?

4
Ich würde versuchen, Memtest darauf auszuführen. Es muss in Ihrer Distribution erhältlich sein. Tshepang vor 13 Jahren 0
Sie haben ein Hardwareproblem, möglicherweise mit dem Speicher, möglicherweise mit dem Motherboard. Wenn Sie übertakten, hören Sie auf. Wenn das Motherboard unter Garantie steht, versuchen Sie, es auszutauschen. Gilles vor 13 Jahren 4

3 Antworten auf die Frage

2
Robert Wm Ruedisueli

Ich habe mir MCE-Fehler angesehen, weil ich gerade daran arbeite, das Übertakten auf meinem Rechner zu optimieren. Ich habe noch keine davon getroffen, da ich mit MemTest86 + zuerst alle schlechten Einstellungen erfasst habe, aber ich weiß, dass ich das tun kann. Daher muss ich regelmäßig nach den Übertaktungsänderungen die ersten Monate nach ihnen suchen. Sie können auftauchen, wenn die Hardware nur knapp über ihr Limit hinausgeschoben wurde und ein Zeichen dafür ist, dass Sie etwas zu übertaktet sind.

Die folgenden Zeilen sind wichtig

"HARDWARE-FEHLER."

und "MCA: BUS-Level-3-Beobachtungsfehler als generischer Speicherzugriffsanforderungs-Nicht-Timeout-Fehlermodell eines Drittanbieters - Fehlermodell: Hartes Versagen der Antwort"

Die anderen Zeilen besagen, dass die Register im Prozessor den Fehler nicht verursachen, und die genauen Fehlerspezifikationen und die genauen Auswirkungen des Fehlers. Sie werden keine dieser Informationen benötigen, es sei denn, Sie sind ein Kernel-Entwickler oder ein Motherboard-Entwickler.

Es scheint, dass Ihr Fehler aus dem Speicher stammt. Dies ist, was allgemein als hartgesottener Fehler bezeichnet wird, weil Ihr System bootet und nur Fehler bekommt.

Im Folgenden finden Sie häufige Ursachen für Probleme mit dem Speicher, dem Speichercontroller oder dem Bus. (Um das Problem leichter zu beheben._

  1. Probleme beim Übertakten (Die Zeiten im RAM sind zu kurz, die RAM-Bus-Geschwindigkeit ist zu hoch.)

  2. Spannungsprobleme (Spannung für RAM und / oder CPU ist im BIOS falsch eingestellt, zu niedrig oder zu hoch oder die Karte ist für einen anderen Spannungs-RAM ausgelegt, z. B. setzen Sie 1,65-Volt-RAM in eine Karte ein, die 1,5 Volt-RAM benötigt.)

  3. Überhitzungsprobleme (CPU-RAM-Controller, CPU-Cache, Motherboard und / oder RAM ist überhitzt. Dies kann mit Spannungsproblemen zusammenhängen.)

  4. Schlechte Stromversorgung (Dies liegt an großen Problemen.)

  5. Fehlerhafter Speicher (Testen Sie MemTest86 + einschließlich des gefürchteten Bitfade-Tests. Möglicherweise handelt es sich nicht um den Speicher, selbst wenn er erkannt wird.)

    6 Bad BIOS (WARNUNG, es kann gefährlich sein, das BIOS bei schlechtem Speicher zu flashen. Überprüfen Sie auf der Website des Herstellers, ob es Probleme mit dem Speicher gibt, laden Sie das BIOS-Image von einem anderen Computer herunter und bereiten Sie es vor und verwenden Sie das On-Boot-BIOS Flasher, um die Menge der verwendeten Ressourcen zu minimieren und somit die Menge der Dinge, die schief gehen können.)

  6. Fehlerhaftes Motherboard und / oder fehlerhafte CPU. (Ich denke, das ist offensichtlich.)

0
stonefoz

Nur Linie, die zählt,

Fehler nicht korrigiert

Sie haben entweder ein schlechtes Gedächtnis oder ein schlechtes Motherboard. Tauschen Sie einen der beiden aus und versuchen Sie es erneut. Führen Sie Memtest86 aus, um herauszufinden, ob der Fehler immer noch schneller ist, und versuchen Sie möglicherweise, den Speicher mit einer niedrigeren Taktrate auszuführen.

Es sei denn, wenn Sie Lötsubstanz-Chips in die Hand nehmen, ist nichts anderes von Bedeutung. Nicht dass ich das sowieso empfehlen würde.

0
P.T.

Die Handbücher zur Programmierung von Intel (oder AMD) -Systemen sind einmalig, um Hilfe zur MCE-Decodierung zu erhalten (siehe Kapitel "Machine Check Architecture"). Das sind ziemlich dichte Dokumente. Und Sie werden schnell in das Unkraut der Unterschiede in der Mikroarchitektur-Revision, des Chipsets im Vergleich zu CPU-Problemen usw. geraten.