Machine Check Ausnahme vom Kernel gemeldet

1035
StuR

Ich habe einen neuen Computer gebaut:

  • Intel Core i7 4770K
  • Gigabyte Z87N-WIFI
  • Samsung 840 Evo S x2 (in RAID 0)
  • 450w Corsair RM 80Plus
  • Dark Rock Pro 3 Kühlung
  • Kingston 1600 DDR3
  • KEINE DEDICATED GPU

Betriebssystem:

  • Linux Mint 16 Petra

Die BIOS-Einstellungen sind vollständig Standard, mit Ausnahme der RAID-Konfiguration. Die CPU ist weder übertaktet noch seit ich sie gekauft habe.

Ungefähr drei Mal pro Tag, seit ich das System aufgebaut habe, stürzt es unerwartet ab und erscheint auf einem schwarzen Bildschirm mit der Aufschrift "Machine Check Exception ...", Bild unten:

enter image description here

Die Temperatur sieht gut aus:

➜ ~ sensors acpitz-virtual-0 Adapter: Virtual device temp1: +27.8°C (crit = +105.0°C) temp2: +29.8°C (crit = +105.0°C)  coretemp-isa-0000 Adapter: ISA adapter Physical id 0: +42.0°C (high = +80.0°C, crit = +100.0°C) Core 0: +40.0°C (high = +80.0°C, crit = +100.0°C) Core 1: +41.0°C (high = +80.0°C, crit = +100.0°C) Core 2: +41.0°C (high = +80.0°C, crit = +100.0°C) Core 3: +40.0°C (high = +80.0°C, crit = +100.0°C)  pkg-temp-0-virtual-0 Adapter: Virtual device temp1: +42.0°C  

BIOS auf den neuesten Stand gebracht.

Kann mir jemand sagen, was das Problem sein könnte?

3
Klingt nach einem Hardwareproblem. Hat die CPU vorher funktioniert? Haben Sie nach verbogenen Pins auf der Hauptplatine gesucht? Haben Sie andere Distros als Mint 16 ausprobiert? DanteTheEgregore vor 10 Jahren 2
Habe es mit einer Reihe von Linux-Distributionen versucht: Fedora, Ubuntu und Linux Mint mit PCRE. Alle stürzen ähnlich ab. Ist es wahrscheinlich ein fehlerhaftes Motherboard oder eine fehlerhafte CPU, die diesen Fehler verursacht? StuR vor 10 Jahren 0
Es kann ein CPU-Fehler sein. Versuchen Sie, [Prime95] (http://www.mersenne.org/download/index.php) herunterzuladen (keine Registrierung erforderlich), und führen Sie den Blend-Test (`mprime -m` zum Ausführen der Konfigurations-Utilty) für 6-8 aus Stunden (mindestens 3). Es läuft weiter, bis Sie aufhören, oder es tritt ein Fehler auf. DanteTheEgregore vor 10 Jahren 0
ACPI-Temperaturen sind nicht gut. Mein Server meldet auch diese genauen Temperaturen - zu jeder Zeit. Versuchen Sie es mit "lm_sensors". Daniel B vor 10 Jahren 0

1 Antwort auf die Frage

2
Daniel B

Dies ist definitiv ein Hardwareproblem. mcelog --asciimeldet Folgendes:

Hardware event. This is not a software error. CPU 0 BANK 4 TSC 2d95278285f8 RIP !INEXACT! 10:ffffffff816f6570 MISC 0 TIME 1398091195 Mon Apr 21 16:39:55 2014 MCG status:RIPV MCIP MCi status: Uncorrected error Error enabled MCi_MISC register valid Processor context corrupt MCA: Internal unclassified error: 402 STATUS ba00000052000402 MCGSTATUS 5 CPUID Vendor Intel Family 6 Model 60 SOCKET 0 APIC 0 microcode 9 

... was leider nicht sehr hilfreich ist. Es ist wahrscheinlich ein nicht dokumentierter interner CPU-Fehler. Ihre beste Wette wäre, wenn möglich, einen Garantieaustausch (Ihrer CPU) in Anspruch zu nehmen.

Sie hatten recht, es war eine fehlerhafte CPU. StuR vor 10 Jahren 0