Brauchen Sie Ideen zur Diagnose / Behebung spontaner Hard-Resets?

690
Sam Dark

Ich habe ein Problem, das fast ein halbes Jahr andauert. Von Zeit zu Zeit wird der PC direkt auf den BIOS POST (ohne BSOD) zurückgesetzt. PC wird nicht übertaktet (zumindest absichtlich). Es sieht nicht so aus, als wäre es mit einer bestimmten Aktivität verbunden, dh es kann zurückgesetzt werden, wenn Sie einfach im Internet surfen oder ein Spiel spielen oder sogar im Ruhezustand am Desktop arbeiten. Der PC arbeitet möglicherweise einige Tage lang stabil und wird dann fünfmal am Tag hart zurückgesetzt.

Mein aktuelles Betriebssystem ist Windows 10. Als erstes habe ich automatische Neustarts deaktiviert und das Schreiben von Minidumps aktiviert. Dann überprüfte Protokolle: https://pastebin.com/PPavraJZ

Es ist nicht klar, was das Problem ist, außer dass es mit einem Stromausfall zusammenhängt.

Dann habe ich einen Minidump genommen und ihn unter http://www.osronline.com/ abgelegt . Haben Sie https://pastebin.com/3aqeQNXi erhalten :

WHEA_UNCORRECTABLE_ERROR (124) Ein schwerwiegender Hardwarefehler ist aufgetreten.

Ich bin nicht sicher, wie ich das alles interpretieren soll, aber für mich sah es nach einem Hardwareproblem aus.

Da ich dachte, dass es sich um ein Hardwareproblem handeln könnte, habe ich Folgendes getan:

  • Ersetztes altes Netzteil.
  • Gedächtnis raus Alle Schlitze mit Druckluftdose gereinigt. Leg es zurück.
  • Ersetzte Wärmeleitpaste auf der CPU (verwendet mx-2). Die Temperatur sank um 5-6 Grad. Bei maximaler Belastung bleibt es jetzt bei etwa 70 Grad.
  • Aktualisiert am neuesten BIOS.
  • Setzen Sie alle BIOS-Einstellungen auf AUTO oder die Standardeinstellungen zurück.
  • Installierte neueste AMD-Chipsatztreiber. Ausgewähltes optimiertes Ryzen-Leistungsprofil.
  • Die gesamte MSI-Software wurde entfernt ... nur für den Fall, dass sie etwas übertrumpft.
  • Ich habe einen halben Tag lang ohne Probleme memtest.
  • Ran Prime95 für eine Stunde ohne Probleme.

Meine aktuelle Hardware:

  • Seasonic Titan Prime 750W.
  • AMD Ryzen 1700 mit serienmäßigem Wraith Spire RGB-Kühler.
  • MSI B350 TOMAHAWK (MS-7A34). Letztes BIOS (1,90 von 19.09.2017)
  • 16 GB DDR4-RAM (8 + 8). 1600,0 MHz (DDR4-3200 / PC4-25600) Corsair CMK16GX4M2B3200C16.
  • MSI GeForce GTX 1080 Aero OC 8 GB DDR5X.
  • OCZ-VERTEX4 als primäre SSD. Gesund.
  • Samsung SSD 960 PRO 512GB als sekundäre SSD. Gesund.
  • ASUS Xonar D2X.
  • USB-Tastatur und -Maus.
  • KX-MB1500RU Panasonic-Drucker über USB angeschlossen.
  • Fall ist Thermaltake Tsunami Dream.

Ich habe keine Ideen, also bitte ich Sie um Hilfe, wie Sie Hard-Resets weiter diagnostizieren und beheben können. Vielen Dank.

0
In dieser Antwort (https://superuser.com/a/1282026/213131) finden Sie einige Ideen. Twisty Impersonator vor 6 Jahren 1
Ja. Das mache ich mehr oder weniger. Es gibt jedoch zwei Probleme: Die meiste Hardware wurde aus Deutschland geliefert, daher würde ein Austausch mehr kosten als ein Neukauf (Versandkosten + Zeit). Da das Problem nicht konstant ist, sollte Ubuntu von LiveCD für Tage oder Wochen verwendet werden, und ich muss diesen PC für die Arbeit verwenden. Der Gedanke, dass die oben genannten Informationen einige Erinnerungen auslösen könnten, ist aber trotzdem ein echter Dank. Zumindest bin ich mir sicher, dass es keinen einfachen Weg gibt :) Sam Dark vor 6 Jahren 0
Verwenden Sie Windbg und den Befehl [! errrec] (https://superuser.com/a/1163779/174557) mit dem Wert von arg2, um zu sehen, warum Sie einen Absturz von 0x124 erhalten magicandre1981 vor 6 Jahren 1
Hier ist es: https://pastebin.com/1LMkbT5T Sam Dark vor 6 Jahren 0
OK, beim Lesen von Daten ist ein L1-Cache-Problem aufgetreten. Der Ryzen ist relativ neu, also haben Sie Garantie und sollten RMA dabei haben magicandre1981 vor 6 Jahren 1
Ja. RMA ist eine Möglichkeit, ist aber kompliziert. Es dauert ungefähr 2 Monate, bis die CPU wieder in den deutschen Online-Shop gelangt ist, und ich muss eine weitere CPU in einem lokalen Shop kaufen, um einen funktionierenden PC zu haben. Wie sicher ist es, dass die CPU fehlerhaft ist und nichts anderes wie die automatische Einstellung der Spannung durch das Motherboard oder die GPU oder den Speicher, der sie verursacht? Sam Dark vor 6 Jahren 0
Konvertieren Sie den Wert 0xbe802800000c0135 vom Status in den Binärwert und prüfen Sie, ob Sie in der AMD-Dokumentation finden, was jedes Bit bedeutet. Haben Sie einen Freund mit einer kompatiblen Ryzen-CPU, den Sie testen können? Wenn diese CPU funktioniert, ist Ihre fehlerhaft. magicandre1981 vor 6 Jahren 1
Dokumente gefunden. http://support.amd.com/TechDocs/54945_PPR_Family_17h_Models_00h-0Fh.pdf, Seite 181. Die Bank bezieht sich auf die Load-Store-Unit. Der Fehler ist ein nicht korrigierbarer ECC-Fehler, der nicht von der Hardware behoben wurde. Ich glaube, von der Spezifikation bezieht sich der Speicher auf den CPU-Cache und nicht auf den regulären Arbeitsspeicher. Irgendeine Idee, wenn ich richtig bin? Sam Dark vor 6 Jahren 0
Übrigens, schickte einen Brief an den AMD-Support, der auf diese Informationen verweist. Sie haben vorgeschlagen, `sfc / scannow` auszuführen, und nachdem ich bestätigt hatte, dass keine Fehler aufgetreten waren, wurde die Rückgabe des Prozessors vorgeschlagen. Ich habe gehofft, dass sie sich wenigstens ein bisschen damit beschäftigen werden :( Sam Dark vor 6 Jahren 0
Leider keine Freunde mit Ryzen, also muss ich mir noch einen kaufen, um es auszuprobieren, schätze ich ... Sam Dark vor 6 Jahren 0
Habe https://github.com/corngood/kill-ryzen-win gefunden und ausgeführt. Abgestürzt Es ist sehr wahrscheinlich, dass es CPU ist. Sam Dark vor 6 Jahren 0
Was macht dieses Tool? magicandre1981 vor 6 Jahren 0
Startet viele C-Compiler parallel, liefert korrekten Code und wartet auf Ausnahme. Das passiert nicht in OK-CPUs, sondern in fehlerhaften. Sam Dark vor 6 Jahren 0
Übrigens, nachdem ich all diese Informationen an AMD übergeben hatte, stimmten sie der RMA-Vorabvereinbarung zu. Ich befinde mich also auf dieser fehlerhaften CPU, bis eine neue ankommt, diese dann durch OK ersetzt und an sie zurückgeschickt wird. Richtige Vorgehensweise für RMA. Sam Dark vor 6 Jahren 0
ok, danke für das feedback. Antworten Sie erneut, wenn Sie das Neue erhalten. übrigens, benachrichtige mich mit @ myusername. Derzeit muss ich das Thema selbst überprüfen, um zu sehen, ob Sie geantwortet haben oder nicht. magicandre1981 vor 6 Jahren 1
@ magicandre1981 installierte CPU von AMD erhalten. Natürlich nicht genug, aber es funktioniert bisher gut. Getestet mit Kill-Ryzen-Win und Prime95 für ein paar Stunden. Sam Dark vor 6 Jahren 0
ok, danke für die Rückmeldung, also war die CPU fehlerhaft. magicandre1981 vor 6 Jahren 0
@ magicandre1981 OMG, mit neuer CPU ist es nur ein Hard-Reset :( Crash-Dump ist ähnlich. Die gesamte RMA scheint überhaupt nicht hilfreich zu sein, außer dass ein seltener Fehler behoben wurde, der mit kill-ryzen reproduzierbar ist. Ich bin wieder verloren. Sam Dark vor 6 Jahren 0
Haben Sie ein anderes Motherboard, das Sie testen können? magicandre1981 vor 6 Jahren 0
Keine zusätzliche Hardware zur Hand. Das Problem ist so frustrierend, dass es mir nichts ausmacht, extra für neue MB auszugeben, wenn dies dadurch gelöst wird. Welches MB würden Sie vorschlagen, um problemlos zu sein? Sam Dark vor 6 Jahren 0
Vor einigen Tagen hatte ein Benutzer auch 0x124-Abstürze und es wurde behoben, indem der schnelle Start von Windows 10 deaktiviert wurde. Verwenden Sie dies? Wenn ja, deaktivieren Sie es auch unter Systemsteuerung-> Energieeinstellungen magicandre1981 vor 6 Jahren 0
@ magicandre1981 entfernte ASUS Xonar D2X aus dem Fall. So weit stabil. Es gibt Meldungen darüber, dass BSOD mit Nvidia-Karten verursacht wird, daher ist es möglicherweise irgendwie darauf zurückzuführen, dass der CPU-L1-Cache-BSOD irgendwie verursacht wird, obwohl es komisch klingt ... Sam Dark vor 6 Jahren 0

0 Antworten auf die Frage