Computer-BSODs NUR beim Starten von Overwatch

591
surazaL

Okay, ich habe dies in den OW-Foren gepostet, obwohl es so aussieht, als ob es niemanden interessiert. Also hier im Posting nur für den Fall, dass es ein Hardwareproblem ist und kein Overwatch-Problem, da ich ein herausragender Fall bin.

Deshalb habe ich ein Gaming-Rig für alle meine Gaming-Bedürfnisse entwickelt, und es hat fast 2 1/2 Jahre gedauert. Ich habe ungefähr zur gleichen Zeit OW gespielt und bis zum letzten OW-Patch war alles in Ordnung. (Deshalb denke ich, dass es ein Problem an ihrem Ende ist). Jetzt spiele ich viele Spiele, die grafisch intensiver sind als OW und ich war noch nie mit ihnen zusammengebrochen. DOOM, Fallout 4 und Witcher 3 sind nur einige Beispiele.

Der Absturz tritt NUR beim Starten von OW auf, er hängt auf einem schwarzen Bildschirm und wenn im Hintergrund Musik läuft, wird eine Notiz angezeigt, bis der Computer BSODs startet und neu startet. Der neueste BSod sagte etwas in Richtung "Clock" und etwas über meinen zweiten Kern?

Dinge, die ich versucht habe; Memcheck, Un und Re installierten das Spiel, aktualisierte das BIOS, aktualisierte Grafiken und sogar neu installierte Fenster.

Ich bin mir nicht sicher, ob dies verwandt ist, aber ich habe kürzlich ein neues Razer Ornata-Keyboard bekommen. Könnte dies dies bewirken? Ich werde eine Testversion ausführen und diesen Beitrag aktualisieren. Aktualisieren; unplugged Tastatur, keine Änderung.

Spezifikationen im angehängten Bild.

https://i.gyazo.com/23e5bf70eed481bb45678be16da44915.png

Letzter Minidump: https://www.filehosting.org/file/details/758289/092618-20607-01.rar

Helfen Sie einem Kerl? Ich hoffe, dieses Problem macht mich nicht so dumm wie mein letztes.

1

2 Antworten auf die Frage

1
Jamie Hanrahan

Der Minidump gibt an, dass der Fehlerprüfcode WHEA_UNCORRECTABLE_ERROR lautet.

WHEA = Windows-Hardware-Fehlerarchitektur. (Das heißt, Sie haben ein Hardwareproblem.) Die im Minidump gemeldeten Bugcheck-Parameter sind:

WHEA_UNCORRECTABLE_ERROR (124) A fatal hardware error has occurred.  Parameter 1 identifies the type of error source that reported the error.  Parameter 2 holds the address of the WHEA_ERROR_RECORD structure that describes the error conditon. Arguments: Arg1: 0000000000000000, Machine Check Exception Arg2: fffffa80070778f8, Address of the WHEA_ERROR_RECORD structure. Arg3: 0000000000000000, High order 32-bits of the MCi_STATUS value. Arg4: 0000000000000000, Low order 32-bits of the MCi_STATUS value. 

Kurz gesagt, die CPU hat eine Ausnahme ausgelöst, die als "Maschinenprüfung" bezeichnet wird. Soweit ich weiß, sind sie für das Betriebssystem immer fatal. Die Minidump sagt, dass Sie eine AMD-CPU haben. Im Handbuch zur AMD-Prozessorarchitektur wird angegeben, dass der Prozessor unter folgenden Umständen eine Ausnahme bei der Maschinenprüfung auslöst:

  1. Cachefehler, die beim Lesen und Schreiben von Daten, beim Testen, beim Ausfüllen der Cachezeile und beim Zurückschreiben der Cachezeile auftreten. [Beachten Sie, dass dies alles innerhalb der CPU ist. Hat nichts mit zB dem Windows-Dateicache zu tun. -jeh]
  2. Paritätsfehler, die den Caches und TLBs zugeordnet sind. [auch in der CPU-Jeh]
  3. ECC-Fehler in Verbindung mit den Caches und DRAM. [ECC-Fehler in den Caches befinden sich in der CPU. Es ist sehr unwahrscheinlich, dass Sie ECC-RAM ausführen. Ich gehe davon aus, dass dies nicht zutrifft. -jeh]
  4. Mit dem Lesen und Schreiben des externen Prozessorbusses verbundene Busfehler. [wie es heißt - "externer Bus", nicht in der CPU -jeh]

Weitere Informationen hierzu erhalten Sie durch Formatieren der WHEA_ERROR_RECORD-Struktur, deren Adresse Windows bequem in das Bugcheck-Argument 2 einfügt.

1: kd> !errrec fffffa80`070778f8 =========================================================================== Common Platform Error Record @ fffffa80070778f8 --------------------------------------------------------------------------- Record Id : 01d45625295c3b26 Severity : Fatal (1) Length : 928 [...] Error : BUSLG_GENERIC_ERR_*_TIMEOUT_ERR (Proc 1 Bank 0) Status : 0xb880000000020f0f 

Wir hatten also eine Auszeit in einem Bus. dh eine Transaktion am Bus wurde gestartet, wurde jedoch nicht früh genug abgeschlossen. Der "Bus" war wahrscheinlich PCIexpress.

Unter den von Ihnen beschriebenen Umständen weist dies stark auf die Grafikkarte hin.

Aber zuerst würde ich versuchen, Ihre Stromversorgung gegen eine bessere / stärkere auszutauschen, insbesondere eine mit mehr Strom auf der 12-V-Schiene. Moderne GPUs sind sehr leistungshungrig.

Hier ist eine Microsoft-Seite, die ausführlicher auf die Interpretation dieser Art von Speicherabbild (d. H. Bugcheck-Code 0x124) eingeht.

Es gibt nicht viel mehr Informationen aus dem Minidump. Das einzige, was gesehen werden kann, ist die aktuelle Thread-Information; Dieser Thread ist für das Melden von WHEA-Fehlern bestimmt. Daher enthält er keine Informationen darüber, was in anderen Threads, möglicherweise in anderen logischen Prozessoren, zu dem Zeitpunkt passiert ist, und der Speicherauszug enthält nichts davon. Normalerweise würde ich es zB versuchen! Laufen,! Fertig usw., aber hier sagt der Debugger einfach "nicht lesen von fffff800030b9000". Das liegt an Informationen, die im Minidump fehlen - was typisch für WHEA-Fehler ist. Wenn Sie Kernel- oder automatische Dumps aktiviert und das Problem reproduziert haben, kann es sein, dass die größere Dump-Datei möglicherweise mehr Informationen enthält. Ich habe jedoch den Eindruck, dass Sie einen eindeutigen Pfad ohne Hardwarepfad haben. Das tut mir leid.

Vielen Dank für Ihre Antwort! Ich nehme nicht an, dass ich gerade ein neues Netzteil gekauft habe (ein evga 600w), das Ihre Lösung beeinflusst? Ich bin fast sicher, dass es ein GPU-Problem ist, das angesichts des hohen Alters meines Erachtens verständlich ist. Finden Sie es einfach seltsam, dass es nur bei einem Programm schmilzt. surazaL vor 5 Jahren 0
Wenn Sie gerade eine qualitativ hochwertige PSU gekauft haben, ist dies wahrscheinlich kein Verdächtiger ... es sei denn, es handelt sich um eine "Kindersterblichkeit". Situation. Bezüglich "nur für ein Programm" (und Sie sagen, dass das Programm nicht das schwerste ist, was die gfx angeht, es geht nicht immer um die Menge an Aktivitäten. Manchmal wird ein Programm nur eine Komponente auf eine andere Art und Weise ausüben, die andere nicht tun. Vielleicht können Sie das tun Finden Sie eine günstigere Grafikkarte, die Sie als Schritt zur Fehlerbehebung eintauschen können. Jamie Hanrahan vor 5 Jahren 0
Funktioniert das Deaktivieren meiner GPU und die Verwendung der integrierten Grafiken auf dieselbe Weise? surazaL vor 5 Jahren 0
Es ist etwas zu probieren, und es kostet Sie nichts. Aber ich dachte an eine günstigere Version derselben Karte, die möglichst dieselben Treiber verwendete. Welche Karte ist das? Jamie Hanrahan vor 5 Jahren 0
Warten. Ich glaube nicht, dass ich Grafiken integriert habe, die zumindest nicht in meinen Grafikkarten erscheinen. Nun, ich denke, die einzige Möglichkeit ist, einen zu kaufen. Auch wenn sich herausstellt, dass dies ein weiteres Problem ist, musste ich trotzdem ein Upgrade durchführen. Hoffe es ist nicht das Board. surazaL vor 5 Jahren 0
Ja ... die FX 6100 hat keine integrierte Grafik. Jamie Hanrahan vor 5 Jahren 0
In Ordnung, Mann, vielen Dank für Ihre Hilfe und Interpretation des Fehlerberichts. Irgendwann kratze ich die Änderung für eine neue GPU zusammen und aktualisiere sie, aber das wird wahrscheinlich eine Weile dauern. Trotzdem vielen Dank nochmal. surazaL vor 5 Jahren 0
0
Horn OK Please

Ich vermute hier nur, aber aufgrund der Anzahl der Dinge, die Sie ausprobiert haben (sogar eine Neuinstallation von Windows), bin ich versucht zu sagen, dass Ihre GPU einen kleinen, lokalisierten Hardwarefehler erlitt. Ein kleiner Teil der GPU selbst, der Platine oder des VRAM ist so defekt, dass nur bestimmte Sequenzen von Grafikaufrufen dazu führen, dass sie manifestiert werden. Es ist durchaus möglich, dass nur ein einziges Spiel dies tut.

Ich hatte vor etwa 10 Jahren ein ähnliches Problem mit einer viel älteren Nvidia-Karte, von der allgemein bekannt war, dass sie mit dem Alter zu Teilversagen führt. Ein bestimmtes MMO würde Artefakte anzeigen und dann abstürzen, andere MMOs und FPS-Spiele würden jedoch einwandfrei laufen.

Wenn Ihre GPU 2,5 Jahre alt ist, ist sie definitiv alt genug, um sich auf eine Art "Frühausfall" zu verschlechtern. Dies ist in der Regel häufiger auf Laptops, wo die Chips konsequent heißer als auf Desktop - Rechnern laufen (zum Beispiel: Macbook Pros hat für kurzlebigen GPUs hatte Jahre ), aber vielleicht haben Sie einfach nur Pech bekommen.

Als grobe Verallgemeinerung glaube ich, dass dieses Problem auf modernen Desktop-Grafikkarten sehr selten ist, aber das bedeutet nicht, dass es nicht passieren kann. Der einzige Grund, warum es seltener wurde, ist, dass Nvidia und AMD in den letzten Generationen mehr QS- und Stresstests in ihre Produkte investiert haben, als dies für ihre langfristige Zuverlässigkeit der Fall war. Wenn Sie einen Chip zu heiß betreiben, wird er irgendwann kaputt gehen - es ist nur eine Frage, wann.

Letztlich gibt, ohne sehr spezielle Ausrüstung (höchstwahrscheinlich ein Elektronenrastermikroskop und / oder Röntgenmikroskop, sowie Tausende von Dollar an zusätzlicher Mikroelektronik - Ausrüstung) ist keine Möglichkeit zu wissen, für bestimmen, was das Problem mit Ihrem GPU ist (wenn man existiert) und wie / warum es passiert ist.

Für einen gewöhnlichen Verbraucher ist die Alternative leider eine einfache, aber oft teure: Wenn Sie den Verdacht haben, dass ein Teil "schlecht" ist, ersetzen Sie es durch ein neues (oder zumindest anderes, aber bekannt funktionierendes) Gerät mit gleichwertiger Funktionalität.

Wenn Sie beispielsweise eine GTX 970 hatten, von der Sie vermuten, dass sie schlecht ist, könnten Sie sich die GTX 960 eines Freundes ausleihen (die sie getestet haben und wissen, dass sie funktioniert), und sie in Ihrem System installieren, nur um zu sehen, ob sie funktioniert. Wenn es nicht funktioniert, ist das Problem etwas anderes. Wenn es funktioniert, ist Ihre GTX 970 schlecht.

Wiederholen Sie diesen Vorgang für jede nur erdenkliche Komponente: Motherboard, CPU, RAM, möglicherweise sogar etwas wie eine WLAN-Karte.

Wenn Sie keine Freunde haben, die sich Computerteile ausleihen lassen, müssen Sie sie möglicherweise für diese Tests kaufen. Wenn Sie eine freundliche lokale Computerwerkstatt kennen, können Sie möglicherweise mit ihrer Ersatzhardware Fehler beheben und möglicherweise nur eine geringe Diagnosegebühr erheben (wenn überhaupt), was viel billiger ist als der Kauf einer neuen GPU. Sie könnten Ihre Chancen auch auf dem Gebrauchtmarkt nutzen, wenn Sie möchten.

Wenn Sie schlechte Hardware erkannt haben, können Sie sie nur ersetzen. In den meisten Fällen ist es nicht wirtschaftlich, eine defekte GPU zu nehmen und zu beheben, da die Zeit, die ein Fachmann mit High-End-Equipment benötigt, um das Problem tatsächlich zu finden und zu beheben, den Wert der GPU übersteigt - es sei denn, es ist brandneu . Und wenn es neu ist, haben Sie eine Garantie und sollten es zur Reparatur oder zum Austausch an den Hersteller zurücksenden. GPUs verlieren zu schnell an Wert, um Reparaturen außerhalb der Garantie zu wirtschaftlich zu machen.

Wenn das Austauschen von Hardware Ihr Problem nicht beheben kann, kann dies immer noch ein Softwareproblem sein. Da Sie jedoch Windows vollständig neu installiert haben (und davon auszugehen ist, dass Overwatch angenommen wird), wette ich, dass Sie eventuell defekte Hardware finden werden etwas Software im Zusammenhang. Außerdem verursacht die typische Art der Datenbeschädigung keinen BSOD.

Dieses Problem könnte schwer zu diagnostizieren sein, es ist fast unmöglich, die Ursache zu bestimmen, und es ist wahrscheinlich teuer, es zu beheben, wenn es meiner Meinung nach so ist. Die meisten GPUs haben eine Garantie von 1 oder 2 Jahren, nicht mehr als 2,5 Jahre. Daher ist die Garantie fast definitiv ausgeschlossen, es sei denn, Sie haben einen sehr guten Hersteller, der sich zu einer längeren Garantie verpflichtet. Wenn Sie nicht unter die Garantie fallen und feststellen, dass das Problem mit der GPU-Hardware zusammenhängt, müssen Sie eine neue GPU kaufen.

Allquixotic deutet darauf hin, dass es viele Gründe für Ihr Problem geben kann und es schwierig sein kann, es zu isolieren. Ein Vorschlag aus Ihrem Kommentar zu "etwas über meinen zweiten Kern" wäre, verschiedene Kernaffinitäten mit Ihrem Exe (OW) auszuprobieren - Task Mgr, Details, OW Exe, Set Affinity. Nur um zu sehen, ob Sie Probleme mit Ihrer CPU haben. reben vor 5 Jahren 0
Aber was ist, wenn ich mein GPU austausche, nur um herauszufinden, dass es ein Boardproblem ist? Reben, wie kann ich die Affinität einstellen, wenn das Programm beim Öffnen abstürzt? surazaL vor 5 Jahren 0
Wenn Sie die GPU ersetzen und es sich nicht um ein GPU-Problem handelt, müssen Sie entweder die neue GPU für eine Rückerstattung zurückgeben (sofern zulässig), sie behalten oder verkaufen. Es ist ein Versuch und ein Irrtum. Horn OK Please vor 5 Jahren 0
_ "Ich hatte vor etwa 10 Jahren ein ähnliches Problem mit einer viel älteren Nvidia-Karte [...]" _ Ja, ich hatte dieses Problem auf einer nVidia-Mobilkarte in meinem Hauptarbeitslaptop. Der Laptop war immer noch was ich sonst brauchte, also tauschte das Motherboard gegen eines mit Intel-Grafik ein. Jamie Hanrahan vor 5 Jahren 0
(also * ich habe getauscht ...) Allerdings waren diese Symptome viel schlimmer als vom OP hier beschrieben: Mit Flackern angefangen, zu massiv gestörter Anzeige, dann Schwärze. Ich hatte noch nie einen Betriebssystemabsturz. Jamie Hanrahan vor 5 Jahren 0