Was kann dazu führen, dass PCIe-Grafikkarten während des Startvorgangs zufällig ausfallen?

752
Dan Story

Ich habe ein System, das mich derzeit verrückt macht, und ich hoffe, dass jemand hier bei StackExchange etwas aufzeigen kann, was ich falsch mache.

Der Computer ist selbst gebaut und besteht aus:

  • CPU: Intel Core i7 4790K (Vorrat bei 4 GHz)
  • MB: Gigabyte GA-Z97X-Gaming G1 WIFI-BK
  • RAM: G.skill Trident X F3-2400C10Q-32GTX (8 GBx4-kompatibles Kit)
  • GFX: 2 Gigabyte GV-N980G1 GAMING-4GD GTX 980 (SLI)
  • PWR: Corsair HX1000i
  • Betriebssystem: Windows 8.1 Pro

Jedes Mal, wenn ich die Maschine einschalte, ist es ein Münzwurf, ob die Grafikkarten online sind oder nicht. Wenn ich Glück habe, fahren die Karten hoch und ich bekomme ein Anzeigesignal (über DP-Ausgang) an meinen Hauptmonitor. In diesem Fall scheint die Maschine korrekt zu funktionieren, bis der Strom aus- und wieder eingeschaltet wird. Die Leistung liegt jedoch deutlich unterhalb der für die Hardware erforderlichen Leistung (der Wert von 3DMark Fire Strike Extreme von etwa 8000 im Vergleich zu Futuremarks 10100 für ein Referenzsystem mit identischer CPU und CPU) Grafikkarten).

Wenn ich Pech habe, startet der Computer und das Video wird mit der integrierten Intel-Grafik (die ich auf einen zweiten Monitor geroutet habe) online gestellt. Der Gerätemanager erkennt die NVIDIA-Karten überhaupt nicht. Sie werden nicht als "unbekanntes Gerät" angezeigt, sie werden nicht als "fehlgeschlagener Start" angezeigt - sie fehlen einfach vollständig.

Nach dem üblichen Verfahren für diese Art von Situationen habe ich Motherboard, Karten, Netzteil und alle Stromanschlüsse entfernt und neu eingesetzt. Ich habe überprüft, ob es keine losen Leiter gibt, die möglicherweise Kurzschlüsse verursachen könnten. Ich habe die CPU- und GPU-Temperaturen überprüft, um sicherzustellen, dass sie unter Last innerhalb der thermischen Grenzen laufen (etwa 65 ° C für GPUs und 55 ° C für CPU).

Das macht mich völlig ratlos. Anregungen (egal wie naheliegend) wären sehr willkommen.

Aktualisierte:

Auf Anfrage von Journeyman Geek in den Kommentaren habe ich Tests auf dem Rechner mit jeder installierten Grafikkarte durchgeführt. Das scheint das Problem zu lösen: Ich habe das System mit jeder Karte etwa ein Dutzend Mal gebootet und es ist noch nicht fehlgeschlagen. Darüber hinaus bestätigt 3DMark, dass die Karten für diese Hardwarekonfiguration mit einer einzelnen GPU einzeln im Durchschnitt arbeiten.

Dieses Problem scheint also speziell auf die Verwendung der beiden Karten in einer SLI-Konfiguration zurückzuführen zu sein.

Ich mache derzeit noch einige Tests mit den beiden Karten in einer anderen PCIe-Steckplatz-Konfiguration (1 & 2 statt 1 & 3), um zu sehen, ob ich möglicherweise einen fehlerhaften Steckplatz auf der Platine gefunden habe.

Update 2:

Die Konfiguration von Steckplatz 1 und 2 funktionierte gut und setzte 9600 für 3DMark Fire Strike Extreme ein. (Niedrig, aber das wird mit zwei doppelt breiten Karten nebeneinander erwartet; sie werden sich gegenseitig überhitzen und thermisch drosseln, ohne dass ein starkes Flüssigkeits- oder Phasenwechselsystem vorhanden ist.)

Nachdem ich einige Tests in dieser Konfiguration durchgeführt hatte, steckte ich die Karten wieder in 1 und 3. Jetzt funktioniert alles über ein Dutzend Stiefel richtig. Das System setzt jetzt 10800 auf FSE.

Ich kann nicht für mein Leben herausfinden, was diesmal möglicherweise anders ist als bei einem halben Dutzend Mal, wenn ich die Karten zuvor erneut eingesetzt habe. Führe diese Konfiguration für ein paar Tage weiter aus und schließe meine Frage als "durch Goblins verursacht" aus, wenn ich die Fehlerbedingung nicht erneut reproduzieren kann.

1
Ich frage mich, ob Sie genug Strom haben, aber ich würde davon ausgehen, dass eine gute 1KW-Versorgung ausreichen sollte. Funktioniert eine einzelne Karte zuverlässig? Außerdem sprechen Sie speziell über Videokarten, es gibt andere PCIe-Karten. :) Journeyman Geek vor 8 Jahren 0
Theoretisch beträgt die maximale TDP der GPUs jeweils 165 W und die CPU 88 W. (Ich habe es in der Frage nicht erwähnt, aber es gibt eine SSD und zwei HHDDs im System sowie einen Blu-ray-Brenner, von denen keiner viel Strom verbrauchen sollte.) Nach vernünftigem Ermessen sollte ein 1-kW-Netzteil enorm sein die Leistungsanforderungen des Systems übersteigen, selbst wenn angenommen wurde, dass der Wirkungsgrad bei 60% liegt. Dan Story vor 8 Jahren 0
Ja, vielleicht habe ich noch ein paar Theorien, aber mit einer einzigen Grafikkarte zu testen, würde ich anfangen. Sie sollten wahrscheinlich genug Kraft für das, was Sie tun, haben, was dies ein bisschen neugieriger macht. Journeyman Geek vor 8 Jahren 0
@JourneymanGeek Aktualisierte Frage mit Ergebnissen von Einzelkartentests. Dan Story vor 8 Jahren 0
Nun, ich bin verblüfft. Versucht, eine Antwort zu posten, aber ich habe keine Ahnung, warum es jetzt funktioniert. Ich vermute mal, irgendwo war etwas los, und der Einzelkartentest stellte sicher, dass Sie es richtig verstanden haben;) Journeyman Geek vor 8 Jahren 0
Haben Sie das neueste BIOS installiert? Klingt für mich nach einem Bios-Problem. Moab vor 8 Jahren 0

1 Antwort auf die Frage

0
ClaireW

Sie haben auf jeden Fall einen bulligen Spielcomputer, aber ich würde immer noch das Netzteil vermuten - bestätigen Sie, dass Ihr Netzteil die empfohlene Wattleistung der 12-V-Schienen erfüllt oder übertrifft, und vergleichen Sie diese mit den Angaben der 980.

Sie haben Windows 8.1 erwähnt, also würde ich sagen, schauen Sie sich Ihre Protokolle an und sehen Sie, ob Sie weitere Informationen darüber erhalten können, warum Ihre Treiber nicht angezeigt werden.

Im Januar bin ich mit zwei 980-Geräten auf dieses Problem gestoßen, habe aber nicht weiter nachgeforscht, weil ich auf ein ASUS-Motherboard und ein älteres Thermaltake-Netzteil aufgerüstet habe und das Problem behoben wurde.