Datenträger-E / A-Fehler diagnostizieren, Plattencontroller ausfallen

3012
Nicholas Masters

Mein PC ist in letzter Zeit ständig mit Festplattenfehlern abgestürzt, und ich versuche, die Ursache zu ermitteln, bevor ich neue Teile bestelle.

Ich habe Windows 7 auf einem SSD-Server (mit Truecrypt) installiert, und ich habe angefangen, BSODs zu erhalten, die sich auf die Festplatte beziehen. Ich kann in Windows booten, aber es stürzt innerhalb weniger Minuten ab, eher wenn ich versuche, Dinge zu tun, die auf die Festplatte schreiben, z. B. die Installation eines Programms.

Ich glaube, meine Festplatte sei gestorben (möglicherweise aufgrund von ssd + truecrypt). Ich habe mir eine von einem Freund geliehen, aber ich kann Windows oder Ubuntu aufgrund ähnlicher Probleme (Festplatten-E / A-Fehler) nicht auf dieser Festplatte installieren. (Ich habe dabei alle anderen Laufwerke usw. getrennt.)

Während der Installation von Windows können die Dateien während der Erweiterungsphase nicht überprüft werden.

Während der Installation von ubuntu erhalte ich Fehler wie "", dass das Installationsprogramm einen Fehler beim Kopieren von Dateien auf die Festplatte festgestellt hat. Fehler 5 Eingabe / Ausgabe Fehler ""

Live Ubuntu scheint ohne Probleme zu funktionieren. Wenn ich jedoch versuche, Ubuntu auf diese Weise auf der Festplatte zu installieren, wird die Installation nicht bestätigt (die Datei wird jedes Mal anders). Während des Laufens cat /dev/urandom > /dev/nullist alles in Ordnung, jedoch cat /dev/urandom > /dev/sdaverursacht Ubuntu innerhalb weniger Minuten (keine Fehlermeldungen).

Ich habe jeden RAM-Stick beim Booten in Windows für sich alleine ausprobiert, was dazu führt, dass er öfter abstürzt.

Ich habe versucht, den CMOS über die verschiedenen SATA-Ports (8) und die SATA-Kabel zurückzusetzen.

Mein Motherboard verfügt über zwei verschiedene Festplattencontroller, einen Intel-Controller und einen Marvel-Controller, und beide scheinen dieses Problem zu haben.

Ich habe von Problemen mit meinem Motherboard-Chipsatz (p67) und den 3-Gbit / s-Sata-Ports gehört, aber ich habe auch Probleme mit den 6-Gbit / s, daher glaube ich nicht, dass dies ein verwandtes Problem ist.

Meine PC-Spezifikationen sind:
MSI P67A-GD65 Intel P67 (REV B3)
Intel 2500k
8gb Basham
BeQuiet! 650W PSU
Samsung 840 SSD (mein)
OCZ SSD (Freund)

Hört sich das an wie ein kaputtes Motherboard? Was kann ich noch tun, um das Problem zu diagnostizieren? Warum sollte es auch häufiger zu Abstürzen kommen, wenn ein Stößel entfernt wird?

Edit: Danke für die Kommentare. Ich habe vergessen zu erwähnen, dass ich das Windows-Memtest ausgeführt habe, das bestanden hat. Ich habe memtest86 jetzt heruntergeladen und es läuft derzeit. Ich werde es erneut aktualisieren, sobald es fertig ist. Außerdem ließ ich den PC cat /dev/urandom > /dev/nulleinige Stunden laufen, und nichts geschah. Umgestellt cat /dev/urandom > /dev/sdaund das Ganze in weniger als 5 Minuten eingesperrt.

Edit: Obwohl Windows Speichertest sagte, dass es keine Fehler gab, fand memtest86 ~ 200k auf einem RAM-Modul, aber 0 auf dem anderen. Ich habe das fehlerhafte Modul entfernt und Ubuntu und dann Windows auf der ssd meines Freundes installiert und es scheint so weit zu funktionieren. Ich kann immer noch nicht in meine eigene SSD booten, es ist nur bsods. Aber ich denke, dass das ursprüngliche bsoding Schreibfehler auf der SSD verursacht haben muss, was dies verursacht hat. Hoffentlich kann ich meine SSD einbinden und die Daten wiederherstellen. Ich glaube, meine Raid-Konfiguration hat während dieses gesamten Prozesses möglicherweise auch etwas Schaden genommen, also hoffentlich erholt sie sich. Gibt es etwas, das ich bei der Wiederherstellung dieser Festplatten beachten sollte?

Ich wähle eine Antwort, sobald ich sicher bin, dass das fehlerhafte RAM-Modul das einzige Problem war.

Edit: Ja, es scheint, als wäre der RAM das einzige Problem gewesen, das die E / A-Probleme verursacht hat. Danke für die Hilfe!

2
@ Moab sagte er, er habe verschiedene SATA-Kabel ausprobiert. Nicholas, führe zuerst memtest86 + aus, um das auszuschließen. Stellen Sie außerdem sicher, dass der Prozessor nicht überhitzt und der Kühlkörper / Lüfter ordnungsgemäß installiert ist. Bigbio2002 vor 8 Jahren 1

1 Antwort auf die Frage

1
qasdfdsaq

Sie müssen zuerst explizit einen Speichertest ausführen. Verwenden Sie dazu entweder den integrierten Speichertester von Windows oder idealerweise memtest86 +, wie von Bigbio2002 vorgeschlagen.

Das klingt nach einem Speicherproblem von Anfang bis Ende und abgesehen von CPU und MB. Dies ist auch das einzige, was Sie nicht ausgeschlossen haben. Wenn Sie Ihr System weiterhin mit fehlerhaftem Speicher verwenden, kann dies zu einer Verschlechterung der Daten auf Ihren Festplatten führen.

Wenn Sie den Speicher nicht ausschließen, sind die verbleibenden Komponenten die CPU und die MB. Möglicherweise trägt das bekannte Problem mit SATA-Anschlüssen der Intel 6-Serie dazu bei - Sie haben möglicherweise zufällig Probleme mit den 6 Gbit / s aus anderen Gründen.

Ziemlich was ich raten würde - aber ich würde dringend memtest86 + empfehlen - auf eine CD schreiben, dann von der Festplatte booten und ausführen. CJM vor 8 Jahren 0
In 12 Minuten lief memtest86 und es heißt "Errors: 168921". Liegt dies eher an dem Speicher selbst oder an den Speichermodulen / Caches auf der Hauptplatine? Warum würde ein fehlerhafter RAM nur Probleme mit der Festplatte verursachen? Nicholas Masters vor 8 Jahren 0
@NicholasMasters: Weitaus wahrscheinlicher ist der Speicher, da moderne Motherboards keine Speichercaches und CPU-Caches alle über Parität und / oder ECC verfügen. Der Grund dafür ist möglicherweise, dass nur ein Teil des Speichers fehlerhaft ist und der Teil für den DMA vom Festplattentreiber verwendet wird. Kernel und Treiber-ASLR sind relativ begrenzt, so dass häufiger immer wieder dieselben Adressen verwendet werden und Speicherfehler tendenziell lokalisiert werden qasdfdsaq vor 8 Jahren 0
Prost auf die Info! Sie haben absolut Recht, da es nur Teil des fehlerhaften Speichers ist. Memtest86 + zeigte, dass eine der Speicheradressen durchweg falsch war und der Rest alles richtig war. Nicholas Masters vor 8 Jahren 0