Linux-Medienbox / Mail-Server mit Dateisystem- / RAID-Fehlern, Kernelpaniken

613
dwf

In der letzten Woche hat der Mini-ITX-Computer, den ich selbst für Mail- und Samba-Freigaben erstellt habe, zwei Mal mit dem Dateisystem-Kernel in Panik geraten. Letzte Nacht habe ich Integritätsfehler beim Streaming eines Films an meinen Set-Top-Client (Video-Artefakte) festgestellt, also habe ich angefangen, herumzuspielen.

Sowohl die interne Festplatte als auch die externe Festplatte verwenden Linux-Software-RAID und auf beiden Spiegeln. Wenn ich eine md5sum für eine ziemlich große Datei wie ein Video mache, und dies wiederholt, bekomme ich jedes Mal eine andere Prüfsumme (das sollte ich beachten.) eine ist ext4, die andere ist JFS). Ich habe von einem USB-Stick in den Wiederherstellungsmodus gebootet, dasselbe passiert. Ich habe nicht versucht, den externen Spiegel auf einem anderen Computer auszulesen, aber ich habe eine der Festplatten installiert, und es schien gut zu gehen, zumindest gab es dort konsistente MD5-Summen.

Dateisysteme wurden also ausgeschlossen (dies geschieht sowohl auf ext4 als auch auf JFS), Festplatten sind wahrscheinlich außer Betrieb (es wäre ein unglaublicher Zufall), SATA-Controller sind wahrscheinlich auf zwei völlig unabhängigen Controllern, einem beschädigten Kernelmodul oder Etwas ist nicht zu sehen, da es auch beim Booten von der Rettungsdiskette läuft.

Die Tatsache, dass dies auf zwei getrennten Laufwerkssätzen geschieht, die von zwei separaten SATA-Controllern gesteuert werden und zwei unterschiedliche Dateisysteme ausführen, und das Verhalten beim Booten zweier unterschiedlicher Kernel bleibt meines Erachtens die einzige plausible Option, dass etwas furchtbar falsch ist Hauptplatine. Dieses Motherboard war bereits ein RMA-Ersatz von einem Unternehmen, dem ich nicht besonders vertraue (Zotac), daher wäre es weniger überraschend als üblich.

Dies ist Ubuntu Server 10.04, übrigens 64-Bit, auf einem Zotac-Motherboard IONITX-C (glaube ich) mit einem Atom N230.

Hat jemand andere Ideen, Diagnosen, die ich durchführen sollte usw.?

EDIT: Zwei Dinge, die ich vergessen habe zu erwähnen: Beim Booten des USB-Sticks habe ich fsck auf beiden MD-Geräten ziemlich oft ausgeführt.

So sehen die Paniken aus:

Linux-Medienbox / Mail-Server mit Dateisystem- / RAID-Fehlern, Kernelpaniken

Ich habe versucht, einige davon ohne viel Erfolg bei Google zu suchen. Ich glaube jedoch, dass die Hardware ohnehin daran schuld ist. Ich weiß nur nicht, welche spezifisches Stück von Hardware.

BEARBEITEN 2: Nur Memtest86 ausgeführt, und kein einziger Test ist bestanden. Die niedrigstwertigen 2 Bytes des Testmusters scheinen immer falsch gelesen zu werden. Immer noch nicht sicher, ob es sich um RAM oder Chipset handelt, und ich habe keinen zusätzlichen RAM-Speicher zum Testen.

3
Haben Sie die Partitionen überprüft, als Sie das USB-Gerät gestartet haben? matthias krull vor 13 Jahren 0
Ja, mehrmals. Es ging ihnen gut. dwf vor 13 Jahren 0

1 Antwort auf die Frage

1
gkrash

Mein Votum ist, dass der RAM schlecht läuft oder möglicherweise etwas auf dem Chipsatz ist. Kannst du den RAM mit bekanntem guten RAM austauschen und sehen, wie es geht? - (Die meisten modernen Linux-Versionen haben eine "memtest" -Option auf der Installationsdiskette, die Sie ausprobieren können, wenn Sie keinen guten RAM kennen, der herumliegt, obwohl ich empfehle, guten RAM als besseren Test zu verwenden.

Danke, dass Sie mich daran erinnert haben. Ich werde auf jeden Fall memtest86 ausführen, wenn ich nach Hause komme. dwf vor 13 Jahren 0
Es stellt sich heraus, dass einer der RAM-Sticks defekt ist, der andere ist in Ordnung. Ich habe eine RMA-Anfrage eingereicht. Vielen Dank! dwf vor 13 Jahren 0