xfs_repair steckt fest - sicher, es zu töten?

866
Michael Stauffer

Centos 6,9

Ich hatte also zwei 40-TB-Volumes ausfallen lassen, zumindest nominell, nachdem ich den Raid umkonfiguriert hatte, zu dem sie gehören. Die Raid-Volumes sind in Ordnung, aber beim Mounten meldete einer, dass "Superblock nicht gelesen werden kann", der andere "falsche Fs-Art, schlechte Option, schlechter Superblock".

Ich habe dann den Fehler begangen, xfs_repair gleichzeitig auf beiden auszuführen (sie befinden sich auf demselben Dateiserver), was ich jetzt verstand, um Speicherprobleme zu bitten. Der Dateiserver verfügt über 64 GB RAM mit halb so viel Swap. Der Server hatte also keinen Speicher mehr und einer der xfs_repair-Prozesse wurde beendet. Jetzt läuft der zweite immer noch, aber er hängt jetzt lange Zeit ohne Fortschritt und 0% CPU-Auslastung.

Ich denke, ich muss den xfs_repair-Prozess stoppen, aber das macht mich nervös. Gibt es noch etwas, was ich versuchen könnte?

Was das andere Volume betrifft, das gerade repariert wurde und dessen Prozess beendet wurde, habe ich versucht, es zu montieren, und es wird jetzt ordnungsgemäß montiert.

Danke für jeden Rat.

1

1 Antwort auf die Frage

1
Itai

Im Allgemeinen ist es nicht sicher, einen Prozess abzubrechen, der eine Manipulation auf niedriger Ebene durchführt. In Ihrem Fall haben Sie jedoch ein Sicherheitsnetz, da das andere Laufwerk funktioniert.

Angenommen, es handelt sich um zwei Volumes, die als RAID 1 eingerichtet wurden, können Sie das funktionsfähige Volume (nur zur zusätzlichen Sicherheit) abmontieren, den Prozess xfs_repair abbrechen und den Status des unterbrochenen Volumes bewerten. Anschließend wird das gute Volume wiederhergestellt (zuvor deaktiviert). wenn es nicht funktioniert.

Da der Prozess bei 0% liegt, ist er wahrscheinlich blockiert, was bedeutet, dass er abgebrochen werden muss. Dies wäre auch der Fall, wenn er sicher wäre oder nicht. Ein Herunterfahren oder Neustart würde dies sowieso implizit töten, also schlage ich vor, dass Sie es selbst machen und mehr Kontrolle darüber haben, was passiert. Wenn etwas Schlimmes passiert, ist es wahrscheinlich schon geschehen oder war unvermeidlich.

Danke für die Bestätigung meiner Gedanken. Ich habe den Prozess abgebrochen und das Volumen steigt jetzt sauber an. Xfs_check sieht jedoch einige Fehler, so dass ich xfs_repair ein Volume nach dem anderen erneut ausführen und die Speicherbelegung begrenzen werde. Michael Stauffer vor 6 Jahren 0