Ich habe gesehen, wie NICs ihren Verstand verloren haben und billige Switches durch Jabbering (Senden eines endlosen Frames) oder durch Senden übermäßiger Low-Level-Ethernet-Flusssteuerungssignale blockieren. Leider können diese Art von MAC / PHY-Hardwarefehlern vom Ethernet-Treiber des Hosts unbemerkt bleiben, sodass in Ihren Protokollen nichts angezeigt wird. Unglücklicherweise ist auch die Tatsache, dass keiner dieser Fehler in einer typischen Schnüffelspur sichtbar ist, da die Flusssteuerungssignale nicht wirklich "Ethernet-Frames" sind, und beim Jabbering erfassen Sniffer im Allgemeinen nur Frames, die innerhalb der normalen Größengrenzen liegen.
Wenn dies das nächste Mal passiert, wäre es interessant zu sehen, ob das Problem dadurch behoben wird, dass einfach die Ethernet-Verbindung des Ubuntu-Servers zum Netzwerk getrennt wird. Wenn dies der Fall ist, tritt das Problem wieder auf, wenn Sie das Ethernet-Kabel wieder anschließen.
Das Löschen des Links reicht möglicherweise aus, um die Chips der Netzwerkkarte zurückzusetzen, um das Problem zu beheben. Wenn das Problem jedoch behoben wird, sobald Sie das Ethernet wieder anschließen, können Sie versuchen, das Ethernet-Kabel vom Ubuntu-Server direkt an einem Sniffer an das Ethernet anzuschließen Maschine (hoffentlich haben Sie eine Maschine mit Auto-MDI-X oder ein Crossover-Kabel zur Hand). Dann können Sie versuchen, Frames aufzunehmen. Wenn Sie Frames erfassen können, erhalten Sie möglicherweise einen Hinweis darauf, wo sich der Fehler mit der Netzwerkkarte, dem Treiber, dem Netzwerkstack oder einer anderen Netzwerkanwendung befindet.
Sie könnten auch auf andere Personen mit derselben Art von NIC (oder zumindest einen NIC-Chipsatz) wie Sie zugreifen, um zu sehen, ob andere das gleiche Problem haben. Natürlich ist es immer gut, sicherzustellen, dass Sie den neuesten Treiber für Ihre Karte haben.
Ist auf Ihrem Ubuntu-Server ohne Heads eine Grafikkarte vorhanden, oder können Sie eine temporäre einsetzen? Beim nächsten Mal könnten Sie ein Display, eine Tastatur und eine Maus anschließen und sehen, was Sie vor Ort auf dem Host lernen können . Ist der Host-Kernel in Panik geraten oder vollständig eingefroren oder werden die Netzwerk-E / A einfach abgespritzt? Wenn der Host grundsätzlich verwendbar ist (mit Ausnahme des Netzwerks), können Sie tcpdump oder Wireshark ausführen und sehen, was er über das Netzwerk zu tun glaubt.
Beachten Sie, dass Sie nicht einmal eine grafische Konsole verwenden müssen, um herauszufinden, was auf der Ubuntu Server-Box passiert. Wenn Ihr Computer beispielsweise über einen seriellen Anschluss verfügt (oder Sie können einen seriellen USB-Adapter anschließen), den Sie als seriellen Konsolenanschluss konfigurieren können, können Sie einen anderen Computer an diesen Port anschließen und sich von der Shell aus bewegen. Wenn Sie eine andere NIC haben, die Sie in diese Box einsetzen könnten, könnten Sie die andere NIC zu einem separaten isolierten Netzwerk wechseln, das Sie für SSH oder VNC in die Box verwenden können (wenn Sie davon ausgehen, dass nur die eine NIC verloren geht (nicht der gesamte Linux-Netzwerkstapel).
Ich würde vorschlagen, eine NIC mit höherer Qualität in Ihrem Server zu installieren, oder den wahrscheinlich zu Hause verwendeten Consumer-Switch durch etwas zu ersetzen, das ausreichend für Unternehmen ist, um die Ports abzutrennen, die das Netzwerk beeinträchtigen.
Update: Einige zusätzliche Vorschläge zur Diagnose / Fehlerbehebung wurden hinzugefügt. Wenn es sich jedoch um die Art von NIC-Hardwarefehlermodi handelt, an die ich denke, bezweifle ich, dass jemand viel Hoffnung hätte, dies zu debuggen, außer den Ingenieuren, die diesen NIC-Chipsatz entworfen haben.