Es klingt nach einer Rennbedingung oder einem Deadlock .
Dh: SW1 und SW2 müssen ein Kommunikationsprotokoll mit Anforderungen und Bestätigungen haben. Wenn dieses Protokoll nicht gut ausgelegt ist, kann es eine Race-Bedingung geben, bei der Pakete nicht in der richtigen Reihenfolge gesendet werden. SW1 wird gestapelt und wartet auf ein Paket von SW2, aber SW2 hat bereits in der Vergangenheit gesendet (und SW1 hat es verfehlt), und SW2 wird es nicht erneut senden und wird auf SW1 in einen Sperrzustand versetzt.
Wenn dies der Fall ist, hängt der Fehler von der Ausführungsgeschwindigkeit von SW1 und SW2 und weiter von der Auslastung der Server ab. Wenn beide Prozesse langsam ausgeführt werden, ist es schwieriger, dass SW1 das Paket von SW2 verfehlt, wodurch der Sperrstatus erstellt wird. Durch Ausführen des Systemmonitors wird das gesamte System etwas langsamer, was möglicherweise ausreicht, um dies zu erreichen.
Wenn für die verschiedenen Server der erste Server mehr ausgelastet ist als die anderen, dann funktioniert er.