Wie entferne ich vorübergehend einen Knoten von der SGE (Sun Grid Engine)?

7792
David B

Ich habe Probleme mit einem bestimmten Knoten. Bis ich das Problem gelöst habe, möchte ich nicht, dass Jobs auf ii ausgeführt werden. Wie kann ich diesen Knoten vorübergehend aus dem "Pool" der Knoten entfernen?

5

3 Antworten auf die Frage

6
user322498

Etwas deaktivieren:

qmod -d *@node_name 

Um wieder zu aktivieren:

qmod -e *@node_name 
Warum ist das downvoted? Albert vor 9 Jahren 0
Als Ratschlag hatte ich ein Problem damit, Namen von Platzhalter-Warteschlangen zur Arbeit zu bekommen. Ich ließ ein `qstat -f` laufen, bekam die Warteschlange auf dem Host, den ich deaktivieren wollte, und benutzte das als Argument nach ** - d ** in` qmod -d` Devin vor 8 Jahren 0
1
Daniel Templeton

Wenn Sie 6.1 oder besser verwenden, ist hier der beste Weg. Erstellen Sie eine neue Hostgruppe mit dem Namen@disabled

qconf -ahgrp @disabled 

Erstellen Sie ein neues Ressourcenkontingent mit

qconf -arqs limit hosts @disabled to slots=0 

Um einen Host zu deaktivieren, fügen Sie ihn einfach der Hostgruppe hinzu

qconf -aattr hostgroup hostlist MYHOST @disabled 

Um den Host wieder zu aktivieren, entfernen Sie ihn aus der Hostgruppe

qconf -dattr hostgroup hostlist MYHOST @disabled 

Durch diesen Prozess wird verhindert, dass neue Jobs auf dem Computer geplant werden, und die aktuell ausgeführten Jobs können abgeschlossen werden.

Das scheint nicht zu funktionieren. Jobs werden immer noch zur Problematik ausgeführt. Was kann hier schief gehen? Ich kann sehen, dass es zu @disbaled hinzugefügt wurde (unter Verwendung von qconf -mhgrp @disabled), und ich habe das Quotenset aktiviert. David B vor 13 Jahren 0
Im Übrigen sieht das Ressourcenkontingentsatz folgendermaßen aus: `` David B vor 13 Jahren 0
Übrigens hat dies funktioniert: ` auf slot = 0} einschränken`, also hat es etwas mit @disabled zu tun. David B vor 13 Jahren 0
0
Tok

Ohne Ihre SGE-Version zu kennen, kann ich nicht mit Sicherheit sagen, dass dies das gewünschte Ergebnis erzielt, jedoch qconf -de fooden Ausführungs-Host foo löscht . qconf -ae fooDer Host foo wird dann wieder zur Ausführungsliste hinzugefügt .

Das scheint auch nicht zu funktionieren. Jobs werden immer noch auf dem problematischen Knoten ausgeführt. David B vor 13 Jahren 0
@David B - Nach dem Entfernen des Hosts zeigt `qconf -s` immer noch den Host? Tok vor 13 Jahren 0