PBS-Stapeljobs - der Befehl qalter

1298
Ryan Budney

Ich habe eine riesige Berechnung auf einem Scientific Linux-Cluster. Momentan habe ich über 600 Jobs in der Warteschlange geparkt, die auf Prozessorzeit warten, während einige ausgeführt werden.

Ich versuche, den Befehl qalter für einige inaktive, aber geplante Jobs zu verwenden. Ich möchte sie zu einem späteren Zeitpunkt einplanen, damit andere Benutzer einen Teil der Warteschlange springen können, gewissermaßen als Höflichkeitsakt. Ist das machbar?

Zum Beispiel befindet sich JOBNAME 292399derzeit im Leerlauf. Es ist geplant, ausgeführt zu werden, wenn sich eine Stelle in der Warteschlange öffnet.

Aber wenn ich qalter -a 10051000 292398gefolgt qrerun 292398bin, bekomme ich qrerun: Request invalid for state of job 292398.euler.

Aus der Qalter-Dokumentation habe ich gedacht, 10051000 bezieht sich auf morgen (5. Oktober, 10 Uhr), aber vielleicht missverstehe ich etwas?

Wenn ich das falsch mache, lass es mich wissen. Die wichtigste Sache, nach der ich suche, ist ein Befehl, der leicht skriptfähig ist, sodass ich ihn modifizieren kann, wenn meine in der Warteschlange befindlichen Aufgaben ausgeführt werden. qalter scheint gut für diese Zwecke zu sein, wenn ich es zum Laufen bringen kann. Ich würde es lieber vermeiden, qdel auszuführen und die Berechnungen neu zu berechnen, da es ein Problem bei der Buchhaltung gibt, welche Aufgaben neu gestartet werden müssen (gegenüber welchen nicht). Ich möchte diese Art der Buchhaltung vermeiden.

Beim Googeln bemerkte ich, dass einige Qalter-Befehle unterschiedliche Datumsformate haben, aber das obige scheint richtig zu sein, soweit ich es aus den man docs entnehmen kann.

Jede Hilfe wäre dankbar.

1

1 Antwort auf die Frage

2
bwDraco

Verwenden Sie qholddiese Option, um einen Job anzuhalten. Wenn Sie bereit sind, qrlsden Job auszuführen, verwenden Sie, um den Job freizugeben. Sie können dazu einfach ein Cron-Skript erstellen.

Weitere Informationen finden Sie im PBS Professional-Benutzerhandbuch und im TORQUE-Administratorhandbuch ( TORQUE ist größtenteils mit PBS kompatibel ).

Bearbeiten: Sie können auch verwenden qalter -a, aber nicht verwenden qrerun: Der Job wird nicht ausgeführt und kann erst nach dem im qalter -aBefehl angegebenen Datum und der Uhrzeit ausgeführt werden. qrerunDaher wird ein Fehler zurückgegeben.

Großartig, danke. qhold + qrls hat den Job gemacht. Ryan Budney vor 11 Jahren 0