Bei SLURM ist standardmäßig keine Ressourcennutzung zulässig. Wenn ein Job in einem Knoten ausgeführt wird, warten die restlichen Jobs auf ihren Abschluss, bevor weitere Jobs auf demselben Knoten ausgeführt werden.
SLURM muss für die gemeinsame Nutzung von Ressourcen konfiguriert werden. Dies sollte ziemlich einfach und gut dokumentiert sein.
Ein Beispiel dafür, was Sie in Ihre slurm.conf-Datei (normalerweise unter / etc / slurm) einfügen möchten, wäre:
SelectType=select/cons_res SelectTypeParameters= DefMemPerCPU=
Dies würde die gemeinsame Nutzung der Ressourcen eines Knotens mithilfe des con_res
Plugins ermöglichen.
Das select/con_res
Plugin erlaubt eine Vielzahl von Parametern (SelectTypeParameters). Die prominentesten sind unten aufgeführt (eine vollständige Liste der Parameter finden Sie auf der Manualpage von slurm.conf):
CR_CPU : CPUs sind die Verbrauchsressource.
CR_CPU_Memory : Fügt CR_CPU Speicher als Verbrauchsmaterial hinzu.
CR_Core-Kerne : Kerne sind die Verbrauchsressource.
CR_Core_Memory : Fügt dem CR_CPU_Memory Speicher als Verbrauchsmaterial hinzu.
Nachdem Sie den Typ der Ressource ausgewählt haben, den Sie als Verbrauchsmaterial in SLURM verwenden möchten, müssen Sie nur die Option shared=yes
zu Ihrer Standardwarteschlange hinzufügen und den Befehl scontrol reconfigure
in dem Knoten ausgeben, der als Controller verwendet wird.