Neue Fragen mit dem Tag «slurm»

Insgesamt gefunden 8 Fragen

0
Bewertungen
1
Antwort
491
Ansicht

Einen SLURM-Zombie-Job beenden

Beim ersten Herunterfahren des für mich zuständigen Abteilungsclusters ist das folgende Problem aufgetreten. Das System führt SLURM 17.11 aus und verwendet MariaDB / SQL zum Speichern von Abrechnungsdaten. Um ein Speicherupgrade durchzuführen, musste ich den Steuerungs- und Datenbankserver des Clust...

0
Bewertungen
0
Antworten
422
Ansichten

Ansys RSM mit SLURM-Cluster

Ich versuche, Ansys Remote Solver Manager (RSM) auf einem Windows-PC mit einem SLURM-Cluster zu verbinden. Anscheinend muss man eine hpc_commands.xmlDatei hinzufügen / bearbeiten, um die clientseitige Integration zu konfigurieren. Aber ich kämpfe mit meiner XML-Datei. Wie soll ich es schreiben?
fragte Anatol vor 5 Jahren

0
Bewertungen
0
Antworten
351
Ansicht

Wie verwende ich SLURMs --dependency = expand:<jobid> korrekt </jobid>

Ich habe einen Slurm-Job von 5 abgeschlossen, der 19 Stunden gelaufen ist, und ich habe Bedenken, dass er die Wandzeit erreicht, bevor er fertig ist. Ich bin nicht der Administrator und es ist das Wochenende, also möchte ich diese Funktion ausprobieren, die ich kürzlich in diesem Beispiel entdeckt h...
fragte hepcat72 vor 5 Jahren

1
Bewertungen
0
Antworten
462
Ansichten

Slurm-Initialisierung fehlgeschlagen

Ich versuche, Slurm in einem Himbeer-Cluster mit Raspbian 9.4 einzurichten. Ich kann slurmctld starten, aber wenn ich slurmd starten möchte, erhalte ich folgende Ausgabe: pi@node1:~ $ slurmd -Dvvvc slurmd: debug: Log file re-opened slurmd: error: Domain socket directory /SHARED/slurm/var/slurmd.node...
fragte Bub Espinja vor 5 Jahren

1
Bewertungen
1
Antwort
584
Ansichten

Ansys Remote Solver mit SLURM-Cluster

Ich versuche, Ansys unter CentOS 7 zu verbinden, um unseren HPC-Cluster zu verwenden, der SLURM als Scheduler verwendet. Ich habe mir alle Konfigurationsdateien angesehen, die ich mir vorstellen konnte. Ich habe sogar meine eigene hps_commands_SLURM.xmlDatei geschrieben, die Fehlermeldung wird angez...
fragte Shahan M vor 6 Jahren

0
Bewertungen
1
Antwort
354
Ansichten

Slurm erlaubt Authentifizierung ohne Zuordnung

Ich verwende slurm mit munge. Außer auf einem Knoten funktionieren alle anderen gut. Auf einem Knoten ist es jedoch auch ohne gültige Zuordnung möglich, ssh darauf zu setzen. Ich habe die sshd- und system-auth-Datei überprüft. Sie sind auf allen Knoten genau gleich. Ich habe bestätigt, dass Munge di...
fragte knightrider vor 6 Jahren

1
Bewertungen
1
Antwort
669
Ansichten

SLURM-Konfiguration: cons_res mit CR_Core kann keine Ressourcen zuordnen oder Jobs werden im CG-Status angezeigt

Ich bin neu bei SLURM. Ich versuche, den Slurm in einem neuen Cluster zu konfigurieren. Ich habe 4 Knoten mit jeweils 14 Kernen. Ich wollte Knoten so teilen, dass jeder Kern unabhängig laufen kann (dh Knoten01 kann 14 unabhängige serielle Aufträge gleichzeitig ausführen), aber kein Kern sollte mehr...
fragte Somesh vor 7 Jahren

1
Bewertungen
0
Antworten
505
Ansichten

Doppeleinträge für den Befehl "slurm sacct" entfernen: "extern"

Derzeit laufende Jobs zeigen zwei Einträge, von denen einer ein .externSuffix hat. Abgeschlossen (oder nicht) Jobs haben auch einen dritten Eintrag: .batch. Gibt es eine Möglichkeit, diese aus der sacctAusgabe zu entfernen (oder nicht anzuzeigen) ? Was sind diese Einträge?
fragte DilithiumMatrix vor 7 Jahren