Neue Fragen mit dem Tag «slurm»
Insgesamt gefunden 8 Fragen
0
Bewertungen
1
Antwort
528
Ansichten
Einen SLURM-Zombie-Job beenden
Beim ersten Herunterfahren des für mich zuständigen Abteilungsclusters ist das folgende Problem aufgetreten. Das System führt SLURM 17.11 aus und verwendet MariaDB / SQL zum Speichern von Abrechnungsdaten. Um ein Speicherupgrade durchzuführen, musste ich den Steuerungs- und Datenbankserver des Clust...
fragte Nox vor 5 Jahren
0
Bewertungen
0
Antworten
470
Ansichten
Ansys RSM mit SLURM-Cluster
Ich versuche, Ansys Remote Solver Manager (RSM) auf einem Windows-PC mit einem SLURM-Cluster zu verbinden. Anscheinend muss man eine hpc_commands.xmlDatei hinzufügen / bearbeiten, um die clientseitige Integration zu konfigurieren. Aber ich kämpfe mit meiner XML-Datei. Wie soll ich es schreiben?
fragte Anatol vor 5 Jahren
0
Bewertungen
0
Antworten
395
Ansichten
Wie verwende ich SLURMs --dependency = expand:<jobid> korrekt </jobid>
Ich habe einen Slurm-Job von 5 abgeschlossen, der 19 Stunden gelaufen ist, und ich habe Bedenken, dass er die Wandzeit erreicht, bevor er fertig ist. Ich bin nicht der Administrator und es ist das Wochenende, also möchte ich diese Funktion ausprobieren, die ich kürzlich in diesem Beispiel entdeckt h...
fragte hepcat72 vor 5 Jahren
1
Bewertungen
0
Antworten
497
Ansichten
Slurm-Initialisierung fehlgeschlagen
Ich versuche, Slurm in einem Himbeer-Cluster mit Raspbian 9.4 einzurichten. Ich kann slurmctld starten, aber wenn ich slurmd starten möchte, erhalte ich folgende Ausgabe: pi@node1:~ $ slurmd -Dvvvc slurmd: debug: Log file re-opened slurmd: error: Domain socket directory /SHARED/slurm/var/slurmd.node...
fragte Bub Espinja vor 6 Jahren
1
Bewertungen
1
Antwort
623
Ansichten
Ansys Remote Solver mit SLURM-Cluster
Ich versuche, Ansys unter CentOS 7 zu verbinden, um unseren HPC-Cluster zu verwenden, der SLURM als Scheduler verwendet. Ich habe mir alle Konfigurationsdateien angesehen, die ich mir vorstellen konnte. Ich habe sogar meine eigene hps_commands_SLURM.xmlDatei geschrieben, die Fehlermeldung wird angez...
fragte Shahan M vor 6 Jahren
0
Bewertungen
1
Antwort
386
Ansichten
Slurm erlaubt Authentifizierung ohne Zuordnung
Ich verwende slurm mit munge. Außer auf einem Knoten funktionieren alle anderen gut. Auf einem Knoten ist es jedoch auch ohne gültige Zuordnung möglich, ssh darauf zu setzen. Ich habe die sshd- und system-auth-Datei überprüft. Sie sind auf allen Knoten genau gleich. Ich habe bestätigt, dass Munge di...
fragte knightrider vor 7 Jahren
1
Bewertungen
1
Antwort
719
Ansichten
SLURM-Konfiguration: cons_res mit CR_Core kann keine Ressourcen zuordnen oder Jobs werden im CG-Status angezeigt
Ich bin neu bei SLURM. Ich versuche, den Slurm in einem neuen Cluster zu konfigurieren. Ich habe 4 Knoten mit jeweils 14 Kernen. Ich wollte Knoten so teilen, dass jeder Kern unabhängig laufen kann (dh Knoten01 kann 14 unabhängige serielle Aufträge gleichzeitig ausführen), aber kein Kern sollte mehr...
fragte Somesh vor 7 Jahren
1
Bewertungen
0
Antworten
554
Ansichten
Doppeleinträge für den Befehl "slurm sacct" entfernen: "extern"
Derzeit laufende Jobs zeigen zwei Einträge, von denen einer ein .externSuffix hat. Abgeschlossen (oder nicht) Jobs haben auch einen dritten Eintrag: .batch. Gibt es eine Möglichkeit, diese aus der sacctAusgabe zu entfernen (oder nicht anzuzeigen) ? Was sind diese Einträge?
fragte DilithiumMatrix vor 7 Jahren