Die Vergabe von Ressourcen des Clusters für parallele Anwendungen
wird über die "Load Sharing Facility" LSF der Firma Platform gesteuert.
Anwendungen werden den Warteschlangen von LSF mit dem bsub-Kommando
übergeben. LSF teilt der Anwendung die angeforderten Ressourcen unter
Berücksichtigung einer möglichst guten Auslastung des Clusters und
einer möglichst gerechten Erfüllung aller anstehenden Anforderungen
zu.
Zur Zeit ist im LSF eine Warteschlange gwdg-pcpar für alle Anwendungen definiert. Weitere Warteschlangen können konfiguriert werden, falls sich dies für eine Verbesserung des Betriebs erforderlich erweist.
Die Grenzwerte für mögliche Anforderungen der Warteschlangen sind in der folgenden Tabelle zusammengestellt
Name der Warteschlange |
Verweilzeit maximal |
Verweilzeit default |
Prozessorzahl maximal |
Speicher maximal |
Speicher default |
gwdg-pcpar | 48 h | 1 h | 108 | 2 GB | 100 MB |
Maximal werden zwei MPI-Prozesse pro Knoten gestartet, so dass eine
Anwendung, die 2n MPI-Tasks anfordert, im Normalfall exklusiv auf n
Knoten bearbeitet wird. Wenn die Knoten exklusiv mit nur einem MPI-Task
genutzt werden sollen, kann die exklusive Nutzung der Knoten durch die
Option -x beim Abschicken des Jobs in die
Warteschlange verlangt werden. Dies ist
nur dann sinnvoll, wenn innerhalb eines MPI-Tasks zwei parallele
Threads
gestartet werden sollen, so dass beide Prozessoren in den Knoten
genutzt werden.
Die GWDG stellt ein Skript mpirun zur Verfügung, das das bsub-Kommando für einzelne parallele Anwendungen mit den notwendigen Optionen generiert. Das oben angegebene Beispiel kann mit folgendem Aufruf von mpirun erzeugt werden:
mpirun -lsf
-np 16 –npn 1 -M 1000000 -W 48:00 –x a.out
Eine vollständige Übersicht der für mpirun möglichen Optionen wird mit mpirun
–h
angezeigt:
ohaan@gwdu102>
mpirun
ATTENTION:
This
command is a wrapper to the LSF queueing system (uScw
if
you want to use the SCALI mpirun, type /opt/scali/bin/mpirun
Usage
:
mpirun
<params> <mpimon-params> <progname> [options...]
-lsf
: Submit job to LSF queueing system,
: default output file is
o.<jobid>
-lsfparams <"params"> : Specify
further LSF bsub parameters (except -R,
: -n,-x,-M,-W) for more details
on LSF options: man bsub
-np <np>
: Total number of processes, default 2
-npn
<npn> : Number of processes
pr.
node, default 2
-q
: quiet, no mpimon printout
-s
: mpimon statistics output
-t
: test mode, no mpi program
started
-v
: Verbose
-x :
use resources exclusivly
-M <mmm>
: set memory limit (in KB)
-W
<HH:MM> : set wallclock time
limit (Hours:Minutes)
-h|-?
: this output
Die Ausgabe von mpirun wird im Arbeitsverzeicnis in die Datei o.%J (%J steht für die Auftragsnummer des mit mpirun erzeugten LSF-Jobs) geschrieben. Ein davon abweichender Name der Ausgabdatei kann mit der Optioin –lsfparams "-o <Name>" erzeugt werden.
Ohne die Option –lsf läuft das mit mpirun gestartete Programm interaktiv, wenn LSF die benötigten Ressourcen bereitstellen kann, andernfalls bricht das Kommando ab.
In der der einfachsten Form kann eine parallele
Anwendung also
z. B. mit
gestartet werden.