Slurm (formerly known as Simple Linux Utility for Resource Management) es el gestor de tareas y recursos del clúster, es uno de los sistemas más elegidos por la mayoría de las supercomputadoras modernas (ver Top500). Slurm permitirá que cada usuario/a envie scripts a la fila de ejecución, donde se le asignará un número (JOB_ID) por orden de llegada, similar a cuando le dan un número para hacer fila en la caja del banco o la farmacia. Una vez que llegue su turno, slurm le asignará los recursos disponibles del clúster a su trabajo y lo ejecutará. Este sistema permite que entre todos podamos compartir los recursos del cluster de una manera equitativa mediante el principio de fair-share.
Teniendo en cuenta lo antedicho, slurm podrá comenzar a correr su trabajo (Status RUNNING) o dejarlo en espera (Status PENDING) hasta que los recursos estén disponibles en caso que ya hayan sido reservados por otro usuario/a.
Cuando envie su script a slurm puede desconectarse del clúster ya que el trabajo quedará en manos del gestor de tareas.
Por otra parte, si ejecuta un comando directamente por línea de comandos y usted no envía su trabajo a slurm, su experimento se detendrá antes de finalizar (si se corta internet o si apaga su computadora).
Como regla general, si su experimento precisa más de unos pocos minutos para terminar, no lo ejecute directamente por línea de comandos, escriba un script y utilice slurm para administrar su ejecución.