El Patagón utiliza el sistema de accounts y qos de SLURM para manejar el uso de recursos de forma balanceada entre usuarios. Existen limites de recursos a nivel de usuario, como también a nivel de account. Un account agrupa un conjunto de usuarios de una misma institución/laboratorio/departamento, y cada account tiene un QOS asociado el cual establece limites en el uso de recursos. A continuación se presenta información de utilidad para conocer los limites actuales puestos en el Patagón.
sacctmgr list accountsacctmgr list user <user>sacctmgr list qossacctmgr list association where user=<user>Existen las siguientes particiones:
A100: Partición con 8x GPUs NVIDIA A100 y CPU Cores AMD Zen2. Ideal para trabajos de Inteligencia Artificial y HPC General. Para mas información ejecutar scontrol show partition A100.L40: Partición con 3x GPUs NVIDIA L40 y CPU Cores AMD Zen4. Ideal para trabajos generales y gráficos en precision FP32. Para mas información ejecutar scontrol show partition L40.A4000: Partición con 3x GPUs NVIDIA L40 y CPU Cores AMD Zen4. Ideal para trabajos generales y gráficos en precision FP32. Para mas información ejecutar scontrol show partition A4000.cpu: Partición con núcleos AMD Zen4. Ideal para trabajos de CPU paralelos. Para mas información ejecutar scontrol show partition cpu.Se definen los siguientes perfiles (QOS):
internal: accounts SLURM de la UACh.
MaxTRESPerUser=cpu=64,gres/gpu=8MaxTRESPerAccount=cpu=128,gres/gpu=16MaxJobsPerUser=4MaxSubmitJobsPerUser=4MaxJobsPerAccount=16MaxSubmitJobsPerAccount=20external: accounts SLURM externos a la UACh.
MaxTRESPerUser=cpu=64,gres/gpu=4MaxTRESPerAccount=cpu=128,gres/gpu=8MaxJobsPerUser=2 (ejecución)MaxSubmitJobsPerUser=2 (ejecución + encolados).MaxJobsPerAccount=16MaxSubmitJobsPerAccount=10temporal: grupo de investigación raíz del Patagón.
MaxJobsPerUser=8MaxSubmitJobsPerUser=8