Diferencias
Muestra las diferencias entre dos versiones de la página.
Ambos lados, revisión anteriorRevisión previaPróxima revisión | Revisión previa | ||
es:centro:servizos:hpc [2022/09/08 16:56] – fernando.guillen | es:centro:servizos:hpc [2024/10/08 09:56] (actual) – [CONDA] jorge.suarez | ||
---|---|---|---|
Línea 24: | Línea 24: | ||
Para acceder al clúster, hay que solicitarlo previamente a través de [[https:// | Para acceder al clúster, hay que solicitarlo previamente a través de [[https:// | ||
- | El acceso se realiza mediante una conexión SSH al nodo de login: | + | El acceso se realiza mediante una conexión SSH al nodo de login (172.16.242.211): |
<code bash> | <code bash> | ||
ssh < | ssh < | ||
Línea 110: | Línea 110: | ||
* Python 3.6.8 | * Python 3.6.8 | ||
* Perl 5.26.3 | * Perl 5.26.3 | ||
+ | En los nodos con GPU, además: | ||
+ | * nVidia Driver 510.47.03 | ||
+ | * CUDA 11.6 | ||
+ | * libcudnn 8.7 | ||
Para usar cualquier otro software no instalado en el sistema u otra versión del mismo hay tres opciones: | Para usar cualquier otro software no instalado en el sistema u otra versión del mismo hay tres opciones: | ||
Línea 142: | Línea 146: | ||
=== uDocker ==== | === uDocker ==== | ||
[[ https:// | [[ https:// | ||
- | uDocker | + | udocker |
<code bash> | <code bash> | ||
ml uDocker | ml uDocker | ||
Línea 157: | Línea 161: | ||
<code bash> | <code bash> | ||
# Obtener miniconda | # Obtener miniconda | ||
- | wget https:// | + | wget https:// |
# Instalarlo | # Instalarlo | ||
- | sh Miniconda3-py39_4.11.0-Linux-x86_64.sh | + | bash Miniconda3-latest-Linux-x86_64.sh |
+ | # Inicializar miniconda para el shell bash | ||
+ | ~/ | ||
</ | </ | ||
Línea 167: | Línea 173: | ||
== Recursos disponibles == | == Recursos disponibles == | ||
<code bash> | <code bash> | ||
+ | hpc-login2 ~]# ver_estado.sh | ||
+ | ============================================================================================================= | ||
+ | NODO | ||
+ | ============================================================================================================= | ||
+ | | ||
+ | | ||
+ | | ||
+ | | ||
+ | | ||
+ | | ||
+ | | ||
+ | | ||
+ | | ||
+ | | ||
+ | | ||
+ | | ||
+ | | ||
+ | | ||
+ | ============================================================================================================= | ||
+ | TOTALES: [Cores : 3/688] [Mem(MB): 270000/ | ||
+ | |||
hpc-login2 ~]$ sinfo -e -o " | hpc-login2 ~]$ sinfo -e -o " | ||
# Hay un alias para este comando: | # Hay un alias para este comando: | ||
Línea 238: | Línea 265: | ||
# Hay un alias que muestra solo la información más relevante: | # Hay un alias que muestra solo la información más relevante: | ||
hpc-login2 ~]$ ver_colas | hpc-login2 ~]$ ver_colas | ||
- | Name | + | Name Priority |
- | ---------- | + | ---------- |
- | | + | |
- | interactive | + | interactive |
- | urgent | + | urgent |
- | long 100 DenyOnLimit | + | long |
- | | + | |
- | | + | |
+ | | ||
</ | </ | ||
# Priority: es la prioridad relativa de cada cola. \\ | # Priority: es la prioridad relativa de cada cola. \\ | ||
Línea 258: | Línea 286: | ||
==== Envío de un trabajo al sistema de colas ==== | ==== Envío de un trabajo al sistema de colas ==== | ||
== Especificación de recursos == | == Especificación de recursos == | ||
- | Por defecto, si se envía un trabajo sin especificar nada el sistema lo envia a la QOS por defecto (regular) y le asigna un nodo, una CPU y toda la memoria disponible. El límite de tiempo para la ejecución del trabajo es el de la cola (4 días y 4 horas). | + | Por defecto, si se envía un trabajo sin especificar nada el sistema lo envía |
Esto es muy ineficiente, | Esto es muy ineficiente, | ||
- %%El número de nodos (-N o --nodes), tareas (-n o --ntasks) y/o CPU por tarea (-c o --cpus-per-task).%% | - %%El número de nodos (-N o --nodes), tareas (-n o --ntasks) y/o CPU por tarea (-c o --cpus-per-task).%% | ||
Línea 326: | Línea 354: | ||
# Obtener acceso interactivo a un nodo (Pulsar Ctrl+D para terminar el acceso): | # Obtener acceso interactivo a un nodo (Pulsar Ctrl+D para terminar el acceso): | ||
hpc-login2 ~]$ salloc -N1 | hpc-login2 ~]$ salloc -N1 | ||
+ | # Obtener acceso interactivo a un nodo de forma EXCLUSIVA | ||
+ | hpc-login2 ~]$ salloc -N1 --exclusive | ||
</ | </ | ||
3. SRUN \\ | 3. SRUN \\ | ||
Línea 410: | Línea 440: | ||
JOBID PARTITION | JOBID PARTITION | ||
6547 defaultPa | 6547 defaultPa | ||
+ | |||
+ | ## Ver estado de uso de las colas del cluster: | ||
+ | hpc-login2 ~]$ estado_colas.sh | ||
+ | JOBS PER USER: | ||
+ | -------------- | ||
+ | | ||
+ | | ||
+ | |||
+ | JOBS PER QOS: | ||
+ | -------------- | ||
+ | | ||
+ | long: 1 | ||
+ | |||
+ | JOBS PER STATE: | ||
+ | -------------- | ||
+ | | ||
+ | | ||
+ | ========================================== | ||
+ | Total JOBS in cluster: | ||
</ | </ | ||
Estados (STATE) más comunes de un trabajo: | Estados (STATE) más comunes de un trabajo: |