Táboa de Contidos

Servidores de computación GPGPU

Descripción del servicio

Servidores con gráficas de acceso libre

Servidores con gráficas de acceso restringido

Alta en el servicio

No todos los servidores están disponibles en todo momento para cualquier uso. Para acceder a los servidores hay que solicitarlo previamente a través del formulario de incidencias. Los usuarios que no tengan permiso de acceso recibirán un mensaje de contraseña incorrecta.

Manual de usuario

Conexión con los servidores

Para conectarse a los servidores, debes hacerlo usando SSH. El nombre y las direcciones IP de los servidores son las siguientes:

La conexión solo es posible desde el interior de la red del centro. Para conectarse desde otras localizaciones o desde la red RAI es necesario hacer uso de la VPN o de la parasela SSH.

Apagado/encendido de los equipos

Los servidores se apagan para ahorrar energía si no detectan ninguna actividad durante una hora. Para encenderlos de nuevo, puedes hacer uso de la herramienta de encendido remoto.

Los servidores entienden como actividad:

Gestión de los trabajos con SLURM

En los servidores en los que hay un gestor de colas es obligatorio usarlo para enviar trabajos y así evitar los conflictos entre procesos, ya que no debe haber dos trabajos en ejecución al mismo tiempo.

Para enviar un trabajo a la cola se usa el comando srun:

srun programa_cuda argumentos_programa_cuda

El proceso srun espera a que el trabajo se ejecute para devolver el control al usuario. Si no se quiere esperar, se pueden usar gestores de sesiones de consola como “screen” para poder dejar el trabajo en espera y desconectar la sesión sin preocuparse y recuperar la salida de la consola más adelante.

Alternativamente, se puede utilizar nohup y pasar el trabajo a segundo plano con &. En este caso la salida se guarda en el archivo nohup.out:

nohup srun programa_cuda argumentos_programa_cuda &

Para ver el estado de la cola se utiliza el comando squeue. El comando muestra una salida similar a esta:

JOBID PARTITION     NAME     USER  ST       TIME  NODES NODELIST(REASON)
9  servidore ca_water pablo.qu    PD       0:00      1 (Resources)
10 servidore ca_water pablo.qu    PD       0:00      1 (Priority)
11 servidore ca_water pablo.qu    PD       0:00      1 (Priority)
12 servidore ca_water pablo.qu    PD       0:00      1 (Priority)
13 servidore ca_water pablo.qu    PD       0:00      1 (Priority)
14 servidore ca_water pablo.qu    PD       0:00      1 (Priority)
 8 servidore ca_water pablo.qu     R       0:11      1 ctgpgpu2

También puede obtenerse una vista interactiva, actualizada cada segundo, con el comando “smap”:

smap -i 1