Diferencias

Muestra las diferencias entre dos versiones de la página.

Enlace a la vista de comparación

Ambos lados, revisión anteriorRevisión previa
es:centro:servizos:servidores_de_computacion_gpgpu [2025/02/18 14:13] fernando.guillenes:centro:servizos:servidores_de_computacion_gpgpu [2025/02/18 16:13] (actual) fernando.guillen
Línea 88: Línea 88:
   * cualquier sesión de screen sin terminar.   * cualquier sesión de screen sin terminar.
  
-==== Xestión dos traballos con SLURM ====+==== Gestión de los trabajos con SLURM ==== 
 +En los servidores en los que hay un gestor de colas es obligatorio usarlo para enviar trabajos y así evitar los conflictos entre procesos, ya que no debe haber dos trabajos en ejecución al mismo tiempo.
  
-Nos servidores nos que hai un xestor de colas é obrigatorio o seu uso para enviar traballos e así evitar conflitos entre procesos, xa que non se deben executar dous traballos ó mesmo tempo. +Para enviar un trabajo a la cola se usa el comando ''srun'':
- +
-Para enviar un traballo á cola utilízase o comando ''srun'':+
  
   srun programa_cuda argumentos_programa_cuda   srun programa_cuda argumentos_programa_cuda
  
-proceso ''srun'' agarda a que o traballo se execute para devolver control ó usuario. Se non se quere agardarpódense utilizar xestores de sesións de consola coma ''screen'', e así poder deixar o traballo á espera desconectar sesión sen preocuparse recuperar a saída de consola máis adiante.+El proceso ''srun'' espera a que el trabajo se ejecute para devolver el control al usuario. Si no se quiere esperarse pueden usar gestores de sesiones de consola como "screen" para poder dejar el trabajo en espera desconectar la sesión sin preocuparse recuperar la salida de la consola más adelante.
  
-Alternativamente, pódese utilizar ''nohup'' pasar o traballo a segundo plano con ''&''Neste caso a saída gárdase no arquivo ''nohup.out'':+Alternativamente, se puede utilizar ''nohup'' pasar el trabajo a segundo plano con ''&''En este caso la salida se guarda en el archivo ''nohup.out'':
  
   nohup srun programa_cuda argumentos_programa_cuda &   nohup srun programa_cuda argumentos_programa_cuda &
  
-Para ver estado da cola utilízase o comando ''squeue''comando mostra unha saída similar a esta:+Para ver el estado de la cola se utiliza el comando ''squeue''El comando muestra una salida similar a esta:
  
 <code>JOBID PARTITION     NAME     USER  ST       TIME  NODES NODELIST(REASON) <code>JOBID PARTITION     NAME     USER  ST       TIME  NODES NODELIST(REASON)
Línea 113: Línea 112:
  8 servidore ca_water pablo.qu           0:11      1 ctgpgpu2</code>  8 servidore ca_water pablo.qu           0:11      1 ctgpgpu2</code>
  
-Tamén pode obterse unha vista interactiva, actualizada cada segundo, co comando ''smap'':+También puede obtenerse una vista interactiva, actualizada cada segundo, con el comando "smap":
  
   smap -i 1   smap -i 1