Diferencias
Muestra las diferencias entre dos versiones de la página.
| Ambos lados, revisión anteriorRevisión previaPróxima revisión | Revisión previa | ||
| es:centro:servizos:hpc:envio_trabajo [2016/02/12 13:15] – [Información de los trabajos] fernando.guillen | es:centro:servizos:hpc:envio_trabajo [2017/10/09 11:13] (actual) – [Table] diego.cougil | ||
|---|---|---|---|
| Línea 1: | Línea 1: | ||
| - | [[ es: | + | ====== Envío y gestión de los trabajos ====== |
| - | ====== Envío y gestión de los trabajos ====== | ||
| - | <note tip> | ||
| - | Para todos los comandos mencionados en esta página existe la correspondiente página del MAN. | ||
| - | </ | ||
| ===== Enviar los trabajos al sistema de colas ===== | ===== Enviar los trabajos al sistema de colas ===== | ||
| + | -------------- | ||
| El envío de trabajos se realiza a través del comando qsub, cuyo argumento obligatorio es el nombre de un script de shell. | El envío de trabajos se realiza a través del comando qsub, cuyo argumento obligatorio es el nombre de un script de shell. | ||
| < | < | ||
| Línea 13: | Línea 10: | ||
| ===== Consultar el estado del trabajo, las colas o los nodos ===== | ===== Consultar el estado del trabajo, las colas o los nodos ===== | ||
| + | --------------- | ||
| ==== Información de las colas ==== | ==== Información de las colas ==== | ||
| El comando '' | El comando '' | ||
| Línea 109: | Línea 106: | ||
| </ | </ | ||
| Una característica interesante de los trabajos finalizados es el EXIT_STATUS que se mostraría cuando el JOB_STATE es C. | Una característica interesante de los trabajos finalizados es el EXIT_STATUS que se mostraría cuando el JOB_STATE es C. | ||
| - | ^ | + | ^ |
| - | | JOB_EXEC_OVERLIMIT | + | | JOB_EXEC_OVERLIMIT |
| - | | JOB_EXEC_STDOUTFAIL | + | | JOB_EXEC_STDOUTFAIL |
| - | | JOB_EXEC_CMDFAIL | + | | JOB_EXEC_CMDFAIL |
| - | | JOB_EXEC_BADRESRT | + | | JOB_EXEC_BADRESRT |
| - | | JOB_EXEC_INITRMG | + | | JOB_EXEC_INITRMG |
| - | | JOB_EXEC_INITRST | + | | JOB_EXEC_INITRST |
| - | | JOB_EXEC_INITABT | + | | JOB_EXEC_INITABT |
| - | | JOB_EXEC_RETRY | + | | JOB_EXEC_RETRY |
| - | | JOB_EXEC_FAIL2 | + | | JOB_EXEC_FAIL2 |
| - | | JOB_EXEC_FAIL1 | + | | JOB_EXEC_FAIL1 |
| - | | JOB_EXEC_OK | + | | JOB_EXEC_OK |
| - | | | | + | | |
| - | | | | + | | |
| + | <code bash> | ||
| + | ct$ checkjob 999999.ctcomp2 | ||
| + | |||
| + | checking job 999999 | ||
| + | |||
| + | State: Running | ||
| + | Creds: | ||
| + | WallTime: 00:25:46 of 12:00:00 | ||
| + | SubmitTime: Tue Feb 16 10:40:31 | ||
| + | (Time Queued | ||
| + | |||
| + | StartTime: Tue Feb 16 10:40:32 | ||
| + | Total Tasks: 32 | ||
| + | |||
| + | Req[0] | ||
| + | Network: [NONE] | ||
| + | Opsys: [NONE] | ||
| + | Allocated Nodes: | ||
| + | [inode15: | ||
| + | |||
| + | |||
| + | IWD: [NONE] | ||
| + | Bypass: 0 StartCount: 1 | ||
| + | PartitionMask: | ||
| + | Flags: | ||
| + | |||
| + | Reservation ' | ||
| + | PE: 32.00 StartPriority: | ||
| + | </ | ||
| <code bash> | <code bash> | ||
| Línea 144: | Línea 170: | ||
| 02/10/2016 16: | 02/10/2016 16: | ||
| 02/10/2016 17: | 02/10/2016 17: | ||
| + | </ | ||
| + | |||
| ==== Información de los nodos ==== | ==== Información de los nodos ==== | ||
| - | El comando '' | + | Para obtener una vista global del estado del cluster se puede utilizar el comando '' |
| + | <code bash> | ||
| + | $ nodes-usage | ||
| + | +----------------------------------+-------------------+ | ||
| + | | USAGE | NODE | | ||
| + | +----------------------------------+-------------------+ | ||
| + | | ################################ | ||
| + | | ################################ | ||
| + | | | node3 (0/ | ||
| + | | ################################ | ||
| + | | | node5 (0/ | ||
| + | | ################################ | ||
| + | | | node7 (0/ | ||
| + | | | inode11 (0/ | ||
| + | | | inode12 (0/?? | ||
| + | | | inode13 (0/ | ||
| + | | | inode14 (0/ | ||
| + | | | inode15 (0/?? | ||
| + | | | inode16 (0/ | ||
| + | | | inode17 (0/?? | ||
| + | | | inode18 (0/?? | ||
| + | | ## | inode19 (2/ | ||
| + | | ############################ | ||
| + | +----------------------------------+-------------------+ | ||
| + | | ############## | ||
| + | +----------------------------------+-------------------+ | ||
| + | </ | ||
| + | |||
| + | Para obtener | ||
| + | |||
| + | <code bash> | ||
| + | $ node-users node1 | ||
| + | Tracing node jobs................................................................... | ||
| + | jorge.suarez natalia.fernandez | ||
| + | </ | ||
| + | |||
| + | Para obtener información más detallada sobre los nodos, se puede utilizar el comando '' | ||
| <code bash> | <code bash> | ||
| ct$ pbsnodes | ct$ pbsnodes | ||
| Línea 194: | Línea 259: | ||
| ===== Eliminar un trabajo de la cola ===== | ===== Eliminar un trabajo de la cola ===== | ||
| - | + | ------------- | |
| - | El comando '' | + | El comando '' |
| < | < | ||