Diferenzas
Isto amosa as diferenzas entre a revisión seleccionada e a versión actual da páxina.
Both sides previous revisionPrevious revisionNext revision | Previous revision | ||
centro:xestion-de-datos:start [2023/07/19 14:33] – felix.diaz | centro:xestion-de-datos:start [2023/10/20 11:12] (actual) – felix.diaz | ||
---|---|---|---|
Liña 1: | Liña 1: | ||
- | ===== Xestión de Datos ===== | + | ===== Xestión de Datos no CiTIUS===== |
+ | Nesta entrada presentamos a información correspondente a Xestión de Datos do CiTIUS, que inclúe referencia a Comisión de Datos do Centro (posta en marcha no último trimestre de 2023), os protocolos e servizos de xestión de datos do CiTIUS, así como unha guía (en construcción) para a Xestión de Datos. | ||
* [[centro: | * [[centro: | ||
- | * [[centro: | + | * [[centro: |
- | * [[centro: | + | * [[centro: |
+ | ===== Servizo de Apoio en Xestión de Datos no CiTIUS===== | ||
- | GDPR, Datos en USC, Gestión de Datos, Políticas FAIR, IA, FAQ. Ejemplos | + | O CiTIUS, a través |
- | + | ||
- | + | ||
- | As malas políticas de xestión de datos son unha das causas das dificultades para a reproducibilidade dos resultados científicos. | + | |
- | ===== Tipos de datos ===== | + | |
- | Os datos de investigación son un conxunto de información, | + | |
- | + | ||
- | Existen moitas formas de clasificar os datos. Amósanse algúns exemplos: | + | |
- | * Segundo o soporte no que se encontra a información: | + | |
- | * Físicos: datos de investigación en papel, formato analóxico. | + | |
- | * Dixitais: producidos nun ordenador ou cun sistema de output dixital | + | |
- | * Segundo o nivel de procesamento da información: | + | |
- | * Primarios: que non sufriron modificacións no proceso de investigación | + | |
- | * Secundarios: | + | |
- | * Segundo o tipo de contidos: | + | |
- | * Persoais: refírense a características persoales e permiten a identificación | + | |
- | * Non persoais: non se refiren a persoas, ou de selo non permiten a identificación das mesmas | + | |
- | + | ||
- | Os datos de investigación poden ser datos experimentales, datos observacionales, | + | |
- | Research data may be experimental data, observational data, reutilizados, | + | |
- | + | ||
- | ===== Datos persoais ===== | + | |
- | + | ||
- | Consideranse **datos persoais** toda información sobre unha persoa física identificada ou identificable. | + | |
- | + | ||
- | Se considera **persoa física identificable** toda persoa da cal a identidade se poida determinar, directa ou indirectamente, | + | |
- | Considéranse categorías especiais de datos persoais, ou **datos sensibles** os datos persoais que: | + | |
- | * Revelan a orixe étcnica ou racial | + | |
- | * As opinións políticas, as conviccións relixiosos ou filosóficas, | + | |
- | * O tratamento de datos xenéticos, datos biométricos dirixidos a identificar de maneira unívoca a unha persona física | + | |
- | * Datos relativos á saúde ou datos relativos á vida sexual ou as orientacións sexuais dunha persoa física. | + | |
- | + | ||
- | Cando se aplican procesos de anonimización que impiden a identificación dos inviduos estos pasan a considerarse anónimos. Os datos pseudo-anonimizados ou encriptados que seguen permitindo a identificación dos individuos seguen entrando dentro do alcance da GDPR. | + | |
- | + | ||
- | ===== Privacidade e xestión de datos na USC ===== | + | |
- | + | ||
- | A USC, a través do [[http:// | + | |
- | + | ||
- | De forma previa o desenvolvemento de **traballos de investigación** | + | |
- | + | ||
- | No caso de **traballos académicos de grao e mestrado** serán os órganos específicos das Facultades ou Escolas | + | |
- | + | ||
- | - Que requiren que o/a estudante traballe directamente con persoas (entrevistas, | + | |
- | - Cando se recollan mostras biolóxicas humanas. | + | |
- | - Cando se obteñan datos personais ou datos personais de categorías especiais. | + | |
- | - Aqueles que se realicen sobre este tipo de fontes (datos o mostras de seres humanos) aínda que non sexan recollidas específicamente para o mesmo. | + | |
- | + | ||
- | + | ||
- | Na [[http://imaisd.usc.es/seccion.asp? | + | |
- | + | ||
- | ===== Xestión de datos ===== | + | |
- | + | ||
- | A Xestión de datos de investigación o //Research dAta Management// | + | |
- | + | ||
- | {{: | + | |
- | + | ||
- | A política FAIR busca, deste modo, asegurar que os datos son localizables, | + | |
- | + | ||
- | A continuación se describen estes catro principios: | + | |
- | * **Ser localizables: | + | |
- | * **Ser accesibles** os datos son accesibles cando os metadatos se poden recuperar a través do seu identificador mediante un protocolo de comunicacións estándar. Este protocolo debe ser aberto, gratuito, de acceso uiversal e incluir a posibilidade de establecer un procedemento de acceso con autenticación e autorización cando sea necesario. | + | |
- | * **Ser interoperables** que se cumpre cando se usan linguaxes formais, accesibles, compartidos e ampliamente aplicables para representar o coñecemento tanto para os datos como os metadatos. | + | |
- | * **Ser reutilizables** os datos serán reutilizables cando os metadatos utilicen na súa descrición atributos precisos e relevantes, se divulguen con licencias de uso claras e accesibles, se vinculen de maneira clara coa súa procedencia e cumplan cos estándares da comunidade correspondente. | + | |
- | + | ||
- | Os principios FAIR e as iniciativas de datos abertos asociadas a Open Science non son equivalentes nin excluíntes, | + | |
- | + | ||
- | + | ||
- | ===== Ciclo de Xestión | + | |
- | + | ||
- | A seguinte táboa amosa as tarefas asociadas a xestión de datos durante a planificación, | + | |
- | + | ||
- | ^ Fase de Investigación ^ Fase XDI ^ Actividades de Xestión de Datos | + | |
- | | Comezo | + | |
- | | | | Planificación de revisións | + | |
- | | | | Identificación dos datos existentes e dos permisos/ | + | |
- | | | Procesamento | Elección da infraestrutura para a preservación dos datos creados ou recollidos (actividade FAIR) | | + | |
- | | | | Definición da estrutura de carpetas | + | |
- | | Investigación (Análise) | Análise | Elección e documentación de datos, formatos e metadatos (FAIR) | | + | |
- | | | Preservación | Definición de mecanismos de backup e preservación. Seguridade e control de accesos, repositorios institucionais (FAIR) | | + | |
- | | Publicación de resultados | Publicación | Publicación de datos en repositorios temáticos ou multidisciplinares | | + | |
- | | | | Elección de licencias de uso, protección de datos e copyright | | + | |
- | | Evaluación | Xestión de datos | Evaluación dos costes de xestión | | + | |
- | | | | Evaluación e revisión do plan de gestión | | + | |
- | + | ||
- | ===== Plan de Xestión de datos de investigación ===== | + | |
- | + | ||
- | O Plan de Xestión de Datos (PXD) é un documento vivo, actualizable e versionable, | + | |
- | + | ||
- | Trátase dun documento dinámico que axuda o persoal investigador a mellorar a súa investigación, | + | |
- | + | ||
- | O PXD debería indicar: | + | |
- | * Que datos se van xerar, recoller, observar e reusar e en qué formatos, ademais de como se reutilizarán datos existentes, | + | |
- | * Como se van a procesar, almacear e preservar os datos | + | |
- | * Candos os datos serán accesibles e quen terá acceso os mesmos | + | |
- | * O responsable dos datos e quen posúe os dereitos sobre os mesmos | + | |
- | * Como se tiveron en conta as cuestións éticas | + | |
- | * Como se reutilizarán os datos | + | |
- | + | ||
- | Unha proposta razoable é desenvolver 3 actualizacións do Plan de Xestión de Datos para os proxectos de investigación: | + | |
- | * Unha versión inicial o comezo do proxecto | + | |
- | * Unha actualización a metade do mesmo | + | |
- | * Unha actualización á finalización de proxecto | + | |
- | + | ||
- | En calquera caso, as actualizacións do Plan de Xestión de Datos deben adaptarse as características de cada proxecto. O **obxetivo é que o plan permita unha boa xestión dos datos durante o ciclo de vida dos proxectos**. | + | |
- | + | ||
- | A continuación amosamos unha lista de plans de xestión de datos públicos: | + | |
- | * [[https://dmponline.dcc.ac.uk/public_plans | Exemplos de plans de xestión da ferramenta DMP Online]] | + | |
- | + | ||
- | ===== Ferramentas para a elaboración dun plan de xestión de datos ===== | + | |
- | + | ||
- | Existen multitude de ferramentas para a xeración de plans de xestión de datos. Algúns exemplos son [[https://dmponline.dcc.ac.uk/ | + | |
- | + | ||
- | Algunahas ferramentas, | + | |
- | + | ||
- | ===== Formatos e organización de datos ===== | + | |
- | Para garantir que os datos sexan FAIR, é importante seleccionar coidadosamente os formatos a utilizar. Ás veces, estes formatos serán condicionados polo equipo ou dispositivo que se emprega na investigación, | + | |
- | + | ||
- | No caso de que só sexa posible gardar os datos nun formato propietario, | + | |
- | + | ||
- | No caso de Data Archiving and Networked Services (DANS), o centro nacional holandés de datos de investigación, | + | |
- | + | ||
- | ^Tipo ^ Formatos preferidos ^ Formatos non preferidos ^ | + | |
- | | Texto | PDF/A, ODT | DOC, DOCX, PDF | | + | |
- | | Linguaxe de marcas | XML, HTML | SGML, MD | | + | |
- | | Folla de cálculo | ODS, CSV | XLS, XLSX, PDF/A | | + | |
- | | Datos estatísticos | DAR, SPS, DO, R | POR, SAV, DTA | | + | |
- | | Imáxenes vectoriais | SVG | AI, EPS, WMF | | + | |
- | + | ||
- | + | ||
- | ===== Xestión da propiedade intelectual ===== | + | |
- | + | ||
- | A propiedade intelectual refírese os dereitos sobre as produccións, | + | |
- | + | ||
- | Unha posibilidade para outorgar dereitos de reutilización os datos son as licenzas [[https:// | + | |
- | + | ||
- | ^ Logo ^ Licenza | + | |
- | | {{: | + | |
- | | {{: | + | |
- | + | ||
- | Existe a posibilidade de ceder unha obra o espazo público coa licenza CC0-public domain {{: | + | |
- | ===== Reutilización de datos de terceiros ===== | + | |
- | + | ||
- | Sempre que se reutilicen | + | |
- | + | ||
- | A non existencia de licenza asociada a datos públicos, nunca debe interpretarse como que non existen restriccións para o seu uso. Se **un dataset non ten licenza esto debe interpretarse como "todos os dereitos restrinxidos" | + | |
- | + | ||
- | ===== Publicación de datos e repositorios ===== | + | |
- | + | ||
- | A USC non dispón neste momento dun repositorio institucional ou política de xestión de datos. Tampouco existen repositorios nacionais. | + | |
- | + | ||
- | Por este motivo aconsellase usar [[https:// | + | |
- | + | ||
- | A [[ https:// | + | |
- | + | ||
- | Por outra parte, tamén é posible non publicar os datos nun repositorio e permitir acceso por contraseña ou mediante outros mecanismos de acceso. Pódese considerar a firma dun Data User Agreement | + | |
- | + | ||
- | ===== A xestión de datos nas publicacións científicas ===== | + | |
- | + | ||
- | Estase convirtindo en práctica habitual a xestión adecuada dos datos de investigación como requisito para a publicación científica. | + | |
- | + | ||
- | Existen publicacións que xa esixen a xestión e publicación dos datos en repositorios adecuados para garantir a calidade e reproducibilidade da investigación. | + | |
- | + | ||
- | + | ||
- | ===== Política de Xestión de datos do CiTIUS ===== | + | |
- | + | ||
- | Incluímos nesta sección referencia as políticas de obrigado cumprimento derivadas da reglamentación existente na USC así como un protocolo de actuación para os proxectos que traballen con xestión de datos no CiTIUS. | + | |
- | + | ||
- | ==== Normas Xerais ==== | + | |
- | + | ||
- | 1. É necesario cumplir coas leis e regulamentos oportunos (e.x. RGPD) cando se traballa con datos. | + | |
- | + | ||
- | 2. Cando se utilizan ou reutilizan datos doutras institucións, | + | |
- | + | ||
- | ==== Regulamentación da USC ==== | + | |
- | + | ||
- | 1. Sempre que se traballe con datos sensibles haberá que seguir as políticas da USC e obter as autorizacións pertinentes do Comité de Bioética. | + | |
- | + | ||
- | 2. Seguindo estas recomendacións, | + | |
- | + | ||
- | 3. Por defecto, o almacenamento de datos tense que facer na ferramenta corporativa Microsoft One Drive, que é a oficialmente contratada e a que conta cos respaldos legais oportunos. | + | |
- | + | ||
- | ==== Protocolo de Xestión de Datos no CiTIUS ==== | + | |
- | + | ||
- | 1. **Principios Fundamentais: | + | |
- | + | ||
- | 2. **Planificación e Asesoramento: | + | |
- | 3. **Xeración e Uso de Datos:** | + | |
- | + | ||
- | a. Almacenamento de Datos: Por defecto, o almacenamento de datos tense que facer na ferramenta corporativa Microsoft One Drive, que é a oficialmente contratada e a que conta cos respaldos legais oportunos. | + | |
- | b. Uso de Datasets Externos: Ao utilizar datasets doutras institucións, | + | |
- | c. Protección de Datos: O almacenamento debe estar protexido por contrasinal ou sistema de login. Todos os membros do equipo deben coñecer as restriccións de confidencialidade asociadas o traballo cos datos. | + | |
- | + | ||
- | 4. **Datos Sensibles e Persoais: | + | |
- | a. Consentimento Informado: Ao traballar con datos sensibles, deberanse seguir as políticas da USC e obter as autorizacións pertinentes do Comité de Bioética. Ademais, será necesario contar e almacenar adecuadamente os consentimentos informados dos individuos que participen nun estudo como suxeitos experimentais. | + | |
- | b. Anonimización: | + | |
- | c. Protección de Dereitos: Se se detecta que se poden violar dereitos fundamentais, | + | |
- | + | ||
- | 5. **Rexistro e Seguimento de Datos:** A Comisión de Datos do CiTIUS manterá un rexistro e fará un seguimento adecuado dos conxuntos de datos xerados desde o Centro. | + | |
- | + | ||
- | Este protocolo debe ser coñecido e seguido por todos os integrantes do equipo de investigación que vaian traballar na creación de repositorios de datos para evitar problemas asociados a posible perda de datos, incorrecta utilización ou alteración. | + | |