Diferenzas
Isto amosa as diferenzas entre a revisión seleccionada e a versión actual da páxina.
Next revision | Previous revision | ||
centro:xestion-de-datos:manexo-datos [2023/10/20 10:37] – creado felix.diaz | centro:xestion-de-datos:manexo-datos [2023/10/20 10:41] (actual) – felix.diaz | ||
---|---|---|---|
Liña 1: | Liña 1: | ||
- | == prueba== | + | ===== Guía para a xestión de datos (en construción) ===== |
+ | |||
+ | ===== Tipos de datos ===== | ||
+ | Os datos de investigación son un conxunto de información, | ||
+ | |||
+ | Existen moitas formas de clasificar os datos. Amósanse algúns exemplos: | ||
+ | * Segundo o soporte no que se encontra a información: | ||
+ | * Físicos: datos de investigación en papel, formato analóxico. | ||
+ | * Dixitais: producidos nun ordenador ou cun sistema de output dixital | ||
+ | * Segundo o nivel de procesamento da información: | ||
+ | * Primarios: que non sufriron modificacións no proceso de investigación | ||
+ | * Secundarios: | ||
+ | * Segundo o tipo de contidos: | ||
+ | * Persoais: refírense a características persoales e permiten a identificación das mesmas | ||
+ | * Non persoais: non se refiren a persoas, ou de selo non permiten a identificación das mesmas | ||
+ | |||
+ | Os datos de investigación poden ser datos experimentales, | ||
+ | Research data may be experimental data, observational data, reutilizados, | ||
+ | |||
+ | ===== Datos persoais ===== | ||
+ | |||
+ | Consideranse **datos persoais** toda información sobre unha persoa física identificada ou identificable. | ||
+ | |||
+ | Se considera **persoa física identificable** toda persoa da cal a identidade se poida determinar, directa ou indirectamente, | ||
+ | Considéranse categorías especiais de datos persoais, ou **datos sensibles** os datos persoais que: | ||
+ | * Revelan a orixe étcnica ou racial | ||
+ | * As opinións políticas, as conviccións relixiosos ou filosóficas, | ||
+ | * O tratamento de datos xenéticos, datos biométricos dirixidos a identificar de maneira unívoca a unha persona física | ||
+ | * Datos relativos á saúde ou datos relativos á vida sexual ou as orientacións sexuais dunha persoa física. | ||
+ | |||
+ | Cando se aplican procesos de anonimización que impiden a identificación dos inviduos estos pasan a considerarse anónimos. Os datos pseudo-anonimizados ou encriptados que seguen permitindo a identificación dos individuos seguen entrando dentro do alcance da GDPR. | ||
+ | |||
+ | ===== Privacidade e xestión de datos na USC ===== | ||
+ | |||
+ | A USC, a través do [[http:// | ||
+ | |||
+ | De forma previa o desenvolvemento de **traballos de investigación** que impliquen a recopilación e o uso de datos sensibles, será necesario a solicitude e aprobación do obxecto de dito estudo por parte do Comité de Bioética. No caso de proxectos de investigación, | ||
+ | |||
+ | No caso de **traballos académicos de grao e mestrado** serán os órganos específicos das Facultades ou Escolas responsables das titulacións os que realizarán unha análise e revisión sobre o cumprimento dos requisitos esixidos, mediante un informe previo á emisión do informe definitivo polo Comité de Bioética. De forma máis específica, | ||
+ | |||
+ | - Que requiren que o/a estudante traballe directamente con persoas (entrevistas, | ||
+ | - Cando se recollan mostras biolóxicas humanas. | ||
+ | - Cando se obteñan datos personais ou datos personais de categorías especiais. | ||
+ | - Aqueles que se realicen sobre este tipo de fontes (datos o mostras de seres humanos) aínda que non sexan recollidas específicamente para o mesmo. | ||
+ | |||
+ | |||
+ | Na [[http:// | ||
+ | |||
+ | ===== Xestión de datos ===== | ||
+ | |||
+ | A Xestión de datos de investigación o //Research dAta Management// | ||
+ | |||
+ | {{: | ||
+ | |||
+ | A política FAIR busca, deste modo, asegurar que os datos son localizables, | ||
+ | |||
+ | A continuación se describen estes catro principios: | ||
+ | * **Ser localizables: | ||
+ | * **Ser accesibles** os datos son accesibles cando os metadatos se poden recuperar a través do seu identificador mediante un protocolo de comunicacións estándar. Este protocolo debe ser aberto, gratuito, de acceso uiversal e incluir a posibilidade de establecer un procedemento de acceso con autenticación e autorización cando sea necesario. | ||
+ | * **Ser interoperables** que se cumpre cando se usan linguaxes formais, accesibles, compartidos e ampliamente aplicables para representar o coñecemento tanto para os datos como os metadatos. | ||
+ | * **Ser reutilizables** os datos serán reutilizables cando os metadatos utilicen na súa descrición atributos precisos e relevantes, se divulguen con licencias de uso claras e accesibles, se vinculen de maneira clara coa súa procedencia e cumplan cos estándares da comunidade correspondente. | ||
+ | |||
+ | Os principios FAIR e as iniciativas de datos abertos asociadas a Open Science non son equivalentes nin excluíntes, | ||
+ | |||
+ | |||
+ | ===== Ciclo de Xestión de datos de investigación ===== | ||
+ | |||
+ | A seguinte táboa amosa as tarefas asociadas a xestión de datos durante a planificación, | ||
+ | |||
+ | ^ Fase de Investigación ^ Fase XDI ^ Actividades de Xestión de Datos | ||
+ | | Comezo do proxecto | Comezo do proxecto de I+D | Elección da ferramenta de edición | | ||
+ | | | | Planificación de revisións e actualizacións | | ||
+ | | | | Identificación dos datos existentes e dos permisos/ | ||
+ | | | Procesamento | Elección da infraestrutura para a preservación dos datos creados ou recollidos (actividade FAIR) | | ||
+ | | | | Definición da estrutura de carpetas e convencións para nomes de ficheiros (actividade FAIR) | | ||
+ | | Investigación (Análise) | Análise | Elección e documentación de datos, formatos e metadatos (FAIR) | | ||
+ | | | Preservación | Definición de mecanismos de backup e preservación. Seguridade e control de accesos, repositorios institucionais (FAIR) | | ||
+ | | Publicación de resultados | Publicación | Publicación de datos en repositorios temáticos ou multidisciplinares | | ||
+ | | | | Elección de licencias de uso, protección de datos e copyright | | ||
+ | | Evaluación | Xestión de datos | Evaluación dos costes de xestión | | ||
+ | | | | Evaluación e revisión do plan de gestión | | ||
+ | |||
+ | ===== Plan de Xestión de datos de investigación ===== | ||
+ | |||
+ | O Plan de Xestión de Datos (PXD) é un documento vivo, actualizable e versionable, | ||
+ | |||
+ | Trátase dun documento dinámico que axuda o persoal investigador a mellorar a súa investigación, | ||
+ | |||
+ | O PXD debería indicar: | ||
+ | * Que datos se van xerar, recoller, observar e reusar e en qué formatos, ademais de como se reutilizarán datos existentes, | ||
+ | * Como se van a procesar, almacear e preservar os datos | ||
+ | * Candos os datos serán accesibles e quen terá acceso os mesmos | ||
+ | * O responsable dos datos e quen posúe os dereitos sobre os mesmos | ||
+ | * Como se tiveron en conta as cuestións éticas | ||
+ | * Como se reutilizarán os datos | ||
+ | |||
+ | Unha proposta razoable é desenvolver 3 actualizacións do Plan de Xestión de Datos para os proxectos de investigación: | ||
+ | * Unha versión inicial o comezo do proxecto | ||
+ | * Unha actualización a metade do mesmo | ||
+ | * Unha actualización á finalización de proxecto | ||
+ | |||
+ | En calquera caso, as actualizacións do Plan de Xestión de Datos deben adaptarse as características de cada proxecto. O **obxetivo é que o plan permita unha boa xestión dos datos durante o ciclo de vida dos proxectos**. | ||
+ | |||
+ | A continuación amosamos unha lista de plans de xestión de datos públicos: | ||
+ | * [[https:// | ||
+ | |||
+ | ===== Ferramentas para a elaboración dun plan de xestión de datos ===== | ||
+ | |||
+ | Existen multitude de ferramentas para a xeración de plans de xestión de datos. Algúns exemplos son [[https:// | ||
+ | |||
+ | Algunahas ferramentas, | ||
+ | |||
+ | ===== Formatos e organización de datos ===== | ||
+ | Para garantir que os datos sexan FAIR, é importante seleccionar coidadosamente os formatos a utilizar. Ás veces, estes formatos serán condicionados polo equipo ou dispositivo que se emprega na investigación, | ||
+ | |||
+ | No caso de que só sexa posible gardar os datos nun formato propietario, | ||
+ | |||
+ | No caso de Data Archiving and Networked Services (DANS), o centro nacional holandés de datos de investigación, | ||
+ | |||
+ | ^Tipo ^ Formatos preferidos ^ Formatos non preferidos ^ | ||
+ | | Texto | PDF/A, ODT | DOC, DOCX, PDF | | ||
+ | | Linguaxe de marcas | XML, HTML | SGML, MD | | ||
+ | | Folla de cálculo | ODS, CSV | XLS, XLSX, PDF/A | | ||
+ | | Datos estatísticos | DAR, SPS, DO, R | POR, SAV, DTA | | ||
+ | | Imáxenes vectoriais | SVG | AI, EPS, WMF | | ||
+ | |||
+ | |||
+ | ===== Xestión da propiedade intelectual ===== | ||
+ | |||
+ | A propiedade intelectual refírese os dereitos sobre as produccións, | ||
+ | |||
+ | Unha posibilidade para outorgar dereitos de reutilización os datos son as licenzas [[https:// | ||
+ | |||
+ | ^ Logo ^ Licenza | ||
+ | | {{: | ||
+ | | {{: | ||
+ | |||
+ | Existe a posibilidade de ceder unha obra o espazo público coa licenza CC0-public domain {{: | ||
+ | ===== Reutilización de datos de terceiros ===== | ||
+ | |||
+ | Sempre que se reutilicen | ||
+ | |||
+ | A non existencia de licenza asociada a datos públicos, nunca debe interpretarse como que non existen restriccións para o seu uso. Se **un dataset non ten licenza esto debe interpretarse como "todos os dereitos restrinxidos" | ||
+ | |||
+ | ===== Publicación de datos e repositorios ===== | ||
+ | |||
+ | A USC non dispón neste momento dun repositorio institucional ou política de xestión de datos. Tampouco existen repositorios nacionais. | ||
+ | |||
+ | Por este motivo aconsellase usar [[https:// | ||
+ | |||
+ | A [[ https:// | ||
+ | |||
+ | Por outra parte, tamén é posible non publicar os datos nun repositorio e permitir acceso por contraseña ou mediante outros mecanismos de acceso. Pódese considerar a firma dun Data User Agreement (DUA) previamente á compartición de datos. | ||
+ | |||
+ | ===== A xestión de datos nas publicacións científicas ===== | ||
+ | |||
+ | Estase convirtindo en práctica habitual a xestión adecuada dos datos de investigación como requisito para a publicación científica. | ||
+ | |||
+ | Existen publicacións que xa esixen a xestión e publicación dos datos en repositorios adecuados para garantir a calidade e reproducibilidade da investigación. | ||
+ | |||
+ |