Gestionar y compartir Datos de Investigación: los retos y los principales componentes a desarrollar (Apresentação na TICAL2020)
1. Gestionar y compartir Datos
de Investigación
los retos y los principales componentes a desarrollar
Pedro Príncipe, Universidade do Minho | 3 de Septiembre 2020 |
2. Temas
1. Importancia de la apertura y publicación de los datos.
2. Compartir y publicar datos de la investigación.
3. Requisitos de los editores y financiadores para la
disponibilidad de datos.
4. Relevancia de la formación sobre gestión e apertura de
datos en las instituciones.
Una visión personal y experiencia en mi
institución, pero también representando
proyectos europeos de ciencia abierta.
3. Universidade do Minho Serviços de Documentação
TÍTULO DA APRESENTAÇÃO
Complemento de título
• Nome:
• e-mail:
• url
Universidade do Minho Serviços de Documentação
RELEVANCIA DE LA APERTURA,
PUBLICACIÓN Y GESTIÓN DE DATOS
El poder de
los datos en
el mundo
digital
Importancia
de los
procesos de
ciencia
abierta
Políticas de
los
financiadores
Requisitos
del editor
Urgencia de
los datos
FAIR
Refuerzo del
papel de las
instituciones
8. DATOS BRUTOS
Diferentes niveles de procesamiento y publicación de datos.
DATOS PROCESADOS
INCONCLUSIVOS
DATOS PROCESADOS
INCLONCLUSIVOS
DATOS
PROCESADOS
DATOS
PROCESADOS
DATOS
PARTILHADOS
DATOS
PARTILHADOS DATOS
PARTILHADOS
DATOS
PARTILHADOS
DATOS
PARTILHADOS
DATOS
ABIERTOS
DATOS
ABIERTOS
Garantizar los requisitos
legales y éticos es
esencial.
DATOS:
CERRADO
RESTRINGIDO
PUBLICADO
EMBARGADO
ABIERTO
9. PUBLICAR Y COMPARTIR DATOS
Aumenta el impacto y la visibilidad de la investigación.
Promueve la transparencia, aumenta el rigor e impulsa el debate.
Promueve la innovación y la potencial reutilización de datos.
Crea nuevas sinergias entre los creadores de datos y otros
investigadores.
Fomenta la mejora de los métodos de validación de la investigación.
Contribuye a reducir los costes asociados a posibles duplicaciones.
Promueve el proyecto asociado a la investigación y sus resultados.
Otorga crédito a los investigadores productores de datos.
Pone a disposición recursos para la educación y la formación.
10. ¿DÓNDE PUBLICAR LOS DATOS?
Puedo publicar mis datos en uno o más servicios, dependiendo de mi institución,
financiación del proyecto o editor de revista donde publico artículos.
Servicio de revista para material complementario
Repositorio de datos institucionales
Repositorio genérico
Archivo o repositorio de datos de dominio disciplinario
Sitio web de la unidad de investigación o proyecto
Data Journal
…
11. Encuentrar un repositorio adecuado
Utilice el portal re3data.org para encontrar un
repositorio que se adapte a mis necesidades y
cumpla con las condiciones para depositar datos.
Utilice un repositorio general como Zenodo, creado
por OpenAIRE / CERN (ou otro como figshare, dryad)
Ya sabemos de la existencia de un repositorio, archivo o base de datos
adecuado en mi dominio científico y en uso por mi comunidad.
OU
12. ¿DÓNDE PUBLICAR LOS DATOS?
Servicio de revista para
material complementario
Cumprir requisitos do
editor
Dados disponíveis junto
dos resultados
publicados
Pode ser dispendioso e
risco com direitos sobre
os dados
Acesso fechado e
improvável que faculte
preservação
Repositorio de datos
institucionales
Aceitar vários tipos de
dados, garantir acesso a
longo prazo
Podem confiar mais
facilmente e não haverá
custos
Pode não oferecer acesso
sustentável a longo prazo
Pode não ter metadados
disciplinares
Repositorio genérico
Alcance de um público
mais vasto.
Aceita vários de tipos,
adequado para dados
interdisciplinares
Normalmente apenas
metadados simples estão
disponíveis
Sem controle editorial
sobre a qualidade dos
materiais depositados
Repositorio disciplinario
Oferece especialização e
experiência em gestão de
dados
Provável que aceite
conjuntos de dados
completos
É provável que sejam
selectivos no tipo de
dados que aceitam
Requer planeamento e
padrões elevados, pode
implicar custos
13. COMPARTIR
Promover la apertura de
datos y la práctica de la
Ciencia Abierta.
PUBLICAR
Disponibilizar y registrar
datos para su
reutilización y generar
mayor impacto.
ADMINISTRAR
Garantizar buenas
prácticas de gestión de
datos y documentación.
20. TEMAS COMUNES QUE LOS FINANCIEROS
REQUIEREN EN LOS PLANES DE GESTIÓN DE DATOS
Descripción de los datos que se recopilarán /
crearán (es decir, tipo, contenido, formato,
volumen, etc.).
Normas y metodologías para la recopilación y
gestión de datos.
Cuestiones éticas, deontológicas y de
propiedad intelectual (resaltar las
restricciones al intercambio de datos, por
ejemplo, embargos, confidencialidad)
Planes para compartir y acceder a datos (es
decir, cómo, cuándo y a quién).
Estrategia de preservación a largo plazo.
26. REQUISITOS DE LOS EDITORES PARA LA
DISPONIBILIDAD DE DATOS
Tipo de requisitos:
Enviar datos al editor.
Depositar el conjunto de
datos en un repositorio
confiable.
Proporcionar información
de contacto.
27. ¡ALERTA!
prestar servicios en instituciones o utilizar servicios de comunidades: los datos deben permanecer
en la administración de los investigadores y las instituciones de investigación.
28. 4.
RELEVANCIA DE LA FORMACIÓN
SOBRE GESTIÓN E APERTURA DE
DATOS EN LAS INSTITUCIONES
¿Cuáles son los temas esenciales para la formación?
¿Qué metodologías usar? Componentes esenciales.
¿Qué contenido presenta FOSTER OS?
Materiales de OpenAIRE.
…
29. Aclarar cuáles son los temas esenciales para la
formación, en qué áreas deberíamos enfocarnos más…
30. CONTEÚDOS – MÓDULOS DO CURSO:
Introducción a la gestión de datos de investigación
Planes de gestión de datos
Documentar y organizar datos
Licencias de datos, protección y propiedad
Compartir y depositar datos en repositorios
Requisitos de los financiadores y editoras para compartir datos
COMPONENTES ESENCIALES DE LA FORMACIÓN EN GESTIÓN DE
DATOS DE INVESTIGACIÓN EN EL CONTEXTO DE CIENCIAABIERTA
31. Datos abiertos
Planificación de
datos
Documentación
de datos
Datos FAIR
Licencias y
proteccion
Politicas y
requisitos
Formación de
alcance general
vs
formación de
dominio disciplinario
CASOS DE
ESTUDO
INFRAESTRUCTURAS
BUENAS
PRACTICAS
HERRAMIENTAS
32. Crear
datos
Procesar
los datos
Analizar
datos
Preservar
datos
Dar
acceso a
datos
Reutilizar
datos
CREAR DATOS: planes de gestión de datos,
encontrar conjuntos de datos existentes,
obtener consentimiento, recopilar y administrar
datos, capturar y crear metadatos.
REUTILIZAR LOS DATOS:
supervisar y realizar
investigación, realizar
revisiones, examinar los
descubrimientos científicos,
enseñar y aprender.
DAR ACCESO A DATOS:
distribuir y compartir datos,
definir licencias y condiciones
de acceso, promover los
datos.
ANALIZAR LOS DATOS:
interpretar y producir datos
derivados, producir resultados,
escribir publicaciones,
preparar datos para compartir.
PROCESAR LOS DATOS:
escriba, transcriba, verifique,
valide y borre datos,
anonimice datos, describa
datos, administre y almacene.
Ref: UK Data Archive: http://www.data-archive.ac.uk/create-manage/life-cycle
PRESERVAR LOS DATOS: almacenar datos,
hacer copias de seguridad y archivar, migrar al
mejor formato y soporte, crear metadatos.
34. Estructura de los contenidos del módulo
¿Qué son los datos de investigación (intro)
Planificación de la gestión de datos
Protección de datos
Producir datos FAIR
Requisitos de los financiadores
Datos abiertos
Cuando compartir datos
Qué datos almacenar y preservar
36. Algunos aspectos relevantes (2/5)
• Integridade da investigação
• Potencial de abertura e
partilha
• Sucesso da Investigação -
benefícios
Argumento
para practicar
41. Descripción general del contenido del módulo
Protección de datos
¿Qué son los datos personales?
Proteger datos personales
Requisitos legales
GDPR
Protección de datos e intercambio de
datos de investigación
Protección en la planificación de la
investigación.
Consentimiento informado
Administrar datos de forma segura
Almacenamiento seguro de datos
Estrategias de anonimización
47. OPEN SCIENCE HANDBOOK (FOSTER)
Manual de treinamento de Ciência Aberta
https://book.fosteropenscience.eu/pt/02IntroducaoaCienciaAberta/02
Dados_e_Materiais_de_Investigacao_Abertos.html
49. INTRO - ¿Qué son los datos de investigación...
Diferentes tipos de datos
Ciclo de vida de los datos y el ciclo de vida de la investigación
Pasos y procesos del ciclo de vida de datos
La importancia de las buenas prácticas de gestión de datos
¿Por qué administrar los datos de búsqueda?
Razones para invertir en la gestión adecuada de datos.
Las diferentes responsabilidades en la gestión de datos
53. ¿Qué constituye un PGD?
Un plan de gestión de datos es un documento que define:
• Cómo se crearán los datos;
• ¿Cómo serán documentados?
• Quién puede acceder a los datos;
• Dónde y cómo se guardarán;
• Quién es responsable de su preservación;
• Si y cómo los datos se pueden compartir y reutilizar.
Información de contexto = permite reutilizar
54. “Los PGD a menudo se requieren como parte de los
acuerdos de subvención de financiadores de ciencia,
pero son útiles en todos los proyectos de investigación
cuando los investigadores crean y recopilan datos.
”
56. 1. DESCRIPCIÓN DE LAS RECOLECCIONES DE
DATOS A SER RECOGIDAS O REUTILIZADAS
• ¿Cómo se recopilarán o producirán los datos y / o cómo
se reutilizarán los datos existentes?
• ¿Qué datos (por ejemplo, tipos, formatos y volúmenes)
se recopilarán o producirán?
57. 2. DOCUMENTACIÓN Y CALIDAD DE DATOS
• ¿Qué metadatos y documentación (por ejemplo, la
metodología de recopilación de datos y la forma en que
se organizan los datos) acompañarán a los datos?
• ¿Qué medidas de control de calidad de los datos se
utilizarán?
58. 3. ALMACENAMIENTO Y RESPALDO DURANTE
EL PROCESO DE INVESTIGACIÓN
• ¿Cómo se almacenarán los datos y metadatos durante el
proceso de investigación?
• ¿Cómo se manejará la seguridad de los datos y la
protección de los datos sensibles durante la
investigación?
59. 4. REQUISITOS LEGALES Y ÉTICOS, CÓDIGOS
DE CONDUCTA
• Si se procesan datos personales, ¿cómo se garantizará el
cumplimiento de la legislación sobre datos personales y
protección de datos?
• ¿Cómo se gestionarán otras cuestiones legales, como los
derechos de propiedad intelectual? ¿Qué legislación es
aplicable?
• ¿Cómo se tendrá en cuenta cuestiones éticas
y códigos de conducta a seguir?
60. 5. COMPARTIR DATOS Y PRESERVACIÓN A
LARGO PLAZO
• ¿Cómo y cuándo estarán disponibles los datos en acceso abierto?
• Existe alguna restricción sobre el intercambio de datos o motivos de
embargo?
• ¿Cómo se seleccionarán los conjuntos de datos para la conservación
y dónde se garantizará la conservación a largo plazo (repositorios y
archivos de datos)?
• ¿Qué métodos, software o herramientas se necesitarán
para acceder y utilizar los datos?
• ¿Cómo se garantizará el registro de identificadores persistentes
(por ejemplo, DOI) para los datos?
61. 6. RESPONSABILIDADES Y RECURSOS DE
GESTIÓN DE DATOS
• ¿Quién (por ejemplo, función, cargo e institución) será
responsable de la gestión de los datos (es decir, el
administrador de datos)?
¿Qué recursos (por ejemplo, financieros y de tiempo) se
dedicarán a la gestión de datos y a garantizar que los
datos sean FAIR?
62. HERRAMIENTAS PARA PLANIFICAR
A elaboração de planos de gestão de dados pode ser agilizada
com o recurso a ferramentas já existentes, disponibilizadas
por diferentes entidades.
• Para facilitar o trabalho dos investigadores, algumas destas
ferramentas já providenciam os planos de acordo com os
requisitos dos financiadores (modelos para elaboração de
planos configurados para os requisitos de financiadores – a
aplicação DMPonline tem um modelo para projetos H2020 da
CE).
• São passíveis de serem utilizadas, parametrizadas e ajustadas
à medida do projeto que os investigadores se encontram a
gerir.
63. Documentar y organizar datos
Estrategias para organizar los datos de la investigación.
Convenciones de nomenclatura de archivos
Formatos y organización de archivos de datos
Migración, Compresión y Versiones
Documentación, metadatos y normalización de datos.
Documentar, organizar y citar datos.
Categorías de metadatos
Cita de datos y ¿Por qué citar datos?
65. Razones para organizar...
Búsqueda fácil (ahorro de tiempo)
Separe las diferentes fases del proyecto
(siempre con una visión general del conjunto)
Separe los archivos originales de los archivos
de trabajo (evite fallas y pérdidas)
Facilita el intercambio colaborativo
68. DOCUMENTACIÓN DE DATOS
Descripción del
proceso de
cobranza.
Descripción de los
datos en sí.
Descripción de
cambios
Asegurar datos
son buscables y sin
ambigüedades
69. CITACIÓN DE DATOS
?
por la importancia en
la validación del
conocimiento
los datos deben
tratarse como objetos
de búsqueda
vincular datos a
publicaciones
FORCE 11 – Declaración de los principios de citación de datos
70. REPOSITORIOS Y APERTURA DE DATOS
Los datos de la investigación
deben depositarse en un
repositorio de confianza.
• disciplinaria o institucional
• o en un repositorio generalista.
71. REPOSITORIOS TEMÁTICOS
… Si no tiene en la institución hay
varios en las áreas temáticas ...
Directorio de repositorio de datos:
re3data.org
75. LICENCIAS CREATIVE COMMONS (CC)
CC es una organización sin fines de lucro
que proporciona herramientas legales
para compartir y reutilizar obras de
autor.
Han producido una serie de licencias que
cumplen con los criterios de acceso
abierto y ofrecen diferentes niveles de
permiso.
76. ¿QUÉ LICENCIA DEBE APLICARSE PARA ABRIR DATOS
DE INVESTIGACIÓN EN CIENCIA ABIERTA?
CC BY 4.0
para datos de investigación clasificados como
trabajos literarios o software.
CC0 (domínio público)
para conjuntos de datos o bases de datos.
77. ¿CÓMO APLICAR LICENCIAS A LOS
DATOS DE INVESTIGACIÓN?
Depositar los datos en un repositorio,
Referir la licencia en la página de destino o sitio
donde se alojan los datos,
Adjunte la licencia a los metadatos de datos,
Prepare el documento de descripción de datos.
No momento de:
78. PARTES DOS DADOS QUE NÃO
PODERÃO SER TORNADOS ACESSÍVEIS
Se debe prestar especial atención a eliminar:
datos personales,
información confidencial, o
propiedad intelectual de otros.
79. OTRAS LICENCIAS
Contexto do
financiador
• As diretrizes do Horizonte 2020
e FCT sugerem a atribuição de
licenças de uso:
Outras licenças
• Licenças para software
• Licenças para dados / bases de
dados
80. Protección de datos personales
Proteger los datos de la investigación significa proteger los derechos de
las personas involucradas en el proceso de investigación.
¿Qué son los datos personales?
Los datos personales son cualquier información que se pueda utilizar para
identificar individuos, como su nombre o fecha de nacimiento.
Información personal: los antecedentes, la opinión política, las creencias
religiosas, la salud, la afiliación sindical u la orientación sexual de una
persona se clasifican como datos personales confidenciales.
Información como el número de hijos que tiene una persona o el
tamaño de sus zapatos se pueden usar para revelar la identidad de un
participante del estudio si el tamaño de la muestra es pequeño.
81. Protección de datos personales.
Un proyecto de investigación debe incluir medidas de protección:
Analice si es realmente necesario recopilar datos personales para
realizar la investigación;
Considere la recopilación de datos de forma anónima si es posible;
Identificar qué datos personales pueden incluirse;
Incluir aspectos de protección de datos en el plan de GD;
Crear y usar formularios de consentimiento;
Definir una estrategia de anonimato apropiada para la investigación;
Garantice un almacenamiento seguro, control de acceso, etc.;
CESSDA proporciona algunos consejos útiles sobre cómo adaptar su
plan de gestión de datos para abarcar la protección de datos aqui.
82. Universidade do Minho Serviços de Documentação
TÍTULO DA APRESENTAÇÃO
Complemento de título
• Nome:
• e-mail:
• url
Universidade do Minho Serviços de Documentação
RELEVANCIA DE LA APERTURA,
PUBLICACIÓN Y GESTIÓN DE DATOS
El poder de
los datos en
el mundo
digital
Importancia
de los
procesos de
ciencia
abierta
Políticas de
los
financiadores
Requisitos
del editor
Urgencia de
los datos
FAIR
Refuerzo del
papel de las
instituciones