por Fernando Ariel López (CAICYT-CONICET) y Lorena Carlino (CONICET) en las Jornadas Virtuales de Acceso Abierto 2016 (25 de octubre de 2016). Más información en http://www.caicyt-conicet.gov.ar/micrositios/accesoabierto/
Tema 1. Generalidades de Microbiologia Universidad de Oriente
Gestión de datos de investigación
1. Gestión de datos de investigación
Fernando Ariel López (CAICYT-CONICET) flopez@caicyt.gov.ar
Lorena Carlino (CONICET) lcarlino@conicet.gov.ar
#JVAA2016 #AccesoAbierto #OAW16
2. Fernando Ariel López
(CAICYT - CONICET, Argentina)
•Coordinador Comunicación y Formación / CAICYT-CONICET
•Director de Biblioteca / UMET
•Co-Fundador y Director / Aprender 3C
•Integra el proyecto de investigación sobre Acceso Abierto /
IIGG-UBA
•Docente / UNAL-PO (Paraguay) y IFTS N°13 (GCBA)
•Autor y Coordinador Comunicaciones / InfoTecarios
•Evaluador en diversas revistas científicas y congresos
profesionales.
Expositor, Consultor y Formador en Acceso Abierto al
conocimiento científico (Repositorios y Revistas Digitales),
Ciencia Abierta (Datos científicos y Plan de Gestión de Datos),
Ciencia 2.0, Web social, Tecnologías de Información y
Comunicación, Alfabetización Informacional, Alfabetizador
Digital, etc.
3. Lorena Carlino
(CONICET, CABA, Argentina)
Actualmente tiene a su cargo la Oficina Técnica
Central de Repositorios Institucionales del
CONICET. Es Licenciada en Bibliotecología y
Documentación (UMSA), Especialista en
Comunicación Institucional (Universidad
Austral). Se ha involucrado en la gestión de la
información digital y el uso compartido de la
información. Lleva adelante la ejecución de
entornos de acceso abierto, el intercambio de
datos de investigación y la implementación de
sistemas interoperables para facilitar y acercar
el conocimiento.
6. LEGISLACIÓNLEGISLACIÓN
• LEY 26.899 (2013)
Creación de Repositorios Digitales Institucionales de
Acceso Abierto, Propios o Compartidos
• RESOLUCIÓN 538 de JFG (2013)
Sistema Nacional de Datos Públicos
• DECRETO 117 (2016)
Plan de Apertura de Datos
• Ley Acceso a la Información Pública
(2016)
Acceso a la Información Pública
7. → hechos, observaciones o experiencias (basado argumento, teoría o prueba)
→ pueden ser numéricos, descriptivos o visuales.
→ pueden ser en estado bruto o analizado,
→ pueden ser experimentales u observacionales.
→ pueden ser abiertos o cerrados
¿Qué son los datos de investigación?¿Qué son los datos de investigación?
8. Los datos incluyen: cuadernos de laboratorio, cuadernos de campo, datos
de investigación primaria (incluidos los datos en papel o en soporte
informático), cuestionarios, cintas de audio, videos, desarrollo de
modelos, fotografías, películas, y las comprobaciones y las respuestas de la
prueba.
Las colecciones datos para la investigación pueden incluir diapositivas;
diseños y muestras.
En la información sobre la procedencia de los datos también se podría incluir:
el cómo, cuándo, donde se recogió y con que (por ejemplo, instrumentos).
El código de software utilizado para generar, comentar o analizar los
datos también pueden ser considerados datos.”
¿Qué son los datos de investigación?¿Qué son los datos de investigación?
9. ● Es una colección de datos reunidos durante la ejecución de un
proyecto de investigación.
● Son objetos digitales compuestos y heterogéneos.
● Constituye la base de la investigación y va asociado a una
publicación científica (resultado de la investigación).
● Se almacena y gestiona en Repositorios Interoperables conforme a
estándares internacionales.
Es el objeto específico de
control, organización,
descripción y preservación
de datos científicos
DATASET
10. BENEFICIOS #DatosAbiertos
●
Ayuda a verificar los resultados.
●
Evitar la fabricación y falsificación de datos.
●
Diferentes interpretaciones o enfoques
aplicados a datos existentes contribuyen a
los avances científicos.
●
Optimización en el uso de recursos.
●
Preservación a largo plazo bien gestionada,
permite mantener la integridad de los datos.
TenopirC, Allard S, Douglass K, AydinogluAU, et al. (2011) Data Sharing by Scientists: Practices
and Perceptions. PLoSONE 6(6): e21101. doi:10.1371/journal.pone.0021101
http://www.plosone.org/article/info:doi/10.1371/journal.pone.0021101
11. CIENCIA
Líneas de Trabajo:
1.POLÍTICA DE DATOS CIENTÍFICOS
2.CICLO DE VIDA DE LOS DATOS CIENTÍFICOS
3.PLAN DE GESTIÓN DE DATOS CIENTÍFICOS
4.E-INFRAESTRUCTURAS
12.
13. 1. Diseño y planificación de la creación/extracción
de datos
2. Creación/Extracción de Datos
3. Limpieza, Normalización y Descripción de Datos
4. Almacenamiento y Preservación de Datos
5. Exploración, Explotación y Visualización de Datos
6. DataMining & Knowledge Discovery
CICLO DE VIDA DE LOS
DATOS CIENTÍFICOS
CICLO DE VIDA DE LOS
DATOS CIENTÍFICOS
14.
15.
16. ¿Qué es un PGD?¿Qué es un PGD?
Un plan de gestión de datos científicos (Data Management Plan - DMP)
es un documento elaborado por el investigador o grupo de investigación
donde se define:
•
•cómo se van a describir, organizar, almacenar y gestionar los datos
•
uso que pueda ser aplicada.
•Quién o quiénes serán los responsables de realizar cada una de estas
actividades.
•
uso que pueda ser aplicada.
17. DMP Argentina (CAICYT-
CONICET)
DMP Argentina (CAICYT-
CONICET)
Propuesta para Proyecto de Investigación:
•Bloque de Datos administrativos
•Bloque de Recolección de datos
•Bloque de Documentación y metadatos
•Bloque de Almacenamiento y copias de
seguridad
•Bloque de Selección y preservación
•Bloque de Re-uso de Datos
18. e-INFRAESTRUCTURASe-INFRAESTRUCTURAS
Repositorio Interoperable de Datos
•Datos Públicos Argentina (CKAN, OKF),
•Zenodo (Invenio, CERN)
•DRYAD, PLICSS, LAGOS (DSpace, MIT & HP),
•Harvard DATAVERSE (Eprints)
Plataforma de Trabajo para Investigadores
•OSF, HubZero, MyExperiment.org, etc.
Cluster de Almacenamiento y/o Procesamiento
20. La profesión del futuro.
Es el encargado en extraer el
conocimiento de los datos. Para ello
deber tener sólidos conocimientos
estadísticos, poseer destrezas para
resolver problemas, hacer preguntas y
explicar los resultados obtenidos.
Data Scientist / Científicos de Datos
21. Bibliotecari@ de Datos / Data Librarian
Es un término ad-hoc, es la aplicació n de los
principios y las prácticas tradicionales de los
bibliotecarios a los datos.
El perfil del bibliotecario de datos requiere:
•Competencias informáticas
•Conocimiento de la disciplina (corpus, prácticas de
investigació n y flujos de trabajo)
•Gestió n de datos:
adquisició n (desarrollo de la colecció n),
organizació n (catalogació n y metadatos),
preservació n y conservació n a largo plazo
implementació n de servicios adecuados para
los usuarios.
23. COMPETENCIAS
• Estadística, Algebra y Programació n
• Tecnologías y Formatos Abiertos
• XML, PYTHON, R, etc.
• Herramientas de normalizació n, procesamiento
y visualizació n.
• Comunicació n (visual y audiovisual)
• Diseñ o Centrado en el Usuario (UX)
24. Ley 26.899
• DESARROLLAR REPOSITORIOS DIGITALES INSTITUCIONALES
DE ACCESO ABIERTO
• ESTABLECER POLÍTICAS
• PRESENTACIÓN DE UN PLAN DE GESTIÓN
• DEPOSITO DE DATOS PRIMARIOS COLECTADOS Y DE LA
PRODUCCIÓN RESULTANTE DE INVESTIGACIONES
FINANCIADAS CON FONDOS PÚBLICOS EN ESOS
REPOSITORIOS
26. HACIA EL
DESARROLLO DE
UN REPOSITORIO
DE DATOS DE
INVESTIVACIÓN
REPOSITORIO
DE DATOS
POLÍTICAS Y
ESTRATEGIAS
PLAN DE
GESTIÓN DE
DATOS
METADATOS
GENÉRICOS Y
DOCUMENTACIÓN
DESARROLLO DE
PLATAFORMA
Gerencia de
Organización y
Sistemas
Gerencia de Desarrollo
29. Y sobre todo…
Es una herramienta para el investigador
¿QUÉ ES UN PLAN DE GESTION DE DATOS?
Es un documento que permite conocer el tratamiento que van a recibir los
datos recopilados o generados en el curso de una investigación.
quiénes están involucrados en el flujo de los datos de investigación;
cuáles son sus prácticas, necesidades y límites a la hora de compartir sus
datos;
qué datos se están generando, cómo se están almcenando y qué grado de
grado de apertura tendrán ;
30. PILOTO – PGD CONICET
JULIO 2016
LANZAMIENTO DE UN PILOTO PGD CONICET
42 PROYECTOS UE INVITADOS
20 PROYECTOS UE VOLUNTARIOS
OBJETIVO
Evaluar el contenido del PGD
Conocer el tratamiento de los datos
Relevar el interés y las necesidades
ALGUNOS RESULTADOS…
PILOTO PGD - CONICET
34. 50% REQUIEREN SOPORTE O CAPACITACIÓN
75% CONSIDERA APROPIADA LA ORGANIZACIÓN DEL CONTENIDO
60% ASUMEN COMO NECESIDAD LA GESTION DE UN PGD
50% REQUIERE MÁS INFORMACIÓN ACERCA DEL USO DE
ESTÁNDARES Y ESQUEMAS DE METADATOS
IMPLEMENTACION
Plan de Gestión de Datos
ENTORNO WEB
CAPACITACIÓN
•Diseño del Sitio Web - FAQ
•Contenido informativo y de consulta
•Talleres online
•Instalación del DMP seleccionado
•Sinergia con MinCyT
2016 - 2017
ENCUESTA DEL PILOTO – PGD CONICET
35. ¿Problemas?
SOMOS GRANDES LECTORES DE ACCESO ABIERTO y
POCO AUTORES DE ACCESO ABIERTO
AUTOARCHIVO
¿Soluciones?
Acompasar el cambio mostrando los beneficios de la apertura tanto
institucionalmente como de quienes son productores
GENERAR CONCIENCIA
ABRIR EN ACCION
36. Incrementa la citación
Uso y reuso, velocidad y
reaprovechamiento
Almacenamiento y preservación
Obtención de Indicadores y
tendencias más reales
Eleva el factor de
impacto
Aumenta la Visibilidad
individual e Institucional
Localización sistemática de la
información
Mejoras en la calidad de la
investigación
Uso de estándares e identificadores
unívocos
Ahorro de fondos públicos
37. GENERAR CONCIENCIA
GESTIONAR EL CAMBIO EFECTIVAMENTE
MARCO
ADECUADO
CONFIANZA BENEFICIOSBENEFICIOS
Leyes
Políticas
Lineamientos
Sistemas amigables
Plataformas robustas
Uso de estándares
Actualización permanente
Resguardos
Aumento de la visibilidad
Incremento de citaciones
Preservación
Localización organizada
Sin duplicidad de esfuerzos
SERVICIOSSERVICIOS
Capacitación
Mesa de Ayuda
Proveer Recursos