4to Taller LEARN sobre Datos de Investigación: Implementación de políticas y estrategias en América Latina y el Caribe.
27 de octubre de 2016, Santiago de Chile. CEPAL (Chile).
Harris, Marvin. - Caníbales y reyes. Los orígenes de la cultura [ocr] [1986].pdf
Gestión de datos de investigación, primeros pasos en argentina
1. Implementación de políticas y estrategias en
América Latina y el Caribe
IV Taller LEARN de Gestión de Datos de Investigación
Santiago, Chile, 27 de Octubre de 2016
Fernando Ariel López
(CAICYT - CONICET)
flopez@caicyt.gov.ar | @fernando__lopez
Gestión de Datos de Investigación,
una propuesta ARGENTINA
2. Fernando Ariel López
(CAICYT - CONICET, Argentina)
• Coordinador Comunicación y Formación / CAICYT-
CONICET
• Director de Biblioteca / UMET
• Co-Fundador y Director / Aprender 3C
• Integra el proyecto de investigación sobre Acceso Abierto /
IIGG-UBA
• Docente / UNAL-PO (Paraguay) y IFTS N°13 (GCBA)
• Autor y Coordinador Comunicaciones / InfoTecarios
• Evaluador en diversas revistas científicas y congresos
profesionales.
Expositor, Consultor y Formador en Acceso Abierto al
conocimiento científico (Repositorios y Revistas Digitales),
Ciencia Abierta (Datos científicos y Plan de Gestión de Datos),
Ciencia 2.0, Web social, Tecnologías de Información y
Comunicación, Alfabetización Informacional, Alfabetizador
Digital, etc.
Más información en about.me/fernandoariellopez
3. BIG DATA: Redes Sociales, IOT,
Smart City, Sensores, Wereables, …
4. CIENCIA à Ciencia Abierta
GOBIERNO à Gobierno Abierto
SOCIEDAD à Periodismo de Datos,
Hackativismo Cívico, Innovación abierta, etc.
5. LEGISLACIÓN
• RESOLUCIÓN 538 de JFG (junio 2013)
Sistema Nacional de Datos Públicos
• LEY 26.899 (diciembre 2013)
Creación de Repositorios Digitales Institucionales de
Acceso Abierto, Propios o Compartidos
• DECRETO 117 (enero 2016)
Plan de Apertura de Datos
• Ley Acceso a la Información Pública (2016)
Acceso a la Información Pública
6. → hechos, observaciones o experiencias (basado argumento, teoría o prueba)
→ pueden ser numéricos, descriptivos o visuales.
→ pueden ser en estado bruto o analizado,
→ pueden ser experimentales u observacionales.
→ pueden ser abiertos o cerrados
¿Qué son los datos de investigación?¿Qué son los datos de investigación?
7. ● Es una colección de datos reunidos durante la ejecución de un
proyecto de investigación.
● Son objetos digitales compuestos y heterogéneos.
● Constituye la base de la investigación y va asociado a una
publicación científica (resultado de la investigación).
● Se almacena y gestiona en Repositorios Interoperables conforme a
estándares internacionales.
Es el objeto específico de
control, organización,
descripción y preservación
de datos científicos
DATASET
8. CIENCIA
Líneas de Trabajo:
1. POLÍTICA DE DATOS CIENTÍFICOS
2. CICLO DE VIDA DE LOS DATOS CIENTÍFICOS
3. PLAN DE GESTIÓN DE DATOS CIENTÍFICOS
4. E-INFRAESTRUCTURAS
5. ROLES, COMPETENCIAS y FORMACIÓN
9.
10. 1. Diseño y planificación de la creación/extracción
de datos
2. Creación/Extracción de Datos
3. Limpieza, Normalización y Descripción de Datos
4. Almacenamiento y Preservación de Datos
5. Exploración, Explotación y Visualización de Datos
6. DataMining & Knowledge Discovery
CICLO DE VIDA DE LOS
DATOS CIENTÍFICOS
12. ¿Qué es un PGD?
Un plan de gestión de datos científicos (Data Management Plan - DMP)
es un documento elaborado por el investigador o grupo de investigación
donde se define:
• Qué datos van a ser creados y cómo,
• Cómo se van a describir, organizar, almacenar y gestionar los datos
• De qué forma van a ser compartidos, explicando cualquier restricción
de uso que pueda ser aplicada.
• Quién o quiénes serán los responsables de realizar cada una de estas
actividades.
• de qué forma van a ser compartidos, explicando cualquier restricción de
uso que pueda ser aplicada.
13.
14.
15.
16. DMP Argentina (CAICYT-CONICET)
Propuesta para Proyecto de Investigación:
• Bloque de Datos administrativos
• Bloque de Recolección de datos
• Bloque de Documentación y metadatos
• Bloque de Almacenamiento y copias de
seguridad
• Bloque de Selección y preservación
• Bloque de Re-uso de Datos
17. JULIO 2016
LANZAMIENTO DE UN PILOTO PGD CONICET
42 PROYECTOS UE INVITADOS
20 PROYECTOS UE VOLUNTARIOS
OBJETIVO
Evaluar el contenido del PGD
Conocer el tratamiento de los datos
Relevar el interés y las necesidades de los
investigadores, agencias de investigación y
financiadores
ALGUNOS RESULTADOS…
ENCUESTA DEL PILOTO – PGD CONICET
21. 75% CONSIDERA APROPIADA LA ORGANIZACIÓN del CONTENIDO
60% ASUMEN COMO NECESIDAD LA GESTION de un PGD
50% REQUIEREN SOPORTE O CAPACITACIÓN
50% REQUIERE MÁS INFORMACIÓN ACERCA del USO DE
ESTÁNDARES Y ESQUEMAS DE METADATOS
ENCUESTA DEL PILOTO – PGD CONICET
22. e-INFRAESTRUCTURAS
Repositorio Interoperable de Datos
• Datos Públicos Argentina (CKAN, OKF),
• Zenodo (Invenio, CERN)
• DRYAD, PLICSS, LAGOS (DSpace, MIT & HP),
• Harvard DATAVERSE (Eprints)
Plataforma de Trabajo para Investigadores
• OSF, HubZero, MyExperiment.org, etc.
Cluster de Almacenamiento y/o Procesamiento
24. La profesión del futuro.
Es el encargado en extraer el
conocimiento de los datos. Para ello
deber tener sólidos conocimientos
estadísticos, poseer destrezas para
resolver problemas, hacer preguntas y
explicar los resultados obtenidos.
Data Scientist / Científicos de Datos
25. Bibliotecari@ de Datos / Data Librarian
Es un término ad-hoc, es la aplicación de los principios
y las prácticas tradicionales de los bibliotecarios a los
datos.
El perfil del bibliotecario de datos requiere:
• Competencias informáticas
• Conocimiento de la disciplina (corpus, prácticas de
investigación y flujos de trabajo)
• Gestión de datos:
q adquisición (desarrollo de la colección),
q organización (catalogación y metadatos),
q preservación y conservación a largo plazo
q implementación de servicios adecuados para los
usuarios.
27. COMPETENCIAS
• Estadística, Algebra y Programación
• Tecnologías y Formatos Abiertos
• XML, PYTHON, R, etc.
• Herramientas de normalización, procesamiento
y visualización.
• Comunicación (visual y audiovisual)
• Diseño Centrado en el Usuario (UX)
28.
29.
30. OPORTUNIDADES
Comunidad Científica:
• Acordar estándares de trabajo, normalización y gestión de datos
• Empoderar en Gestión de Datos Científicos
• Contribuir al avance de la ciencia, maximizando la visibilidad y el impacto
de la inversión en Investigación
• Financiamiento y Desarrollo de e-infraestructuras para el
aprovechamiento de la Big Data Científica
• Encuentro con otras comunidades de Gobierno Abierto, Periodismo de
Datos, HackActivismo Cívico, IoT, etc.