SlideShare una empresa de Scribd logo
1 de 58
Descargar para leer sin conexión
Datos abiertos en ciencias
(4to. Taller LEARN, CEPAL, Santiago, 27 octubre 2016)
Claudio Guti´errez • DCC, Universidad de Chile / CIWS •
cgutierr@dcc.uchile.cl
. ”[...] la Compa˜n´ıa de Jes´us que no permite al profano el
acceso a sus colecciones, por lo que tantos problemas de la
historia quedar´an siempre desesperadamente oscuros, o el
Banco de Francia que no permite a los especialistas del primer
Imperio consultar sus registros [...] as´ı seguiremos, hasta que
las sociedades consientan organizar racionalmente, con su
memoria, el conocimiento de s´ı mismas. No lo lograr´an sino
luchando cuerpo a cuerpo con los dos principales
responsables del olvido y la ignorancia: la negligencia que
extrav´ıa documentos, y, m´as peligroso a´un, la pasi´on por
el secreto [...] Nuestra civilizaci´on habr´a hecho un inmenso
progreso el d´ıa en que el disimulo, erigido en m´etodo de
acci´on y casi en virtud burguesa, deje el lugar al gusto por
la informaci´on.
(MARC BLOCH, APOLOG´IA PARA LA HISTORIA, 1943)
M´as informaci´on, m´as comunicaci´on no elimina la fundamental
imprecisi´on del todo, mas bien la agrava. [...] La masa de
informaci´on no engendra ninguna verdad. Cuanta m´as
informaci´on se pone en marcha, tanto m´as intrincado se
hace el mundo. La hiperinformaci´on y la hipercomunicaci´on
no inyecta ninguna luz en la oscuridad. (BYUNG-CHUL HAN, LA
SOCIEDAD DE LA TRANSPARENCIA, 2012)
ASUNTO POL´ITICO Y T ´ECNICO
En esta charla: el desaf´ıo t´ecnico
I. Datos abiertos hoy
II. Entender los datos
A- Datos
B- Datos abiertos
C- Datos abiertos cient´ıficos
III. Desaf´ıos
I. DATOS ABIERTOS HOY
Resumen:
• Portales de datos cient´ıficos
• APIs para datos cient´ıficos online
• Datasets y journals
• Visualizaciones y herramientas
• Marcos legales y regulaciones
• Iniciativas pro datos abiertos
• ... ¿qu´e m´as?... ¿c´omo jerarquizar?
II. ENTENDER LOS DATOS
II.A. DATOS
ACLARACI ´ON NECESARIA
Datos = informaci´on; Datos = conocimiento
conocimiento = informaci´on + metainformaci´on
informaci´on = datos + metadatos
datos = ?
DATOS (DEFINICI ´ON DE BUR ´OCRATA)
hechos y estad´ısticas reunidas para referencia o an´alisis
COMPUTACI ´ON. cantidades, caracteres o s´ımbolos sobre
las que opera un computador, almacenadas y transmitidas
en forma de se˜nales el´ectricas y almacenadas en medios
magn´eticos, ´opticos o mec´anicos.
FILOSOF´IA. cosas conocidas o asumidas como hechos,
que forman la base de un razonamiento o c´alculo
DATOS (DEFINICI ´ON ENTRE NOS)
Datos
Mundo virtual
=
Atomos
Mundo material
O sin matem´aticas:
Ciencia de los datos = qu´ımica del mundo virtual
¿QU ´E ES UN DATO? UN DATASET?
1. Definici´on extensional:
• Un archivo de datos
• Un conjunto (red) de archivos de datos
2. Definici´on intensional:
• Una URI (o una direcci´on o una API)
• La salida (el output) de un sensor
• Un concepto: “los jugadores de la Premier League”
GESTIONAR DATOS VERSI ´ON 1.0
(el enfoque tradicional)
1. Limpiar, organizar, clasificar
2. Sistema de curator´ıa y almacenamiento
3. Sistema de recuperaci´on (cat´alogos, lenguajes consulta,
etc.)
Ejemplo de enfoque tradicional: NATURE
SCIENTIFIC DATA JOURNAL:
“Scientific Data is a peer-reviewed, open-access journal for
descriptions of scientifically valuable datasets, and research
that advances the sharing and reuse of scientific data.”
GESTIONAR DATOS VERSI ´ON 2.0
JIM GRAY: No mover los datos...
La Web como unificador, como infraestrutura de datos
1. Repositorios locales de los propios productores y
organizaciones que los producen
2. Infraestructura para integrarlos (virtualmente) y enlazarlos
3. Sistema de archivo para efectos de seguridad
¿Y los bibliotecarios d´onde quedan?: dise˜no integraci´on,
est´andares de metadatos, sistemas de archivo.
¿POR QU ´E HABLAMOS DE ESTO hoy?
1. Nuevas tecnolog´ıas de captura, transformaci´on y
almacenamiento de datos. Diluvio datos
2. Alcanzamos las fronteras de nuestro “hogar com´un”.
Empezamos a “toparnos” (Brundtland Report).
Interconectiviidad
3. Nueva forma de crear conocimiento. Otra “ciencia”.
I.B. DATOS CIENT´IFICOS
PREGUNTA (NADA) INGENUA:
¿Qu´e son “datos cient´ıficos” (de “investigaci´on”)?
Los datos cient´ıficos se definen como informaci´on recolectada
usando m´etodos espec´ıficos para un prop´osito espec´ıfico de
estudio o an´alisis. Datos recolectados en un experimento de
laboratorio hecho bajo condiciones controladas es un ejemplo
de datos cient´ıficos.
“Datos generados en el ciclo de vida de una investigaci´on
como de sus resultados.” (Biblioteca CEPAL).
PREGUNTA (NADA) INGENUA:
¿Qu´e son “datos cient´ıficos”?
(OECD) “Research data” are defined as factual records
(numerical scores, textual records, images and sounds) used
as primary sources for scientific research, and that are
commonly accepted in the scientific community as necessary to
validate research findings. A research data set constitutes a
systematic, partial representation of the subject being
investigated.
PREGUNTA (NADA) INGENUA:
¿Qu´e son “datos cient´ıficos”?
1. Diferencia importante: datos “usados” versus datos
“recolectados” o “generados”
2. M´as amplio que datos que generan (o que dejan) los
proyectos cient´ıficos (e.g. para efectos de replicaci´on)
3. Verdadero desaf´ıo que viene: datos de sensores
4. Otros no menores: privacidad, seguridad (datos m´edicos)
II.C. DATOS ABIERTOS
Un dato es abierto si cualquiera es libre para
acceder a ´el, usarlo, modificarlo y compartirlo
bajo condiciones que, como mucho, preserven
su autor´ıa y su apertura.
(Handbook of Open Data)
NSF Principles:
Public
Accesible
Described
Reusable
Complete
Timely
Managed Post Release
OECD Principles
Openness Flexibility
Transparency Legal conformity
Professionalism Interoperability
Quality Security
Efficiency Accountability
Sustainability Formal responsability
Protection of
intellectual property
OKF Principles
Access (whole, cost, form)
Redistribution & Reuse
Atribution & Integrity
No discrimination against persons or groups
No discrimination gaints fields of endeavor
Distribution of License
License must not be specific to package
License must not restrict distribution of other works
Cinco enfoques y argumentos para “open”:
1. Democracia: acceso est´a hoy desigualmente
distribu´ıdo
2. Econom´ıa: baja los costos y promueve la innovaci´on
3. T´ecnico: ventajas t´ecnicas de arquitecturas abiertas
4. Transparencia: datos deben ser accesibles a todo
p´ublico
5. Accountability: mejora la replicabilidad y la auditor´ıa
(tomado y modificado de Fecher & Friesike, 2014)
Open realmente open
At the end of the day, information outlives software and
transcends software and is more valuable than software. I
think any online service can call itself “Open” if it makes,
and lives up to, this commitment: Any data that you give
us, we’ll let you take away again, without withholding
anything, or encoding it in a proprietary format, or
claiming any intellectual-property rights whatsoever.
(Set My Data Free, Tim Bray, 2006)
III. DESAF´IOS
ALGUNOS DESAF´IOS:
1. “Negligencia que extrav´ıa.” Hacer conciencia sobre el valor
de los datos.
2. “Pasi´on por el secreto” (y crisis del concepto de
propiedad para datos, informaci´on, conocimiento).
Cambiar mentalidad.
3. Modelos de incentivos y negocios adecuados. Entender
los commons del mundo virtual.
4. M´as desafiante que los anteriores: lidiar con la avalancha
de datos.
“Some of the design flaws of current open data sites are pretty
obvious. The datasets that are more important, or could
potentially be more useful, are not brought into the surface of
these sites” (C´esar Hidalgo)
DESAF´IO 1: ¿C´omo calcular el valor de los datos? Ante
la avalancha de datos, ¿c´omo jerarquizar los datos?
Cantidad de datos excede por mucho las capacidades
humanas de “I/O”.
DESAF´IO 2: Visualizaci´on, interfaces para m´aquinas,
recuperaci´on automatizada de datos
Mentalidad cl´asica: bases de datos, repositorios “finitos”,
accesos locales, enfoque centralizado.
DESAF´IO 3: Datos globales como extensi´on de los
locales o cualitativamente diferentes? (infinitos, globales,
decentralizados)
Los datos (´atomos) est´an naturalmente enlazados
DESAF´IO 4: La estructura de enlazamiento (de red) de
los datos Cu´anto replicar, c´omo (e.g. portales de datos
abiertos). El tema de las dificultades t´ecnicas.
Test de las cinco estrellas:
1. disponga sus datos en la Web (en cualquier formato) bajo
licencias abiertas
2. disp´ongalos como datos estructurados (e.g. use Excel en
vez de la imagen escaneadas de una tabla)
3. h´agalos disponibles en formatos abiertos no propietarios
(e.g. CSV en vez de Excel)
4. use URIs para denotar cosas, de forma que las personas
puedan apuntar a, o referenciar vuestros datos
5. enlace sus datos a otros datos para proveer contexto
GRACIAS POR LA ATENCI ´ON
cgutierr@dcc.uchile.cl

Más contenido relacionado

La actualidad más candente

Gestión de datos de investigación, primeros pasos en argentina
Gestión de datos de investigación, primeros pasos en argentinaGestión de datos de investigación, primeros pasos en argentina
Gestión de datos de investigación, primeros pasos en argentinaFernando-Ariel Lopez
 
Workshop de datos científicos. Introducción
Workshop de datos científicos. IntroducciónWorkshop de datos científicos. Introducción
Workshop de datos científicos. IntroducciónFernando-Ariel Lopez
 
Gestión de datos de investigación
Gestión de datos de investigaciónGestión de datos de investigación
Gestión de datos de investigaciónFernando-Ariel Lopez
 
Primeros para implementar un plan de gestión de datos
Primeros para implementar un plan de gestión de datosPrimeros para implementar un plan de gestión de datos
Primeros para implementar un plan de gestión de datosFernando-Ariel Lopez
 
Avances en torno a la Ley 26.899 e iniciativa regional de datos primarios de...
Avances en torno a la Ley 26.899 e iniciativa regional de datos primarios de...Avances en torno a la Ley 26.899 e iniciativa regional de datos primarios de...
Avances en torno a la Ley 26.899 e iniciativa regional de datos primarios de...LEARN Project
 
Datos Abiertos de Investigacion - Caso Mexico
Datos Abiertos de Investigacion - Caso MexicoDatos Abiertos de Investigacion - Caso Mexico
Datos Abiertos de Investigacion - Caso MexicoLEARN Project
 
Plan de gestión de datos de investigación: una propuesta Argentina del CAICYT...
Plan de gestión de datos de investigación: una propuesta Argentina del CAICYT...Plan de gestión de datos de investigación: una propuesta Argentina del CAICYT...
Plan de gestión de datos de investigación: una propuesta Argentina del CAICYT...Fernando-Ariel Lopez
 
Ley peruana de Repositorios Digitales
Ley peruana de Repositorios DigitalesLey peruana de Repositorios Digitales
Ley peruana de Repositorios DigitalesLibio Huaroto
 
Interop metadata tony
Interop metadata tonyInterop metadata tony
Interop metadata tonymaredata
 
Mare d seminario-rmelero
Mare d seminario-rmeleroMare d seminario-rmelero
Mare d seminario-rmeleromaredata
 
Repositorios peruanos: reflexiones y perspectivas
Repositorios peruanos: reflexiones y perspectivasRepositorios peruanos: reflexiones y perspectivas
Repositorios peruanos: reflexiones y perspectivasLibio Huaroto
 
Repositorios digitales como apoyo a la investigación científica
Repositorios digitales como apoyo a la investigación científicaRepositorios digitales como apoyo a la investigación científica
Repositorios digitales como apoyo a la investigación científicaLibio Huaroto
 
Presentacion barcelona 3.rafael.antonia.v2
Presentacion barcelona 3.rafael.antonia.v2Presentacion barcelona 3.rafael.antonia.v2
Presentacion barcelona 3.rafael.antonia.v2maredata
 
Gestion de datos para la investigacion: el caso peruano by Edward Mezones, Su...
Gestion de datos para la investigacion: el caso peruano by Edward Mezones, Su...Gestion de datos para la investigacion: el caso peruano by Edward Mezones, Su...
Gestion de datos para la investigacion: el caso peruano by Edward Mezones, Su...LEARN Project
 
Gestión de datos de investigación. Fundación Juan March
Gestión de datos de investigación. Fundación Juan MarchGestión de datos de investigación. Fundación Juan March
Gestión de datos de investigación. Fundación Juan MarchFESABID
 
Red Maredata - Universidad de Alicante - EDAUA16
Red Maredata - Universidad de Alicante - EDAUA16Red Maredata - Universidad de Alicante - EDAUA16
Red Maredata - Universidad de Alicante - EDAUA16datos.ua.es
 

La actualidad más candente (20)

Gestión de datos de investigación, primeros pasos en argentina
Gestión de datos de investigación, primeros pasos en argentinaGestión de datos de investigación, primeros pasos en argentina
Gestión de datos de investigación, primeros pasos en argentina
 
Workshop de datos científicos. Introducción
Workshop de datos científicos. IntroducciónWorkshop de datos científicos. Introducción
Workshop de datos científicos. Introducción
 
Gestión de datos de investigación
Gestión de datos de investigaciónGestión de datos de investigación
Gestión de datos de investigación
 
Gestión de Datos Científicos
Gestión de Datos CientíficosGestión de Datos Científicos
Gestión de Datos Científicos
 
Primeros para implementar un plan de gestión de datos
Primeros para implementar un plan de gestión de datosPrimeros para implementar un plan de gestión de datos
Primeros para implementar un plan de gestión de datos
 
Avances en torno a la Ley 26.899 e iniciativa regional de datos primarios de...
Avances en torno a la Ley 26.899 e iniciativa regional de datos primarios de...Avances en torno a la Ley 26.899 e iniciativa regional de datos primarios de...
Avances en torno a la Ley 26.899 e iniciativa regional de datos primarios de...
 
Datos Abiertos de Investigacion - Caso Mexico
Datos Abiertos de Investigacion - Caso MexicoDatos Abiertos de Investigacion - Caso Mexico
Datos Abiertos de Investigacion - Caso Mexico
 
Plan de gestión de datos de investigación: una propuesta Argentina del CAICYT...
Plan de gestión de datos de investigación: una propuesta Argentina del CAICYT...Plan de gestión de datos de investigación: una propuesta Argentina del CAICYT...
Plan de gestión de datos de investigación: una propuesta Argentina del CAICYT...
 
Ley peruana de Repositorios Digitales
Ley peruana de Repositorios DigitalesLey peruana de Repositorios Digitales
Ley peruana de Repositorios Digitales
 
Interop metadata tony
Interop metadata tonyInterop metadata tony
Interop metadata tony
 
Mare d seminario-rmelero
Mare d seminario-rmeleroMare d seminario-rmelero
Mare d seminario-rmelero
 
Repositorios peruanos: reflexiones y perspectivas
Repositorios peruanos: reflexiones y perspectivasRepositorios peruanos: reflexiones y perspectivas
Repositorios peruanos: reflexiones y perspectivas
 
Repositorios digitales como apoyo a la investigación científica
Repositorios digitales como apoyo a la investigación científicaRepositorios digitales como apoyo a la investigación científica
Repositorios digitales como apoyo a la investigación científica
 
Presentacion barcelona 3.rafael.antonia.v2
Presentacion barcelona 3.rafael.antonia.v2Presentacion barcelona 3.rafael.antonia.v2
Presentacion barcelona 3.rafael.antonia.v2
 
Gestion de datos para la investigacion: el caso peruano by Edward Mezones, Su...
Gestion de datos para la investigacion: el caso peruano by Edward Mezones, Su...Gestion de datos para la investigacion: el caso peruano by Edward Mezones, Su...
Gestion de datos para la investigacion: el caso peruano by Edward Mezones, Su...
 
Repositorios
RepositoriosRepositorios
Repositorios
 
CENTRO DE DATOS
CENTRO DE DATOSCENTRO DE DATOS
CENTRO DE DATOS
 
El proyecto LEARN y la gestión de datos de investigación: Avances y desafíos ...
El proyecto LEARN y la gestión de datos de investigación: Avances y desafíos ...El proyecto LEARN y la gestión de datos de investigación: Avances y desafíos ...
El proyecto LEARN y la gestión de datos de investigación: Avances y desafíos ...
 
Gestión de datos de investigación. Fundación Juan March
Gestión de datos de investigación. Fundación Juan MarchGestión de datos de investigación. Fundación Juan March
Gestión de datos de investigación. Fundación Juan March
 
Red Maredata - Universidad de Alicante - EDAUA16
Red Maredata - Universidad de Alicante - EDAUA16Red Maredata - Universidad de Alicante - EDAUA16
Red Maredata - Universidad de Alicante - EDAUA16
 

Destacado

LEARN: Helping Institutions to Build and Implement a Policy on research Data
LEARN: Helping Institutions to Build and Implement a Policy on research DataLEARN: Helping Institutions to Build and Implement a Policy on research Data
LEARN: Helping Institutions to Build and Implement a Policy on research DataLEARN Project
 
Research Data Management in São Paulo by Fabio Kon FAPESP
Research Data Management in São Paulo by Fabio Kon FAPESPResearch Data Management in São Paulo by Fabio Kon FAPESP
Research Data Management in São Paulo by Fabio Kon FAPESPLEARN Project
 
About Data From A Machine Learning Perspective
About Data From A Machine Learning PerspectiveAbout Data From A Machine Learning Perspective
About Data From A Machine Learning PerspectiveLEARN Project
 
Data for Development in the Caribbean
Data for Development in the CaribbeanData for Development in the Caribbean
Data for Development in the CaribbeanLEARN Project
 
Managing Research Data in the Caribbean: Good practices and challenges
Managing Research Data in the Caribbean: Good practices and challengesManaging Research Data in the Caribbean: Good practices and challenges
Managing Research Data in the Caribbean: Good practices and challengesLEARN Project
 
LEARN Project: The Story So Far
LEARN Project: The Story So FarLEARN Project: The Story So Far
LEARN Project: The Story So FarLEARN Project
 
The Data Deluge: the Role of Research Organisations
The Data Deluge: the Role of Research OrganisationsThe Data Deluge: the Role of Research Organisations
The Data Deluge: the Role of Research OrganisationsLEARN Project
 
El camino hacia la Gestión de Datos de Investigación: la experiencia de Perú ...
El camino hacia la Gestión de Datos de Investigación: la experiencia de Perú ...El camino hacia la Gestión de Datos de Investigación: la experiencia de Perú ...
El camino hacia la Gestión de Datos de Investigación: la experiencia de Perú ...LEARN Project
 
Data management: The new frontier for libraries
Data management: The new frontier for librariesData management: The new frontier for libraries
Data management: The new frontier for librariesLEARN Project
 
Developing a Framework for Research Data Management Protocols
Developing a Framework for Research Data Management ProtocolsDeveloping a Framework for Research Data Management Protocols
Developing a Framework for Research Data Management ProtocolsLEARN Project
 
Opening Research Data in EU Universities: Policies, Motivators and Challenges
Opening Research Data in EU Universities: Policies, Motivators and ChallengesOpening Research Data in EU Universities: Policies, Motivators and Challenges
Opening Research Data in EU Universities: Policies, Motivators and ChallengesLEARN Project
 
The Needs of Stakeholders in the RDM Process - the role of LEARN
The Needs of Stakeholders in the RDM Process - the role of LEARNThe Needs of Stakeholders in the RDM Process - the role of LEARN
The Needs of Stakeholders in the RDM Process - the role of LEARNLEARN Project
 

Destacado (12)

LEARN: Helping Institutions to Build and Implement a Policy on research Data
LEARN: Helping Institutions to Build and Implement a Policy on research DataLEARN: Helping Institutions to Build and Implement a Policy on research Data
LEARN: Helping Institutions to Build and Implement a Policy on research Data
 
Research Data Management in São Paulo by Fabio Kon FAPESP
Research Data Management in São Paulo by Fabio Kon FAPESPResearch Data Management in São Paulo by Fabio Kon FAPESP
Research Data Management in São Paulo by Fabio Kon FAPESP
 
About Data From A Machine Learning Perspective
About Data From A Machine Learning PerspectiveAbout Data From A Machine Learning Perspective
About Data From A Machine Learning Perspective
 
Data for Development in the Caribbean
Data for Development in the CaribbeanData for Development in the Caribbean
Data for Development in the Caribbean
 
Managing Research Data in the Caribbean: Good practices and challenges
Managing Research Data in the Caribbean: Good practices and challengesManaging Research Data in the Caribbean: Good practices and challenges
Managing Research Data in the Caribbean: Good practices and challenges
 
LEARN Project: The Story So Far
LEARN Project: The Story So FarLEARN Project: The Story So Far
LEARN Project: The Story So Far
 
The Data Deluge: the Role of Research Organisations
The Data Deluge: the Role of Research OrganisationsThe Data Deluge: the Role of Research Organisations
The Data Deluge: the Role of Research Organisations
 
El camino hacia la Gestión de Datos de Investigación: la experiencia de Perú ...
El camino hacia la Gestión de Datos de Investigación: la experiencia de Perú ...El camino hacia la Gestión de Datos de Investigación: la experiencia de Perú ...
El camino hacia la Gestión de Datos de Investigación: la experiencia de Perú ...
 
Data management: The new frontier for libraries
Data management: The new frontier for librariesData management: The new frontier for libraries
Data management: The new frontier for libraries
 
Developing a Framework for Research Data Management Protocols
Developing a Framework for Research Data Management ProtocolsDeveloping a Framework for Research Data Management Protocols
Developing a Framework for Research Data Management Protocols
 
Opening Research Data in EU Universities: Policies, Motivators and Challenges
Opening Research Data in EU Universities: Policies, Motivators and ChallengesOpening Research Data in EU Universities: Policies, Motivators and Challenges
Opening Research Data in EU Universities: Policies, Motivators and Challenges
 
The Needs of Stakeholders in the RDM Process - the role of LEARN
The Needs of Stakeholders in the RDM Process - the role of LEARNThe Needs of Stakeholders in the RDM Process - the role of LEARN
The Needs of Stakeholders in the RDM Process - the role of LEARN
 

Similar a Open Data in the world of Science” by Dr. Claudio Gutiérrez

Datos de investigación: reflexiones sobre su acceso abierto
Datos de investigación: reflexiones sobre su acceso abiertoDatos de investigación: reflexiones sobre su acceso abierto
Datos de investigación: reflexiones sobre su acceso abiertoSocialBiblio
 
Introducción a la terminología de la sociedad e
Introducción a la terminología de la sociedad eIntroducción a la terminología de la sociedad e
Introducción a la terminología de la sociedad eMegamovil
 
Minería de Datos: Conceptos y Tendencias
Minería de Datos: Conceptos y TendenciasMinería de Datos: Conceptos y Tendencias
Minería de Datos: Conceptos y Tendenciastravon1
 
Gestión del conocimiento y el desarrollo de Bibliotecas Digitales libres
Gestión del conocimiento y el desarrollo de Bibliotecas Digitales libresGestión del conocimiento y el desarrollo de Bibliotecas Digitales libres
Gestión del conocimiento y el desarrollo de Bibliotecas Digitales libresDiego Spano
 
Text mining para historiadores de arte
Text mining para historiadores de arteText mining para historiadores de arte
Text mining para historiadores de artePepe
 
introduccion-al-analisis-de-datos--------
introduccion-al-analisis-de-datos--------introduccion-al-analisis-de-datos--------
introduccion-al-analisis-de-datos--------RubnGarcs2
 
Aplicaciones Difusas: Evolución de las Bases de Datos
Aplicaciones Difusas: Evolución de las Bases de DatosAplicaciones Difusas: Evolución de las Bases de Datos
Aplicaciones Difusas: Evolución de las Bases de DatosLuis Fernando Aguas Bucheli
 
WEKA: Programa que Permite una mayor Comprensión y Acercamiento a la Minería ...
WEKA: Programa que Permite una mayor Comprensión y Acercamiento a la Minería ...WEKA: Programa que Permite una mayor Comprensión y Acercamiento a la Minería ...
WEKA: Programa que Permite una mayor Comprensión y Acercamiento a la Minería ...Jean Sanchez
 
INTERNET: Retos y Oportunidades en los Archivos
INTERNET:Retos y Oportunidades en los ArchivosINTERNET:Retos y Oportunidades en los Archivos
INTERNET: Retos y Oportunidades en los ArchivosKarla Arosemena
 
Produccinperiodismoenweb 120122075955-phpapp02
Produccinperiodismoenweb 120122075955-phpapp02Produccinperiodismoenweb 120122075955-phpapp02
Produccinperiodismoenweb 120122075955-phpapp02Universidad Autónoma
 
Produccinperiodismoenweb 120122075955-phpapp02
Produccinperiodismoenweb 120122075955-phpapp02Produccinperiodismoenweb 120122075955-phpapp02
Produccinperiodismoenweb 120122075955-phpapp02Universidad Autónoma
 
UNIDAD II: LA INFORMACIÓN CIENTÍFICA Y TÉCNICA.
UNIDAD II: LA INFORMACIÓN CIENTÍFICA Y TÉCNICA.UNIDAD II: LA INFORMACIÓN CIENTÍFICA Y TÉCNICA.
UNIDAD II: LA INFORMACIÓN CIENTÍFICA Y TÉCNICA.Lizeth Yuliana Pinto Roa
 
Innovación en el tratamiento de la información desde la Ingeniería del Conoc...
Innovación en el tratamiento de la información desde la  Ingeniería del Conoc...Innovación en el tratamiento de la información desde la  Ingeniería del Conoc...
Innovación en el tratamiento de la información desde la Ingeniería del Conoc...Joaquín Borrego-Díaz
 
Competencias informacionales para la búsqueda de información en la Web
Competencias informacionales para la búsqueda de información en la WebCompetencias informacionales para la búsqueda de información en la Web
Competencias informacionales para la búsqueda de información en la WebMaria Estrada
 
El Big Data como fenómeno y herramienta para el e‐research en CSyH Digitales
El Big Data como fenómeno y herramienta para el e‐research en CSyH DigitalesEl Big Data como fenómeno y herramienta para el e‐research en CSyH Digitales
El Big Data como fenómeno y herramienta para el e‐research en CSyH DigitalesMaría Sánchez González (@cibermarikiya)
 
Introducción a la terminología de la sociedad e
Introducción a la terminología de la sociedad eIntroducción a la terminología de la sociedad e
Introducción a la terminología de la sociedad eMegamover
 

Similar a Open Data in the world of Science” by Dr. Claudio Gutiérrez (20)

Datos de investigación: reflexiones sobre su acceso abierto
Datos de investigación: reflexiones sobre su acceso abiertoDatos de investigación: reflexiones sobre su acceso abierto
Datos de investigación: reflexiones sobre su acceso abierto
 
Big Data para mortales
Big Data para mortalesBig Data para mortales
Big Data para mortales
 
Introducción a la terminología de la sociedad e
Introducción a la terminología de la sociedad eIntroducción a la terminología de la sociedad e
Introducción a la terminología de la sociedad e
 
Clase 1-intro
Clase 1-introClase 1-intro
Clase 1-intro
 
Minería de Datos: Conceptos y Tendencias
Minería de Datos: Conceptos y TendenciasMinería de Datos: Conceptos y Tendencias
Minería de Datos: Conceptos y Tendencias
 
Gestión del conocimiento y el desarrollo de Bibliotecas Digitales libres
Gestión del conocimiento y el desarrollo de Bibliotecas Digitales libresGestión del conocimiento y el desarrollo de Bibliotecas Digitales libres
Gestión del conocimiento y el desarrollo de Bibliotecas Digitales libres
 
Text mining para historiadores de arte
Text mining para historiadores de arteText mining para historiadores de arte
Text mining para historiadores de arte
 
introduccion-al-analisis-de-datos--------
introduccion-al-analisis-de-datos--------introduccion-al-analisis-de-datos--------
introduccion-al-analisis-de-datos--------
 
Aplicaciones Difusas: Evolución de las Bases de Datos
Aplicaciones Difusas: Evolución de las Bases de DatosAplicaciones Difusas: Evolución de las Bases de Datos
Aplicaciones Difusas: Evolución de las Bases de Datos
 
Articulo ICIEI
Articulo ICIEIArticulo ICIEI
Articulo ICIEI
 
WEKA: Programa que Permite una mayor Comprensión y Acercamiento a la Minería ...
WEKA: Programa que Permite una mayor Comprensión y Acercamiento a la Minería ...WEKA: Programa que Permite una mayor Comprensión y Acercamiento a la Minería ...
WEKA: Programa que Permite una mayor Comprensión y Acercamiento a la Minería ...
 
INTERNET: Retos y Oportunidades en los Archivos
INTERNET:Retos y Oportunidades en los ArchivosINTERNET:Retos y Oportunidades en los Archivos
INTERNET: Retos y Oportunidades en los Archivos
 
Produccinperiodismoenweb 120122075955-phpapp02
Produccinperiodismoenweb 120122075955-phpapp02Produccinperiodismoenweb 120122075955-phpapp02
Produccinperiodismoenweb 120122075955-phpapp02
 
Produccinperiodismoenweb 120122075955-phpapp02
Produccinperiodismoenweb 120122075955-phpapp02Produccinperiodismoenweb 120122075955-phpapp02
Produccinperiodismoenweb 120122075955-phpapp02
 
UNIDAD II: LA INFORMACIÓN CIENTÍFICA Y TÉCNICA.
UNIDAD II: LA INFORMACIÓN CIENTÍFICA Y TÉCNICA.UNIDAD II: LA INFORMACIÓN CIENTÍFICA Y TÉCNICA.
UNIDAD II: LA INFORMACIÓN CIENTÍFICA Y TÉCNICA.
 
Diapositivasss
DiapositivasssDiapositivasss
Diapositivasss
 
Innovación en el tratamiento de la información desde la Ingeniería del Conoc...
Innovación en el tratamiento de la información desde la  Ingeniería del Conoc...Innovación en el tratamiento de la información desde la  Ingeniería del Conoc...
Innovación en el tratamiento de la información desde la Ingeniería del Conoc...
 
Competencias informacionales para la búsqueda de información en la Web
Competencias informacionales para la búsqueda de información en la WebCompetencias informacionales para la búsqueda de información en la Web
Competencias informacionales para la búsqueda de información en la Web
 
El Big Data como fenómeno y herramienta para el e‐research en CSyH Digitales
El Big Data como fenómeno y herramienta para el e‐research en CSyH DigitalesEl Big Data como fenómeno y herramienta para el e‐research en CSyH Digitales
El Big Data como fenómeno y herramienta para el e‐research en CSyH Digitales
 
Introducción a la terminología de la sociedad e
Introducción a la terminología de la sociedad eIntroducción a la terminología de la sociedad e
Introducción a la terminología de la sociedad e
 

Más de LEARN Project

Research Data Management, Challenges and Tools - Per Öster
Research Data Management, Challenges and Tools - Per Öster Research Data Management, Challenges and Tools - Per Öster
Research Data Management, Challenges and Tools - Per Öster LEARN Project
 
LEARN Final Conference: Tutorial Group | Using the LEARN Model RDM Policy
LEARN Final Conference: Tutorial Group | Using the LEARN Model RDM PolicyLEARN Final Conference: Tutorial Group | Using the LEARN Model RDM Policy
LEARN Final Conference: Tutorial Group | Using the LEARN Model RDM PolicyLEARN Project
 
LEARN Final Conference: Tutorial Group | Implementing the LEARN RDM Toolkit
LEARN Final Conference: Tutorial Group | Implementing the LEARN RDM ToolkitLEARN Final Conference: Tutorial Group | Implementing the LEARN RDM Toolkit
LEARN Final Conference: Tutorial Group | Implementing the LEARN RDM ToolkitLEARN Project
 
Research Data in an Open Science World - Prof. Dr. Eva Mendez, uc3m
Research Data in an Open Science World - Prof. Dr. Eva Mendez, uc3mResearch Data in an Open Science World - Prof. Dr. Eva Mendez, uc3m
Research Data in an Open Science World - Prof. Dr. Eva Mendez, uc3mLEARN Project
 
Data, Science, Society - Claudio Gutierrez, University of Chile
Data, Science, Society - Claudio Gutierrez, University of ChileData, Science, Society - Claudio Gutierrez, University of Chile
Data, Science, Society - Claudio Gutierrez, University of ChileLEARN Project
 
LEARN Final Conference: Tutorial Group | How To Engage Early Career Researchers
LEARN Final Conference: Tutorial Group | How To Engage Early Career ResearchersLEARN Final Conference: Tutorial Group | How To Engage Early Career Researchers
LEARN Final Conference: Tutorial Group | How To Engage Early Career ResearchersLEARN Project
 
LEARN Final Conference: Tutorial Group | Costing RDM
LEARN Final Conference: Tutorial Group | Costing RDMLEARN Final Conference: Tutorial Group | Costing RDM
LEARN Final Conference: Tutorial Group | Costing RDMLEARN Project
 
Paolo Budroni at COAR Annual Meeting
Paolo Budroni at COAR Annual MeetingPaolo Budroni at COAR Annual Meeting
Paolo Budroni at COAR Annual MeetingLEARN Project
 
LEARN Carribean Workshop Opening Remarks
LEARN Carribean Workshop Opening RemarksLEARN Carribean Workshop Opening Remarks
LEARN Carribean Workshop Opening RemarksLEARN Project
 
“Data for Development – the value of data for research and society” by Dr. Ma...
“Data for Development – the value of data for research and society” by Dr. Ma...“Data for Development – the value of data for research and society” by Dr. Ma...
“Data for Development – the value of data for research and society” by Dr. Ma...LEARN Project
 

Más de LEARN Project (11)

Research Data Management, Challenges and Tools - Per Öster
Research Data Management, Challenges and Tools - Per Öster Research Data Management, Challenges and Tools - Per Öster
Research Data Management, Challenges and Tools - Per Öster
 
LEARN Final Conference: Tutorial Group | Using the LEARN Model RDM Policy
LEARN Final Conference: Tutorial Group | Using the LEARN Model RDM PolicyLEARN Final Conference: Tutorial Group | Using the LEARN Model RDM Policy
LEARN Final Conference: Tutorial Group | Using the LEARN Model RDM Policy
 
LEARN Final Conference: Tutorial Group | Implementing the LEARN RDM Toolkit
LEARN Final Conference: Tutorial Group | Implementing the LEARN RDM ToolkitLEARN Final Conference: Tutorial Group | Implementing the LEARN RDM Toolkit
LEARN Final Conference: Tutorial Group | Implementing the LEARN RDM Toolkit
 
Research Data in an Open Science World - Prof. Dr. Eva Mendez, uc3m
Research Data in an Open Science World - Prof. Dr. Eva Mendez, uc3mResearch Data in an Open Science World - Prof. Dr. Eva Mendez, uc3m
Research Data in an Open Science World - Prof. Dr. Eva Mendez, uc3m
 
Data, Science, Society - Claudio Gutierrez, University of Chile
Data, Science, Society - Claudio Gutierrez, University of ChileData, Science, Society - Claudio Gutierrez, University of Chile
Data, Science, Society - Claudio Gutierrez, University of Chile
 
LEARN Final Conference: Tutorial Group | How To Engage Early Career Researchers
LEARN Final Conference: Tutorial Group | How To Engage Early Career ResearchersLEARN Final Conference: Tutorial Group | How To Engage Early Career Researchers
LEARN Final Conference: Tutorial Group | How To Engage Early Career Researchers
 
LEARN Final Conference: Tutorial Group | Costing RDM
LEARN Final Conference: Tutorial Group | Costing RDMLEARN Final Conference: Tutorial Group | Costing RDM
LEARN Final Conference: Tutorial Group | Costing RDM
 
Paolo Budroni at COAR Annual Meeting
Paolo Budroni at COAR Annual MeetingPaolo Budroni at COAR Annual Meeting
Paolo Budroni at COAR Annual Meeting
 
LEARN Webinar
LEARN WebinarLEARN Webinar
LEARN Webinar
 
LEARN Carribean Workshop Opening Remarks
LEARN Carribean Workshop Opening RemarksLEARN Carribean Workshop Opening Remarks
LEARN Carribean Workshop Opening Remarks
 
“Data for Development – the value of data for research and society” by Dr. Ma...
“Data for Development – the value of data for research and society” by Dr. Ma...“Data for Development – the value of data for research and society” by Dr. Ma...
“Data for Development – the value of data for research and society” by Dr. Ma...
 

Último

programa dia de las madres 10 de mayo para evento
programa dia de las madres 10 de mayo  para eventoprograma dia de las madres 10 de mayo  para evento
programa dia de las madres 10 de mayo para eventoDiegoMtsS
 
RETO MES DE ABRIL .............................docx
RETO MES DE ABRIL .............................docxRETO MES DE ABRIL .............................docx
RETO MES DE ABRIL .............................docxAna Fernandez
 
Lecciones 04 Esc. Sabática. Defendamos la verdad
Lecciones 04 Esc. Sabática. Defendamos la verdadLecciones 04 Esc. Sabática. Defendamos la verdad
Lecciones 04 Esc. Sabática. Defendamos la verdadAlejandrino Halire Ccahuana
 
Historia y técnica del collage en el arte
Historia y técnica del collage en el arteHistoria y técnica del collage en el arte
Historia y técnica del collage en el arteRaquel Martín Contreras
 
EXPECTATIVAS vs PERSPECTIVA en la vida.
EXPECTATIVAS vs PERSPECTIVA  en la vida.EXPECTATIVAS vs PERSPECTIVA  en la vida.
EXPECTATIVAS vs PERSPECTIVA en la vida.DaluiMonasterio
 
TEMA 13 ESPAÑA EN DEMOCRACIA:DISTINTOS GOBIERNOS
TEMA 13 ESPAÑA EN DEMOCRACIA:DISTINTOS GOBIERNOSTEMA 13 ESPAÑA EN DEMOCRACIA:DISTINTOS GOBIERNOS
TEMA 13 ESPAÑA EN DEMOCRACIA:DISTINTOS GOBIERNOSjlorentemartos
 
texto argumentativo, ejemplos y ejercicios prácticos
texto argumentativo, ejemplos y ejercicios prácticostexto argumentativo, ejemplos y ejercicios prácticos
texto argumentativo, ejemplos y ejercicios prácticosisabeltrejoros
 
ACUERDO MINISTERIAL 078-ORGANISMOS ESCOLARES..pptx
ACUERDO MINISTERIAL 078-ORGANISMOS ESCOLARES..pptxACUERDO MINISTERIAL 078-ORGANISMOS ESCOLARES..pptx
ACUERDO MINISTERIAL 078-ORGANISMOS ESCOLARES..pptxzulyvero07
 
Manual - ABAS II completo 263 hojas .pdf
Manual - ABAS II completo 263 hojas .pdfManual - ABAS II completo 263 hojas .pdf
Manual - ABAS II completo 263 hojas .pdfMaryRotonda1
 
Informatica Generalidades - Conceptos Básicos
Informatica Generalidades - Conceptos BásicosInformatica Generalidades - Conceptos Básicos
Informatica Generalidades - Conceptos BásicosCesarFernandez937857
 
Clasificaciones, modalidades y tendencias de investigación educativa.
Clasificaciones, modalidades y tendencias de investigación educativa.Clasificaciones, modalidades y tendencias de investigación educativa.
Clasificaciones, modalidades y tendencias de investigación educativa.José Luis Palma
 
SINTAXIS DE LA ORACIÓN SIMPLE 2023-2024.pptx
SINTAXIS DE LA ORACIÓN SIMPLE 2023-2024.pptxSINTAXIS DE LA ORACIÓN SIMPLE 2023-2024.pptx
SINTAXIS DE LA ORACIÓN SIMPLE 2023-2024.pptxlclcarmen
 
30-de-abril-plebiscito-1902_240420_104511.pdf
30-de-abril-plebiscito-1902_240420_104511.pdf30-de-abril-plebiscito-1902_240420_104511.pdf
30-de-abril-plebiscito-1902_240420_104511.pdfgimenanahuel
 
codigos HTML para blogs y paginas web Karina
codigos HTML para blogs y paginas web Karinacodigos HTML para blogs y paginas web Karina
codigos HTML para blogs y paginas web Karinavergarakarina022
 
2024 - Expo Visibles - Visibilidad Lesbica.pdf
2024 - Expo Visibles - Visibilidad Lesbica.pdf2024 - Expo Visibles - Visibilidad Lesbica.pdf
2024 - Expo Visibles - Visibilidad Lesbica.pdfBaker Publishing Company
 
CALENDARIZACION DE MAYO / RESPONSABILIDAD
CALENDARIZACION DE MAYO / RESPONSABILIDADCALENDARIZACION DE MAYO / RESPONSABILIDAD
CALENDARIZACION DE MAYO / RESPONSABILIDADauxsoporte
 
cortes de luz abril 2024 en la provincia de tungurahua
cortes de luz abril 2024 en la provincia de tungurahuacortes de luz abril 2024 en la provincia de tungurahua
cortes de luz abril 2024 en la provincia de tungurahuaDANNYISAACCARVAJALGA
 

Último (20)

programa dia de las madres 10 de mayo para evento
programa dia de las madres 10 de mayo  para eventoprograma dia de las madres 10 de mayo  para evento
programa dia de las madres 10 de mayo para evento
 
RETO MES DE ABRIL .............................docx
RETO MES DE ABRIL .............................docxRETO MES DE ABRIL .............................docx
RETO MES DE ABRIL .............................docx
 
Lecciones 04 Esc. Sabática. Defendamos la verdad
Lecciones 04 Esc. Sabática. Defendamos la verdadLecciones 04 Esc. Sabática. Defendamos la verdad
Lecciones 04 Esc. Sabática. Defendamos la verdad
 
Historia y técnica del collage en el arte
Historia y técnica del collage en el arteHistoria y técnica del collage en el arte
Historia y técnica del collage en el arte
 
EXPECTATIVAS vs PERSPECTIVA en la vida.
EXPECTATIVAS vs PERSPECTIVA  en la vida.EXPECTATIVAS vs PERSPECTIVA  en la vida.
EXPECTATIVAS vs PERSPECTIVA en la vida.
 
TEMA 13 ESPAÑA EN DEMOCRACIA:DISTINTOS GOBIERNOS
TEMA 13 ESPAÑA EN DEMOCRACIA:DISTINTOS GOBIERNOSTEMA 13 ESPAÑA EN DEMOCRACIA:DISTINTOS GOBIERNOS
TEMA 13 ESPAÑA EN DEMOCRACIA:DISTINTOS GOBIERNOS
 
texto argumentativo, ejemplos y ejercicios prácticos
texto argumentativo, ejemplos y ejercicios prácticostexto argumentativo, ejemplos y ejercicios prácticos
texto argumentativo, ejemplos y ejercicios prácticos
 
Repaso Pruebas CRECE PR 2024. Ciencia General
Repaso Pruebas CRECE PR 2024. Ciencia GeneralRepaso Pruebas CRECE PR 2024. Ciencia General
Repaso Pruebas CRECE PR 2024. Ciencia General
 
ACUERDO MINISTERIAL 078-ORGANISMOS ESCOLARES..pptx
ACUERDO MINISTERIAL 078-ORGANISMOS ESCOLARES..pptxACUERDO MINISTERIAL 078-ORGANISMOS ESCOLARES..pptx
ACUERDO MINISTERIAL 078-ORGANISMOS ESCOLARES..pptx
 
Manual - ABAS II completo 263 hojas .pdf
Manual - ABAS II completo 263 hojas .pdfManual - ABAS II completo 263 hojas .pdf
Manual - ABAS II completo 263 hojas .pdf
 
Informatica Generalidades - Conceptos Básicos
Informatica Generalidades - Conceptos BásicosInformatica Generalidades - Conceptos Básicos
Informatica Generalidades - Conceptos Básicos
 
Clasificaciones, modalidades y tendencias de investigación educativa.
Clasificaciones, modalidades y tendencias de investigación educativa.Clasificaciones, modalidades y tendencias de investigación educativa.
Clasificaciones, modalidades y tendencias de investigación educativa.
 
SINTAXIS DE LA ORACIÓN SIMPLE 2023-2024.pptx
SINTAXIS DE LA ORACIÓN SIMPLE 2023-2024.pptxSINTAXIS DE LA ORACIÓN SIMPLE 2023-2024.pptx
SINTAXIS DE LA ORACIÓN SIMPLE 2023-2024.pptx
 
30-de-abril-plebiscito-1902_240420_104511.pdf
30-de-abril-plebiscito-1902_240420_104511.pdf30-de-abril-plebiscito-1902_240420_104511.pdf
30-de-abril-plebiscito-1902_240420_104511.pdf
 
codigos HTML para blogs y paginas web Karina
codigos HTML para blogs y paginas web Karinacodigos HTML para blogs y paginas web Karina
codigos HTML para blogs y paginas web Karina
 
Power Point: "Defendamos la verdad".pptx
Power Point: "Defendamos la verdad".pptxPower Point: "Defendamos la verdad".pptx
Power Point: "Defendamos la verdad".pptx
 
2024 - Expo Visibles - Visibilidad Lesbica.pdf
2024 - Expo Visibles - Visibilidad Lesbica.pdf2024 - Expo Visibles - Visibilidad Lesbica.pdf
2024 - Expo Visibles - Visibilidad Lesbica.pdf
 
CALENDARIZACION DE MAYO / RESPONSABILIDAD
CALENDARIZACION DE MAYO / RESPONSABILIDADCALENDARIZACION DE MAYO / RESPONSABILIDAD
CALENDARIZACION DE MAYO / RESPONSABILIDAD
 
La Trampa De La Felicidad. Russ-Harris.pdf
La Trampa De La Felicidad. Russ-Harris.pdfLa Trampa De La Felicidad. Russ-Harris.pdf
La Trampa De La Felicidad. Russ-Harris.pdf
 
cortes de luz abril 2024 en la provincia de tungurahua
cortes de luz abril 2024 en la provincia de tungurahuacortes de luz abril 2024 en la provincia de tungurahua
cortes de luz abril 2024 en la provincia de tungurahua
 

Open Data in the world of Science” by Dr. Claudio Gutiérrez

  • 1. Datos abiertos en ciencias (4to. Taller LEARN, CEPAL, Santiago, 27 octubre 2016) Claudio Guti´errez • DCC, Universidad de Chile / CIWS • cgutierr@dcc.uchile.cl
  • 2. . ”[...] la Compa˜n´ıa de Jes´us que no permite al profano el acceso a sus colecciones, por lo que tantos problemas de la historia quedar´an siempre desesperadamente oscuros, o el Banco de Francia que no permite a los especialistas del primer Imperio consultar sus registros [...] as´ı seguiremos, hasta que las sociedades consientan organizar racionalmente, con su memoria, el conocimiento de s´ı mismas. No lo lograr´an sino luchando cuerpo a cuerpo con los dos principales responsables del olvido y la ignorancia: la negligencia que extrav´ıa documentos, y, m´as peligroso a´un, la pasi´on por el secreto [...] Nuestra civilizaci´on habr´a hecho un inmenso progreso el d´ıa en que el disimulo, erigido en m´etodo de acci´on y casi en virtud burguesa, deje el lugar al gusto por la informaci´on. (MARC BLOCH, APOLOG´IA PARA LA HISTORIA, 1943)
  • 3. M´as informaci´on, m´as comunicaci´on no elimina la fundamental imprecisi´on del todo, mas bien la agrava. [...] La masa de informaci´on no engendra ninguna verdad. Cuanta m´as informaci´on se pone en marcha, tanto m´as intrincado se hace el mundo. La hiperinformaci´on y la hipercomunicaci´on no inyecta ninguna luz en la oscuridad. (BYUNG-CHUL HAN, LA SOCIEDAD DE LA TRANSPARENCIA, 2012)
  • 4. ASUNTO POL´ITICO Y T ´ECNICO
  • 5. En esta charla: el desaf´ıo t´ecnico I. Datos abiertos hoy II. Entender los datos A- Datos B- Datos abiertos C- Datos abiertos cient´ıficos III. Desaf´ıos
  • 7.
  • 8.
  • 9.
  • 10.
  • 11.
  • 12.
  • 13.
  • 14.
  • 15.
  • 16.
  • 17.
  • 18.
  • 19.
  • 20.
  • 21.
  • 23. • Portales de datos cient´ıficos • APIs para datos cient´ıficos online • Datasets y journals • Visualizaciones y herramientas • Marcos legales y regulaciones • Iniciativas pro datos abiertos • ... ¿qu´e m´as?... ¿c´omo jerarquizar?
  • 26. ACLARACI ´ON NECESARIA Datos = informaci´on; Datos = conocimiento conocimiento = informaci´on + metainformaci´on informaci´on = datos + metadatos datos = ?
  • 27. DATOS (DEFINICI ´ON DE BUR ´OCRATA) hechos y estad´ısticas reunidas para referencia o an´alisis COMPUTACI ´ON. cantidades, caracteres o s´ımbolos sobre las que opera un computador, almacenadas y transmitidas en forma de se˜nales el´ectricas y almacenadas en medios magn´eticos, ´opticos o mec´anicos. FILOSOF´IA. cosas conocidas o asumidas como hechos, que forman la base de un razonamiento o c´alculo
  • 28. DATOS (DEFINICI ´ON ENTRE NOS) Datos Mundo virtual = Atomos Mundo material O sin matem´aticas: Ciencia de los datos = qu´ımica del mundo virtual
  • 29. ¿QU ´E ES UN DATO? UN DATASET? 1. Definici´on extensional: • Un archivo de datos • Un conjunto (red) de archivos de datos 2. Definici´on intensional: • Una URI (o una direcci´on o una API) • La salida (el output) de un sensor • Un concepto: “los jugadores de la Premier League”
  • 30. GESTIONAR DATOS VERSI ´ON 1.0 (el enfoque tradicional) 1. Limpiar, organizar, clasificar 2. Sistema de curator´ıa y almacenamiento 3. Sistema de recuperaci´on (cat´alogos, lenguajes consulta, etc.)
  • 31. Ejemplo de enfoque tradicional: NATURE SCIENTIFIC DATA JOURNAL: “Scientific Data is a peer-reviewed, open-access journal for descriptions of scientifically valuable datasets, and research that advances the sharing and reuse of scientific data.”
  • 32. GESTIONAR DATOS VERSI ´ON 2.0 JIM GRAY: No mover los datos... La Web como unificador, como infraestrutura de datos 1. Repositorios locales de los propios productores y organizaciones que los producen 2. Infraestructura para integrarlos (virtualmente) y enlazarlos 3. Sistema de archivo para efectos de seguridad ¿Y los bibliotecarios d´onde quedan?: dise˜no integraci´on, est´andares de metadatos, sistemas de archivo.
  • 33. ¿POR QU ´E HABLAMOS DE ESTO hoy? 1. Nuevas tecnolog´ıas de captura, transformaci´on y almacenamiento de datos. Diluvio datos 2. Alcanzamos las fronteras de nuestro “hogar com´un”. Empezamos a “toparnos” (Brundtland Report). Interconectiviidad 3. Nueva forma de crear conocimiento. Otra “ciencia”.
  • 35. PREGUNTA (NADA) INGENUA: ¿Qu´e son “datos cient´ıficos” (de “investigaci´on”)? Los datos cient´ıficos se definen como informaci´on recolectada usando m´etodos espec´ıficos para un prop´osito espec´ıfico de estudio o an´alisis. Datos recolectados en un experimento de laboratorio hecho bajo condiciones controladas es un ejemplo de datos cient´ıficos. “Datos generados en el ciclo de vida de una investigaci´on como de sus resultados.” (Biblioteca CEPAL).
  • 36. PREGUNTA (NADA) INGENUA: ¿Qu´e son “datos cient´ıficos”? (OECD) “Research data” are defined as factual records (numerical scores, textual records, images and sounds) used as primary sources for scientific research, and that are commonly accepted in the scientific community as necessary to validate research findings. A research data set constitutes a systematic, partial representation of the subject being investigated.
  • 37. PREGUNTA (NADA) INGENUA: ¿Qu´e son “datos cient´ıficos”? 1. Diferencia importante: datos “usados” versus datos “recolectados” o “generados” 2. M´as amplio que datos que generan (o que dejan) los proyectos cient´ıficos (e.g. para efectos de replicaci´on) 3. Verdadero desaf´ıo que viene: datos de sensores 4. Otros no menores: privacidad, seguridad (datos m´edicos)
  • 38.
  • 39.
  • 40.
  • 42. Un dato es abierto si cualquiera es libre para acceder a ´el, usarlo, modificarlo y compartirlo bajo condiciones que, como mucho, preserven su autor´ıa y su apertura. (Handbook of Open Data)
  • 44. OECD Principles Openness Flexibility Transparency Legal conformity Professionalism Interoperability Quality Security Efficiency Accountability Sustainability Formal responsability Protection of intellectual property
  • 45. OKF Principles Access (whole, cost, form) Redistribution & Reuse Atribution & Integrity No discrimination against persons or groups No discrimination gaints fields of endeavor Distribution of License License must not be specific to package License must not restrict distribution of other works
  • 46. Cinco enfoques y argumentos para “open”: 1. Democracia: acceso est´a hoy desigualmente distribu´ıdo 2. Econom´ıa: baja los costos y promueve la innovaci´on 3. T´ecnico: ventajas t´ecnicas de arquitecturas abiertas 4. Transparencia: datos deben ser accesibles a todo p´ublico 5. Accountability: mejora la replicabilidad y la auditor´ıa (tomado y modificado de Fecher & Friesike, 2014)
  • 47. Open realmente open At the end of the day, information outlives software and transcends software and is more valuable than software. I think any online service can call itself “Open” if it makes, and lives up to, this commitment: Any data that you give us, we’ll let you take away again, without withholding anything, or encoding it in a proprietary format, or claiming any intellectual-property rights whatsoever. (Set My Data Free, Tim Bray, 2006)
  • 49. ALGUNOS DESAF´IOS: 1. “Negligencia que extrav´ıa.” Hacer conciencia sobre el valor de los datos. 2. “Pasi´on por el secreto” (y crisis del concepto de propiedad para datos, informaci´on, conocimiento). Cambiar mentalidad. 3. Modelos de incentivos y negocios adecuados. Entender los commons del mundo virtual. 4. M´as desafiante que los anteriores: lidiar con la avalancha de datos.
  • 50.
  • 51. “Some of the design flaws of current open data sites are pretty obvious. The datasets that are more important, or could potentially be more useful, are not brought into the surface of these sites” (C´esar Hidalgo) DESAF´IO 1: ¿C´omo calcular el valor de los datos? Ante la avalancha de datos, ¿c´omo jerarquizar los datos?
  • 52.
  • 53. Cantidad de datos excede por mucho las capacidades humanas de “I/O”. DESAF´IO 2: Visualizaci´on, interfaces para m´aquinas, recuperaci´on automatizada de datos
  • 54. Mentalidad cl´asica: bases de datos, repositorios “finitos”, accesos locales, enfoque centralizado. DESAF´IO 3: Datos globales como extensi´on de los locales o cualitativamente diferentes? (infinitos, globales, decentralizados)
  • 55. Los datos (´atomos) est´an naturalmente enlazados DESAF´IO 4: La estructura de enlazamiento (de red) de los datos Cu´anto replicar, c´omo (e.g. portales de datos abiertos). El tema de las dificultades t´ecnicas.
  • 56. Test de las cinco estrellas: 1. disponga sus datos en la Web (en cualquier formato) bajo licencias abiertas 2. disp´ongalos como datos estructurados (e.g. use Excel en vez de la imagen escaneadas de una tabla) 3. h´agalos disponibles en formatos abiertos no propietarios (e.g. CSV en vez de Excel) 4. use URIs para denotar cosas, de forma que las personas puedan apuntar a, o referenciar vuestros datos 5. enlace sus datos a otros datos para proveer contexto
  • 57.
  • 58. GRACIAS POR LA ATENCI ´ON cgutierr@dcc.uchile.cl