Datosabiertos: Reutilización de información en el sector público<br />Jose Emilio LabraGayo<br />Universidad of Oviedo, Sp...
Esquema<br />Explosión de datos<br />Razones para publicar los datos<br />¿Cómo publicar los datos?<br />Datos abiertos vs...
Explosión de datos<br />Contenido generado por usuarios<br />Información de los gobiernos<br />Internet de las cosas<br />
Razones para liberar datos<br />Facilitan la investigación<br />Tasa de descubrimiento se acelera con mejores accesos a lo...
Razones para liberar datos<br />Los sistemas abiertos facilitan las contribuciones externas<br />
Razones para liberar datos<br />Datos = base para la cooperación <br />Para realizar tareas comunitarias se requiere acces...
Razones para liberar datos<br />Eficiencia y calidad de los sistemas<br />Hay muchos datos comunes que no están publicados...
Razones para liberar datos<br />Trasparencia<br />Fomentar participación<br />Generar confianza<br />Evaluar al gobierno<b...
Razones para liberar datos<br />Esta presentación hubiera sido muchísimo más aburrida si no hubiese tenido acceso a los da...
Si realmente quieres algo…<br />…déjalo libre<br />
Como ciudadanos…<br />…también podemos demandar datos abiertos…<br />
…demandar datos abiertos<br />	Cuando los datos pertenecen a la humanidad<br />
…demandar datos abiertos<br />Cuando son hechos independientes y verificables ó de conocimiento común<br />Ejemplo: conoci...
…demandar datos abiertos<br />Cuando los datos han sido creados con dinero público<br />Son nuestros datos<br />Los han pa...
OK, ¡vivan los datos abiertos!pero…<br />¿Cómo publicarlos?<br />
El mayor reto = Integración<br />En general, el problema no es informatizar algo<br />El problema es integrar los sistemas...
Modelo de Estrellas*<br />* Enunciado por TimBerners Lee en Gov 2.0 Expo 2010<br />http://www.youtube.com/watch?v=ga1aSJXC...
Formatos no estructurados<br />Formatos “caja negra”: Imágenes, vídeos, música, etc.<br />Formatos binarios: PDF, PS, etc....
Ejemplo: Servicio Público de Empleo<br />★<br />http://www.sepe.es/contenidos/cifras/datos_estadisticos/municipios/<br />
★ ★<br />Formatos estructurados<br />Los datos tienen una estructura<br />Ejemplo: Hojas de cálculo<br />Problema con form...
Ejemplo: Servicio Público de empleo<br />★ ★<br />http://www.sepe.es/contenidos/cifras/datos_estadisticos/municipios/9<br />
★ ★ ★<br />Formatos no propietarios<br />Utilizar formatos abiertos estructurados<br />Ejemplos: CSV, HTML<br />Problema: ...
CSV<br />★ ★ ★<br />“Commaseparatedvalues” valores delimitados por comas<br />
HTML<br />★ ★ ★ <br />HTML está pensado para representar información que se visualiza en el navegador<br />El procesamient...
★ ★ ★ ★<br />URIs para identificar datos<br />Utilizar una URI para identificar un dato<br />Diferentes representaciones p...
XML<br />★ ★ ★ ★<br />XML permite representar información estructurada<br />Los documentos pueden validarse (XML Schema)<b...
★ ★ ★ ★<br />Negociación de contenido<br />El protocolo de comunicación permite que el navegador informe al servidor del t...
★ ★ ★ ★<br />¿2 representaciones para lo mismo?<br />Ejemplo: Códigos de barras<br />
★ ★ ★ ★ ★<br />Enlazar con otros datos<br />Enlazar datos identificados mediante URIs<br />Objetivo: Facilitar la identifi...
★ ★ ★ ★ ★<br />RDF<br />RDF es un modelo de representación en forma de grafo<br />RDF (ResourceDescription Framework)<br /...
★ ★ ★ ★ ★<br />RDF es composicional<br />2 grafos independientes pueden componerse<br />El lenguaje SPARQL permite realiza...
★ ★ ★ ★ ★<br />RDF como representación<br />Negociación de contenido<br />	HTML: información para navegadores<br />	RDF: i...
★ ★ ★ ★ ★<br />Proyecto Linking Open Data<br />
★ ★ ★ ★ ★<br />De Wikipedia a DBPedia<br />Infoset<br />
★ ★ ★ ★ ★<br />De Wikipedia a DBPedia<br />
Un pequeño ejercicio<br />Obtener datos de desempleo en municipios asturianos<br />RDF<br />Excel<br />HTML + <br />Google...
Ejercicio: Ejemplo de Excel<br />
Ejercicio: RDF<br />
Ejercicio: HTML<br />
Iniciativas para datos abiertos<br />
Algunas iniciativas en España<br />
Conclusiones<br />Publicación de datos abiertos<br />De datos abiertos a datos enlazados<br />Nuevos retos:<br />Legalidad...
Fin de la presentación<br />Másinformación: <br />http://www.di.uniovi.es/~labra<br />
Agradecimientos<br />Algunas ideas o partes de esta presentación han sido tomadas de otras presentaciones similares de:<br...
Próxima SlideShare
Cargando en…5
×

Datos abiertos: Reutilización de información en el sector público

1.834 visualizaciones

Publicado el

Presentación realizada por Jose Emilio Labra Gayo para las Jornadas "Empleo y Universidad" organizadas por la Universidad de Oviedo, los días 9 y 10 de Junio de 2010

Publicado en: Educación, Tecnología
0 comentarios
1 recomendación
Estadísticas
Notas
  • Sé el primero en comentar

Sin descargas
Visualizaciones
Visualizaciones totales
1.834
En SlideShare
0
De insertados
0
Número de insertados
122
Acciones
Compartido
0
Descargas
28
Comentarios
0
Recomendaciones
1
Insertados 0
No insertados

No hay notas en la diapositiva.

Datos abiertos: Reutilización de información en el sector público

  1. 1. Datosabiertos: Reutilización de información en el sector público<br />Jose Emilio LabraGayo<br />Universidad of Oviedo, Spain<br />http://www.di.uniovi.es/~labra<br />
  2. 2. Esquema<br />Explosión de datos<br />Razones para publicar los datos<br />¿Cómo publicar los datos?<br />Datos abiertos vs datos enlazados<br />
  3. 3. Explosión de datos<br />Contenido generado por usuarios<br />Información de los gobiernos<br />Internet de las cosas<br />
  4. 4. Razones para liberar datos<br />Facilitan la investigación<br />Tasa de descubrimiento se acelera con mejores accesos a los datos<br />Por el bien común de la humanidad<br />
  5. 5. Razones para liberar datos<br />Los sistemas abiertos facilitan las contribuciones externas<br />
  6. 6. Razones para liberar datos<br />Datos = base para la cooperación <br />Para realizar tareas comunitarias se requiere acceso a datos comunes<br />
  7. 7. Razones para liberar datos<br />Eficiencia y calidad de los sistemas<br />Hay muchos datos comunes que no están publicados<br />Ej. ¿Lista de municipios?<br />
  8. 8. Razones para liberar datos<br />Trasparencia<br />Fomentar participación<br />Generar confianza<br />Evaluar al gobierno<br />
  9. 9. Razones para liberar datos<br />Esta presentación hubiera sido muchísimo más aburrida si no hubiese tenido acceso a los datos parcial o totalmente abiertos de Google, Flickr, Wikipedia, Slideshare y muchos otros proyectos… <br />
  10. 10. Si realmente quieres algo…<br />…déjalo libre<br />
  11. 11. Como ciudadanos…<br />…también podemos demandar datos abiertos…<br />
  12. 12. …demandar datos abiertos<br /> Cuando los datos pertenecen a la humanidad<br />
  13. 13. …demandar datos abiertos<br />Cuando son hechos independientes y verificables ó de conocimiento común<br />Ejemplo: conocimiento científico<br />
  14. 14. …demandar datos abiertos<br />Cuando los datos han sido creados con dinero público<br />Son nuestros datos<br />Los han pagado nuestros impuestos<br />
  15. 15. OK, ¡vivan los datos abiertos!pero…<br />¿Cómo publicarlos?<br />
  16. 16. El mayor reto = Integración<br />En general, el problema no es informatizar algo<br />El problema es integrar los sistemas<br />Interoperabilidad<br />No basta con publicar datos…<br />
  17. 17. Modelo de Estrellas*<br />* Enunciado por TimBerners Lee en Gov 2.0 Expo 2010<br />http://www.youtube.com/watch?v=ga1aSJXCFe0<br />
  18. 18. Formatos no estructurados<br />Formatos “caja negra”: Imágenes, vídeos, música, etc.<br />Formatos binarios: PDF, PS, etc.<br />Requieren técnicas de tratamiento de la señal, reconocimiento de patrones, etc.<br />★<br />
  19. 19. Ejemplo: Servicio Público de Empleo<br />★<br />http://www.sepe.es/contenidos/cifras/datos_estadisticos/municipios/<br />
  20. 20. ★ ★<br />Formatos estructurados<br />Los datos tienen una estructura<br />Ejemplo: Hojas de cálculo<br />Problema con formatos propietarios<br />Requieren herramientas que no son públicas<br />
  21. 21. Ejemplo: Servicio Público de empleo<br />★ ★<br />http://www.sepe.es/contenidos/cifras/datos_estadisticos/municipios/9<br />
  22. 22. ★ ★ ★<br />Formatos no propietarios<br />Utilizar formatos abiertos estructurados<br />Ejemplos: CSV, HTML<br />Problema: Contenido depende del contexto<br />
  23. 23. CSV<br />★ ★ ★<br />“Commaseparatedvalues” valores delimitados por comas<br />
  24. 24. HTML<br />★ ★ ★ <br />HTML está pensado para representar información que se visualiza en el navegador<br />El procesamiento puede requerir “screenscrapping” <br />
  25. 25. ★ ★ ★ ★<br />URIs para identificar datos<br />Utilizar una URI para identificar un dato<br />Diferentes representaciones para cada tipo de dato<br />Negociación de contenido<br />http://puzzles.org/pieza23471<br />
  26. 26. XML<br />★ ★ ★ ★<br />XML permite representar información estructurada<br />Los documentos pueden validarse (XML Schema)<br />El significado de las etiquetas depende de la aplicación<br />
  27. 27. ★ ★ ★ ★<br />Negociación de contenido<br />El protocolo de comunicación permite que el navegador informe al servidor del tipo de contenido que prefiere<br />El servidor devuelve una representación diferente según las preferencias del cliente<br />servidor<br />cliente<br />
  28. 28. ★ ★ ★ ★<br />¿2 representaciones para lo mismo?<br />Ejemplo: Códigos de barras<br />
  29. 29. ★ ★ ★ ★ ★<br />Enlazar con otros datos<br />Enlazar datos identificados mediante URIs<br />Objetivo: Facilitar la identificación de nuevos conjuntos de datos<br />Nuevo conocimiento<br />
  30. 30. ★ ★ ★ ★ ★<br />RDF<br />RDF es un modelo de representación en forma de grafo<br />RDF (ResourceDescription Framework)<br />Las propiedades tienen valores globales (URIs)<br />http://obs.org#totalDesempleados<br />4530<br />dato<br />http://obs.org#año<br />http://obs.org#municipio<br />2009<br />Oviedo<br />
  31. 31. ★ ★ ★ ★ ★<br />RDF es composicional<br />2 grafos independientes pueden componerse<br />El lenguaje SPARQL permite realizar consultas a grafos<br />
  32. 32. ★ ★ ★ ★ ★<br />RDF como representación<br />Negociación de contenido<br /> HTML: información para navegadores<br /> RDF: información para sistemas automáticos<br />URI<br />http://tiempo.com/prevision/oviedo<br />303 SeeOther http://tiempo.com/prevision/Oviedo/informe.html<br />303 SeeOther http://tiempo.com/prevision/Oviedo/informe.rdf<br />
  33. 33. ★ ★ ★ ★ ★<br />Proyecto Linking Open Data<br />
  34. 34. ★ ★ ★ ★ ★<br />De Wikipedia a DBPedia<br />Infoset<br />
  35. 35. ★ ★ ★ ★ ★<br />De Wikipedia a DBPedia<br />
  36. 36. Un pequeño ejercicio<br />Obtener datos de desempleo en municipios asturianos<br />RDF<br />Excel<br />HTML + <br />Google Maps<br />
  37. 37. Ejercicio: Ejemplo de Excel<br />
  38. 38. Ejercicio: RDF<br />
  39. 39. Ejercicio: HTML<br />
  40. 40. Iniciativas para datos abiertos<br />
  41. 41. Algunas iniciativas en España<br />
  42. 42. Conclusiones<br />Publicación de datos abiertos<br />De datos abiertos a datos enlazados<br />Nuevos retos:<br />Legalidad: licencias, copyrights, patentes…<br />Privacidad<br />Temporalidad<br />Semántica e inferencia<br />
  43. 43. Fin de la presentación<br />Másinformación: <br />http://www.di.uniovi.es/~labra<br />
  44. 44. Agradecimientos<br />Algunas ideas o partes de esta presentación han sido tomadas de otras presentaciones similares de:<br />IvanHermann, Jacco van Ossenbruggen, Nova Spivak, IanHorrocks, Tim Berners-Lee, Jose Manuel Alonso, Svein-Magnus Sørensen, Jose Luis Marín.<br />También se hanutilizadodatosaccesibles en Google, Flickr, Wikipedia, Slideshare, etc. a cuyosautoresoriginales me hubieragustadocitar. <br />

×