2015 bogota datos_enlazados

381 visualizaciones

Publicado el

Charla Linked data - Datos abiertos enlazados impartida en el IV Foro Distrital Buenas Prácticas en Gestión de la Información Geográfica - Bogotá, Colombia, 14 Diciembre 2015

Publicado en: Internet
0 comentarios
1 recomendación
Estadísticas
Notas
  • Sé el primero en comentar

Sin descargas
Visualizaciones
Visualizaciones totales
381
En SlideShare
0
De insertados
0
Número de insertados
34
Acciones
Compartido
0
Descargas
7
Comentarios
0
Recomendaciones
1
Insertados 0
No insertados

No hay notas en la diapositiva.

2015 bogota datos_enlazados

  1. 1. Linked Data Jose Emilio Labra Gayo Universidad de Oviedo, España http://www.di.uniovi.es/~labra
  2. 2. Jose Emilio Labra Gayo, http://www.di.uniovi.es/~labra Presentación Desde 2004, grupo investigación WESO (WEb Semántics Oviedo) Miembro del W3c WG Data Shapes Charman W3c Best practices Multilingual linked open data Libro Web Semántica Editorial NetBiblo, Colección Pocket Innova http://www.netbiblo.com Oviedo
  3. 3. Jose Emilio Labra Gayo, http://www.di.uniovi.es/~labra La charla en 1’ ¿Qué pasa? ¿Porqué? ¿Cómo? La era de los datos Razones para publicar datos Datos abiertos enlazados Ejemplos de portales de datos Mitos y realidades
  4. 4. Jose Emilio Labra Gayo, http://www.di.uniovi.es/~labra
  5. 5. Jose Emilio Labra Gayo, http://www.di.uniovi.es/~labra Evolución de la Web Crecimiento casi exponencial Fuente: http://www.internetlivestats.com Dic. 2015: 965,049,928 sitios web online 3,264,979,367 usuarios de internet Sitios web Año
  6. 6. Jose Emilio Labra Gayo, http://www.di.uniovi.es/~labra http://www.facebook.com/note.php?note_id=76191543919 http://beerpla.net/2008/08/14/how-to-find-out-the-number-of-videos-on-youtube/ Datos y datos... Facebook: 1556 millones usuarios activos Youtube: 100 horas de video subidas/minuto Twitter: 500 millones de tweets/día Flickr: 48 millones de fotos/mes ...y lo que está por llegar... Fuente: http://www.coverpop.com/pop/flickr_interesting Fuente: http://www.internetlivestats.com
  7. 7. Jose Emilio Labra Gayo, http://www.di.uniovi.es/~labra Avalancha de datos Tendencias Open Producir datos es tecnológicamente fácil Movimientos: Open Software Open Content Open Data Open Science Open Government Viejos modelos afectados Música, Cine, finanzas,... ¿Educación? ¿Gobierno? ...
  8. 8. Jose Emilio Labra Gayo, http://www.di.uniovi.es/~labra ¿Porqué publicar datos? 2 razones (para los gobiernos) Trasparencia Liderazgo
  9. 9. Jose Emilio Labra Gayo, http://www.di.uniovi.es/~labra Trasparencia Publicar datos abiertos Aumentar credibilidad Confianza en el gobierno Legitimar decisiones tomadas Facilitar medidas anti-corrupción
  10. 10. Jose Emilio Labra Gayo, http://www.di.uniovi.es/~labra Trasparencia Fomentar la investigación Acelerar tasa de descubrimiento Bien común de la ciudadanía
  11. 11. Jose Emilio Labra Gayo, http://www.di.uniovi.es/~labra Trasparencia Facilitan contribuciones externas Sabiduría de las masas http://en.wikipedia.org/wiki/Wisdom_of_the_crowd
  12. 12. Jose Emilio Labra Gayo, http://www.di.uniovi.es/~labra Trasparencia Datos creados con dinero público Son nuestros Los hemos pagado con nuestros impuestos Retorno de inversión Rendición de cuentas Eficiencia
  13. 13. Jose Emilio Labra Gayo, http://www.di.uniovi.es/~labra Liderazgo Gobierno como catalizador Fomentar nuevas iniciativas Colaboración ciudadana Prevención de catástrofes Portales de salud Nuevas Apps
  14. 14. Jose Emilio Labra Gayo, http://www.di.uniovi.es/~labra Liderazgo Contrarrestar fuentes de datos no oficiales ¿Cómo evitar filtraciones de datos? Posibilidades 1.- Aumerntar seguridad 2.- Publicar datos oficiales
  15. 15. Jose Emilio Labra Gayo, http://www.di.uniovi.es/~labra Liderazgo Aumentar calidad del software Datos oficiales interoperables Reducción de costes de mantenimiento Ejemplo: ¿Última lista de barrios en una ciudad?
  16. 16. Jose Emilio Labra Gayo, http://www.di.uniovi.es/~labra Dedicado a los administradores de Bases de Datos
  17. 17. OK, ¡vivan los datos abiertos! pero…
  18. 18. Jose Emilio Labra Gayo, http://www.di.uniovi.es/~labra El mayor reto = Integración En general, el problema no es informatizar algo El problema es integrar los sistemas Interoperabilidad No basta con publicar datos…
  19. 19. Jose Emilio Labra Gayo, http://www.di.uniovi.es/~labra Publicar = hacer accesible Niveles de accesibilidad Discapacidad física Discapacidad técnica: otros entornos Intelectual y cultural Analfabetismo Barreras de conocimiento Otros idiomas… Accesible para las máquinas
  20. 20. Jose Emilio Labra Gayo, http://www.di.uniovi.es/~labra Pérdida semántica Pérdida de semántica al publicar La persona que publica tiene información que se pierde publicador Contenido publicado Múltiples formatos: HTML, PDF, JPG, ... consumidor (persona) consumidor (agente) próximo sábado Semántica
  21. 21. Jose Emilio Labra Gayo, http://www.di.uniovi.es/~labra ¿Publicar para personas y computadoras a la vez? Problema: entes muy diferentes Las computadoras necesitan un contexto Hay que buscar solución de compromiso 001010000100 100010010010 010000010001 Formato ideal Formato ideal El texto en lenguaje natural es el formato ideal para tí...
  22. 22. Jose Emilio Labra Gayo, http://www.di.uniovi.es/~labra Cadenas de texto = ambigüas ¿Qué significa "Oviedo" ? Puede ser una ciudad en España ...o una ciudad en Florida, USA ...o un jugador de fútbol ...o....¿Cómo sabemos a qué se refiere? URIs como identificadores únicos http://www.oviedo.es/ http://www.cityofoviedo.net/ https://twitter.com/Bryan_Oviedo
  23. 23. Jose Emilio Labra Gayo, http://www.di.uniovi.es/~labra Modelo de Estrellas* ★ Publicar los datos (en cualquier formato) ★★ Utilizar formato estructurado (Excel en lugar de imágenes escaneadas) ★★★ Usar formatos no propietarios (CSV en lugar de Excel) ★★★★ Usar URIs para identificar datos (otros sistemas puedan enlazar nuestros datos) ★★★★★ Enlazar con otros datos externos (proporcionar contexto) * Enunciado por Tim Berners-Lee en Gov 2.0 Expo 2010 http://www.youtube.com/watch?v=ga1aSJXCFe0
  24. 24. Jose Emilio Labra Gayo, http://www.di.uniovi.es/~labra Formatos no estructurados Formatos “caja negra”: Imágenes, vídeos, música, etc. Formatos binarios: PDF, PS, etc. Requieren técnicas de tratamiento de la señal, reconocimiento de patrones, etc. ★
  25. 25. Jose Emilio Labra Gayo, http://www.di.uniovi.es/~labra Ejemplo: Servicio Público de Empleo http://www.sepe.es/contenidos/cifras/datos_estadisticos/municipios/ ★
  26. 26. Jose Emilio Labra Gayo, http://www.di.uniovi.es/~labra Formatos estructurados Los datos tienen una estructura Ejemplo: Hojas de cálculo Problema con formatos propietarios Requieren herramientas que no son públicas ★ ★
  27. 27. Jose Emilio Labra Gayo, http://www.di.uniovi.es/~labra Ejemplo: Servicio Público de empleo http://www.sepe.es/contenidos/cifras/datos_estadisticos/municipios/9 ★ ★
  28. 28. Jose Emilio Labra Gayo, http://www.di.uniovi.es/~labra Formatos no propietarios Utilizar formatos abiertos estructurados Ejemplos: CSV, HTML, XML, JSON,... Puede procesarse automáticamente Problema: El procesado depende del contexto Difícil reutilizar técnicas entre diferentes sistemas ★ ★ ★
  29. 29. Jose Emilio Labra Gayo, http://www.di.uniovi.es/~labra CSV “Comma separated values” valores delimitados por comas ★ ★ ★
  30. 30. Jose Emilio Labra Gayo, http://www.di.uniovi.es/~labra HTML HTML = información que se visualiza en navegador Seres humanos que usan un navegador Etiquetas de presentación: h1, p, br, table, ... ★ ★ ★ Procesar HTML automáticamente puede ser muy complicado
  31. 31. Jose Emilio Labra Gayo, http://www.di.uniovi.es/~labra URIs para identificar datos Utilizar URIs para identificar datos Los datos pueden ser referenciados Diferentes representaciones mediante negociación de contenido: • Para humanos (HTML,...) • Para máquinas (RDF,...) ★ ★ ★ ★
  32. 32. Jose Emilio Labra Gayo, http://www.di.uniovi.es/~labra Ejemplo: RDF ★ ★ ★ ★ <http://www.sepe.es/datos/desempleo/Asturias/Allande/2013/10> HTML? @prefix sepe: <http://www.sepe.es/datos/> sepe:obs1 sepe:municipio "Allande" ; sepe:desempleados 18 . RDF?
  33. 33. Jose Emilio Labra Gayo, http://www.di.uniovi.es/~labra ¿Varias representaciones para lo mismo? ¿Se puede hacer un sitio web bonito para los humanos y útil para las máquinas? ★ ★ ★ ★ Metáfora: Bolsa de patatas fritas
  34. 34. Jose Emilio Labra Gayo, http://www.di.uniovi.es/~labra ¡5 estrellas! Datos enlazados Las representaciones devuelven enlaces a otros datos Enlaces entre datasets Ventajas: Los consumidores podrán reutilizar y descubrir nuevos datos Aplicaciones "no previstas" ★ ★ ★ ★ ★
  35. 35. Jose Emilio Labra Gayo, http://www.di.uniovi.es/~labra Ejemplo: RDF bien enlazado ★ ★ ★ ★ ★ <http://www.sepe.es/datos/desempleo/Asturias/Allende/2013/10> HTML? @prefix sepe: <http://www.sepe.es/datos/> sepe:obs1 sepe:municipio <http://dbpedia.org/resource/Allande>; sepe:desempleados 23 . RDF? dbo:allande dbo:areaTotal 342.24 ; rdf:type <http:/.../municipalitiesInAsturias> ; dbo:country <http:/.../Spain> ; dbo:populationTotal 2106 ; . . .
  36. 36. Jose Emilio Labra Gayo, http://www.di.uniovi.es/~labra Principios Linked Open Data 1. Utilizar URIs para denotar cosas 2. Permitir que las URIs sean dereferenciables 3. Proporcionar información útil Para personas y máquinas (HTML, RDF) 4. Incluir enlaces a otras cosas relacionadas ★ ★ ★ ★ ★ La mejor manera de explotar tus datos se le ocurrirá a otro Jo Walsh, Rufus Pollock, http://www.okfn.org/files/talks/xtech_2007/
  37. 37. Jose Emilio Labra Gayo, http://www.di.uniovi.es/~labra Linking Open Data (2007)
  38. 38. Jose Emilio Labra Gayo, http://www.di.uniovi.es/~labra Linking Open Data (2008)
  39. 39. Jose Emilio Labra Gayo, http://www.di.uniovi.es/~labra Linking Open Data (2009)
  40. 40. Jose Emilio Labra Gayo, http://www.di.uniovi.es/~labra Linking Open Data (2010)
  41. 41. Jose Emilio Labra Gayo, http://www.di.uniovi.es/~labra Linking Open Data (2011)
  42. 42. Jose Emilio Labra Gayo, http://www.di.uniovi.es/~labra Linking Open Data (2014)
  43. 43. Jose Emilio Labra Gayo, http://www.di.uniovi.es/~labra Portales de datos enlazados Algunas iniciativas data.gov.uk ... datos.bcn.cl data.webfoundation.org landportal.info
  44. 44. Jose Emilio Labra Gayo, http://www.di.uniovi.es/~labra La Web Semántica Web semántica  Web de Datos Visión donde los datos se publican y se enlazan con otros datos Objetivos: Reutilizar Automatizar Integrar Tim Berners Lee, inventor de la WWW
  45. 45. Jose Emilio Labra Gayo, http://www.di.uniovi.es/~labra Algunas tecnologías RDF Descripción datos SPARQL Consultas OWL - RDFS Inferencias SHEX - SHACL Validación
  46. 46. Jose Emilio Labra Gayo, http://www.di.uniovi.es/~labra RDF Resource Description Framework (1998) Descripción de recursos Recurso = se identifica con URI Se basa en tripletas Sujeto  Predicado  Objeto
  47. 47. Jose Emilio Labra Gayo, http://www.di.uniovi.es/~labra Tripletas RDF http://purl.org/dc/elements/1.1/creator Sujeto URI que Identifica Facultad Biología Predicado URI que identifica propiedad de creación Objeto URI que identifica Juan @prefix dc: <http://purl.org/dc/elements/1.1/>. @prefix uni: <http://uniovi.es/> . uni:biologia dc:creator uni:juan . http://uniovi.es/biology http://uniovi.es/juan RDF en notación Turtle
  48. 48. Jose Emilio Labra Gayo, http://www.di.uniovi.es/~labra Grafo RDF @prefix rdf: <http://www.w3.org/1999/02/22-rdf-syntax-ns#> . @prefix uni: <http://uniovi.es/> . @prefix dc: <http://purl.org/dc/elements/1.1/> . uni:biologia dc:creator uni:juan . uni:biologia dc:creator uni:ana . uni:juan rdf:type uni:Profesor . uni:ana rdf:type uni:Profesor . uni:biologia uni:juan dc:creator uni:anadc:creator uni:Profesor rdf:type rdf:type
  49. 49. Jose Emilio Labra Gayo, http://www.di.uniovi.es/~labra RDF es composicional uni:quimica uni:ana dc:creator uni:luisdc:creator uni:Becario rdf:type uni:biologia uni:juan dc:creator dc:creator uni:Profesor rdf:type rdf:type uni:derecho dc:creator uni:Profesor uni:ana rdf:type uni:luis uni:Becario rdf:type Grafo 1 Grafo 2 Grafo 3
  50. 50. Jose Emilio Labra Gayo, http://www.di.uniovi.es/~labra RDF es composicional uni:quimica uni:ana dc:creator uni:luisdc:creator uni:Becario rdf:type uni:biologia uni:juan dc:creator dc:creator uni:Profesor rdf:type rdf:type uni:derecho dc:creator uni:Profesor uni:ana rdf:type uni:luis uni:Becario rdf:type Grafo 1 Grafo 2 Grafo 3
  51. 51. Jose Emilio Labra Gayo, http://www.di.uniovi.es/~labra RDF es composicional uni:quimica uni:ana dc:creator uni:luis dc:creator uni:Becario rdf:type uni:biologia uni:juan dc:creator dc:creator uni:Profesor rdf:type rdf:type uni:derecho dc:creator Grafo 1 + Grafo 2 + Grafo 3
  52. 52. Jose Emilio Labra Gayo, http://www.di.uniovi.es/~labra Formatos RDF Numerosos formatos y sintaxis: N3 RDF/XML N-Triples Turtle json-ld RDFa etc.
  53. 53. Jose Emilio Labra Gayo, http://www.di.uniovi.es/~labra SPARQL Simple Protocol and RDF Query Language Lenguaje de consultas para la web semántica Se basa en encaje de grafos Extrae información de modelos RDF Un protocolo Mecanismo para invocar SPARQL en un servicio Endpoint SPARQL: Servicio que cumple el protocolo
  54. 54. Jose Emilio Labra Gayo, http://www.di.uniovi.es/~labra SPARQL Ejemplo: Buscar páginas cuyo autor sea un profesor @prefix rdf: <http://www.w3.org/1999/02/22-rdf-syntax-ns#> . @prefix uni: <http://uniovi.es/> . @prefix dc: <http://purl.org/dc/elements/1.1/> . SELECT ?p ?c WHERE { ?p dc:creator ?c . ?c rdf:type uni:Profesor. }
  55. 55. Jose Emilio Labra Gayo, http://www.di.uniovi.es/~labra SPARQL SELECT ?p ?c WHERE { ?p dc:creator ?c . ?c rdf:type uni:Profesor . } uni:quimica uni:ana dc:creator uni:luis dc:creator uni:Becario rdf:type uni:biologia uni:juan dc:creator dc:creator uni:Profesor rdf:type rdf:type uni:derecho dc:creator ?p dc:creator ?c uni:Profesor rdf:type ?p ?c Resultados ?p ?c uni:biologia uni:juan uni:quimica uni:ana uni:biologia uni:ana ?p ?c ?p ?c
  56. 56. Jose Emilio Labra Gayo, http://www.di.uniovi.es/~labra OWL, RDF Schema Permite definir clases, propiedades,... OWL permite declarar ontologías RDF Schema es un poco más sencillo Se pueden hacer inferencias
  57. 57. Jose Emilio Labra Gayo, http://www.di.uniovi.es/~labra Ejemplo con inferencias rdf:type uni:Profesor rdfs:subClassOf uni:PersonaEjemplo uni:juan rdf:type
  58. 58. Jose Emilio Labra Gayo, http://www.di.uniovi.es/~labra SPARQL + Inferencia Combinar SPARQL e inferencia Ejemplo: Páginas cuyo autor sea una persona @prefix rdf: <http://www.w3.org/1999/02/22-rdf-syntax-ns#> . @prefix uni: <http://uniovi.es/> . @prefix dc: <http://purl.org/dc/elements/1.1/> . SELECT ?p ?c WHERE { ?p dc:creator ?c . ?p rdf:type uni:Persona. }
  59. 59. Jose Emilio Labra Gayo, http://www.di.uniovi.es/~labra uni:quimica uni:ana dc:creator uni:luis dc:creator uni:Becario rdf:type uni:biologia uni:juan dc:creator dc:creator uni:Profesor rdf:type rdf:type uni:derecho dc:creator uni:Persona rdfs:subClassOf rdfs:subClassOf SPARQL con inferencia SELECT ?p ?c WHERE { ?p dc:creator ?c . ?c rdf:type uni:Persona . } ?p dc:creator ?c uni:Persona rdf:type ?p ?c Resultados ?p ?c uni:biologia uni:juan uni:quimica uni:ana uni:biologia uni:ana ?p ?c ?p ?c rdf:type rdf:type ?p ?c uni:derecho uni:luis
  60. 60. Jose Emilio Labra Gayo, http://www.di.uniovi.es/~labra Ontologías RDF Schema permite hacer inferencias sencillas Poca expresividad OWL (Web Ontology Language) Añade más expresividad Formalizar dominios concretos: ontologías Expresividad vs Complejidad
  61. 61. Jose Emilio Labra Gayo, http://www.di.uniovi.es/~labra uni:biologia dc:creator uni:juan . uni:biologia dc:creator uni:luis . uni:juan rdf:type uni:Profesor . uni:luis rdf:type uni:Elefante . SHEX - SHACL Validar datos en RDF Comprobar la estructura de los grafos RDF Ejemplo: <WebPage> { dc:creator @<Creator> } <Creator> { rdf:type (uni:Profesor uni:Becario) } X
  62. 62. Jose Emilio Labra Gayo, http://www.di.uniovi.es/~labra WESO Web Semantics Oviedo Grupo de investigación creado en 2004 Algunos proyectos Tecnologías semánticas Conciliación de entidades, multimedia, validación, ... Portales de datos: BOPA Asturias, BCN Chile, Licitaciones públicas,... 2 ejemplos seleccionados: WebIndex - Web Foundation LandPortal
  63. 63. Jose Emilio Labra Gayo, http://www.di.uniovi.es/~labra WebIndex Índice del impacto de la Web a nivel mundial Presentado por Tim Berners-Lee http://data.webfoundation.org/webindex/v2013/country/PER
  64. 64. Jose Emilio Labra Gayo, http://www.di.uniovi.es/~labra LandPortal Portal con datos de la tierra Desarrollado para la IFAD (Naciones Unidas)
  65. 65. Jose Emilio Labra Gayo, http://www.di.uniovi.es/~labra Algunos mitos Navegador inteligente Una nueva Web El cerebro global La gran verdad: Una única ontología Una etiqueta para cada cosa Nadie querrá compartir datos Demasiada apertura Moda pasajera No hay Killer application
  66. 66. Jose Emilio Labra Gayo, http://www.di.uniovi.es/~labra El navegador inteligente Mito: El objetivo es conseguir sistemas que naveguen por internet de forma inteligente Realidad: Objetivo = desarrollar tecnologías que faciliten el procesamiento automático de la información de la Web y su integración No es Inteligencia Artificial pero sí se utilizan técnicas de esa disciplina
  67. 67. Jose Emilio Labra Gayo, http://www.di.uniovi.es/~labra Una nueva Web Mito: La Web Semántica ( Web 3.0) es una nueva versión de la web que obligará a cambiar todo lo que ya hay Realidad: Se propone transición gradual. Tecnologías semánticas ofrecen valor añadido. "A Little semantics goes a long way" J. A. hendler
  68. 68. Jose Emilio Labra Gayo, http://www.di.uniovi.es/~labra El cerebro global Mito: La Web semántica generará un cerebro global Realidad: Objetivo: facilitar un mejor uso de los datos de la web. Sí es un camino hacia la inteligencia colectiva
  69. 69. Jose Emilio Labra Gayo, http://www.di.uniovi.es/~labra La gran verdad Mito: Se propone la creación de una única ontología con todo el conocimiento de la humanidad Realidad: Múltiples ontologías para diferentes dominios Facilitar la integración Mejorar la descripción de dominios
  70. 70. Jose Emilio Labra Gayo, http://www.di.uniovi.es/~labra Una etiqueta para cada cosa Mito: Quieren asignar una etiqueta similar a RFID para cada cosa Realidad No es factible que cada cosa conlleve sus propios metadatos Descripciones de recursos externas a ellos
  71. 71. Jose Emilio Labra Gayo, http://www.di.uniovi.es/~labra Nadie querrá compartir datos Mito: Los publicadores de datos no estarán motivados a liberar los datos Realidad: Lo harán cuando encuentren un retorno de inversión adecuado Posicionamiento semántico http://schema.org Principales buscadores indexan datos estructurados Google, Yandex, Yahoo, Bing
  72. 72. Jose Emilio Labra Gayo, http://www.di.uniovi.es/~labra Demasiada apertura Mito: Si sacamos los datos de las bases de datos, los perdemos Realidad: Existen tecnologías para limitar acceso Declarar de dónde provienen los datos Establecer propiedad legal de los datos (licencias)
  73. 73. Jose Emilio Labra Gayo, http://www.di.uniovi.es/~labra Moda pasajera Mito: Mito1: La Web semántica es algo nuevo Mito 2: La Web semántica es algo viejo Realidad: Planteada ya en 1994, visión a largo plazo Exceso de entusiasmo vs escepticismo Casos de éxito no siempre asociados a web semántica: RSS, microformatos, XBRL, Schema, …
  74. 74. Jose Emilio Labra Gayo, http://www.di.uniovi.es/~labra No hay killer application Mito: No se ha desarrollado una killer application Realidad: ¿Es necesaria? ¿Linked Open Data?
  75. 75. Jose Emilio Labra Gayo, http://www.di.uniovi.es/~labra Es caro Mito: Publicar datos enlazados es caro Realidad El trabajo más difícil suele estar ya hecho Lo más difícil es convencer a las personas Involucrar a desarrolladores, organizaciones, etc. Existe mucho código abierto disponible Pero... ...publicar datos enlazados no es a coste cero
  76. 76. Jose Emilio Labra Gayo, http://www.di.uniovi.es/~labra Conclusiones y retos Proyecto Linked Open Data es imparable De portales Web a portales de datos Primera fase = producción Segunda fase = consumo ¿Qué quieren los usuarios? Calidad es cada vez más importante

×