"Principios básicos de la web semántica y linked data, y su aplicación en el gobierno abierto" por Oscar Corcho, catedrático de la Escuela Técnica Superior de Ingenieros Informáticos (Universidad Politécnica de Madrid).
IX Encuentros de Centros de Documentación de Arte Contemporáneo en Artium - Oscar Corcho
1. Principios básicos de la Web
Semántica y Linked Data, y su
aplicación en el Gobierno Abierto
IX Encuentros de centros de
documentación de arte contemporáneo
Vitoria, 24/10/2018
Con contribuciones de María Poveda, Raúl García-Castro,
Paola Espinoza y otros miembros del Ontology
Engineering Group
Oscar Corcho
https://www.slideshare.com/ocorcho
ocorcho@fi.upm.es
@ocorcho
24/10/2018
Vitoria/Gasteiz
2. License
• This work is licensed under the license
CC BY-NC-SA 4.0 International
• http://purl.org/NET/rdflicense/cc-by-nc-sa4.0
• You are free:
• to Share — to copy, distribute and transmit the work
• to Remix — to adapt the work
• Under the following conditions
• Attribution — You must attribute the work by inserting
• “[source Oscar Corcho]” at the footer of each reused slide
• a credits slide stating: “These slides are partially based on
“Principios básicos de la Web Semántica y Linked Data, y
su aplicación en el Gobierno Abierto” by O. Corcho”
• Non-commercial
• Share-Alike
3. Objetivos de esta charla
• Situarnos en el contexto de los datos abiertos,
nuestras obligaciones y las oportunidades que se
abren gracias a ellos
• Presentar, a modo de tutorial, algunos principios
básicos sobre la Web Semántica y la Web de datos
enlazados (o Linked Data)
• Comentar nuestro trabajo en progreso en la
aplicación de estos principios en el área del
Gobierno Abierto
5. ¿Qué son los datos abiertos (open data)?
• “Los datos abiertos (open data) son datos que
pueden ser utilizados, reutilizados y redistribuidos
libremente por cualquier persona u organización –
sujetos únicamente, como mucho, a los requisitos de
atribución y de compartir de manera similar”
• Elementos clave:
• Disponibilidad y Acceso: los datos deben estar disponibles
como un todo, con un coste máximo que sea el de su
reproducción, y preferiblemente en Internet. Asimismo,
deben ser fáciles de modificar.
• Reutilización y Redistribución: los datos deben darse con
una licencia que permita la reutilización y redistribución,
incluyendo la mezcla con otros conjuntos de datos.
• Participación Universal: todos deben poder usarlos,
reutilizarlos y redistribuirlos.
[fuente: Open Data Handbook, http://opendatahandbook.org/en/what-is-open-data/ ]
6. Legislación relevante. Europa y España
• Open Access Initiative (2001). Información científica; > 510 orgs
• Convención de Aarhus (1998). Derecho de participación y acceso; 41
países y la UE
• Directivas PSI. Reutilización de la PSI (2003/98/EC y 2013/37/UE)
• Convención sobre el acceso a documentos oficiales (2009)
• 12 países: Bélgica, Finlanda, Noruega, Suecia, Hungría, Estonia,
Lituania, Eslovenia, Georgia, Montenegro, Serbia y Macedonia
• Ley 37/2007. Reutilización de PSI (transpone la directiva 2003/98/EC)
• Modificada: ley 18/2015 (BOE 10/07/2015, directiva 2013/37/UE )
• Ley 11/2007. Acceso de los ciudadanos a los servicios públicos, y
Derecho a la calidad de los servicios
• RD 4/2010 Esquema Nacional de Interoperabilidad
• Estándares abiertos, principio de neutralidad tecnológica, open
source
• RD 1495/2011 Desarrolla la Ley 37/2007, para el ámbito estatal
• Norma Técnica de Interoperabilidad (19/02/2013, BOE 4/3/2013)
[fuente: basado en idea original de Antonio Rodríguez Pascual (CNIG)]
10. Datos abiertos y cómo publicarlos
En un tablón de anuncios
• Para aquellos con mucho tiempo disponible
• O los que están allí en el momento preciso
Adapted from: Antonio Rodríguez Pascual (IGN)
11. Datos abiertos y cómo publicarlos
En nuestra página Web o aplicación móvil
• Para las personas
Adapted from: Antonio Rodríguez Pascual (IGN)
12. Datos abiertos y cómo publicarlos
En otras páginas Web o aplicaciones móviles
• Para las personas (p.ej, obtenido a partir de GTFS)
Adapted from: Antonio Rodríguez Pascual (IGN)
13. Datos abiertos y cómo publicarlos
En ficheros
• Para ser cargados por humanos en un Sistema
de Información (XML, HTML, CSV, GTFS, etc.)
• Con suerte, no es un PDF escaneado
Adaptado de: Antonio Rodríguez Pascual (IGN)
14. Datos abiertos y cómo publicarlos
Mediante servicios Web
• Para desarrolladores
• Permite generar servicios de valor añadido
• Integrarlo en la lógica de la aplicación del usuario
Adaptado de: Antonio Rodríguez Pascual (IGN)
16. Datos abiertos y cómo publicarlos
Mediante APIs (semánticas) y enlazadas
• Para ser consultados por sistemas (y personas)
• Permite generar servicios de valor añadido
• Formatos estandarizados (JSON, JSON-LD, RDF)
• Modelos estandarizados (vocabularios, ontologías)
17. No reutilizable
√ Reutilizable.
No abierto
√ Reutilizable, abierto.
No completo
√ Reutilizable, abierto,
completo
No enlazado
√ Reutilizable, abierto,
completo, enlazado
Formatos de representación de los datos
Y muchos otros: JSON, JSON-LD, Shapefiles, MARC21, KMZ,
KML, PC-Axis, etc.
18. Hablemos ahora de los principios
básicos de las 4 y 5 estrellas
(Web semántica y Linked Data)
22. Linked Data: Cuatro principios (Tim Berners Lee, 2006)
• Utilizar URIs para referirse a
cualquier cosa
• Utilizar URIs HTTP para que
cualquiera pueda consultarlas
• http://datos.bne.es/persona/XX1718
747
• Cuando alguien consulte una
URI, dar información útil de
acuerdo con estándares (RDF,
JSON-LD, SPARQL)
• Ver código fuente de
http://datos.bne.es/persona/XX1718
747.html
• O
http://datos.bne.es/persona/XX1718
747.ttl
• Incluir enlaces a otras URIs,
para que se puedan descubrir
otras cosas relacionadas
http://www.w3.org/DesignIssues/LinkedData.html
http://www.ted.com/talks/tim_berners_lee_on_the
_next_web.html
24. “La Web Semántica es una extensión de la Web actual donde la
información tiene un significado bien definido, facilitando a ordenadores
y personas trabajar de manera cooperativa. Está basada en la idea de
tener los datos en la Web bien descritos y enlazados, para que se puedan
usar para facilitar tareas como la búsqueda, la automatización de tareas,
la integración de información, etc.
Hendler, J., Berners-Lee, T., and Miller, E.
Integrating Applications on the Semantic Web, 2002,
http://www.w3.org/2002/07/swint.html
¿Qué es la Web Semántica?
Ontologías
Anotaciones
25. Evolución de la Web de Linked Open Data
2007
2008
2009
2010•UK Government
•US Government
•BBC
•Open Calais
•Freebase
•NY Times
•CNET
•DBpedia
•….
26. Evolución de la Web de Linked Open Data (II)
https://lod-cloud.net/
2018-08-28
1,224 datasets
27. Pero... ¿alguien utiliza esto para algo?
https://search.google.com/structured-data/testing-tool
https://toolbox.google.com/datasetsearch
28. RDF y RDF Schema
• RDF: Resource Description Framework
• Recomendación del W3C
• Modelo
• Sintaxis
• Semántica
28
Database XML RDF(S)
Esquema
Datos
RDF Schema
RDF
30. • También conocido como “triples” (tripletas)
• [Sujeto, Predicado, Objeto]
• “Raúl es un miembro del Ontology Engineering Group”
• [Raúl, is member of, Ontology Engineering Group]
• “El nombre completo de Raúl es Raúl García Castro”
• [Raúl, has full name, Raúl García Castro]
• “Raúl nació el 26 de Diciembre de 1975”
• [Raúl, was born, 26 December 1975]
• “La página web del Ontology Engineering Group es http://www.oeg-upm.net/”
• [Ontology Engineering Group, has web page, http://www.oeg-upm.net/]
Componentes de RDF
30
is member of
Raúl Ontology Engineering Group
Raúl Raúl García Castro
has full name
Raúl 26 December 1975
has birth date
has web page
Ontology Engineering Group http://www.oeg-upm.net/
Raúl
Raúl
Raúl
Ontology Engineering Group
Ontology Engineering Group
31. Grafos y Datasets RDF
• Los grafos RDF son conjuntos de tripletas
• Y un conjunto de grafos conforma un RDF Dataset
(en RDF1.1)
• Hay un grafo for defecto (default graph)
• Y cero o más grafos con nombre (named graph)
31
is member of
Raúl
Ontology Engineering Group
Raúl García Castro
has full name
26 December 1975
has birth date
has web page
http://www.oeg-upm.net/
32. IRIs y URIs en RDF
• Componentes de una URI (RFC3986) o IRI (RFC3987)
• http://www.oeg-upm.net:8080/Info/People?position=current#Raul
• URIs vs IRIs en RDF:
• Uniform vs Internationalized Resource Identifier
• Las IRIs pueden contener caracteres Unicode
32
Scheme Authority Path Query Fragment
http://www.oeg-upm.net/Properties#isMemberOf
http://www.oeg-upm.net/People#Raul
http://www.oeg-upm.net/Organization#OEG
“Raúl García Castro”
http://www.oeg-upm.net/Properties#hasFullName
“1975-12-26”^^xsd:datehttp://www.oeg-upm.net/Properties#hasBirthDate
http://www.oeg-upm.net/Properties#hasWebPage
http://www.oeg-upm.net/
33. Espacios de nombres (namespaces) en RDF
• Las IRIs bajo un namespace se llaman vocabularios
33
Prefijo URI
people http://www.oeg-upm.net/People#
organization http://www.oeg-upm.net/Organization#
properties http://www.oeg-upm.net/Properties#
rdf http://www.w3.org/1999/02/22-rdf-syntax-ns#
rdfs http://www.w3.org/2000/01/rdf-schema#
xsd http://www.w3.org/2001/XMLSchema#
properties:isMemberOf
people:Raul
organization:OEG
“Raúl García Castro”
properties:hasFullName
“1975-12-26”^^xsd:dateproperties:hasBirthDate
properties:hasWebPage
http://www.oeg-upm.net/
34. Serializaciones en RDF
• Varias serializaciones (muchas de ellas finalmente aprobadas en Feb2014)
• RDF/XML (www.w3.org/TR/rdf-syntax-grammar/)
• Turtle (http://www.w3.org/TR/turtle/)
• N-Triples (http://www.w3.org/TR/n-triples/)
• TriG (http://www.w3.org/TR/trig/)
• RDFa (http://www.w3.org/TR/xhtml-rdfa-primer/)
• JSON-LD (http://www.w3.org/TR/json-ld/)
• N-Quads (http://www.w3.org/TR/n-quads/)
• Importante: las serializaciones permiten diferentes variantes sintácticas.
• El orden en el que las tripletas RDF aparecen en un documento no es relevante
34
39. Hablemos ahora de los principios
básicos de las 4 y 5 estrellas
(Web semántica y Linked Data)
Y también habría que hablar de SPARQL,
OWL, Linked Data Fragments, etc.
Y de RDA (Resource Description and Access),
FRBR, Dublin Core, schema.org, etc.
https://miriadax.net/web/semantic-web-and-linked-data
40. Y finalmente, ¿cómo estamos
aplicando estos principios en el
Gobierno Abierto?
Y más aún, ¿cómo no quedarnos sólo en estas
4 o 5 estrellas?
41. Datos
abiertos
Gobierno Abierto (un vistazo general)
• El Gobierno Abierto tiene como objetivo que los ciudadanos
colaboren en la creación y la mejora de los servicios públicos y
en el robustecimiento de la transparencia y la rendición de
cuentas. El concepto de Gobierno Abierto se sustenta en tres
pilares básicos: la Transparencia, la Colaboración, la
Participación.
• Fuente:
https://administracionelectronica.gob.es/pae_Home/pae_Estrategia
s/pae_Gobierno_Abierto_Inicio.html
Participación
ciudadana
Transparencia
44. Algunas iniciativas internacionales
• Open Government Partnership
• Global Open Data Initiative
• Iniciativas nacionales y locales
• https://www.opengovpartnership.org/countries/spain
• https://www.opengovpartnership.org/countries/madrid-
spain
• Open Data Charter
• https://opendatacharter.net/
• 6 principios básicos
47. ¿Por qué nuestro interés en las ciudades?
• Los conjuntos de datos regionales y nacionales son
útiles para proporcionar indicadores,
compaaraciones entre países y regiones, etc.
• Sin embargo, los datos locales son normalmente
mejores para generar valor económico y/o social
• Más cercanos a la gente
• Más cercanos a los negocios locales
• Más cercanos a los desarrolladores
48. ODI, ciudades y Gobierno Abierto
• Nodo del Open Data Institute para Madrid
• Involucrados en:
• Líderes de la red temática española sobre datos abiertos
para ciudades inteligentes (Open Data for Smart Cities)
• Líderes de la norma técnica UNE178301:2015 sobre datos
abiertos para ciudades inteligentes
• Miembros del grupo de trabajo sobre datos abiertos de la
FEMP (Federación Española de Municipios y Provincias)
• Soporte técnico y de innovación para varias iniciativas
locales de datos abiertos (Zaragoza, Madrid), y otras a
través de Localidata
49. Algunas de nuestras experiencias/aportaciones
• Estratégicas
• Hojas de ruta (por ejemplo, para el
Ayuntamiento de Madrid)
• Contribuciones a la Guía de Datos
Abiertos de la FEMP
• Tecnológicas
• Despliegues en CKAN
• Desarrollo de ontologías
• http://vocab.linkeddata.es/datosabiertos/def/
• Infraestructura para el desarrollo de ontologías
• Despliegues de 5 estrellas y APIs REST
• Por ejemplo, https://datos.zaragoza.es/
• Educativas
• Cursos centrados en la generación y uso de datos abiertos
en administraciones públicas
50. Proyecto Ciudades Abiertas (financiado por red.es)
INICIATIVA PLATAFORMA DE GOBIERNO ABIERTO,
COLABORATIVA E INTEROPERABLE (121/17-SP)
51. Proyecto Ciudades Abiertas (financiado por red.es)
• Creación de 10+ ontologías
• Censo de locales
• https://github.com/opencitydata/comercio-censo-locales
• Padrón
• Contratación pública
• …
• Grupos de trabajo para conjuntos de datos
específicos, con expertos de dominio, usuarios, e
ingenieros de ontologías
• De manera similar a lo que se está haciendo en
OpenContracting, Open311, etc.
• APIs y datos enlazados homogéneos en todas las
ciudades
52. Datos enlazados + ontologías
• Cuando abrimos nuestros datos, sería bueno usar
las mismas estructuras de datos
Publish
Extract
Publish
Extract
Publish
Extract
Quiero publicar
mis datos
I am using GTFS I am using my own CSV
structure
I provide it as a Web
service
Desarrollar una app y desplegarla en todas las ciudades
55. Herramientas desarrollo de ontologías @OEG-UPM
56
Evaluación
o OOPS! OntOlogy Pitfall Scanner
http://oops.linkeddata.es/
Documentación
o HTML: Widoco
https://github.com/dgarijo/Widoco/
o Diagramas: AR2DTool
http://ar2dtool.linkeddata.es/
o Catálogo
• Vocabularios OEG
http://vocab.linkeddata.es/
• Ciudades: http://smartcity.linkeddata.es/
• Datos abiertos:
http://vocab.linkeddata.es/datosabiertos/
o Desarrollo distribuido
o OnToology http://ontoology.linkeddata.es/
56. Soporte tecnológico para estas actividades
Informes de evaluación
Documentación en HTML
Diagramas
IDs permanentes
Negociación de
contenidos
Bundles
Previsualización
57. ¿Dónde usaremos estos datos enlazados + ontologías?
• Para su reutilización
• En portales y APIs de datos abiertos
• Ejemplo:
https://www.zaragoza.es/sede/servicio/organigrama/
• Para hacer visualizaciones relacionadas con
transparencia
• Ejecución de presupuestos
• Contratación pública
• Para facilitar la participación pública
• Discusiones “informadas” con datos enlazados
• Mapas colaborativos
• Legislación colaborativa
58. Objetivos de esta charla
• Situarnos en el contexto de los datos abiertos,
nuestras obligaciones y las oportunidades que se
abren gracias a ellos
• Presentar, a modo de tutorial, algunos principios
básicos sobre la Web Semántica y la Web de datos
enlazados (o Linked Data)
• Comentar nuestro trabajo en progreso en la
aplicación de estos principios en el área del
Gobierno Abierto
59. Principios básicos de la Web
Semántica y Linked Data, y su
aplicación en el Gobierno Abierto
IX Encuentros de centros de
documentación de arte contemporáneo
Vitoria, 24/10/2018
Con contribuciones de María Poveda, Raúl García-Castro,
Paola Espinoza y otros miembros del Ontology
Engineering Group
Oscar Corcho
https://www.slideshare.com/ocorcho
ocorcho@fi.upm.es
@ocorcho
24/10/2018
Vitoria/Gasteiz
Notas del editor
http://opendatahandbook.org/en/what-is-open-data/
http://www.gtfs-data-exchange.com/agency/madrid/
Video from minute 5:50 is where everything is better explained.