Primera entrega. Material del curso sobre Linked Data impartido en la entidad pública empresarial Red.es por Asunción Gómez-Pérez y Oscar Corcho (Ontology Engineering Group - Universidad Politécnica de Madrid).
1. Material
del
curso
sobre
Tecnologías
Semánticas
en
la
Web
de
Datos
red.es,
29/11/2012
Ontology
Engineering
Group
Asunción
Gómez-‐Pérez,
Oscar
Corcho
García
Licencia
de
uso:
Creative
Commons
Attribution-‐
NonCommercial-‐ShareAlike
3.0
Unported
(CC
BY-‐NC-‐SA
3.0)
Más
información
sobre
cursos
disponible
en:
http://cursos.oeg-‐upm.net/
2. 26/11/12
Tecnologías Semánticas en
la Web de datos
Asunción Gómez-Pérez, Oscar Corcho
Facultad de Informática, Universidad Politécnica de Madrid
Campus de Montegancedo sn, 28660 Boadilla del Monte, Madrid
http://www.oeg-upm.net
asun@fi.upm.es
Agradecimientos:
Garijo, D. Vila, L.Vilches, B. Villazón
Curso en Red.es. 29 de Noviembre de 2012
Indice
1. Web de Linked Data: Conceptos Básicos
A. Gómez Pérez (30 min.)
2. RDF, RDF Schema y SPARQL
O. Corcho (90 min.)
3. Vocabularios
A. Gómez Pérez (90 min.)
4. Herramientas de publicación de datos para portales
de datos abiertos
O. Corcho (30 min.)
Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012 2
1
3. 26/11/12
Web de Linked Data:
Conceptos Básicos
Asunción Gómez-Pérez, Oscar Corcho
Facultad de Informática, Universidad Politécnica de Madrid
Campus de Montegancedo sn, 28660 Boadilla del Monte, Madrid
http://www.oeg-upm.net
asun@fi.upm.es
Agradecimientos:
D. Vila
Curso en Red.es. 29 de Noviembre de 2012
Índice
1. Concepto
2. Fundamentos
3. Proceso
Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012 4
2
4. 26/11/12
Consultas complejas usando datos de diferentes páginas Web
http://www.bne.es/
http://elviajero.elpais.com/
Turista alemán entusiasta de
Cervantes dispuesto a conocer más
sobre el trabajo y la vida de Cervantes
http://www.viaf.org/
http://www.aemet
Tecnologías Semánticas en la Web de Datos. *Picture attribution: http://commons.wikimedia.org/wiki/User:Gugerell
Red.es. 29 de noviembre de 2012 5
BD BD BD BD BD BD
BNE VIAF AEMET IGN Prisa DBpedia Integración de datos
BNE
Ubicado en
Alcalá de Henares
1605 El Quijote
Año de Igual a
Publicación autor Lugar de
nacimiento
M. Cervantes Alcalá de Henares
M. Cervantes
M. Cervantes
creador
Año de
publicación Don Quixote
1960 Alcalá de Henares
Alcalá de Henares
Traducido a
Temperatura
localizado guía
Hebrew
20º
Tapas Siglo
de Oro
VIAF
Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012 6
3
5. 26/11/12
Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012 7
http://www.emtmadrid.es/
Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012 8
4
6. 26/11/12
Ayto Catas BD BD BD
Madrid tro AEMET DBpedia IGN Integración de datos
L-20
Código Local
Madrid
11012723 Cafetería Simpatía
NúmeroPortal sameAs
vcard:adr
city
C/ Alcalá, 54 Madrid
C/ Alcalá, 54
C/ Alcalá, 54
refCatastral
codPostal 1446403VK4714E0001AZ
28014 Madrid
superficie
Temperatura
añoConstrucción
971m2
20º
1910
Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012 9
Asunción Gómez Pérez 10
5
7. 26/11/12
Agregar Información
Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012 11
Event BD BD BD BD
Media DBpedia ElPaís Havas Twitter Agregar información
31/10/2012
fecha
Tagcloud
Diviertt Fiesta Halloween 2012
organizador
isTagCloudOf
lugar
hashtag
Madrid Arena #madridarena
Madrid Arena
Madrid Arena
lugar
país Madrid
España #madridarena
noticia
http://elpais.com/elpais/2012/11/01/
inenglish/1351773824_923902.html
Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012 12
6
8. 26/11/12
Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012 13
Linked Data
Visualización de
datos y
conocimientos
Enlazado
Generación
de RDF
Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012
7
10. 26/11/12
Fundamentos
Modelos en RDF(S) Identificadores únicos: URI
identifica o nombra recursos
Enlaces a otros conjuntos de datos
Same As
Navegación de datos
http://iflastandards.info/ns/fr/frbr/frbrer/C1005 http://iflastandards.info/ns/fr/frbr/frbrer/C1001
Es creador de
Persona Cer Obra
Es una Es una
Es creador de
Cervantes Cer El Quijote
http://datos.bne.es/resource/XX1718747 http://datos.bne.es/resource/XX3383563
Same As
Same As
Cervantes
http://viaf.org/viaf/17220427
Cervantes
http://dbpedia.org/resource/Miguel_de_Cervantes
Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012
Fundamentos
Alineando Modelos con Owl EquivalentClass
Persona http://schema.org/Person
http://iflastandards.info/ns/fr/frbr/frbrer/C1005 EquivalentClass
Persona
Persona http://xmlns.com/foaf/0.1/Person
lugar de
nacimiento
Municipio Municipio
EquivalentClass
http://dbpedia.org/resource/Municipalities_of_Spain http://geo.linkeddata.es/ontology/Municipio
Es un Es un
Alcalá de Henares Same As Alcalá de Henares
http://dbpedia.org/page/Alcal%C3%A1_de_Henares http://geo.linkeddata.es/resource/Alcalá de Henares
Lecciones aprendidas
1. Reutilización de modelos existentes
2. Alineación de datos y conceptos.
Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012
9
11. 26/11/12
El modelo (Ontología) y los datos
Lengua
traducción
Es creador de Lugar de nacimiento
Año Obra Persona Lugar Ontología
Fecha de publicación
Se refiere a
Ubicado en
Biblioteca
Catalán
traducción
Es creador de Lugar de nacimiento
1960 El Quijote Cervantes Alcalá de Henares
Fecha de publicación
Se refiere a
Ubicado en Datos
Vida de Cervantes
BNE
Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012 19
El modelo (Ontología) y los datos (datasets)
idioma
http://iflastandards.info/ns/fr/frbr/frbrer/C1002
Ontología
traducción
Es creador de
trabajo Persona
Año http://iflastandards.info/ns/fr/frbr/frbrer/C1001 http://iflastandards.info/ns/fr/frbr/frbrer/C1005
Fecha de publicación
Lugar de nacimiento
Tiene subject
Localizado en http://geo.linkeddata.es/ontology/Municipio
Biblioteca
http://xmlns.com/foaf/0.1/Organization
Catalán
http://datos.bne.es/resource/XX1924295
translation http://geo.linkeddata.es/resource/Alcalá de Henares
Don Quijote de la Mancha
Cervantes Saavedra, Miguel de
Es autor Lugar de nacimiento
1960 http://datos.bne.es/resource/XX3383563 http://datos.bne.es/resource/XX1718747
Fecha de publicación
Tiene subject
Localizado en http://datos.bne.es/resource/bimo0002045496
BNE Vida de Miguel de Cervantes Saavedra
http://datos.bne.es/# Datos
Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012 20
10
12. 26/11/12
Índice
1. Concepto
2. Fundamentos
3. Proceso
Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012 21
Especificación @ BNE
• Registros en formato MARC 21
• 3.9 millones de registros bibliográficos
Especificar
• 4.2 millones de registros de autoridades
• Versión: Noviembre 2011
Modelar
AUTHORITY BIBLIOGRAPHIC
Generar RDF
Enlazar
Persons 76576 Maps
Corporate bodies 320727 Sound recordings
Conferences 166017 Gravings, drawings, pictures
Publicar
Titles 35770 Manuscripts
Subject 143959 Ancient books
2696560 Modern books
Explotar
178473 Scores
3021 Electronic resources
156634 Serials
96672 Videos
Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012 22
11
13. 26/11/12
La Ontología: basada en vocabularios IFLA
Especificar
Modelar
Generar RDF
Enlazar
Publicar
Explotar
Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012
La herramienta Marimba genera RDF
Especificar
Modelar
Generar RDF
Enlazar
Publicar
Explotar
BNE
Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012
12
14. 26/11/12
Marimba enlaza con otros recursos:
VIAF, DNB, SUDOC, LIBRIS, DBpedia
http://d-nb.info/gnd/11851993X
Especificar
DNB
Modelar http://viaf.org/viaf/17220427
VIAF
Same As
Same As http://dbpedia.org/resource/Miguel_de_Cervantes
Generar RDF
DBpedia
Same As
Enlazar
http://datos.bne.es/resource/XX1718747
BNE
Publicar Same As
Same As
Explotar http://www.idref.fr/026774771/id
SUDOC
http://libris.kb.se/resource/auth/45369
LIBRIS
Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012
Marimba enlaza con otros recursos:
VIAF, DNB, SUDOC, LIBRIS, DBpedia
Especificar
Modelar
Generar RDF
Enlazar
Publicar
Explotar
Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012
13
15. 26/11/12
Publicar
Especificar
Modelar
Publicar los datos
Generar RDF
Describir el recurso con VOID
Para facilitar el descubrimiento
Enlazar
• Registrar en CKAN tu recurso
Publicar
• Utilizar sitemap4rdf para generar el sitemap
Explotar
• Cargar el sitemap en Google y Sindice
Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012
Explotar
Interfaz Web
Especification
Especificar
Modelar
Model
RDF
Generar RDF
generation
Publication
Enlazar
Consultas en SPARQL
Exploitation
Publicar
URI Cervantes
select distinct COUNT(?Obras) where {
Explotar http://datos.bne.es/resource/XX1718747 Is author
<http://iflastandards.info/ns/fr/frbr/frbrer/P2010>
?Obras
}
http://linkeddata3.dia.fi.upm.es/bne-demo
Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012
14