Tercera entrega. Material del curso sobre Linked Data impartido en la entidad pública empresarial Red.es por Asunción Gómez-Pérez y Oscar Corcho (Ontology Engineering Group - Universidad Politécnica de Madrid).
03. Vocabularios. Tecnologías Semánticas en la Web de Datos
1. Material
del
curso
sobre
Tecnologías
Semánticas
en
la
Web
de
Datos
red.es,
29/11/2012
Ontology
Engineering
Group
Asunción
Gómez-‐Pérez,
Oscar
Corcho
García
Licencia
de
uso:
Creative
Commons
Attribution-‐
NonCommercial-‐ShareAlike
3.0
Unported
(CC
BY-‐NC-‐SA
3.0)
Más
información
sobre
cursos
disponible
en:
http://cursos.oeg-‐upm.net/
2. 28/11/12
Indice
1. Web de Linked Data: Conceptos Básicos
A. Gómez Pérez (30 min)
2. RDF, RDF Schema y SPARQL
O. Corcho (90 min)
3. Vocabularios
A. Gómez Pérez (90 min)
4. Herramientas de publicación de datos para portales
de datos abiertos
O. Corcho (30 min)
Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012 1
Vocabularios
Asunción Gómez-Pérez, Oscar Corcho
Facultad de Informática, Universidad Politécnica de Madrid
Campus de Montegancedo sn, 28660 Boadilla del Monte, Madrid
http://www.oeg-upm.net
asun@fi.upm.es
Agradecimientos:
D. Garijo, R. García, M. Poveda, J.A. Ramos, M.C. Suárez-
Figueroa, D. Vila, L. Vilches, B. Villazón
Curso en Red.es. 29 de Noviembre de 2012
1
3. 28/11/12
1. Introducción
2. Tipos de vocabularios
3. Proceso de Construcción
4. Ejemplos de Vocabularios
• Personas y Organizaciones: FOAF, vCard, ORG
• Documentos: DC, BIBO
• Geo: puntos, curvas y polígonos
• Estadísticas: Data Cube
• Bibliotecas: FRBR
• Otros vocabularios: sensores, provenance, VOID
5. Ejemplos de Redes de vocabularios en aplicaciones
de datos enlazados
• Instituto Geográfico Nacional
Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012 3
Caso de uso
¿Qué vocabularios debemos utilizar para
describir en el formato de datos enlazados el
organigrama de los diferentes Ministerios,
las personas que forman parte de él y su
ubicación?
Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012
2
4. 28/11/12
Organigrama diferentes en los Ministerios
Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012 5
Organigramas con diferente terminología
Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012 6
3
5. 28/11/12
Descripción de los ministros “a la carta”
Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012 7
Diferentes formas de describir la dirección de contacto
Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012 8
4
6. 28/11/12
1. Introducción
2. Tipos de vocabularios
3. Proceso de Construcción
4. Ejemplos de Vocabularios
5. Ejemplos de Redes de vocabularios en aplicaciones
de datos enlazados
6. Conclusiones
Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012 9
Las organizaciones poseen vocabularios
Clasificacion
Informal
ID
Name
Ve
Vehículo
10.01
Coche
10.02
Motocicleta
10.03
Bicicleta
Tesauro 10.01
Vehículo
10.01.01
Rueda
10.01.02
Asiento
10.01.03
Puerta
Catalogo/ID
?
Conocimiento
implícito en los
? números
XX-YY-ZZ
02-01-02
02: transporte
01: carretera
02: 3 carriles
Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012
5
7. 28/11/12
Ontología
• Una ontología es:
• Un conjunto de términos consensuados
• Incluye:
• Conceptos
• Taxonomias de Conceptos
• Propiedades
• Relaciones entre concpetos
• Visión compartida sobre cómo modelar un dominio de interés
• Implementadas en OWL o RDF(S)
• Herramientas: Protégé, NeOn Toolkit, Topbraid composer, etc.
Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012 11
Ejemplos de ontologías
SIOC Ontology
Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012 12
6
8. 28/11/12
Ontologías: Conocimientos y Datos
Nivel de
Conocimientos
Conceptos
Taxonomías
Relaciones
Atributos
Ontología Axiomas
Nivel de
Instancias de conceptos
Datos
Instancias de relaciones
Instancias
Fecha de
Nivel de Es creador de publicación
Ce Año
Conocimientos Persona Obra
r
Es una
Es una Es un
Fecha de
Nivel de Es creador de publicación
Datos Cervantes Cer El Quijote 1960
13
Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012 13
Ejemplo de ontología
Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012
7
9. 28/11/12
1. Introducción
2. Tipos de vocabularios
3. Proceso de Construcción
4. Ejemplos de Vocabularios
5. Ejemplos de Redes de vocabularios en aplicaciones
de datos enlazados
6. Conclusiones
Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012 15
Vocabularios en la Web de datos
¿Qué vocabularios son los
más utilizados?
Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012 16
8
10. 28/11/12
Modelar en la Web de Datos
Especificar
Modelar
RDF Generation
Links Generation
Publication
Misma visión
(Shared
understanding)
Exploitation
Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012
Tendencias en la construcción de ontologías
• Reutilizar recursos ricos en conocimientos
• Construcción de ontologías y vocabularios de forma
colaborativa
• Conectar ontologías y vocabularios en redes
Construcción
De ontologías
Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012
9
11. 28/11/12
Modelar
Buscar Ontologías
Linked Open Vocabularies
¿Son Si Construir el modelo
apropiados? reutilizando vocabularios
existentes
No
Buscar recursos basados Catálogos Institucionales y
en conocimientos estándares
¿Son Si Transforma el recurso en
apropiados? una ontología
No
Construye desde el principio usando la
metodología NeOn
Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012 19
Búscar vocabularios en LOV
http://labs.mondeca.com/dataset/lov/
Linked Open Vocabularies (LOV)
• Ecosistema de vocabularios utilizados en datos
abiertos enlazados (RDFS or OWL ontologies)
• 300 vocabularios descritos con metadatos
• Clasificados en espacios (vocabulary spaces)
• Enlazados usando VOAF
• Servicios
• Consulta
• Búsqueda
• Métricas
Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012 20
10
12. 28/11/12
Los espacios en LOV
Ciencia
Generales
Web
Recomendaciones Multimedia
Espacio
Tiempo
Eventos Bibliotecas
Organizaciones
sociales
Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012 21
Descripción de vocabularios en LOV
Metadatos
Vocabularios que Vocabularios
lo usan que usa
Versiones
Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012 22
11
13. 28/11/12
1. Introducción
2. Tipos de vocabularios
3. Proceso de Construcción
4. Ejemplos de Vocabularios
• Personas y Organizaciones: FOAF, vCard, ORG
• Documentos: DC, BIBO
• Geo: puntos, curvas y polígonos
• Estadísticas: Data Cube
• Bibliotecas: FRBR
• Otros vocabularios: sensores, provenance, VOID
5. Ejemplos de Redes de vocabularios en aplicaciones
de datos enlazados
• Instituto Geográfico Nacional
Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012 23
Vocabularios de Personas y Organizaciones
Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012 24
12
14. 28/11/12
FOAF– Friend Of A Friend
• Vocabulario RDF para describir:
• Personas
• Grupos
• Documentos
o http://www.foaf-project.org/
Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012 25
FOAF – relación con otros vocabularios
Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012 26
13
15. 28/11/12
FOAF - Evolución
Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012 27
FOAF - El vocabulario
Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012 28
14
16. 28/11/12
FOAF - Una parte del modelo
foaf:based_near
wgs_84:SpatialThing foaf:Agent
foaf:Group
foaf:Organization foaf:Document
foaf:Person foaf:publications
foaf:Image
foaf:mbox - foaf:firstName
- foaf:surname
- foaf:familyname foaf:img
owl:Thing foaf:knows
foaf:depiction
foaf:homepage
Extracto del modelo de FOAF
Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012 29
FOAF- modelo e instancias
foaf:based near
_
wgs _84:SpatialThing foaf:Agent
foaf :Group
foaf:Organization foaf:Document
foaf :Person foaf:publications foaf:Image
foaf:mbox - foaf:firstName
- foaf:surname
- foaf:familyname foaf img
:
owl:Thing foaf:knows
instanceOf foaf:depiction
foaf:homepage
instanceOf instanceOf
instanceOf instanceOf
“Asunción”
foaf:firstName
“Gómez-Pérez” “Mari Carmen”
foaf surname
: foaf:firstName
oeg:Asun foaf:knows oeg:MC
foaf:surname
foaf:img “Suárez de Figueroa”
http ://.../people/asun_ oeg.png instanceOf
foaf:mbox
foaf homepage
: foaf:publications foaf publications
:
instanceOf
asun@ fi.upm.es
http://oeg- upm.net / http://www.springer.com/.../ 978-3 -642- 24793
foaf:depiction
http://springer.com/…/images /NeOnBook .tif
Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012 30
15
17. 28/11/12
RDF de ejemplo instanciación de Foaf
XML
Turtle
Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012 31
V-Card– Tarjetas de presentación
• vCard automates the
exchange of personal
and organization
information typically
found on a traditional
business card.
• RDF Classes:
• Vcard
• Name
• Address
• Organisation,
• Location
• Label
• Tel
http://www.w3.org/Submission/vcard-rdf/
• Email.
32
16
18. 28/11/12
Ejemplo instanciación Vcard
vcard:url
owl:Thing vcard:email
vcard:VCard vcard:n vcard:Name
- vcard:given-name
- vcard:family-name
instanceOf
instanceOf
instanceOf
instanceOf oeg:Asun vcard:n oeg:AsunName
vcard:email vcard:given-name vcard:family-name
vcard:url
“Asunción” “Gómez”
asun@fi.upm.es
http://oeg-upm.net/
Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012 33
RDF de ejemplo instanciación de VCard
Turtle
XML
Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012 34
17
20. 28/11/12
ORG: Una ontología de organizaciones (W3C)
• ORG es una ontología para representar datos de
organizaciones.
• Estructura de la organización
• Noción
• Sub-organizaciones y unidades
• Fin
• Estructura de reporte
• Miembros
• Roles,
• Relaciones entre miembros
• Ubicación
• Edificios, direcciones, etc.
• Historia (fusiones, cambios de nombre)
http://www.w3.org/TR/vocab-org/
Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012 37
ORG: Una ontología para organizaciones
http://www.w3.org/TR/vocab-org/
38
19
21. 28/11/12
ORG: Metadatos
Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012 39
ORG: Relación con otros vocabularios
Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012 40
20
22. 28/11/12
ORG - Evolución
Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012 41
ORG: El vocabulario
Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012 42
21
23. 28/11/12
ORG - Una parte del modelo
org:headOf
foaf:Agent org:membetOf org:Organization org:hasUnit/unitOf
org:OrganizationalUnit
org:postIn/hasPost
org:holds/heldBy
org:Post
Extracto del modelo de ORG
Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012 43
ORG: modelo e instancias
org:headOf
foaf:Agent org:memberOf org:Organization org:hasUnit/unitOf
org:OrganizationalUnit
org:postIn/hasPost
org:holds/heldBy
instanceOf
org:Post
“Universidad
Politécnica de
instanceOf Madrid”
skos:prefLabel
univEs:UPM
“Facultad de
instanceOf
org:unitOf Informática”
skos:prefLabel
upm:FI
org:postIn
“Departamento
de Inteligencia
org:unitOf
fi:15 skos:prefLabel Artificial”
org:memberOf
org:memberOf
skos:prefLabel fi:DIA
org:memberOf
org:memberOf
“Director de org:holds/heldBy org:memberOf
departamento” org:headOf
org:memberOf
instanceOf
instanceOf
oeg:Asun
foaf:knows oeg:MC
foaf:firstName
foaf:surname foaf:firstName
“Asunción” foaf:surname
foaf:img “Mari Carmen”
instanceOf “Gómez”
“Suárez de Figueroa”
http://.../people/asun_oeg.png
Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012 44
22
24. 28/11/12
ORG: modelo e instancias – Sintaxis Turtle
Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012 45
ORG: modelo e instancias – Sintaxis RDF/XML
Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012 46
23
25. 28/11/12
1. Introducción
2. Tipos de vocabularios
3. Proceso de Construcción
4. Ejemplos de Vocabularios
• Personas y Organizaciones: FOAF, vCard, ORG
• Documentos: DC, BIBO
• Geo: puntos, curvas y polígonos
• Estadísticas: Data Cube
• Bibliotecas: FRBR
• Otros vocabularios: sensores, provenance, VOID
5. Ejemplos de Redes de vocabularios en aplicaciones
de datos enlazados
• Instituto Geográfico Nacional
Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012 47
DC: The Bibliographic Ontology
• Dublin Core es un ontología para describir recursos
mediante metadatos simples y generales (DC terms).
• Subconjunto de 15 elementos (DC elements) reconocidos
por IETF RFC 5013, ANSI/NISO Standard Z39.85-2007 y
ISO Standard 15836:2009.
• Pensado para ser utilizado junto con otros vocabularios
especializados de acuerdo a las necesidades de
implementación.
• http://dublincore.org/documents/2012/06/14/dcmi-terms/?v=terms
Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012 48
24
26. 28/11/12
DC: Relación con otros vocabularios
Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012 49
DC: Evolución
Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012 50
25
27. 28/11/12
DC: El vocabulario
126 Elementos
Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012 51
DC: Una parte del modelo
dc:relation
dc:source
dc:subject
dc:description
owl:Thing dc:identifier
dc:coverage dc:LocationPeriodOrJurisdiction
dc:creator
dc:Agent dc:contributor dc:BibliographicResource dc:format
dc:publisher - dc:title
dc:MediaTypeOrExtent
dc:rights dc:type dc:language
dc:RightsStatement
dc:Class dc:LinguisticSystem
Extracto del modelo de DC
Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012 52
26
28. 28/11/12
DC: modelo e instancias
dc:creator
dc:contributor
dc:publisher
dc:Agent
instanceOf
dc:BibliographicResource
instanceOf - dc:title
http://dbpedia.org/page/Springer_Publishing
oeg:MC
instanceOf
dc:publisher
oeg:Asun dc:creator
dc:contributor instanceOf
instanceOf
http://www.springer.com/.../978-3-642-24793-4
dc:contributor
kmi:Enrico
terms:created
instanceOf dc:contributor terms:title “2012”
terms:identifier
stl:Aldo “Ontology Engineering
in a Networked World” “978-3-642-24794-1”
Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012 53
RDF de ejemplo instanciación de Dublin Core
XML
Turtle
Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012 54
27
29. 28/11/12
DC en Protégé
55
BIBO: The Bibliographic Ontology
• Bibliographic Ontology (BIBO) para describir datos
bibliográficos en la Web
• BIBO can be used as
• Ontologia de citas
• Clasificación de documentos
• bibliontology.com/
• http://purl.org/ontology/bibo/
Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012 56
28
30. 28/11/12
BIBO: Relación con otros vocabularios
Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012 57
BIBO: Evolución
Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012 58
29
31. 28/11/12
BIBO: El vocabulario
189 Elementos
Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012 59
BIBO: Una parte del modelo
foaf:Agent
equivalentClass
bibo:Agent bibo:editor bibo:Document
bibo:Article
bibo:Book
bibo:Proceedings
bibo:Thesis
Extracto del modelo de BIBO
Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012 60
30
32. 28/11/12
BIBO: modelo e instancias
foaf:Agent
bibo:editor bibo:Document
equivalentClass
bibo:Article
bibo:Agent
bibo:Book
instanceOf
bibo:Proceedings
instanceOf bibo:Thesis
springer:Springer
instanceOf
bibo:publisher
“Ontology Engineering in
springer:978-3-642-24794-1 dc:title
a Networked World”@en
dc:date
bibo:isbn
bibo:editor “2012”
bibo:numPages
instanceOf
instanceOf “978-3-642-24794-1”
oeg:MC bibo:editor
bibo:editor bibo:editor
foaf:firstName
foaf:surname “444”
“Mari Carmen”
“Suárez de Figueroa”
cnr:AGangemi
oeg:Asun foaf:firstName
kmi:EMotta
foaf:firstName foaf:surname
foaf:surname foaf:firstName “Aldo”
“Asunción” foaf:img foaf:surname
“Gangemi”
“Enrico”
“Gómez”
“Motta”
http://.../people/asun_oeg.png
instanceOf
Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012 61
BIBO in Protégé
bibliontology.com
62
31
33. 28/11/12
BIBO: modelo e instancias – Sintaxis RDF/XML
Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012 64
1. Introducción
2. Tipos de vocabularios
3. Proceso de Construcción
4. Ejemplos de Vocabularios
• Personas y Organizaciones: FOAF, vCard, ORG
• Documentos: DC, BIBO
• Geo: puntos, curvas y polígonos
• Estadísticas: Data Cube
• Bibliotecas: FRBR
• Otros vocabularios: sensores, provenance, VOID
5. Ejemplos de Redes de vocabularios en aplicaciones
de datos enlazados
• Instituto Geográfico Nacional
Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012 65
32
34. 28/11/12
Puntos en cartografía: WGS84
• Vocabulario para representar Puntos
• latitud
• Longitud
• @en
• http://www.w3.org/2003/01/geo/
<rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"
xmlns:geo="http://www.w3.org/2003/01/geo/wgs84_pos#">
<geo:Point>
<geo:lat> 55.701</geo:lat>
<geo:long>12.552</geo:long>
</geo:Point>
</rdf:RDF>
Asunción Gómez Pérez Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012 66
Geoes: Modelo de Geometria
geoes: http://geo.linkeddata.es/
geo: http://www.w3.org/2003/01/geo/wgs84_pos#
geoes:ontology/Geometry
rdfs:subClassOf rdfs:subClassOf
rdfs:subClassOf
geo:Point geoes:ontology/Curve geoes:ontology/Polygon
Composed by Composed by
geo:lat geo:long
Collection of 2 or Collection of 3 or
more geo:Points more geo:Points
67
Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012
33
35. 28/11/12
Geoes: curvas
Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012
Geoes: Polígonos
geoes: http://geo.linkeddata.es/
otalex: http://otalex.linkeddata.es/
geo: http://www.w3.org/2003/01/geo/wgs84_pos#
otalex:resource/wgs84/…
69 otalex:resource/ 38.985
wgs84/38.98531526569159_-5.4985940847130 geo:lat
78
by)
geo:long
otalex:resource/ -5.498
osed
wgs84/38.982575823226234_-5.495821779307
mp
759
( co
Por
otalex:resource/
38.984222213320045_-5.49938294416971
ado
m
Embalse de Orellana
:for
geo
rdfs:label
geo:geometry
otalex:resource/ geoes:resource/Embalse/Embalse
4e994dad1c44d2b50597dd64ddfb %20de%20Orellana
cac30de06d80
rdf:type rdf:type
geoes:Polígono geoes:ontology/Embalse
(Polygon) (reservoir)
Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012 69
34
36. 28/11/12
Ejemplo de RDF
Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012 70
1. Introducción
2. Tipos de vocabularios
3. Proceso de Construcción
4. Ejemplos de Vocabularios
• Personas y Organizaciones: FOAF, vCard, ORG
• Documentos: DC, BIBO
• Geo: puntos, curvas y polígonos
• Bibliotecas:
• Estadísticas: Data Cube
• Descripcion de conjuntos de datos: VOID
5. Ejemplos de Redes de vocabularios en aplicaciones
de datos enlazados
6. Conclusiones
Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012 71
35
37. 28/11/12
Bibliotecas: FRBR
Obra 2
Specification
Works
Obra 1
Modelling Obra 3
RDF Generation
Expresión 2
Links Generation
Expresión1 Expressions
Publication
Exploitation
Manifestación1 Manifestations
Manifestación2
Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012 72
Ontología de la BNE: basada en los vocabularios de FRBR
Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012
36
38. 28/11/12
Marimba genera RDF
BNE
1. Introducción
2. Tipos de vocabularios
3. Proceso de Construcción
4. Ejemplos de Vocabularios
• Personas y Organizaciones: FOAF, vCard, ORG
• Documentos: DC, BIBO
• Geo: puntos, curvas y polígonos
• Bibliotecas:
• Estadísticas: Data Cube
• Descripcion de conjuntos de datos: VOID
5. Ejemplos de Redes de vocabularios en aplicaciones
de datos enlazados
6. Conclusiones
Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012 75
37
39. 28/11/12
Data cubes
• U n c u b o p u e d e s e r c o n s i d e r a d o u n a e x t e n s i ó n
multidimensional de tablas 2-D (igual que en geometría un cubo
es una extensión tridimensional de un cuadrado)
• El término hiper-cubo se utiliza, en ocasiones, especialmente para
los datos con más de tres dimensiones
• Cada dimensión representa algún atributo en la base de datos
(como las ventas, los beneficios, los gastos, etc.)
• Las celdas en el cubo de datos representan la medida de
interés. Por ejemplo, pueden contener un contador para el
número de veces que se produce una combinación de atributo
en la base de datos, o el valor mínimo, máximo, la suma o
media de algún atributo)
• Las consultas se realizan en el cubo para recuperar información
que sirva de apoyo a las decisiones
Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012 76
Data cubes
Cubo
Celdas
Dimensiones
Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012 78
38
40. 28/11/12
Example: Desempleo
Dimensión (Año)
Dimensión (CCAA)
Celdas (Datos de paro registrado)
Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012 79
RDF Data Cube: Vocabulario
Cubo
Dimensión
Celdas
(Datos)
Fenómeno
Observado
Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012 80
39
41. 28/11/12
Ejemplo: Data Cube y Desempleo
qb:DataSet
rdf:type
stats:unemployment
qb:dataSet qb:dataSet
stats:unemployment …… stats:unemployment/
/Cantabria_2004 Canarias_2008
rdf:type rdf:type
qb:Observation
Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012
81
1. Introducción
2. Tipos de vocabularios
3. Proceso de Construcción
4. Ejemplos de Vocabularios
• Personas y Organizaciones: FOAF, vCard, ORG
• Documentos: DC, BIBO
• Geo: puntos, curvas y polígonos
• Bibliotecas
• Estadísticas: Data Cube
• Otros Vocabularios: sensores, provenance, VOID,
DCAT, …
5. Ejemplos de Redes de vocabularios en aplicaciones
de datos enlazados
• Instituto Geográfico Nacional
Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012 82
40
42. 28/11/12
SSN Ontology with other Ontologies
Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012 83
Provenance
Del proceso
• OPM, Provernir, PM,
• PROV-O @W3C
John
creator
Del Recurso creaJonDate
File.txt
12-‐2-‐1900
• DC, Premis, SWANL
• EDM (including agregation) rights
GPL
used
Meta-provenance
Revision
• DC-PROV @ W3C (ongoing) Process
• OAI-ORE PROVENANCE
Model
(RDF(S))
generatedBy
Filev1.
txt
RDF
Store
Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012 84 1
41
43. 28/11/12
DCAT: Data Catalog Vocabulary
• DCAT es un vocabulario para facilitar la interoperabilidad de
catálogos de datos publicados en la web.
• DCAT facilita la tarea de descubrir catálogos de datos y el
consumo de metadatos procedentes de distintos catálogos.
• Los principales conceptos descritos en DCAT son:
• Catálogo
• Record de un catálogo
• Conjunto de datos
• Distribución
• Descarga
• Servicio web
• http://www.w3.org/TR/vocab-dcat/
Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012 85
DCAT: El vocabulario
Imagen tomada de http://www.w3.org/TR/vocab-dcat/
Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012 86
42
44. 28/11/12
¿Qué es voID?
• vocabulario en RDFS • Metadatos generales:
publicado por el W3C licencia, autor, temática,
número de tripletas...
• Métodos de acceso:
• Permite la descripción de dirección SPARQL endpoint,
un conjunto de datos ficheros descargables..
RDF • Metadatos de estructura:
recursos de ejemplo, patrón
de URIs, vocabularios
• Facilita el descubrimiento
utilizados..
y la utilización del dataset
• Linksets (conjuntos de datos
por parte de usuarios
a los que enlaza el dataset):
potenciales (e.g. describe la propiedad
agregadores, indexadores, utilizada (e.g. owl:sameAs,
desarrolladores de skos:closeMatch), la URI del
aplicaciones) dataset con el que se enlaza,
enlaces de ejemplo…
http://www.w3.org/TR/void/
Asunción Gómez Pérez
Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012 87
VOID
88
43
45. 28/11/12
BNE VOID
Asunción Gómez Pérez 89
adms: Asset Description Metadata Schema
• El vocabulario adms describe conceptos relacionados con la
interoperablidiad semántica de recursos.
• Incluye conceptos como “Repositorio de recursos
semanticos”, “Recurso semántico” y “Distribución de
recursos semánticos” que son especializaciones de conceptos
mas generales: Repositorio y Distribución.
• El vocabulario adms ha sido creado en el programa de
soluciones de interoperabilidad para las administraciones
públicas europeas (ISA: Interoperability solutions for European
public administrations) de la comisión europea.
• http://www.w3.org/ns/adms#
Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012 90
44
46. 28/11/12
adms: El vocabulario
Imagen tomada de http://www.w3.org/ns/adms
Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012 91
1. Introducción
2. Tipos de vocabularios
3. Proceso de Construcción
4. Ejemplos de Vocabularios
5. Ejemplos de Redes de vocabularios en
aplicaciones de datos enlazados
6. Conclusiones
Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012 92
45
47. 28/11/12
Ontologias de geolinkeddata
93 Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012
Acceso uniforme a BD
?
Ontología de fenómenos Lago
OMI
Lago
Redes de
Lago de Agua dulce
Ontologías
Lago de agua salada
SPARQL Endpoints
URI: http://geo.linkeddata.es/NGCE/resource/Laguna/Tae%C3%B1a%2C%20Laguna%20de
URI: http://geo.linkeddata.es/NGCE/resource/Laguna/Tollos%2C%20Laguna%20de%20los
[…]
NGCE BCN200 NOMGEO URI: http://geo.linkeddata.es/NOMGEO/resource/Laguna/Hilejas%2C%20Laguna%20de%20las
URI: http://geo.linkeddata.es/NOMGEO/resource/Laguna/Tejo%2C%20Laguna%20del
[…]
URI: http://geo.linkeddata.es/BCN200/resource/Laguna/Laguna%20de%20Paniagua
URI: http://geo.linkeddata.es/BCN200/resource/Laguna/Laguna%20Laguna%20
[…]
La respuesta final compuesta por 1.806 URI
(38 de NGCE, 1.416 de NOMGEO y 406 de BCN200).
Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012
46
48. 28/11/12
Ontología de fenónmenos cartográficos
02
0201 Curva de nivel
- Tipo
• NDepresión
• Glaciar
• Batimétormal
• rica
- Categoría
• Normal
• Maestra
• Auxiliar
- Origen
• Desconocido
• Restitución
• Digitalización
• MDT
http://mayor2.dia.fi.upm.es/oeg-upm/files/
phenomontology/Phenom4.0.1.owl
Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012
Ontología de Hidrología
Nivel superior
Nivel inferior
Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012
47
49. 28/11/12
Implementación
+ Pellet
1 4
2
5
3
Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012
Ontologias de Geolinkeddata
WGS84 Geo
Positioning: an RDF
vocabulary scv:Dimension
hydrographical scv:Item
phenomena (rivers, W3C 4 scv:Dataset
lakes, etc.) Vocabulary
O.
hasStatisticalData Statistics
hasLat/Long WGS84 hasLat/Long
SCOVO
on
hydrOntology hasLocation/isLocated FAO
Vocabulary for
O. instants, intervals,
FAO durations, etc.
Time
UNESCO Geopolitical
EGM / ERM 4 hasGeometry
hasGeometry
ontology
W3C Time
GeoNames
… GML
Names and Legend
international code
Ontology for OGC GML 4 systems for
territories and
Ontology
Geography Markup Specification groups
Language
Specification 4
Thesaurus
Classes 33 33
Object Properties 44 44 reused
Data Properties 318 318 Following the INSPIRE
(INfrastructure for SPatial InfoRmation in Europe) recommendation.
hydrOntology,SCOVO, FAO Geopolitcal, WGS84, GML, and Time
Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012
48
50. 28/11/12
Ontologías de datos metereológicos
Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012 99
1. Introducción
2. Tipos de vocabularios
3. Proceso de Construcción
4. Ejemplos de Vocabularios
5. Ejemplos de Redes de vocabularios en aplicaciones
de datos enlazados
6. Conclusiones
Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012 100
49
51. 28/11/12
Conclusiones
Las AA.PP. deben consensuar qué
vocabularios van a utilizar para
describir sus datos y facilitar la
interoperabilidad semántica
Los vocabularios deben ser
multilingües
Asunción Gómez Pérez Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012 101
50