SlideShare una empresa de Scribd logo
1 de 52
Descargar para leer sin conexión
INICIATIVA BARCELONA OPEN DATA
EL VALOR D’OBRIR LES DADES
Datos enlazados
curso 1.6
Docente:
Álvaro Sicilia @alvarosiciliago
OBJECTIVO DE LA SESIÓN
● Al final de la sesión seréis capaces de:
● Definir que son los datos enlazados y la web semántica
● Identificar datos enlazados y saber navegar por ellos
● Describir recursos en la web (RDF)
● Identificar tecnologías para enlazar datos
Facultar a los participantes para enlazar datos abiertos y su uso
Datos enlazados
ÍNDICE
1. Introducción a los datos enlazados
2. De datos abiertos a datos enlazados
3. Uso de vocabularios y DCAT
4. Enlazar datos abiertos
5. Describir recursos en la web
6. Como transformar datos abiertos a RDF
7. Tecnologías utilizadas en la web semántica
8. Consultar datos enlazados
¿Que son los datos
enlazados?
Preparad una definición de este
concepto
Actividad colectiva
Tiempo: 2 minutos
Actividad
* http://www.w3c.es/Divulgacion/GuiasBreves/LinkedData
** http://www.w3c.es/Divulgacion/GuiasBreves/WebSemantica
Los Datos Enlazados es la forma que tiene la Web
Semántica de vincular los distintos datos que están
distribuidos en la Web, de forma que se referencian de la
misma forma que lo hacen los enlaces de las páginas web*
La Web Semántica es una Web extendida, dotada de mayor
significado en la que cualquier usuario en Internet podrá
encontrar respuestas a sus preguntas de forma más rápida y
sencilla gracias a una información mejor definida**
INTRODUCCIÓN A LOS DATOS ENLAZADOS
INTRODUCCIÓN A LOS DATOS ENLAZADOS
INTRODUCCIÓN A LOS DATOS ENLAZADOS
IMDB Wikipedia
¿Lugar de nacimiento
de Harrison Ford?
¿Número de habitantes
de Chicago?
DE DATOS ABIERTOS A DATOS ENLAZADOS
¿Preguntas sobre una fuente de datos?
Actores
Ciudade
s
IMDB Wikipedia
¿Qué actores que han nacido en poblaciones de
más de 2 millones de habitantes?
DE DATOS ABIERTOS A DATOS ENLAZADOS
¿Preguntas complejas sobre múltiples
fuentes de datos?
Actores
Ciudade
s
IMDB Wikipedia
Usar la Web como una única gran base de datos global →
Movernos de una Web de documentos a una Web de Datos
DE DATOS ABIERTOS A DATOS ENLAZADOS
¿Preguntas complejas sobre múltiples
fuentes de datos?
DE DATOS ABIERTOS A DATOS ENLAZADOS
1. Usar URIs como nombres de las cosas
2. Usar HTTP URIs, para que cualquiera los pueda consultar
3. Cuando alguien consulta una URI, proporcionar
información útil en lenguajes estándar (RDF, SPARQL)
4. Incluir enlaces a otras URIs
* http://www.w3.org/DesignIssues/LinkedData.html
Los Cuatro principios de la Web de datos
enlazados (Tim Berners Lee, 2006)*
★ publicar los datos en la Web (en cualquier format) con una licencia abierta
★★ publicar los datos estructurados (ex: en Excel lugar de una imagen con datos)
★★★ publicar daots utilizando formatos no propietarios (ex:: CSV en lugar de Excel)
★★★★ utilitzar URIs para apuntar a cosas
★★★★
★
Enlazar datos con otros datos
DE DATOS ABIERTOS A DATOS ENLAZADOS
Las 5 estrellas de Tim Berners Lee
DE DATOS ABIERTOS A DATOS ENLAZADOS
Wikipedia
DE DATOS ABIERTOS A DATOS ENLAZADOS
Wikipedia
Navegar por portales
de datos abiertos y
enlazados → listar los
diferentes portales
Actividad individual
Tiempo: 15 minutos
Actividad
DE DATOS ABIERTOS A DATOS ENLAZADOS
¿Cómo publicar datos enlazados?
1.
Empezar
por un
plan
5.
Mantenerlo
2.
Seleccionar
los datos
4.
Publicació
n
3.
Creación
de un
dataset
Proceso de los
datos abiertos
DE DATOS ABIERTOS A DATOS ENLAZADOS
¿Cómo publicar datos enlazados?
Aplicar un formato
abierto
Capturar los
metadatos
Aplicar una licencia
abierta
Revisar el dataset
Actividad
¿Que es un
vocabulario?
Preparad una definición de este
concepto
Actividad colectiva
Tiempo: 2 minutos
USO DE VOCABULARIOS Y DCAT
¿Qué es un vocabulario?
Los vocabularios definen los conceptos y
relaciones utilizados para describir y representar
un área de interés.
Definition taken from: http://www.w3.org/standards/semanticweb/ontology
USO DE VOCABULARIOS Y DCAT
¿Qué es un vocabulario?
Los vocabularios definen los conceptos y
relaciones utilizados para describir y representar
un área de interés.
Definition taken from: http://www.w3.org/standards/semanticweb/ontology
USO DE VOCABULARIOS Y DCAT
¿Dónde está el vocabulario?
USO DE VOCABULARIOS Y DCAT
¿Dónde está el vocabulario?
City Creation date
Establishment
date
Long Lat Alt State
Actividad
¿Crear un vocabulario
para el dataset de
ejemplo?
Actividad en grupos
Tiempo: 5 minutos
USO DE VOCABULARIOS Y DCAT
¿Dónde está el vocabulario?
City Creation date
Establishment
date
Long Lat Alt State
State
City
USO DE VOCABULARIOS Y DCAT
¿Dónde está el vocabulario?
City Creation date
Establishment
date
Long Lat Alt State
State
City
RAE:
1. f. Conjunto de edificios y calles, regidos por u
n ayuntamiento, cuya población densa y
numerosa se dedica por lo común a
actividades no agrícolas.
RAE:
5. m. País soberano, reconocido como tal en el
orden internacional, asentado en un territorio
determinado y dotado de órganos de gobierno
propios..
Uso de vocabularios y DCAT
¿Dónde está el vocabulario?
City Creation date
Establishment
date
Long Lat Alt State
City
State
belongs to state
USO DE VOCABULARIOS Y DCAT
¿Dónde está el vocabulario?
City Creation date
Establishment
date
Long Lat Alt State
City
State
belongs to state
- Creation date
- Establishment date
USO DE VOCABULARIOS Y DCAT
¿Dónde está el vocabulario?
City Creation date
Establishment
date
Long Lat Alt State
City
State
belongs to state
- Creation date
- Establishment date Point
located at
- longitud
- latitud
- altitude
USO DE VOCABULARIOS Y DCAT
¿Dónde está el vocabulario?
City Creation date
Establishment
date
Long Lat Alt State
City
State
belongs to state
- Creation date
- Establishment date Point
located at
- longitud
- latitud
- altitude
• Un vocabulario puede representar muchos datasets
• Los vocabularios son utilizados para integrar o
armonizar datos de diferentes fuentes (CSV, bases
de datos, páginas web…)
USO DE VOCABULARIOS Y DCAT
Ventajas de utilizar vocabularios
Un vocabulario:
- Data contexto (para moverse de datos a información)
- Facilita reutilización de los datos
- Reduce ambigüedad
- Facilita la integración
- Facilita el mantenimiento
USO DE VOCABULARIOS Y DCAT
Data Catalog Vocabulary (DCAT)
DCAT es una especificación (vocabulario) para la
descripción de catálogos de datos en la red. La
especificación oficial ha sido elaborada por el W3C,
basada en algunos proyectos anteriores.
DCAT-AP (Application Profile) es una especificación
basada en DCAT para describir datasets del sector
público en Europa.
USO DE VOCABULARIOS Y DCAT
Data Catalog Vocabulary (DCAT)
https://www.w3.org/TR/vocab-dcat/
USO DE VOCABULARIOS Y DCAT
Vocabulary of Interlinked Datasets (VoiD)
http://richard.cyganiak.de/2011/gld/gld-dcat-and-void.pdf
ENLAZAR DATOS ABIERTOS
¿Cómo publicar datos enlazados?
Aplicar un formato
abierto
Capturar los
metadatos
Aplicar una licencia
abierta
Revisar el dataset
Identificar enlaces
con otros datasets
Enlazar las instancias de
los diferentes datasets
ENLAZAR DATOS ABIERTOS
Enlazando datos abiertos
Procedimiento
1. Identificar aquellos conceptos cuyos individuos puedan
ser enlazados dado su interés y potencial.
2. Identificar qué conjuntos de datos pueden contener
instancias de los conceptos inidentificados previamente.
3. Seleccionar las herramientas mas adecuadas para llevar
a cabo el enlazado (semi) automático.
4. Ejecutar estas herramientas sobre las fuentes de datos
para obtener los correspondientes enlaces.
ENLAZAR DATOS ABIERTOS
Enlazando datos abiertos
• Alineación por valores. Determinar cuando dos valores
de dos propiedades expresados de forma diferente son
equivalentes
• Alineación por instancias. Determinar si dos instancias
son equivalentes
• De acuerdo a las descripciones disponibles para
dichas instancias
• Basado en agregación de técnicas de alineación de
valores, transitividad de owl:sameAs, mapeos de
ontologías, etc.
• Alineación por dataset. Utilizando un conjunto de
potenciales mapeos de individuos entre dos datasets
Los conjuntos de datos son analizados como un todo
Actividad
¿Enlazar dos datasets
de ejemplo?
Actividad en grupos
Tiempo: 15 minutos
DESCRIBIR RECURSOS EN LA WEB
Describir la semántica de la información de manera
procesable por máquinas
Resource Description Framework (RDF)
Tripletas: Sujeto – Predicado – Objecto
Harrison Ford es un Actor
Harrison Ford mide 1,85
Harrison Ford nació en Chicago
Actividad
Escribir triples para el
dataset de ejemplo
Actividad en grupos
Tiempo: 15 minutos
DESCRIBIR RECURSOS EN LA WEB
Describir la semántica de la información de manera
procesable por máquinas
Resource Description Framework (RDF)
Tripletas: Sujeto – Predicado – Objecto
http://es.dbpedia.org/resource/Harrison_Ford
http://es.dbpedia.org/ontology/Actor
https://www.w3.org/1999/02/22-rdf-syntax-ns#typ
e
DESCRIBIR RECURSOS EN LA WEB
Describir la semántica de la información de manera
procesable por máquinas
Resource Description Framework (RDF)
Tripletas: Sujeto – Predicado – Objecto
http://es.dbpedia.org/resource/Harrison_Ford
http://es.dbpedia.org/resource/Chicago
http://es.dbpedia.org/ontology/birthPlac
e
DESCRIBIR RECURSOS EN LA WEB
Describir la semántica de la información de manera
procesable por máquinas
Resource Description Framework (RDF)
Tripletas: Sujeto – Predicado – Objecto
http://es.dbpedia.org/resource/Harrison_Ford
“1.85”
http://es.dbpedia.org/ontology/heig
ht
height
DESCRIBIR RECURSOS EN LA WEB
Describir la semántica de la información de manera
procesable por máquinas
Resource Description Framework (RDF)
Tripletas: Sujeto – Predicado – Objecto
…/Harrison_Ford
“1.85”
…/Chicago
…Actor
type
birthPlace
height
height
DESCRIBIR RECURSOS EN LA WEB
Describir la semántica de la información de manera
procesable por máquinas
Resource Description Framework (RDF)
Tripletas: Sujeto – Predicado – Objecto
…/Harrison_Ford
“1.85”
…/Chicago
…Actor
type
…/RobinWilliams
“1.7”
type
birthPlace
COMO TRANSFORMAR DATOS ABIERTOS A RDF
dataset
Rdf
dump Triple store
Consultas
Sparql
dataset SQL RDF
wrapper
Consultas
Sparql
• Rápido
• No
actualizado
• Materializado
• No es rápido
• Actualizado
• Bases de datos
relacionalesMapeos
R2RML
COMO TRANSFORMAR DATOS ABIERTOS A RDF
http://wifo5-03.informatik.uni-mannheim.de/pubby/
COMO TRANSFORMAR DATOS ABIERTOS A RDF
http://silkframework.org/
TECNOLOGÍAS UTILIZADAS EN LA WEB SEMÁNTICA
Triple stores:
- Virtuoso Universal Server virtuoso.openlinksw.com
- RDF4J www.rdf4j.org
Publicar datos
- Pubby wifo5-03.informatik.uni-mannheim.de/pubby
- Elda github.com/epimorphics/elda
Enlazar datos
- Silk silkframework.org
- Limes aksw.org/Projects/LIMES.html
W3C listado de recursos:
www.w3.org/wiki/TaskForces/CommunityProjects/Linkin
gOpenData/SemWebClients
CONSULTAR DATOS ENLAZADOS
Breve introducción a SPARQL
SELECT Distinct ?Concepto
WHERE {
?x a ?Concepto.
}
http://es.dbpedia.org/sparq
l
SELECT Distinct ?x
WHERE {
?x a <http://schema.org/Airport>.
}
Actividad
Consulta datos
enlazados
Actividad individual
Tiempo: 10 minutos
OBJECTIVO DE LA SESIÓN
● Ara sois capaces de:
● Definir que son los datos enlazados y la web semántica
● Identificar datos enlazados y saber navegar por ellos
● Describir recursos en la web (RDF)
● Identificar tecnologías para enlazar datos
Facultar a los participantes para enlazar datos abiertos y su uso
Datos enlazados
Tiempo para
preguntas

Más contenido relacionado

La actualidad más candente

Estrategias de apoyo a la investigación: Investigación
Estrategias de apoyo a la investigación: InvestigaciónEstrategias de apoyo a la investigación: Investigación
Estrategias de apoyo a la investigación: Investigación
Emilio Douglas
 
Perspectivas en el ámbito del patrimonio digital: nuevos retos de futuro (2005)
Perspectivas en el ámbito del patrimonio digital: nuevos retos de futuro (2005)Perspectivas en el ámbito del patrimonio digital: nuevos retos de futuro (2005)
Perspectivas en el ámbito del patrimonio digital: nuevos retos de futuro (2005)
Joseba Abaitua
 
Buscadores
BuscadoresBuscadores
Buscadores
jonnygb7
 
Navegación y búsqueda en el cyberespacio
Navegación y búsqueda en el cyberespacioNavegación y búsqueda en el cyberespacio
Navegación y búsqueda en el cyberespacio
anesantivale
 
Universidad minuto de dios
Universidad minuto de diosUniversidad minuto de dios
Universidad minuto de dios
zerrato
 
1.tabla evaluación de recursos web (1)
1.tabla evaluación de recursos web (1)1.tabla evaluación de recursos web (1)
1.tabla evaluación de recursos web (1)
lilianagarciaarana
 
la internet, web invisible, motores de busqueda y tipos de busqueda
la internet, web invisible, motores de busqueda y tipos de busquedala internet, web invisible, motores de busqueda y tipos de busqueda
la internet, web invisible, motores de busqueda y tipos de busqueda
Daniel Castañeda
 
Gaston Internet[1]
Gaston Internet[1]Gaston Internet[1]
Gaston Internet[1]
guest8e3f96
 

La actualidad más candente (18)

Estrategias de apoyo a la investigación: Investigación
Estrategias de apoyo a la investigación: InvestigaciónEstrategias de apoyo a la investigación: Investigación
Estrategias de apoyo a la investigación: Investigación
 
aporte de internet
aporte de internetaporte de internet
aporte de internet
 
Perspectivas en el ámbito del patrimonio digital: nuevos retos de futuro (2005)
Perspectivas en el ámbito del patrimonio digital: nuevos retos de futuro (2005)Perspectivas en el ámbito del patrimonio digital: nuevos retos de futuro (2005)
Perspectivas en el ámbito del patrimonio digital: nuevos retos de futuro (2005)
 
Tutorial Web Semantica Morelia
Tutorial Web Semantica MoreliaTutorial Web Semantica Morelia
Tutorial Web Semantica Morelia
 
Buscadores
BuscadoresBuscadores
Buscadores
 
Navegación y búsqueda en el cyberespacio
Navegación y búsqueda en el cyberespacioNavegación y búsqueda en el cyberespacio
Navegación y búsqueda en el cyberespacio
 
02.ana hernandez
02.ana hernandez02.ana hernandez
02.ana hernandez
 
Universidad minuto de dios
Universidad minuto de diosUniversidad minuto de dios
Universidad minuto de dios
 
Buscadores
BuscadoresBuscadores
Buscadores
 
1.tabla evaluación de recursos web
1.tabla evaluación de recursos web1.tabla evaluación de recursos web
1.tabla evaluación de recursos web
 
1.tabla evaluación de recursos web (1)
1.tabla evaluación de recursos web (1)1.tabla evaluación de recursos web (1)
1.tabla evaluación de recursos web (1)
 
Información de calidad para asignaciones de calidad
Información de calidad para asignaciones de calidadInformación de calidad para asignaciones de calidad
Información de calidad para asignaciones de calidad
 
la internet, web invisible, motores de busqueda y tipos de busqueda
la internet, web invisible, motores de busqueda y tipos de busquedala internet, web invisible, motores de busqueda y tipos de busqueda
la internet, web invisible, motores de busqueda y tipos de busqueda
 
Clase1
Clase1Clase1
Clase1
 
Búsqueda, gestión y evaluación de información en internet
Búsqueda, gestión y evaluación de información en internetBúsqueda, gestión y evaluación de información en internet
Búsqueda, gestión y evaluación de información en internet
 
Buscadores de internet
Buscadores de internetBuscadores de internet
Buscadores de internet
 
Internet[1]
Internet[1]Internet[1]
Internet[1]
 
Gaston Internet[1]
Gaston Internet[1]Gaston Internet[1]
Gaston Internet[1]
 

Similar a Curs 1.6. Datos enlazados (2h) OpenDataLab

Parte 2. web semantica eva mendez - argentina - 301009
Parte 2. web semantica   eva mendez - argentina - 301009Parte 2. web semantica   eva mendez - argentina - 301009
Parte 2. web semantica eva mendez - argentina - 301009
izrxrzi
 
Anotaciones semanticas recursos
Anotaciones semanticas recursosAnotaciones semanticas recursos
Anotaciones semanticas recursos
Martin Coronel
 
Sistemas de Recomendación de Información - Web Semáctica
Sistemas de Recomendación de Información - Web SemácticaSistemas de Recomendación de Información - Web Semáctica
Sistemas de Recomendación de Información - Web Semáctica
martinp
 
Web semántica y sus principales características
Web semántica y sus principales característicasWeb semántica y sus principales características
Web semántica y sus principales características
Pollis Morales
 

Similar a Curs 1.6. Datos enlazados (2h) OpenDataLab (20)

Curs 1.6 Datos Enlazados
Curs 1.6 Datos EnlazadosCurs 1.6 Datos Enlazados
Curs 1.6 Datos Enlazados
 
Curs 1.6. Dades Enllaçades (14/02)
Curs 1.6. Dades Enllaçades (14/02)Curs 1.6. Dades Enllaçades (14/02)
Curs 1.6. Dades Enllaçades (14/02)
 
The Web of Data
The Web of DataThe Web of Data
The Web of Data
 
Dbpedia
DbpediaDbpedia
Dbpedia
 
ROH: Proceso de Ingeniería Ontológica & Uso y Extensión de Vocabularios Estándar
ROH: Proceso de Ingeniería Ontológica & Uso y Extensión de Vocabularios EstándarROH: Proceso de Ingeniería Ontológica & Uso y Extensión de Vocabularios Estándar
ROH: Proceso de Ingeniería Ontológica & Uso y Extensión de Vocabularios Estándar
 
Parte 2. web semantica eva mendez - argentina - 301009
Parte 2. web semantica   eva mendez - argentina - 301009Parte 2. web semantica   eva mendez - argentina - 301009
Parte 2. web semantica eva mendez - argentina - 301009
 
Anotaciones semanticas recursos
Anotaciones semanticas recursosAnotaciones semanticas recursos
Anotaciones semanticas recursos
 
Herramientas para linked data
Herramientas para linked dataHerramientas para linked data
Herramientas para linked data
 
Web of data y los repositorios institucionales
Web of data y los repositorios institucionalesWeb of data y los repositorios institucionales
Web of data y los repositorios institucionales
 
Curso integración Web Semántica
Curso integración Web Semántica Curso integración Web Semántica
Curso integración Web Semántica
 
Sistemas de Recomendación de Información - Web Semáctica
Sistemas de Recomendación de Información - Web SemácticaSistemas de Recomendación de Información - Web Semáctica
Sistemas de Recomendación de Información - Web Semáctica
 
Ponencia Dspace Istec
Ponencia Dspace IstecPonencia Dspace Istec
Ponencia Dspace Istec
 
Agrovoc cswb training_1
Agrovoc cswb training_1Agrovoc cswb training_1
Agrovoc cswb training_1
 
Websemantica
WebsemanticaWebsemantica
Websemantica
 
Websemantica 1218250849453303 9
Websemantica 1218250849453303 9Websemantica 1218250849453303 9
Websemantica 1218250849453303 9
 
Web Semantica Y las Bases de Datos
Web Semantica Y las Bases de DatosWeb Semantica Y las Bases de Datos
Web Semantica Y las Bases de Datos
 
Websemantica2007 1197487057652938 3
Websemantica2007 1197487057652938 3Websemantica2007 1197487057652938 3
Websemantica2007 1197487057652938 3
 
Charla 9a Jornada de Usuarios Ex-Libris, 30 de septiembre de 2014
Charla 9a Jornada de Usuarios Ex-Libris, 30 de septiembre de 2014Charla 9a Jornada de Usuarios Ex-Libris, 30 de septiembre de 2014
Charla 9a Jornada de Usuarios Ex-Libris, 30 de septiembre de 2014
 
Introducción a la Web Semántica
Introducción a la Web SemánticaIntroducción a la Web Semántica
Introducción a la Web Semántica
 
Web semántica y sus principales características
Web semántica y sus principales característicasWeb semántica y sus principales características
Web semántica y sus principales características
 

Más de Iniciativa Barcelona Open Data

Más de Iniciativa Barcelona Open Data (20)

Presentació Programa Acadèmic FormacióxDonesxBarris
Presentació Programa Acadèmic FormacióxDonesxBarrisPresentació Programa Acadèmic FormacióxDonesxBarris
Presentació Programa Acadèmic FormacióxDonesxBarris
 
Programa Acadèmic FormacióxDonesxBarris
Programa Acadèmic FormacióxDonesxBarrisPrograma Acadèmic FormacióxDonesxBarris
Programa Acadèmic FormacióxDonesxBarris
 
Presentacions DATAVIZ La tecnòloga .pdf
Presentacions DATAVIZ La tecnòloga .pdfPresentacions DATAVIZ La tecnòloga .pdf
Presentacions DATAVIZ La tecnòloga .pdf
 
Datos x Comercio
Datos x ComercioDatos x Comercio
Datos x Comercio
 
OpenDataDay2022_IgnasiServià
OpenDataDay2022_IgnasiServiàOpenDataDay2022_IgnasiServià
OpenDataDay2022_IgnasiServià
 
OpenDataDay2022_SusanaGil
OpenDataDay2022_SusanaGilOpenDataDay2022_SusanaGil
OpenDataDay2022_SusanaGil
 
OpenDataDay2022_KarmaPeiro
OpenDataDay2022_KarmaPeiroOpenDataDay2022_KarmaPeiro
OpenDataDay2022_KarmaPeiro
 
OpenDataDay2022_OriolRoselló
OpenDataDay2022_OriolRosellóOpenDataDay2022_OriolRoselló
OpenDataDay2022_OriolRoselló
 
OpenDataDay2022_PepBudi
OpenDataDay2022_PepBudiOpenDataDay2022_PepBudi
OpenDataDay2022_PepBudi
 
OpenDataDay2022_XescaSerra
OpenDataDay2022_XescaSerraOpenDataDay2022_XescaSerra
OpenDataDay2022_XescaSerra
 
Presentació projecte Dades x Comerç
Presentació projecte Dades x ComerçPresentació projecte Dades x Comerç
Presentació projecte Dades x Comerç
 
Roberto Fraile - Proyecto LORD
Roberto Fraile - Proyecto LORDRoberto Fraile - Proyecto LORD
Roberto Fraile - Proyecto LORD
 
Maria Quiles - Inteligencia Artificial Industrial
Maria Quiles - Inteligencia Artificial IndustrialMaria Quiles - Inteligencia Artificial Industrial
Maria Quiles - Inteligencia Artificial Industrial
 
Pol Colomer - Caso de uso Reby
Pol Colomer - Caso de uso RebyPol Colomer - Caso de uso Reby
Pol Colomer - Caso de uso Reby
 
Juantomás - Unir PDP en Inteligencia Artificial 2020
Juantomás - Unir PDP en Inteligencia Artificial 2020Juantomás - Unir PDP en Inteligencia Artificial 2020
Juantomás - Unir PDP en Inteligencia Artificial 2020
 
Lourdes m iguel_workshop final de temporada open_datalab tarragona 20200702_sc
Lourdes m iguel_workshop final de temporada open_datalab tarragona 20200702_scLourdes m iguel_workshop final de temporada open_datalab tarragona 20200702_sc
Lourdes m iguel_workshop final de temporada open_datalab tarragona 20200702_sc
 
Isadora Christel Jiménez i el Valor de les Dades Obertes per als projectes so...
Isadora Christel Jiménez i el Valor de les Dades Obertes per als projectes so...Isadora Christel Jiménez i el Valor de les Dades Obertes per als projectes so...
Isadora Christel Jiménez i el Valor de les Dades Obertes per als projectes so...
 
Workshop Aplicar reutilizacion datos abiertos ambito Social. Alejandro Llorente
Workshop Aplicar reutilizacion datos abiertos ambito Social. Alejandro LlorenteWorkshop Aplicar reutilizacion datos abiertos ambito Social. Alejandro Llorente
Workshop Aplicar reutilizacion datos abiertos ambito Social. Alejandro Llorente
 
Les dades obertes per innovar en la Sociologia i en l'anàlisi de la realitat'
Les dades obertes per innovar en la Sociologia i en l'anàlisi de la realitat'Les dades obertes per innovar en la Sociologia i en l'anàlisi de la realitat'
Les dades obertes per innovar en la Sociologia i en l'anàlisi de la realitat'
 
Jornada Divulgativa per Empreses: Les dades obertes, un valor pel meu projecte
Jornada Divulgativa per Empreses: Les dades obertes, un valor pel meu projecteJornada Divulgativa per Empreses: Les dades obertes, un valor pel meu projecte
Jornada Divulgativa per Empreses: Les dades obertes, un valor pel meu projecte
 

Último

Anclaje Grupo 5..pptx de todo tipo de anclaje
Anclaje Grupo 5..pptx de todo tipo de anclajeAnclaje Grupo 5..pptx de todo tipo de anclaje
Anclaje Grupo 5..pptx de todo tipo de anclaje
klebersky23
 
METODOLOGÍA 5S - PRESENTACION DE INICIO DEL PROYECTO
METODOLOGÍA 5S - PRESENTACION DE INICIO DEL PROYECTOMETODOLOGÍA 5S - PRESENTACION DE INICIO DEL PROYECTO
METODOLOGÍA 5S - PRESENTACION DE INICIO DEL PROYECTO
JoselynGoeTmara
 
2. POLITICAS Y LEGISLACION EDUCATIVA.pptx
2. POLITICAS Y LEGISLACION EDUCATIVA.pptx2. POLITICAS Y LEGISLACION EDUCATIVA.pptx
2. POLITICAS Y LEGISLACION EDUCATIVA.pptx
camilasto28
 
Proyectos de investigacion en ciencias sociales 6to - maipue (2).pdf
Proyectos de investigacion en ciencias sociales 6to - maipue (2).pdfProyectos de investigacion en ciencias sociales 6to - maipue (2).pdf
Proyectos de investigacion en ciencias sociales 6to - maipue (2).pdf
nicolas24233
 
Reporte de incidencia delictiva Silao marzo 2024
Reporte de incidencia delictiva Silao marzo 2024Reporte de incidencia delictiva Silao marzo 2024
Reporte de incidencia delictiva Silao marzo 2024
OBSERVATORIOREGIONAL
 
Reporte de incidencia delictiva de Romita marzo 2024
Reporte de incidencia delictiva de Romita marzo 2024Reporte de incidencia delictiva de Romita marzo 2024
Reporte de incidencia delictiva de Romita marzo 2024
OBSERVATORIOREGIONAL
 
La Inteligencia Artificial -AnaliticayDatos-BeatrizGarcia-Abril2024-D.pdf
La Inteligencia Artificial -AnaliticayDatos-BeatrizGarcia-Abril2024-D.pdfLa Inteligencia Artificial -AnaliticayDatos-BeatrizGarcia-Abril2024-D.pdf
La Inteligencia Artificial -AnaliticayDatos-BeatrizGarcia-Abril2024-D.pdf
analiticaydatos
 
REPORTE DE HOMICIDIO DOLOSO IRAPUATO ABRIL 2024
REPORTE DE HOMICIDIO DOLOSO IRAPUATO ABRIL 2024REPORTE DE HOMICIDIO DOLOSO IRAPUATO ABRIL 2024
REPORTE DE HOMICIDIO DOLOSO IRAPUATO ABRIL 2024
IrapuatoCmovamos
 

Último (17)

Anclaje Grupo 5..pptx de todo tipo de anclaje
Anclaje Grupo 5..pptx de todo tipo de anclajeAnclaje Grupo 5..pptx de todo tipo de anclaje
Anclaje Grupo 5..pptx de todo tipo de anclaje
 
Pineda - Metodologia de la investigacion manual para el desarrollo de persona...
Pineda - Metodologia de la investigacion manual para el desarrollo de persona...Pineda - Metodologia de la investigacion manual para el desarrollo de persona...
Pineda - Metodologia de la investigacion manual para el desarrollo de persona...
 
METODOLOGÍA 5S - PRESENTACION DE INICIO DEL PROYECTO
METODOLOGÍA 5S - PRESENTACION DE INICIO DEL PROYECTOMETODOLOGÍA 5S - PRESENTACION DE INICIO DEL PROYECTO
METODOLOGÍA 5S - PRESENTACION DE INICIO DEL PROYECTO
 
PRESENTACION SOBRE LA HOJA DE CALCULO ⠀⠀
PRESENTACION SOBRE LA HOJA DE CALCULO ⠀⠀PRESENTACION SOBRE LA HOJA DE CALCULO ⠀⠀
PRESENTACION SOBRE LA HOJA DE CALCULO ⠀⠀
 
5558423-peru-evolucion-de-la-pobreza-monetaria-2014-2023(2).pdf
5558423-peru-evolucion-de-la-pobreza-monetaria-2014-2023(2).pdf5558423-peru-evolucion-de-la-pobreza-monetaria-2014-2023(2).pdf
5558423-peru-evolucion-de-la-pobreza-monetaria-2014-2023(2).pdf
 
2. POLITICAS Y LEGISLACION EDUCATIVA.pptx
2. POLITICAS Y LEGISLACION EDUCATIVA.pptx2. POLITICAS Y LEGISLACION EDUCATIVA.pptx
2. POLITICAS Y LEGISLACION EDUCATIVA.pptx
 
Proyectos de investigacion en ciencias sociales 6to - maipue (2).pdf
Proyectos de investigacion en ciencias sociales 6to - maipue (2).pdfProyectos de investigacion en ciencias sociales 6to - maipue (2).pdf
Proyectos de investigacion en ciencias sociales 6to - maipue (2).pdf
 
Problemas de programación lineal entera.pptx
Problemas de programación lineal entera.pptxProblemas de programación lineal entera.pptx
Problemas de programación lineal entera.pptx
 
Reporte de incidencia delictiva Silao marzo 2024
Reporte de incidencia delictiva Silao marzo 2024Reporte de incidencia delictiva Silao marzo 2024
Reporte de incidencia delictiva Silao marzo 2024
 
Mapa concepto sobre la contabilidad de costos
Mapa concepto sobre la contabilidad de costosMapa concepto sobre la contabilidad de costos
Mapa concepto sobre la contabilidad de costos
 
REGISTRO CONTABLE DE CONTABILIDAD 2022..
REGISTRO CONTABLE DE CONTABILIDAD 2022..REGISTRO CONTABLE DE CONTABILIDAD 2022..
REGISTRO CONTABLE DE CONTABILIDAD 2022..
 
Crecimiento del PIB real revisado sexenios neoliberales y nueva era del sober...
Crecimiento del PIB real revisado sexenios neoliberales y nueva era del sober...Crecimiento del PIB real revisado sexenios neoliberales y nueva era del sober...
Crecimiento del PIB real revisado sexenios neoliberales y nueva era del sober...
 
Reporte de incidencia delictiva de Romita marzo 2024
Reporte de incidencia delictiva de Romita marzo 2024Reporte de incidencia delictiva de Romita marzo 2024
Reporte de incidencia delictiva de Romita marzo 2024
 
Asignatura-Optativa-Sociologia-CS-3BGU.pdf
Asignatura-Optativa-Sociologia-CS-3BGU.pdfAsignatura-Optativa-Sociologia-CS-3BGU.pdf
Asignatura-Optativa-Sociologia-CS-3BGU.pdf
 
La Inteligencia Artificial -AnaliticayDatos-BeatrizGarcia-Abril2024-D.pdf
La Inteligencia Artificial -AnaliticayDatos-BeatrizGarcia-Abril2024-D.pdfLa Inteligencia Artificial -AnaliticayDatos-BeatrizGarcia-Abril2024-D.pdf
La Inteligencia Artificial -AnaliticayDatos-BeatrizGarcia-Abril2024-D.pdf
 
REPORTE DE HOMICIDIO DOLOSO IRAPUATO ABRIL 2024
REPORTE DE HOMICIDIO DOLOSO IRAPUATO ABRIL 2024REPORTE DE HOMICIDIO DOLOSO IRAPUATO ABRIL 2024
REPORTE DE HOMICIDIO DOLOSO IRAPUATO ABRIL 2024
 
4° UNIDAD DE APRENDIZAJE 2 MAYO 2024.docx
4°  UNIDAD DE APRENDIZAJE 2 MAYO  2024.docx4°  UNIDAD DE APRENDIZAJE 2 MAYO  2024.docx
4° UNIDAD DE APRENDIZAJE 2 MAYO 2024.docx
 

Curs 1.6. Datos enlazados (2h) OpenDataLab

  • 1. INICIATIVA BARCELONA OPEN DATA EL VALOR D’OBRIR LES DADES Datos enlazados curso 1.6 Docente: Álvaro Sicilia @alvarosiciliago
  • 2. OBJECTIVO DE LA SESIÓN ● Al final de la sesión seréis capaces de: ● Definir que son los datos enlazados y la web semántica ● Identificar datos enlazados y saber navegar por ellos ● Describir recursos en la web (RDF) ● Identificar tecnologías para enlazar datos Facultar a los participantes para enlazar datos abiertos y su uso Datos enlazados
  • 3. ÍNDICE 1. Introducción a los datos enlazados 2. De datos abiertos a datos enlazados 3. Uso de vocabularios y DCAT 4. Enlazar datos abiertos 5. Describir recursos en la web 6. Como transformar datos abiertos a RDF 7. Tecnologías utilizadas en la web semántica 8. Consultar datos enlazados
  • 4. ¿Que son los datos enlazados? Preparad una definición de este concepto Actividad colectiva Tiempo: 2 minutos Actividad
  • 5. * http://www.w3c.es/Divulgacion/GuiasBreves/LinkedData ** http://www.w3c.es/Divulgacion/GuiasBreves/WebSemantica Los Datos Enlazados es la forma que tiene la Web Semántica de vincular los distintos datos que están distribuidos en la Web, de forma que se referencian de la misma forma que lo hacen los enlaces de las páginas web* La Web Semántica es una Web extendida, dotada de mayor significado en la que cualquier usuario en Internet podrá encontrar respuestas a sus preguntas de forma más rápida y sencilla gracias a una información mejor definida** INTRODUCCIÓN A LOS DATOS ENLAZADOS
  • 6. INTRODUCCIÓN A LOS DATOS ENLAZADOS
  • 7. INTRODUCCIÓN A LOS DATOS ENLAZADOS
  • 8. IMDB Wikipedia ¿Lugar de nacimiento de Harrison Ford? ¿Número de habitantes de Chicago? DE DATOS ABIERTOS A DATOS ENLAZADOS ¿Preguntas sobre una fuente de datos? Actores Ciudade s
  • 9. IMDB Wikipedia ¿Qué actores que han nacido en poblaciones de más de 2 millones de habitantes? DE DATOS ABIERTOS A DATOS ENLAZADOS ¿Preguntas complejas sobre múltiples fuentes de datos? Actores Ciudade s
  • 10. IMDB Wikipedia Usar la Web como una única gran base de datos global → Movernos de una Web de documentos a una Web de Datos DE DATOS ABIERTOS A DATOS ENLAZADOS ¿Preguntas complejas sobre múltiples fuentes de datos?
  • 11. DE DATOS ABIERTOS A DATOS ENLAZADOS 1. Usar URIs como nombres de las cosas 2. Usar HTTP URIs, para que cualquiera los pueda consultar 3. Cuando alguien consulta una URI, proporcionar información útil en lenguajes estándar (RDF, SPARQL) 4. Incluir enlaces a otras URIs * http://www.w3.org/DesignIssues/LinkedData.html Los Cuatro principios de la Web de datos enlazados (Tim Berners Lee, 2006)*
  • 12. ★ publicar los datos en la Web (en cualquier format) con una licencia abierta ★★ publicar los datos estructurados (ex: en Excel lugar de una imagen con datos) ★★★ publicar daots utilizando formatos no propietarios (ex:: CSV en lugar de Excel) ★★★★ utilitzar URIs para apuntar a cosas ★★★★ ★ Enlazar datos con otros datos DE DATOS ABIERTOS A DATOS ENLAZADOS Las 5 estrellas de Tim Berners Lee
  • 13. DE DATOS ABIERTOS A DATOS ENLAZADOS Wikipedia
  • 14. DE DATOS ABIERTOS A DATOS ENLAZADOS Wikipedia
  • 15. Navegar por portales de datos abiertos y enlazados → listar los diferentes portales Actividad individual Tiempo: 15 minutos Actividad
  • 16. DE DATOS ABIERTOS A DATOS ENLAZADOS ¿Cómo publicar datos enlazados? 1. Empezar por un plan 5. Mantenerlo 2. Seleccionar los datos 4. Publicació n 3. Creación de un dataset Proceso de los datos abiertos
  • 17. DE DATOS ABIERTOS A DATOS ENLAZADOS ¿Cómo publicar datos enlazados? Aplicar un formato abierto Capturar los metadatos Aplicar una licencia abierta Revisar el dataset
  • 18. Actividad ¿Que es un vocabulario? Preparad una definición de este concepto Actividad colectiva Tiempo: 2 minutos
  • 19. USO DE VOCABULARIOS Y DCAT ¿Qué es un vocabulario? Los vocabularios definen los conceptos y relaciones utilizados para describir y representar un área de interés. Definition taken from: http://www.w3.org/standards/semanticweb/ontology
  • 20. USO DE VOCABULARIOS Y DCAT ¿Qué es un vocabulario? Los vocabularios definen los conceptos y relaciones utilizados para describir y representar un área de interés. Definition taken from: http://www.w3.org/standards/semanticweb/ontology
  • 21. USO DE VOCABULARIOS Y DCAT ¿Dónde está el vocabulario?
  • 22. USO DE VOCABULARIOS Y DCAT ¿Dónde está el vocabulario? City Creation date Establishment date Long Lat Alt State
  • 23. Actividad ¿Crear un vocabulario para el dataset de ejemplo? Actividad en grupos Tiempo: 5 minutos
  • 24. USO DE VOCABULARIOS Y DCAT ¿Dónde está el vocabulario? City Creation date Establishment date Long Lat Alt State State City
  • 25. USO DE VOCABULARIOS Y DCAT ¿Dónde está el vocabulario? City Creation date Establishment date Long Lat Alt State State City RAE: 1. f. Conjunto de edificios y calles, regidos por u n ayuntamiento, cuya población densa y numerosa se dedica por lo común a actividades no agrícolas. RAE: 5. m. País soberano, reconocido como tal en el orden internacional, asentado en un territorio determinado y dotado de órganos de gobierno propios..
  • 26. Uso de vocabularios y DCAT ¿Dónde está el vocabulario? City Creation date Establishment date Long Lat Alt State City State belongs to state
  • 27. USO DE VOCABULARIOS Y DCAT ¿Dónde está el vocabulario? City Creation date Establishment date Long Lat Alt State City State belongs to state - Creation date - Establishment date
  • 28. USO DE VOCABULARIOS Y DCAT ¿Dónde está el vocabulario? City Creation date Establishment date Long Lat Alt State City State belongs to state - Creation date - Establishment date Point located at - longitud - latitud - altitude
  • 29. USO DE VOCABULARIOS Y DCAT ¿Dónde está el vocabulario? City Creation date Establishment date Long Lat Alt State City State belongs to state - Creation date - Establishment date Point located at - longitud - latitud - altitude • Un vocabulario puede representar muchos datasets • Los vocabularios son utilizados para integrar o armonizar datos de diferentes fuentes (CSV, bases de datos, páginas web…)
  • 30. USO DE VOCABULARIOS Y DCAT Ventajas de utilizar vocabularios Un vocabulario: - Data contexto (para moverse de datos a información) - Facilita reutilización de los datos - Reduce ambigüedad - Facilita la integración - Facilita el mantenimiento
  • 31. USO DE VOCABULARIOS Y DCAT Data Catalog Vocabulary (DCAT) DCAT es una especificación (vocabulario) para la descripción de catálogos de datos en la red. La especificación oficial ha sido elaborada por el W3C, basada en algunos proyectos anteriores. DCAT-AP (Application Profile) es una especificación basada en DCAT para describir datasets del sector público en Europa.
  • 32. USO DE VOCABULARIOS Y DCAT Data Catalog Vocabulary (DCAT) https://www.w3.org/TR/vocab-dcat/
  • 33. USO DE VOCABULARIOS Y DCAT Vocabulary of Interlinked Datasets (VoiD) http://richard.cyganiak.de/2011/gld/gld-dcat-and-void.pdf
  • 34. ENLAZAR DATOS ABIERTOS ¿Cómo publicar datos enlazados? Aplicar un formato abierto Capturar los metadatos Aplicar una licencia abierta Revisar el dataset Identificar enlaces con otros datasets Enlazar las instancias de los diferentes datasets
  • 35. ENLAZAR DATOS ABIERTOS Enlazando datos abiertos Procedimiento 1. Identificar aquellos conceptos cuyos individuos puedan ser enlazados dado su interés y potencial. 2. Identificar qué conjuntos de datos pueden contener instancias de los conceptos inidentificados previamente. 3. Seleccionar las herramientas mas adecuadas para llevar a cabo el enlazado (semi) automático. 4. Ejecutar estas herramientas sobre las fuentes de datos para obtener los correspondientes enlaces.
  • 36. ENLAZAR DATOS ABIERTOS Enlazando datos abiertos • Alineación por valores. Determinar cuando dos valores de dos propiedades expresados de forma diferente son equivalentes • Alineación por instancias. Determinar si dos instancias son equivalentes • De acuerdo a las descripciones disponibles para dichas instancias • Basado en agregación de técnicas de alineación de valores, transitividad de owl:sameAs, mapeos de ontologías, etc. • Alineación por dataset. Utilizando un conjunto de potenciales mapeos de individuos entre dos datasets Los conjuntos de datos son analizados como un todo
  • 37. Actividad ¿Enlazar dos datasets de ejemplo? Actividad en grupos Tiempo: 15 minutos
  • 38. DESCRIBIR RECURSOS EN LA WEB Describir la semántica de la información de manera procesable por máquinas Resource Description Framework (RDF) Tripletas: Sujeto – Predicado – Objecto Harrison Ford es un Actor Harrison Ford mide 1,85 Harrison Ford nació en Chicago
  • 39. Actividad Escribir triples para el dataset de ejemplo Actividad en grupos Tiempo: 15 minutos
  • 40. DESCRIBIR RECURSOS EN LA WEB Describir la semántica de la información de manera procesable por máquinas Resource Description Framework (RDF) Tripletas: Sujeto – Predicado – Objecto http://es.dbpedia.org/resource/Harrison_Ford http://es.dbpedia.org/ontology/Actor https://www.w3.org/1999/02/22-rdf-syntax-ns#typ e
  • 41. DESCRIBIR RECURSOS EN LA WEB Describir la semántica de la información de manera procesable por máquinas Resource Description Framework (RDF) Tripletas: Sujeto – Predicado – Objecto http://es.dbpedia.org/resource/Harrison_Ford http://es.dbpedia.org/resource/Chicago http://es.dbpedia.org/ontology/birthPlac e
  • 42. DESCRIBIR RECURSOS EN LA WEB Describir la semántica de la información de manera procesable por máquinas Resource Description Framework (RDF) Tripletas: Sujeto – Predicado – Objecto http://es.dbpedia.org/resource/Harrison_Ford “1.85” http://es.dbpedia.org/ontology/heig ht
  • 43. height DESCRIBIR RECURSOS EN LA WEB Describir la semántica de la información de manera procesable por máquinas Resource Description Framework (RDF) Tripletas: Sujeto – Predicado – Objecto …/Harrison_Ford “1.85” …/Chicago …Actor type birthPlace
  • 44. height height DESCRIBIR RECURSOS EN LA WEB Describir la semántica de la información de manera procesable por máquinas Resource Description Framework (RDF) Tripletas: Sujeto – Predicado – Objecto …/Harrison_Ford “1.85” …/Chicago …Actor type …/RobinWilliams “1.7” type birthPlace
  • 45. COMO TRANSFORMAR DATOS ABIERTOS A RDF dataset Rdf dump Triple store Consultas Sparql dataset SQL RDF wrapper Consultas Sparql • Rápido • No actualizado • Materializado • No es rápido • Actualizado • Bases de datos relacionalesMapeos R2RML
  • 46. COMO TRANSFORMAR DATOS ABIERTOS A RDF http://wifo5-03.informatik.uni-mannheim.de/pubby/
  • 47. COMO TRANSFORMAR DATOS ABIERTOS A RDF http://silkframework.org/
  • 48. TECNOLOGÍAS UTILIZADAS EN LA WEB SEMÁNTICA Triple stores: - Virtuoso Universal Server virtuoso.openlinksw.com - RDF4J www.rdf4j.org Publicar datos - Pubby wifo5-03.informatik.uni-mannheim.de/pubby - Elda github.com/epimorphics/elda Enlazar datos - Silk silkframework.org - Limes aksw.org/Projects/LIMES.html W3C listado de recursos: www.w3.org/wiki/TaskForces/CommunityProjects/Linkin gOpenData/SemWebClients
  • 49. CONSULTAR DATOS ENLAZADOS Breve introducción a SPARQL SELECT Distinct ?Concepto WHERE { ?x a ?Concepto. } http://es.dbpedia.org/sparq l SELECT Distinct ?x WHERE { ?x a <http://schema.org/Airport>. }
  • 51. OBJECTIVO DE LA SESIÓN ● Ara sois capaces de: ● Definir que son los datos enlazados y la web semántica ● Identificar datos enlazados y saber navegar por ellos ● Describir recursos en la web (RDF) ● Identificar tecnologías para enlazar datos Facultar a los participantes para enlazar datos abiertos y su uso Datos enlazados