Este documento presenta una introducción a la Web Semántica. Explica las limitaciones de la Web actual y conceptos fundamentales como ontologías, RDF y SPARQL. También cubre temas como datos enlazados, principios para publicar datos enlazados y la nube de datos abiertos enlazados. El objetivo final es extender la Web actual permitiendo que la información tenga un significado definido y pueda ser procesada y comprendida por máquinas.
1. Introducci´on
Tecnolog´ıas de la web sem´antica
Datos enlazados
Transformaci´on de BDR a grafos RDF
Problemas abiertos de investigaci´on
Conclusiones
Introducci´on a la Web Sem´antica
Yusniel Hidalgo Delgado
yhdelgado@uci.cu
Junio 2014
Yusniel Hidalgo Delgado yhdelgado@uci.cu Introducci´on a la Web Sem´antica
2. Introducci´on
Tecnolog´ıas de la web sem´antica
Datos enlazados
Transformaci´on de BDR a grafos RDF
Problemas abiertos de investigaci´on
Conclusiones
Sumario
1 Introducci´on
2 Tecnolog´ıas de la web sem´antica
3 Datos enlazados
4 Transformaci´on de BDR a grafos RDF
5 Problemas abiertos de investigaci´on
6 Conclusiones
Yusniel Hidalgo Delgado yhdelgado@uci.cu Introducci´on a la Web Sem´antica
3. Introducci´on
Tecnolog´ıas de la web sem´antica
Datos enlazados
Transformaci´on de BDR a grafos RDF
Problemas abiertos de investigaci´on
Conclusiones
Bibliograf´ıa
1 Linking Government Data. edited by D. WOOD. Edition
ed.: Springer New York Dordrecht Heidelberg London, 2011.
ISBN 978-1-4614-1767-5
2 HEATH, T. AND C. BIZER. Linked Data: Evolving the
Web into a Global Data Space. edited by J. HENDLER
AND F.V. HARMELEN. Edition ed.: Morgan & Claypool,
2011. ISBN 9781608454310
3 Handbook of Semantic Web Technologies. edited by J.
DOMINGUE, D. FENSEL AND J.A. HENDLER. Edition ed.
New York: Springer-Verlag Berlin Heidelberg, 2011. ISBN
978-3-540-92913-0
Yusniel Hidalgo Delgado yhdelgado@uci.cu Introducci´on a la Web Sem´antica
4. Introducci´on
Tecnolog´ıas de la web sem´antica
Datos enlazados
Transformaci´on de BDR a grafos RDF
Problemas abiertos de investigaci´on
Conclusiones
Limitaciones de la web actual
Conceptos fundamentales
Formato
1 La mayor´ıa de los contenidos Web actuales poseen alg´un
grado de estructuraci´on (PDF, HTML, XML, TXT)
2 Los contenidos est´an dise˜nados para ser le´ıdos por humanos
no por las computadoras
3 Falta de capacidad de las representaciones en que se basa la
web actual para expresar significados
Yusniel Hidalgo Delgado yhdelgado@uci.cu Introducci´on a la Web Sem´antica
5. Introducci´on
Tecnolog´ıas de la web sem´antica
Datos enlazados
Transformaci´on de BDR a grafos RDF
Problemas abiertos de investigaci´on
Conclusiones
Limitaciones de la web actual
Conceptos fundamentales
Formato
1 La mayor´ıa de los contenidos Web actuales poseen alg´un
grado de estructuraci´on (PDF, HTML, XML, TXT)
2 Los contenidos est´an dise˜nados para ser le´ıdos por humanos
no por las computadoras
3 Falta de capacidad de las representaciones en que se basa la
web actual para expresar significados
Yusniel Hidalgo Delgado yhdelgado@uci.cu Introducci´on a la Web Sem´antica
6. Introducci´on
Tecnolog´ıas de la web sem´antica
Datos enlazados
Transformaci´on de BDR a grafos RDF
Problemas abiertos de investigaci´on
Conclusiones
Limitaciones de la web actual
Conceptos fundamentales
Formato
1 La mayor´ıa de los contenidos Web actuales poseen alg´un
grado de estructuraci´on (PDF, HTML, XML, TXT)
2 Los contenidos est´an dise˜nados para ser le´ıdos por humanos
no por las computadoras
3 Falta de capacidad de las representaciones en que se basa la
web actual para expresar significados
Yusniel Hidalgo Delgado yhdelgado@uci.cu Introducci´on a la Web Sem´antica
7. Introducci´on
Tecnolog´ıas de la web sem´antica
Datos enlazados
Transformaci´on de BDR a grafos RDF
Problemas abiertos de investigaci´on
Conclusiones
Limitaciones de la web actual
Conceptos fundamentales
Formato
Yusniel Hidalgo Delgado yhdelgado@uci.cu Introducci´on a la Web Sem´antica
8. Introducci´on
Tecnolog´ıas de la web sem´antica
Datos enlazados
Transformaci´on de BDR a grafos RDF
Problemas abiertos de investigaci´on
Conclusiones
Limitaciones de la web actual
Conceptos fundamentales
Integraci´on
1 Los datos estructurados no son publicados en un formato
´unico procesable por las computadoras, lo que dificulta su
extracci´on antes de ser usados
2 Los datos se encuentran dispersos, sin relaci´on expl´ıcita entre
ellos, imposibilitando su descubrimiento y utilizaci´on por
sistemas inform´aticos
3 Resulta imposible razonar sobre los datos, en aras de inferir
conocimiento nuevo a partir del existente
Yusniel Hidalgo Delgado yhdelgado@uci.cu Introducci´on a la Web Sem´antica
9. Introducci´on
Tecnolog´ıas de la web sem´antica
Datos enlazados
Transformaci´on de BDR a grafos RDF
Problemas abiertos de investigaci´on
Conclusiones
Limitaciones de la web actual
Conceptos fundamentales
Integraci´on
1 Los datos estructurados no son publicados en un formato
´unico procesable por las computadoras, lo que dificulta su
extracci´on antes de ser usados
2 Los datos se encuentran dispersos, sin relaci´on expl´ıcita entre
ellos, imposibilitando su descubrimiento y utilizaci´on por
sistemas inform´aticos
3 Resulta imposible razonar sobre los datos, en aras de inferir
conocimiento nuevo a partir del existente
Yusniel Hidalgo Delgado yhdelgado@uci.cu Introducci´on a la Web Sem´antica
10. Introducci´on
Tecnolog´ıas de la web sem´antica
Datos enlazados
Transformaci´on de BDR a grafos RDF
Problemas abiertos de investigaci´on
Conclusiones
Limitaciones de la web actual
Conceptos fundamentales
Integraci´on
1 Los datos estructurados no son publicados en un formato
´unico procesable por las computadoras, lo que dificulta su
extracci´on antes de ser usados
2 Los datos se encuentran dispersos, sin relaci´on expl´ıcita entre
ellos, imposibilitando su descubrimiento y utilizaci´on por
sistemas inform´aticos
3 Resulta imposible razonar sobre los datos, en aras de inferir
conocimiento nuevo a partir del existente
Yusniel Hidalgo Delgado yhdelgado@uci.cu Introducci´on a la Web Sem´antica
11. Introducci´on
Tecnolog´ıas de la web sem´antica
Datos enlazados
Transformaci´on de BDR a grafos RDF
Problemas abiertos de investigaci´on
Conclusiones
Limitaciones de la web actual
Conceptos fundamentales
Integraci´on
Yusniel Hidalgo Delgado yhdelgado@uci.cu Introducci´on a la Web Sem´antica
12. Introducci´on
Tecnolog´ıas de la web sem´antica
Datos enlazados
Transformaci´on de BDR a grafos RDF
Problemas abiertos de investigaci´on
Conclusiones
Limitaciones de la web actual
Conceptos fundamentales
Recuperaci´on
Los resultados ofrecidos por motores de b´usqueda como Google y
Yahoo resultan imprecisos y, en muchos casos, no satisfacen las
necesidades de b´usqueda de los usuarios. Esto se debe a que est´an
orientados a responder consultas basadas en palabras claves, no
siendo capaces de recuperar la informaci´on a partir de consultas
expresadas en lenguaje natural.
Yusniel Hidalgo Delgado yhdelgado@uci.cu Introducci´on a la Web Sem´antica
13. Introducci´on
Tecnolog´ıas de la web sem´antica
Datos enlazados
Transformaci´on de BDR a grafos RDF
Problemas abiertos de investigaci´on
Conclusiones
Limitaciones de la web actual
Conceptos fundamentales
Recuperaci´on
Los buscadores actuales no son capaces de manejar t´erminos
ambiguos. Ejemplo: “Paris”
1 Capital de Francia
2 Ciudades en Canada y EEUU
3 Filme “Paris, Texas”de Wim Wenders
4 Paris Jackson, la hija de Michael Jackson
Yusniel Hidalgo Delgado yhdelgado@uci.cu Introducci´on a la Web Sem´antica
14. Introducci´on
Tecnolog´ıas de la web sem´antica
Datos enlazados
Transformaci´on de BDR a grafos RDF
Problemas abiertos de investigaci´on
Conclusiones
Limitaciones de la web actual
Conceptos fundamentales
Recuperaci´on
Yusniel Hidalgo Delgado yhdelgado@uci.cu Introducci´on a la Web Sem´antica
15. Introducci´on
Tecnolog´ıas de la web sem´antica
Datos enlazados
Transformaci´on de BDR a grafos RDF
Problemas abiertos de investigaci´on
Conclusiones
Limitaciones de la web actual
Conceptos fundamentales
Web sem´antica
Web Sem´antica (Berners-Lee, 2001)
“La Web Sem´antica no pretende sustituir la Web actual, sino que
es una extensi´on en la que la informaci´on tiene un significado
bien definido posibilitando a los humanos y las computadoras
trabajar en cooperaci´on.”
Yusniel Hidalgo Delgado yhdelgado@uci.cu Introducci´on a la Web Sem´antica
16. Introducci´on
Tecnolog´ıas de la web sem´antica
Datos enlazados
Transformaci´on de BDR a grafos RDF
Problemas abiertos de investigaci´on
Conclusiones
Limitaciones de la web actual
Conceptos fundamentales
Datos enlazados
Datos enlazados (Berners-Lee, 2006)
“Los datos enlazados (linked data) se refieren a un conjunto de
buenas pr´acticas para la publicaci´on y enlazado de datos
estructurados en la Web.”
Yusniel Hidalgo Delgado yhdelgado@uci.cu Introducci´on a la Web Sem´antica
17. Introducci´on
Tecnolog´ıas de la web sem´antica
Datos enlazados
Transformaci´on de BDR a grafos RDF
Problemas abiertos de investigaci´on
Conclusiones
Limitaciones de la web actual
Conceptos fundamentales
Ontolog´ıas
Ontolog´ıa (Studer, 1998)
Una ontolog´ıa es una especificaci´on formal y expl´ıcita de una
conceptualizaci´on compartida
1 Las ontolog´ıas est´an compuestas por clases, propiedades,
instancias y axiomas formales
2 Existen varios lenguajes para la definici´on de ontolog´ıas siendo
los m´as comunes OWL, OWL2 y RDFS
3 Algunos de los vocabularios y ontolog´ıas m´as utilizados son:
FOAF, Dublin Core y SKOS
Yusniel Hidalgo Delgado yhdelgado@uci.cu Introducci´on a la Web Sem´antica
18. Introducci´on
Tecnolog´ıas de la web sem´antica
Datos enlazados
Transformaci´on de BDR a grafos RDF
Problemas abiertos de investigaci´on
Conclusiones
RDF
SPARQL
Resource Description Framework (RDF)
1 Modelo de datos flexible basado en grafos dirigidos
2 ´Util para describir datos estructurados y sus interrelaciones en
un formato procesable por las computadoras
3 Utiliza las ontolog´ıas para la descripci´on formal de los datos
en t´erminos de clases y propiedades
4 Se basa en tripletas de la forma sujeto-predicado-objeto
Sujeto Objeto
Predicado
Yusniel Hidalgo Delgado yhdelgado@uci.cu Introducci´on a la Web Sem´antica
19. Introducci´on
Tecnolog´ıas de la web sem´antica
Datos enlazados
Transformaci´on de BDR a grafos RDF
Problemas abiertos de investigaci´on
Conclusiones
RDF
SPARQL
Resource Description Framework (RDF)
Ejemplo
Tim Berners-Lee es el autor del art´ıculo ”Linked Data Design
Issues” y fue publicado en el a˜no 2006
¿C´omo se puede representar esta informaci´on en la web utilizando
el modelo de datos RDF?
Yusniel Hidalgo Delgado yhdelgado@uci.cu Introducci´on a la Web Sem´antica
20. Introducci´on
Tecnolog´ıas de la web sem´antica
Datos enlazados
Transformaci´on de BDR a grafos RDF
Problemas abiertos de investigaci´on
Conclusiones
RDF
SPARQL
Resource Description Framework (RDF)
Yusniel Hidalgo Delgado yhdelgado@uci.cu Introducci´on a la Web Sem´antica
21. Introducci´on
Tecnolog´ıas de la web sem´antica
Datos enlazados
Transformaci´on de BDR a grafos RDF
Problemas abiertos de investigaci´on
Conclusiones
RDF
SPARQL
SPARQL Protocol and RDF Query Language (SPARQL)
1 Es un lenguaje est´andar de la W3C para la realizaci´on de
consultas sobre un grafo o m´ultiples grafos RDF
2 Su sintaxis es similar a la del lenguaje SQL aunque orientado
a tripletas RDF
3 Los resultados de las consultas SPARQL pueden ser conjuntos
de tripletas RDF, grafos RDF, URIs de recursos o
simplemente valores (cadenas de texto, n´umeros, etc.)
Yusniel Hidalgo Delgado yhdelgado@uci.cu Introducci´on a la Web Sem´antica
22. Introducci´on
Tecnolog´ıas de la web sem´antica
Datos enlazados
Transformaci´on de BDR a grafos RDF
Problemas abiertos de investigaci´on
Conclusiones
Principios de los datos enlazados
Linked Open Data Cloud
Publicaci´on de datos enlazados
Principios de los datos enlazados
1 Utilizar una URI para identificar cada recurso publicado en la
Web (Identificar)
2 Tener publicados estos recursos en una URI basada en HTTP
de modo que puedan ser f´acilmente localizados y consultados
(Localizar)
3 Proporcionar informaci´on ´util, detallada o extra acerca del
recurso cuando se acceda a esta URI basada en HTTP
(Describir)
4 Incluir enlaces a otras URI relacionadas con los datos
contenidos en el recurso, de forma que se potencie el
descubrimiento de la informaci´on sobre la Web (Enlazar)
Yusniel Hidalgo Delgado yhdelgado@uci.cu Introducci´on a la Web Sem´antica
23. Introducci´on
Tecnolog´ıas de la web sem´antica
Datos enlazados
Transformaci´on de BDR a grafos RDF
Problemas abiertos de investigaci´on
Conclusiones
Principios de los datos enlazados
Linked Open Data Cloud
Publicaci´on de datos enlazados
Linked Open Data Cloud
As of September 2011
Music
Brainz
(zitgist)
P20
Turismo
de
Zaragoza
yovisto
Yahoo!
Geo
Planet
YAGO
World
Fact-
book
El
Viajero
Tourism
WordNet
(W3C)
WordNet
(VUA)
VIVO UF
VIVO
Indiana
VIVO
Cornell
VIAF
URI
Burner
Sussex
Reading
Lists
Plymouth
Reading
Lists
UniRef
UniProt
UMBEL
UK Post-
codes
legislation
data.gov.uk
Uberblic
UB
Mann-
heim
TWC LOGD
Twarql
transport
data.gov.
uk
Traffic
Scotland
theses.
fr
Thesau-
rus W
totl.net
Tele-
graphis
TCM
Gene
DIT
Taxon
Concept
Open
Library
(Talis)
tags2con
delicious
t4gm
info
Swedish
Open
Cultural
Heritage
Surge
Radio
Sudoc
STW
RAMEAU
SH
statistics
data.gov.
uk
St.
Andrews
Resource
Lists
ECS
South-
ampton
EPrints
SSW
Thesaur
us
Smart
Link
Slideshare
2RDF
semantic
web.org
Semantic
Tweet
Semantic
XBRL
SW
Dog
Food
Source Code
Ecosystem
Linked Data
US SEC
(rdfabout)
Sears
Scotland
Geo-
graphy
Scotland
Pupils &
Exams
Scholaro-
meter
WordNet
(RKB
Explorer)
Wiki
UN/
LOCODE
Ulm
ECS
(RKB
Explorer)
Roma
RISKS
RESEX
RAE2001
Pisa
OS
OAI
NSF
New-
castle
LAAS
KISTI
JISC
IRIT
IEEE
IBM
Eurécom
ERA
ePrints dotAC
DEPLOY
DBLP
(RKB
Explorer)
Crime
Reports
UK
Course-
ware
CORDIS
(RKB
Explorer)
CiteSeer
Budapest
ACM
riese
Revyu
research
data.gov.
ukRen.
Energy
Genera-
tors
reference
data.gov.
uk
Recht-
spraak.
nl
RDF
ohloh
Last.FM
(rdfize)
RDF
Book
Mashup
Rådata
nå!
PSH
Product
Types
Ontology
Product
DB
PBAC
Poké-
pédia
patents
data.go
v.uk
Ox
Points
Ord-
nance
Survey
Openly
Local
Open
Library
Open
Cyc
Open
Corpo-
rates
Open
Calais
OpenEI
Open
Election
Data
Project
Open
Data
Thesau-
rus
Ontos
News
Portal
OGOLOD
Janus
AMP
Ocean
Drilling
Codices
New
York
Times
NVD
ntnusc
NTU
Resource
Lists
Norwe-
gian
MeSH
NDL
subjects
ndlna
my
Experi-
ment
Italian
Museums
medu-
cator
MARC
Codes
List
Man-
chester
Reading
Lists
Lotico
Weather
Stations
London
Gazette
LOIUS
Linked
Open
Colors
lobid
Resources
lobid
Organi-
sations
LEM
Linked
MDB
LinkedL
CCN
Linked
GeoData
LinkedCT
Linked
User
Feedback
LOV
Linked
Open
Numbers
LODE
Eurostat
(Ontology
Central)
Linked
EDGAR
(Ontology
Central)
Linked
Crunch-
base
lingvoj
Lichfield
Spen-
ding
LIBRIS
Lexvo
LCSH
DBLP
(L3S)
Linked
Sensor Data
(Kno.e.sis)
Klapp-
stuhl-
club
Good-
win
Family
National
Radio-
activity
JP
Jamendo
(DBtune)
Italian
public
schools
ISTAT
Immi-
gration
iServe
IdRef
Sudoc
NSZL
Catalog
Hellenic
PD
Hellenic
FBD
Piedmont
Accomo-
dations
GovTrack
GovWILD
Google
Art
wrapper
gnoss
GESIS
GeoWord
Net
Geo
Species
Geo
Names
Geo
Linked
Data
GEMET
GTAA
STITCH
SIDER
Project
Guten-
berg
Medi
Care
Euro-
stat
(FUB)
EURES
Drug
Bank
Disea-
some
DBLP
(FU
Berlin)
Daily
Med
CORDIS
(FUB)
Freebase
flickr
wrappr
Fishes
of Texas
Finnish
Munici-
palities
ChEMBL
FanHubz
Event
Media
EUTC
Produc-
tions
Eurostat
Europeana
EUNIS
EU
Insti-
tutions
ESD
stan-
dards
EARTh
Enipedia
Popula-
tion (En-
AKTing)
NHS
(En-
AKTing) Mortality
(En-
AKTing)
Energy
(En-
AKTing)
Crime
(En-
AKTing)
CO2
Emission
(En-
AKTing)
EEA
SISVU
educatio
n.data.g
ov.uk
ECS
South-
ampton
ECCO-
TCP
GND
Didactal
ia
DDC Deutsche
Bio-
graphie
data
dcs
Music
Brainz
(DBTune)
Magna-
tune
John
Peel
(DBTune)
Classical
(DB
Tune)
Audio
Scrobbler
(DBTune)
Last.FM
artists
(DBTune)
DB
Tropes
Portu-
guese
DBpedia
dbpedia
lite
Greek
DBpedia
DBpedia
data-
open-
ac-uk
SMC
Journals
Pokedex
Airports
NASA
(Data
Incu-
bator)
Music
Brainz
(Data
Incubator)
Moseley
Folk
Metoffice
Weather
Forecasts
Discogs
(Data
Incubator)
Climbing
data.gov.uk
intervals
Data
Gov.ie
data
bnf.fr
Cornetto
reegle
Chronic-
ling
America
Chem2
Bio2RDF
Calames
business
data.gov.
uk
Bricklink
Brazilian
Poli-
ticians
BNB
UniSTS
UniPath
way
UniParc
Taxono
my
UniProt
(Bio2RDF)
SGD
Reactome
PubMed
Pub
Chem
PRO-
SITE
ProDom
Pfam
PDB
OMIM
MGI
KEGG
Reaction
KEGG
Pathway
KEGG
Glycan
KEGG
Enzyme
KEGG
Drug
KEGG
Com-
pound
InterPro
Homolo
Gene
HGNC
Gene
Ontology
GeneID
Affy-
metrix
bible
ontology
BibBase
FTS
BBC
Wildlife
Finder
BBC
Program
mes BBC
Music
Alpine
Ski
Austria
LOCAH
Amster-
dam
Museum
AGROV
OC
AEMET
US Census
(rdfabout)
Yusniel Hidalgo Delgado yhdelgado@uci.cu Introducci´on a la Web Sem´antica
24. Introducci´on
Tecnolog´ıas de la web sem´antica
Datos enlazados
Transformaci´on de BDR a grafos RDF
Problemas abiertos de investigaci´on
Conclusiones
Principios de los datos enlazados
Linked Open Data Cloud
Publicaci´on de datos enlazados
Naturaleza de los datos
Yusniel Hidalgo Delgado yhdelgado@uci.cu Introducci´on a la Web Sem´antica
25. Introducci´on
Tecnolog´ıas de la web sem´antica
Datos enlazados
Transformaci´on de BDR a grafos RDF
Problemas abiertos de investigaci´on
Conclusiones
Principios de los datos enlazados
Linked Open Data Cloud
Publicaci´on de datos enlazados
Naturaleza de los datos
Yusniel Hidalgo Delgado yhdelgado@uci.cu Introducci´on a la Web Sem´antica
26. Introducci´on
Tecnolog´ıas de la web sem´antica
Datos enlazados
Transformaci´on de BDR a grafos RDF
Problemas abiertos de investigaci´on
Conclusiones
Principios de los datos enlazados
Linked Open Data Cloud
Publicaci´on de datos enlazados
Gu´ıa metodol´ogica
Desarrollo iterativo e incremental
Yusniel Hidalgo Delgado yhdelgado@uci.cu Introducci´on a la Web Sem´antica
27. Introducci´on
Tecnolog´ıas de la web sem´antica
Datos enlazados
Transformaci´on de BDR a grafos RDF
Problemas abiertos de investigaci´on
Conclusiones
Principios de los datos enlazados
Linked Open Data Cloud
Publicaci´on de datos enlazados
Especificaci´on
Objetivo
Obtener una especificaci´on detallada de los requerimientos
Tareas:
1 Identificaci´on y an´alisis de las fuentes de datos
2 Dise˜no de las URI
3 Definici´on de la licencia de los datos enlazados
Yusniel Hidalgo Delgado yhdelgado@uci.cu Introducci´on a la Web Sem´antica
28. Introducci´on
Tecnolog´ıas de la web sem´antica
Datos enlazados
Transformaci´on de BDR a grafos RDF
Problemas abiertos de investigaci´on
Conclusiones
Principios de los datos enlazados
Linked Open Data Cloud
Publicaci´on de datos enlazados
Modelado
Objetivo
Crear o reutilizar la o las ontolog´ıas necesarias para modelar los
datos
Tareas:
1 Identificar las ontolog´ıas existentes que puedan ser reutilizadas
en el dominio de nuestros datos
2 Si no se identifica ninguna ontolog´ıa en la tarea anterior, es
necesario crear una ontolog´ıa propia reutilizando tantos
t´erminos sea posible encontrar en otros vocabularios
3 Si no se encuentran t´erminos a reutilizar, es necesario
desarrollar una ontolog´ıa propia desde cero
Yusniel Hidalgo Delgado yhdelgado@uci.cu Introducci´on a la Web Sem´antica
29. Introducci´on
Tecnolog´ıas de la web sem´antica
Datos enlazados
Transformaci´on de BDR a grafos RDF
Problemas abiertos de investigaci´on
Conclusiones
Principios de los datos enlazados
Linked Open Data Cloud
Publicaci´on de datos enlazados
Generaci´on
Objetivo
Transformar los datos existentes en la fuente de datos a grafos
RDF, empleando las ontolog´ıas definidas en la actividad anterior
Tareas:
1 Transformaci´on
2 Limpieza de los datos
3 Enlazado
Yusniel Hidalgo Delgado yhdelgado@uci.cu Introducci´on a la Web Sem´antica
30. Introducci´on
Tecnolog´ıas de la web sem´antica
Datos enlazados
Transformaci´on de BDR a grafos RDF
Problemas abiertos de investigaci´on
Conclusiones
Principios de los datos enlazados
Linked Open Data Cloud
Publicaci´on de datos enlazados
Publicaci´on
Objetivo
Publicar el grafo RDF en la Web mediante un SPARQL Endpoint o
URIs dereferenciadas
Tareas:
1 Publicaci´on del dataset (ej: pubby)
2 Publicaci´on de los metadatos del dataset (ej. VoID)
3 Posibilitar el descubrimiento del dataset (generar el sitemap,
a˜nadir el dataset en el repositorio CKAN, etc)
Yusniel Hidalgo Delgado yhdelgado@uci.cu Introducci´on a la Web Sem´antica
31. Introducci´on
Tecnolog´ıas de la web sem´antica
Datos enlazados
Transformaci´on de BDR a grafos RDF
Problemas abiertos de investigaci´on
Conclusiones
Principios de los datos enlazados
Linked Open Data Cloud
Publicaci´on de datos enlazados
Consumo
Objetivo
Desarrollar herramientas que utilicen los grafos RDF previamente
publicados
Algunas de estas herramientas son:
1 Linked Data Mashup
2 Linked Data Browser
3 Linked Data Search Engine
4 Otras aplicaciones espec´ıficas del dominio de los datos
Yusniel Hidalgo Delgado yhdelgado@uci.cu Introducci´on a la Web Sem´antica
32. Introducci´on
Tecnolog´ıas de la web sem´antica
Datos enlazados
Transformaci´on de BDR a grafos RDF
Problemas abiertos de investigaci´on
Conclusiones
Modelo relacional vs Modelo RDF
Lenguajes de alineaci´on RDB2RDF
Modelo relacional vs Modelo RDF
Estudios recientes han demostrado que es posible alinear el modelo
relacional con el modelo de datos basado en grafos RDF
Yusniel Hidalgo Delgado yhdelgado@uci.cu Introducci´on a la Web Sem´antica
33. Introducci´on
Tecnolog´ıas de la web sem´antica
Datos enlazados
Transformaci´on de BDR a grafos RDF
Problemas abiertos de investigaci´on
Conclusiones
Modelo relacional vs Modelo RDF
Lenguajes de alineaci´on RDB2RDF
Lenguajes de alineaci´on RDB2RDF
El RDB2RDF Working Group de la W3C ha definido dos est´andares
para realizar la alineaci´on entre BDR y grafos RDF. Sin embargo,
a´un existen muy pocas herramientas que los implementan.
Yusniel Hidalgo Delgado yhdelgado@uci.cu Introducci´on a la Web Sem´antica
34. Introducci´on
Tecnolog´ıas de la web sem´antica
Datos enlazados
Transformaci´on de BDR a grafos RDF
Problemas abiertos de investigaci´on
Conclusiones
Modelo relacional vs Modelo RDF
Lenguajes de alineaci´on RDB2RDF
Direct Mapping
1 Se establece una alineaci´on directa entre el modelo relacional
y el modelo basado en grafos RDF
2 Existe una correspondencia directa entre las tablas de la base
de datos con las clases de la ontolog´ıa y los atributos de la
base de datos con las propiedades de la ontolog´ıa
3 La alineaci´on se realiza de manera autom´atica, tomando
como entrada el esquema de la base de datos relacional
Yusniel Hidalgo Delgado yhdelgado@uci.cu Introducci´on a la Web Sem´antica
35. Introducci´on
Tecnolog´ıas de la web sem´antica
Datos enlazados
Transformaci´on de BDR a grafos RDF
Problemas abiertos de investigaci´on
Conclusiones
Modelo relacional vs Modelo RDF
Lenguajes de alineaci´on RDB2RDF
R2RML
1 Se basa en tablas l´ogicas para recuperar datos a partir de una
base de datos de entrada
2 Una tabla l´ogica puede ser: una tabla, una vista o una
consulta SQL v´alida
3 Permite manejar alineaciones complejas que requieren
transformaci´on de datos, c´alculo de datos o filtros antes de
generar las tripletas a partir de la BD
4 La alineaci´on se personaliza atendiendo a las ontolog´ıas de
dominios utilizadas en la modelaci´on de los datos
Yusniel Hidalgo Delgado yhdelgado@uci.cu Introducci´on a la Web Sem´antica
36. Introducci´on
Tecnolog´ıas de la web sem´antica
Datos enlazados
Transformaci´on de BDR a grafos RDF
Problemas abiertos de investigaci´on
Conclusiones
Problemas abiertos de investigaci´on
´Areas activas de investigaci´on
1 Almacenamiento escalable de grafos RDF
2 Procesamiento de consultas sobre grafos RDF utilizando
Cloud Computing
3 T´ecnicas de miner´ıa sobre grafos RDF (an´alisis)
4 Algoritmos de razonamiento incremental
5 Publicaci´on de grafos RDF desde flujos de datos (Linked
Stream Data)
6 Aplicaciones a diversos dominios (datos geogr´aficos,
biol´ogicos, educativos, meteorol´ogicos, bibliogr´aficos)
Yusniel Hidalgo Delgado yhdelgado@uci.cu Introducci´on a la Web Sem´antica
37. Introducci´on
Tecnolog´ıas de la web sem´antica
Datos enlazados
Transformaci´on de BDR a grafos RDF
Problemas abiertos de investigaci´on
Conclusiones
Conclusiones
Conclusiones
1 La web cl´asica posee tres limitaciones fundamentales:
formato, integraci´on y recuperaci´on de la informaci´on
2 Las ontolog´ıas permiten formalizar el significado de la
informaci´on presente en la web sem´antica
3 Existen lenguajes para alinear esquemas de bases de datos
relacionales con ontolog´ıas, con el objetivo de producir
tripletas RDF
Yusniel Hidalgo Delgado yhdelgado@uci.cu Introducci´on a la Web Sem´antica