SlideShare una empresa de Scribd logo
1 de 57
Descargar para leer sin conexión
Semantic Web: U
Datos Heterogén
Web

SEMANTIC)WEB)

Usando)Linked)Data)para)conectar)Datos)
Heterogéneos)y)Distribuidos)a)través)de)la)Web

)

Nelson Piedra (UTPL, nopiedra@utpl.edu.ec)!
!
Edmundo Tovar (UPM etovar@fi.upm.es )!
Jorge López UTPL, Janneth Chicaiza UTPL, Oscar Martínez UMH!
!

XX"Congreso"Nacional"de"Estudiantes"de"Ingeniería"de"Sistemas"y"
Computación,"2012))
Universidad)Santo)Toribio)de)Mogrovejo)Chiclayo,)Perú)

this work is licensed under a Creative Commons Atribución-NoComercial-SinDerivadas 3.0 Ecuador

#CONEISC
#OpenEducationalResources
#OpenCourseWare
#linkeddata #ocw #oer #SemWeb
#SemanticWeb #LOCWD #LOD
Vint Cerf and Sir Tim Berners-Lee

Texto

By Adolfo Plasencia
http://www.flickr.com/photos/adolfoplasencia/3529884072/
internet
INTERNET Sus orígenes se remontan a la década de 1960, dentro de ARPA (hoy DARPA) se crea
el proyecto ARPANet (Advanced Research Projects Agency Network). En 1969, se estableció la
primera conexión de computadoras, conocida como ARPANET, entre tres universidades en
California y una en Utah, Estados Unidos.
... (años de inspiración y transpiración que se pueden ver en http://es.wikipedia.org/wiki/Internet)
En el CERN de Ginebra, un grupo de físicos encabezado por Tim Berners-Lee creó el lenguaje
HTML, basado en el SGML. En 1990 el mismo equipo construyó el primer cliente Web, llamado
WorldWideWeb (WWW), y el primer servidor we
En 1990 el CERN crea el código HTML y con él el primer cliente
World Wide Web. En la imagen el código HTML con sintaxis
coloreada.
primero conectamos
DOCUMENTOS
luego conectamos
PERSONAS
en la próxima Web,
conectaremos DATA
La Web está en evolución
The Web principle of designed
The Web was designed as an information space, with the goal that it should be
useful not only for human-human communication, but also that machines
would be able to participate and help.
[Tim Berners-Lee]
Estado Actual de la Web
(1) Contenido Almacenado en Silos de Información
Diversas Plataformas y Sistemas (CMS, APIs) almacenan Información.
Millones de datos contenidos en Millones de Documentos Web, embebidos en
CMS heterogéneos, de difícil acceso y procesamiento semántico.
(2) Descubrimiento y Reusabilidad Limitadas
No es posible reusar datos fuera de los CMS
Muy pocos datos de las páginas Web están disponibles en formatos procesables
por agentes máquina
la Web actual es una Web de Documentos
destinada para interpretación y consumo
humano... de humanos para humanos
Uno de los mayores obstáculos de la Web actual es que la mayoría de la
Información en la Web está diseñada para consumo humano, incluso si el
contenido está generado a partir de bases de datos estructuradas. El
contenido está estructurado en un formato que no es entendible por las
máquinas.

¿Y las máquinas? su acceso es restringido...
Web of Documents
from human to human

Los links expresan relaciones entre documentos
escritos en HTML, conectan páginas, pero no conectan
datos/significados/información.
from
Web of Documents

to
Web of Data
Web of Documents
from human to human
Los links expresan relaciones entre documentos escritos en HTML,
conectan páginas, pero no conectan datos/significados/información.
la solución...
¿(1) máquinas inteligentes o
(2)datos inteligentes ?
dejando de lado el problema de la
Inteligencia Artificial de entrenar a las
máquinas para que se comporten como
seres humanos, el enfoque de Web
Semántica es desarrollar lenguajes para
expresar la información en un
formato procesable por las máquinas
[TBL]

A.I.
Information
Silos

RDF
data
Tim Berners-Lee on the Next Web (TED, 2009)
Wordle of the transcript of Sir Tim Berners-Lee TED talk, the Next Web.
License: Some rights reserved by Chris P Jobling
http://www.flickr.com/photos/cpjobling/5034035908/
Web of Data
Discovery, Access, and Usages of Resources in the Web
Web of Data,
Conectar cualquier cosa en la Web,
enlazar DATOS más que Documentos
Linked Data es (a) sobre usar la Web para conectar datos relacionados que
antes no estaban enlazados, o (b) usar la Web para disminuir las barreras para
enlazar datos que actualmente están enlazados por otros métodos.
Linked Data (c) es una buena práctica para exponer, compartir y conectar
piezas de datos, información, y conocimiento en la Web semántica, usando
URIs para identificar las cosas y RDF para describir y enlazar semánticamente
las cosas.
Linked-Data Principles, back to TBL note from ’98
1.Usar URIs para identificar globalmente una cosa de
interés en la Web (OCW, syllabus, test, autores,
universidad, país, idioma, ...)
2.Usar HTTP para conectar y visualizar los recursos.
3.Describir los recursos a través del estándar; RDF*, y
permitir la consulta de datos a través de SPARQL
4.Incluir links a otros URIs de manera que se posible
descubrir otras cosas.
COMPARACIÓN
La Web Semántica no solo se trata de poner datos en la Web. Es sobre enlazar
cosas, de manera que las personas o las máquinas puedan explorar la Web de
Datos.
Features

The Web of Document

The Web of Data

Analogy

a global filesystem

a global database

Designed for

human consumption

machines first, humans later

Primary objects

documents

things (or descriptions of things)

Links between

documents (or subparts of)

things

Degree of structure in objects

fairly low, disconnected data

high

Semantics of content and links
implicit

Implicit

explicit

adapted from: Tom Heath, Talis, 2009
The Linking Open Data cloud diagram, evolution
Next images sequence shows datasets that have been published in Linked
Data format, by contributors to the Linking Open Data community project and
other individuals and organisations. It is based on metadata collected and
curated by contributors to the CKAN directory. Last updated: 2010-09-22.

“Linking Open Data cloud diagram, by Richard Cyganiak and Anja Jentzsch. http://lod-cloud.net/”
20071008

“Linking Open Data cloud diagram, by Richard Cyganiak and Anja Jentzsch. http://lod-cloud.net/” This work is available under a CC-BY-SA license.

25 datasets

http://richard.cyganiak.de/2007/10/lod/loddatasets_2007-10-08.png
20071107

“Linking Open Data cloud diagram, by Richard Cyganiak and Anja Jentzsch. http://lod-cloud.net/” This work is available under a CC-BY-SA license.

28 datasets

http://richard.cyganiak.de/2007/10/lod/loddatasets_2007-11-07.png
20071110

“Linking Open Data cloud diagram, by Richard Cyganiak and Anja Jentzsch. http://lod-cloud.net/” This work is available under a CC-BY-SA license.

28 datasets

http://richard.cyganiak.de/2007/10/lod/loddatasets_2007-11-10.png
20080228

“Linking Open Data cloud diagram, by Richard Cyganiak and Anja Jentzsch. http://lod-cloud.net/” This work is available under a CC-BY-SA license.

32 datasets

http://richard.cyganiak.de/2007/10/lod/loddatasets_2008-02-28.png
20080331

“Linking Open Data cloud diagram, by Richard Cyganiak and Anja Jentzsch. http://lod-cloud.net/” This work is available under a CC-BY-SA license.

34 datasets

http://richard.cyganiak.de/2007/10/lod/loddatasets_2008-03-31.png
20080919

“Linking Open Data cloud diagram, by Richard Cyganiak and Anja Jentzsch. http://lod-cloud.net/” This work is available under a CC-BY-SA license.

45 datasets

http://richard.cyganiak.de/2007/10/lod/loddatasets_2008-09-18.png
20090305

“Linking Open Data cloud diagram, by Richard Cyganiak and Anja Jentzsch. http://lod-cloud.net/” This work is available under a CC-BY-SA license.

89 datasets

http://richard.cyganiak.de/2007/10/lod/loddatasets_2009-03-05.png
20090327

“Linking Open Data cloud diagram, by Richard Cyganiak and Anja Jentzsch. http://lod-cloud.net/” This work is available under a CC-BY-SA license.

93 datasets

http://richard.cyganiak.de/2007/10/lod/loddatasets_2009-03-27.png
20090714

“Linking Open Data cloud diagram, by Richard Cyganiak and Anja Jentzsch. http://lod-cloud.net/” This work is available under a CC-BY-SA license.

95 datasets

http://richard.cyganiak.de/2007/10/lod/loddatasets_2009-07-14.png
20100922

“Linking Open Data cloud diagram, by Richard Cyganiak and Anja Jentzsch. http://lod-cloud.net/” This work is available under a CC-BY-SA license.

203
datasets

http://richard.cyganiak.de/2007/10/lod/loddatasets_2010-09-22_colored.png
OPEN: "A piece of knowledge is open if you are
free to use, reuse, and redistribute it"
http://www.opendefinition.org/okd

Our OER semantic vision:
Educational Content
+
Open Licenses
+
Data in Machine Format
Open Educational Content and Open
Education Practices represent the next stage
of human knowledge organization
EJEMPLO: DATA en la página web
de un OCW de UPM
OCW	
  
University
knowledge	
  area

Title
Author(s)
Department
syllabus
bibliography
year
ects	
  credits
:me	
  autoself
descrip:on
‘Ontologies and
Semantic Web’

subject

has	
  a

author-creator

predicate

whose	
  name	
  is

Asunción Gómez
Pérez

object
http://ocw.upm.es/ciencia-de-lacomputacion-e-inteligenciaartificial/ontologies-and-semanticweb

subject

has	
  a

http://purl.org/dc/elements/1.1//
creator

predicate

whose	
  name	
  is

Asunción Gómez
Pérez

object
example for locwd dataset
Subject

Predicate

Object

locwd:opencourseware

dc:creator

foaf:Person

locwd:opencourseware

dc:title

xsd:string

locwd:opencourseware

dc:description

xsd:string

locwd:opencourseware

dc:subject

skos:Concept, xsd:string

locwd:biblio

rdfs:subclassOf

bibo:document

locwd:biblio

dcterms:isPartOf, bibo:DocumentPart,
xsd:string
dc:title

locwd:ocwRepository

dc:creator

foaf:Organization
Linked OpenCourseWare Data connected
with the LinkedOpenData Cloud

!
!

WHY!OCW/OER!+!LINKED!DATA?!
!

IN#ORDER#TO#MOVE#FORWARD#AND#REALIZE#
THE#PROMISE#OF#LINKED#DATA#FOR#OCW/OER#
REPOSITORIES,#UNIVERSITIES#
#
42
General'Framework'
The framework used is divided into five phases:
•  (1) Identify and select heterogeneous data sources to
determine the scope of the content. Of the information
sources for evaluation, we selected OCW
repositories, information stored in structured
databases, Web page content, information accessible
via RSS feeds, RDF available, etc.;
•  (2) Model vocabularies;
•  (3) Generate RDF data,
•  (4) Publish linked data, and
•  (5) Consume and display linked data.
43
Why$publish$Linked$OCW$Data?$
•  Because$LinkedData$holds$the$poten9al$to$move$our$OCW$collec9ons$
out$of$their$silos$
•  Open$the$data$and$content$silos,$to$leverage$the$knowledge$capital$
represented$by$our$OCW$repositories$
•  To$enrich$our$informa9on$landscape,$to$mprove$visibility$
•  To$improve$ease$of$discovery$open$academic$resources$
•  To$improve$ease$of$consump9on$and$reuse$of$OCW$
•  To$reduce$redundancy$in$searched$of$OCW$
•  Promo9ng$innova9on$and$Added$Value$to$Open$$
Enrichment Linked OCW Data Repository

Monitoring for universities, organizations and
courses
LOCWD Triplestore

Agent to
include new
Universities
Organizations

RDF data

A new OCW
organization

OCW Directories
Listener

URI links
A new OCW

Agent to
include new
Legislation from
universities
stream of html
content

Linked	
  Universities	
  DataSet

Map the
terms mined to
terms already in
the LOD
Cloud

Connect
University Data
with Other RDF
Repositories
RDF	
  vocabularies

URIs for universities things
RDF for describe Universities resources
Links to other Universities - things

OCW Repositories
Listener

LUD
Linked
Universities
Data

Extraction of Universities data

Legend

Terms mined as
RDF tripletes
RDF triplestore

Content extraction from HTML pages

Extraction
of content from
each university
page (CC license

raw
content

stream of
extracted content

verified )
Use of crawling and
scraping
techniques

Temporary	
  Repository	
  for	
  
store	
  of	
  	
  html	
  content	
  
extracted	
  

ocw data
pattern

Extraction
of data patterns
(Classification, and
applying of clustering
SNA techniques )

Publish the
mined info as
linked data and
create RDF links
to resources in
the LOD cloud

non-reliable data
or erroneous data
data corrected

Relational
database
Software agent
Get information from
RSS subscription

Cleasing Data
(detecting and
correcting corrupt or
inaccurate data

Get RDF content,
if available
Apply scraping
technique
Get embebed content
in HTML pages
Estrategia de Trabajo
• Fase 1. Integrar repositorios heterogéneos de OCW.
(Asegurar actualización de datos (ejemplo datos no
entregados), Interoperabilidad)
– Presencia de OCW-UNIVERSIA en el Cloud de Linked Data
– Análisis y Limpieza de datos

• Fase 2. Describir Semánticamente cada OCW.
– Establecer el vocabulario Linked Universia Data, a través del
que se integren los recursos OCW/OER con otros DataStores
en el mundo
– Identificar consultas de interés
Fuentes de datos OCW
– Interna:
• UNIVERSIA, Excel con los siguientes datos: (Titulo del Curso, URL
del Curso; Texto de Autores - no estaban separados por “;”-)
– Externa:
• WEB, Visita manual a cada sitio OCW, extracción de datos
adicionales, Actualización de cursos OCW que no constaban en el
EXCEL, nuestra fuente primaria.
• La Nube de Datos de LinkedData: DBPedia, GeoNames,
Vocabularios RDF. Con pocos atributos, la posibilidad de
desambiguar información es limitada.
university name

University

university oficial web site
OCW repository name

OCW
repository

state of repository
Platform

country

URL OCW repository
RSS link

OCW001

Course title

Knowledge
Area

Language

Creation date
Language

Tag list

Tag
Meaning

Course Description

OERs

tag

Licensed

FirstName

Author

LastName
Gender

OER link
OER Subject
OER type
OER language

university
organization unit
DBLP
Vocabularios
• Dublin Core, dc: http://purl.org/dc/elements/1.1/
• dcterms: http://purl.org/dc/terms/
• Person, foaf: http://xmlns.com/foaf/0.1/
• geo: http://www.w3.org/2003/01/geo/wgs84_pos#
• sioc: http://rdfs.org/sioc/ns#
• tag: http://twitlogic.fortytwo.net/hashtag/
• rdf: http://www.w3.org/1999/02/22-rdf-syntax-ns#
• rdfs:http://www.w3.org/2000/01/rdf-schema#
• owl: http://www.w3.org/2002/07/owl#
• Concept, skos: http://www.w3.org/2004/02/skos/core#
• Bibliographic Ontology, bibo: http://purl.org/ontology/bibo/
• fti: http://franz.com/ns/allegrograph/2.2/textindex/
• AIISO: http://vocab.org/aiiso
Consultas	
  posibles	
  con	
  datos	
  
vinculados
• 1.	
  Consultar	
  Cursos	
  OCW,	
  relacionados	
  con	
  un	
  tema	
  determinado	
  y	
  que	
  se	
  devuelvan	
  
ordenados	
  cronológicamente	
  (primero	
  los	
  más	
  recientes)
– Datos	
  de	
  Entrada:	
  término	
  a	
  consultar,	
  ejemplo:	
  “Ontologies”,	
  “Web	
  2.0”
– Datos	
  necesarios:	
  Cursos	
  OCW,	
  fecha	
  de	
  creación	
  del	
  curso,	
  fuente	
  de	
  conceptos	
  
(temas,	
  categorías,	
  tags,	
  …)	
  y	
  la	
  relación	
  éntre	
  estos	
  y	
  cada	
  curso	
  OCW.
– Técnica:	
  Filtrar	
  cursos	
  OCW	
  por	
  concepto,	
  ordenar	
  los	
  resultados
• 2.	
  Consultar	
  docentes-­‐autores	
  de	
  cursos	
  OCW,	
  en	
  temas	
  específicos,	
  que	
  son	
  	
  
reconocidos	
  por	
  su	
  relevancia	
  cien@fica/académica	
  y/o	
  por	
  la	
  relevancia	
  de	
  sus	
  cursos	
  
OCW	
  (medido	
  en	
  términos	
  de	
  visitas	
  al	
  OCW)
– Datos	
  de	
  Entrada:	
  término	
  a	
  consultar,	
  ejemplo:	
  “eLearning”,	
  “Seman:c	
  Web”
– Datos	
  necesarios:	
  Datos	
  de	
  Autores	
  de	
  OCW,	
  dato	
  de	
  impacto	
  cienSfico	
  (se	
  puede	
  
consultar	
  el	
  indice_H	
  de	
  cada	
  autor,	
  haciendo	
  enlace	
  con	
  ISIWeb/DBLP),	
  dato	
  con	
  la	
  
can:dad	
  de	
  visitas	
  y	
  calificación	
  social	
  del	
  curso	
  OCW	
  	
  (este	
  dato	
  se	
  puede	
  recoger	
  a	
  
través	
  de	
  la	
  herramienta	
  de	
  búsqueda)
– Técnica:	
  Selección	
  de	
  autores	
  de	
  cursos	
  OCW	
  que	
  :enen	
  relación	
  con	
  el	
  concepto	
  a	
  
consultar,	
  	
  comparación	
  de	
  Autores	
  de	
  OCW	
  según	
  “índice	
  h”	
  (u	
  otro)	
  y	
  dato	
  sobre	
  uso	
  
de	
  sus	
  curso	
  OCW	
  (o	
  calificación	
  social	
  del	
  OCW).
Consultas	
  posibles	
  con	
  datos	
  
vinculados	
  (II)
• 3.	
  Consultar	
  Repositorios	
  OCW	
  según	
  información	
  geográfica	
  de	
  entrada	
  o	
  información	
  
de	
  caracterísGcas	
  del	
  repositorio	
  buscado
– Datos	
  de	
  Entrada:	
  (a)	
  Información	
  geográfica	
  (país,	
  longitud,	
  la:tud,	
  ciudad,	
  …)	
  (b)	
  
Tipo	
  de	
  Plataforma,	
  idioma,	
  Licencia	
  CC	
  de	
  repositorio,	
  can:dad	
  de	
  cursos,	
  
Universidad	
  asociada,	
  etc.
– Datos	
  necesarios:	
  Datos	
  del	
  repositorio	
  OCW,	
  y	
  link	
  a	
  fuentes	
  de	
  datos	
  RDF	
  externos:	
  
DBPEDIA,	
  GEONAMES,	
  FREEBASE,	
  ….
– Técnica:	
  enlazar	
  las	
  propiedades	
  del	
  repositorio	
  con	
  Fuentes	
  de	
  datos	
  RDF	
  externas.
• 4.	
  Consulta	
  de	
  Información	
  cien@fica	
  y	
  Académica	
  de	
  un	
  Autor	
  de	
  cursos	
  OCW	
  en	
  
fuentes	
  externas	
  a	
  la	
  base	
  de	
  datos	
  (integración	
  de	
  autores	
  con	
  otras	
  fuentes	
  de	
  datos)
– Datos	
  de	
  Entrada:	
  Datos	
  de	
  Persona
– Datos	
  necesarios:	
  Datos	
  de	
  Autores	
  de	
  OCW,	
  dato	
  de	
  impacto	
  cienSfico	
  (se	
  puede	
  
consultar	
  el	
  indice_H	
  de	
  cada	
  autor,	
  haciendo	
  enlace	
  con	
  ISIWeb/DBLP),	
  dato	
  con	
  la	
  
can:dad	
  de	
  visitas	
  y	
  calificación	
  social	
  del	
  curso	
  OCW	
  	
  (este	
  dato	
  se	
  puede	
  recoger	
  a	
  
través	
  de	
  la	
  herramienta	
  de	
  búsqueda)
– Técnica:	
  En	
  función	
  de	
  los	
  datos	
  de	
  entrada	
  para	
  la	
  consulta,	
  proponer	
  los	
  posibles	
  
autores	
  de	
  cursos	
  OCW	
  que	
  sa:sfacen	
  tales	
  condiciones	
  de	
  búsqueda;	
  a	
  con:nuación	
  
consultar	
  a	
  través	
  de	
  datos	
  de	
  enlace	
  hacia	
  las	
  fuentes	
  de	
  datos	
  externas	
  en	
  los	
  que	
  el	
  
autor-­‐OCW	
  pueda	
  tener	
  información	
  que	
  podamos	
  extraer;	
  obtener	
  datos	
  potenciales	
  
del	
  autor,	
  aplicar	
  proceso	
  de	
  conciliación/desambiguación;	
  mostrar	
  resultados.
Consultas	
  FUTURAS.	
  El	
  mecanismo	
  
existe,	
  pero	
  no	
  hay	
  datos
5.	
  Buscar	
  en	
  el	
  contenido	
  de	
  Cursos	
  OCW:	
  por	
  ciertos	
  OERs	
  o	
  ciertos	
  Conceptos	
  que	
  no	
  
constan	
  en	
  el	
  Gtulo	
  (Ejemplo:	
  en	
  Universia	
  existe	
  un	
  curso	
  de	
  Web	
  SemánGca	
  dictado	
  
por	
  UPM,	
  en	
  el	
  syllabus	
  de	
  este	
  curso	
  hay	
  capítulos	
  de	
  dos	
  temas:	
  RDF	
  y	
  SPARQL;	
  si	
  se	
  
consulta	
  en	
  el	
  buscador	
  de	
  OCW-­‐Universia	
  por	
  algo	
  relacionado	
  a	
  RDF/SPARQL/
LinkedData	
  no	
  hay	
  resultados;	
  esto	
  se	
  puede	
  solucionar	
  con	
  LinkedData)
– Datos	
  de	
  Entrada:	
  Buscar	
  por	
  el	
  Stulo	
  de	
  un	
  OER,	
  o	
  por	
  un	
  concepto,	
  etc
– Datos	
  necesarios:	
  Datos	
  de	
  cursos	
  OCW,	
  	
  Datos	
  de	
  Conceptos	
  que	
  se	
  enlacen	
  a	
  los	
  
cursos	
  OCW,	
  y	
  Una	
  base	
  de	
  datos	
  de	
  OERs	
  enlazados	
  en	
  alguna	
  propiedad	
  a	
  Conceptos	
  
y	
  a	
  otros	
  OERs/OCWs	
  
– Técnica:	
  La	
  búsqueda	
  no	
  es	
  solamente	
  sobre	
  el	
  :tulo	
  de	
  un	
  Curso	
  OCW	
  o	
  un	
  recurso	
  
OER.	
  Se	
  trata	
  de	
  la	
  aplicación	
  de	
  filtros	
  para	
  seleccionar	
  OERs/OCW	
  a	
  través	
  de	
  las	
  
relaciones	
  que	
  se	
  dan	
  entre	
  recursos	
  educa:vos	
  abiertos	
  y	
  los	
  conceptos	
  (tags,	
  
categorías,	
  etc)	
  que	
  se	
  dispongan	
  localmente	
  o	
  en	
  la	
  nube	
  de	
  Linked	
  Data.	
  	
  	
  	
  Es	
  
necesario	
  implementar	
  procesos	
  para	
  extraer	
  conceptos	
  desde	
  el	
  contenido	
  que	
  ya	
  
existe	
  en	
  los	
  si4os	
  Web	
  de	
  los	
  OpenCourseWare.
Buena Práctica para abrir datos de OER / OCW

•★	
  publicar	
  recursos	
  en	
  la	
  Web	
  bajo	
  una	
  licencia	
  abierta
•★★	
  preferir	
  publicar	
  datos	
  estructurados	
  en	
  lugar	
  de	
  no	
  estructurados	
  
(ejemplo,	
  excel	
  en	
  lugar	
  de	
  imágenes)
•★★★	
  usar	
  formatos	
  no-­‐propietarios	
  (ejemplo	
  CSV	
  en	
  lugar	
  de	
  EXCEL)
•★★★★	
  usar	
  URIs	
  para	
  iden:ficar	
  cosas,	
  que	
  luego	
  la	
  gente	
  pueda	
  usar	
  
para	
  hacer	
  enlaces
•★★★★★	
  enlazar	
  los	
  datos	
  a	
  otros	
  datos	
  con	
  el	
  fin	
  de	
  describir	
  y	
  ampliar	
  
el	
  contexto

• Tim Berners-Lee suggested a 5-star deployment scheme for Linked
Open Data and Ed Summers provided a nice rendering of it. from:	
  
hip://lab.linkeddata.deri.ie/2010/star-­‐scheme-­‐by	
  	
  
TED2009 Tim Berners-Lee on the next Web

Linked	
  Data	
  es	
  Interoperabiliad	
  de	
  Data
La necesidad de comunicación e interoperación entre sistemas de información distribuidos y autónomos se ha
incrementado con el uso de la Web.

e.g. Interoperabilidad entre Repositorios OCW/OER heterogéneos y distribuidos
concept extraction
desambiguation

entity equivalence
You might like...

LUD publication

RDF
Data Store

recomendations

Other OER
OCW suggested

Sistema	
  Recomendador	
  de	
  OCW
Ejemplo	
  de	
  App	
  en	
  Capa	
  de	
  Visualización	
  de	
  Datos	
  
Enlazados

El repositorio conectado a
GeoNames

El repositorio
conectado a DBPedia

hip://oer.loxa.ec/ocwmap/
LOCWD-Mobile Architecture

Server
RESTful web service SPARQL end point

Client
Controller

ViewGroup

1

View

2

ViewGroup

View

Ways	
  for	
  user	
  interaction:	
  
touch,	
  gestures,	
  type,	
  talk,	
  
sensors,	
  and	
  so	
  on.

Listens for
events

The	
  view	
  is	
  
implemented	
  as	
  a	
  
tree	
  of	
  subclasses	
  of	
  
the	
  View	
  class

View

View

1) data binding to the model,
2) sending messages to the
controller, and
3) handling messages from the
controller

7

Model

The	
  model	
  manages	
  
the	
  behavior	
  and	
  data	
  
of	
  the	
  APP	
  domain.

event queue
The	
  controller	
  
interprets	
  the	
  user	
  
inputs,	
  translates	
  
external	
  actions	
  into	
  
events	
  that	
  are	
  enqueued	
  
and	
  then	
  passed	
  into	
  the	
  
model	
  	
  informing	
  the	
  
model	
  and/or	
  the	
  
view	
  to	
  change	
  as	
  
appropriate.

3

Content Provider

send	
  and	
  receive	
  messages

4

LOCWD

LUD

LOERD

Linked Open
Course Ware
Data

Linked
Universities
Data

Linked OER
Data

RDF	
  vocabularies

RESTful

6

SQLLite	
  to	
  manage	
  
the	
  remote	
  data	
  as	
  
local	
  data	
  in	
  Android	
  
applications
DataDroid Lib

KeyEvent

	
  HTTP	
  REST	
  

View

OCW Users:
Teachers, Students
and Self-learners

5

Web services

LOCWD

SPARQL endpoint

Triplestore
Linked OpenCourseWare
DataSet - LOCWD

URIs	
  for	
  OCW	
  things
RDF	
  for	
  describe	
  resources
Links	
  to	
  other	
  LOD	
  -­‐	
  things	
  
Screen from LOCWD-Mobil to browse and select OCW Points of Interest Mobile’s map view of
OCW repositories in the user’s proximity

Screen from OCW-Recommender mobil app
OCW and OER

raw data now!
References
•

The	
  Seman:c	
  Web,	
  Scien:fic	
  American,	
  May	
  2001,	
  Berners-­‐Lee,	
  Hendler	
  and	
  Lassila	
  W3C	
  Seman:c	
  Web	
  Ac:vity,	
  February	
  2001

•

Dave	
  Beckei's	
  RDF	
  Resource	
  Guide	
  hip://ilrt.org/discovery/rdf/resources/
Everything	
  about	
  RDF.

•

Seman:c	
  Web	
  History:	
  Nodes	
  and	
  Arcs	
  1989-­‐1999	
  -­‐	
  The	
  WWW	
  Proposal	
  and	
  RDF,	
  Dan	
  Brickley,	
  1999-­‐11-­‐12

•

BERNERS-­‐LEE,	
  Tim.	
  Linked	
  data	
  [online].	
  W3C,	
  Last	
  change	
  2009/06/18.	
  Available	
  from	
  WWW:	
  hip://www.w3.org/DesignIssues/LinkedData.html

•

Auer,	
  S.,	
  Bizer,	
  C.,	
  Kobilarov,	
  G.,	
  Lehmann,	
  J.,	
  Ives,	
  Z.:	
  Dbpedia:	
  A	
  nucleus	
  for	
  a	
  web	
  of	
  open	
  data.	
  In:	
  Aberer,	
  K.,	
  Choi,	
  K.-­‐S.,	
  Noy,	
  N.,	
  Allemang,	
  D.,	
  Lee,	
  K.-­‐I.,	
  Nixon,	
  L.J.B.,	
  Golbeck,	
  J.,	
  Mika,	
  P.,	
  Maynard,	
  
D.,	
  Mizoguchi,	
  R.,	
  Schreiber,	
  G.,	
  Cudr	
  ́e-­‐Mauroux,	
  P.	
  (eds.)	
  ASWC	
  2007	
  and	
  ISWC	
  2007.	
  LNCS,	
  vol.	
  4825,	
  pp.	
  722–735.	
  Springer,	
  Heidelberg	
  (2007)

•

Auer,	
  S.,	
  Dietzold,	
  S.,	
  Lehmann,	
  J.,	
  Hellmann,	
  S.,	
  Aumueller,	
  D.:	
  Triplify	
  -­‐	
  lightweight	
  linked	
  data	
  publica:on	
  from	
  rela:onal	
  databases.	
  In:	
  Proceedings	
  of	
  the	
  17th	
  Interna:onal	
  Conference	
  on	
  World	
  
Wide	
  Web,	
  WWW	
  2009,	
  Madrid,	
  Spain,	
  April	
  20-­‐24,	
  pp.	
  621–630	
  (2009)

•

Berners-­‐Lee,	
  T.,	
  Hendler	
  J.,	
  and	
  Lassila	
  O.	
  (2001)	
  “The	
  seman:c	
  web.	
  A	
  new	
  form	
  of	
  web	
  content	
  that	
  is	
  meaningful	
  to	
  computers	
  will	
  unleash	
  a	
  revolu:on	
  of	
  new	
  possibili:es”,	
  Scien:fic	
  American,	
  
2001.	
  

•

Berners-­‐Lee,	
  T.,	
  et	
  al.:	
  Tabulator:	
  Exploring	
  and	
  analyzing	
  linked	
  data	
  on	
  the	
  seman:c	
  web.	
  In:	
  Proceedings	
  of	
  the	
  3rd	
  Interna:onal	
  Seman:c	
  Web	
  User	
  Inter-­‐	
  ac:on	
  Workshop	
  (2006),	
  hip://
swui.seman:cweb.org/swui06/papers/Berners-­‐Lee/Berners-­‐Lee.pdf

•

Bizer,	
  C.,	
  Cyganiak,	
  R.,	
  Heath,	
  T.:	
  How	
  to	
  publish	
  linked	
  data	
  on	
  the	
  web	
  (2007),	
  hip://sites.wiwiss.fu-­‐berlin.de/suhl/bizer/pub/LinkedDataTutorial/	
  

•

Buneman,	
  P.,	
  Khanna,	
  S.,	
  Tan,	
  W.C.:	
  Why	
  and	
  where:	
  A	
  characteriza:on	
  of	
  data	
  provenance.	
  In:	
  Van	
  den	
  Bussche,	
  J.,	
  Vianu,	
  V.	
  (eds.)	
  ICDT	
  2001.	
  LNCS,	
  vol.	
  1973,	
  Springer,	
  Heidelberg	
  (2000)

•

Erling,	
  O.,	
  Mikhailov,	
  I.:	
  RDF	
  support	
  in	
  the	
  Virtuoso	
  DBMS.	
  volume	
  P-­‐113	
  of	
  GI-­‐Edi:on	
  -­‐	
  Lecture	
  Notes	
  in	
  Informa:cs	
  (LNI),	
  Bonner	
  Ko	
  ̈llen	
  Verlag	
  (September	
  2007)	
  (ISSN	
  1617-­‐5468)	
  hip://
esw.w3.org/topic/SweoIG/TaskForces/CommunityProjects/Linking	
  OpenData	
  DBpedia:	
  A	
  Nucleus	
  for	
  a	
  Web	
  of	
  Open	
  Data

•

Ghawi,	
  R.,	
  Cullot,	
  N.:	
  Database-­‐to-­‐ontology	
  mapping	
  genera:on	
  for	
  seman:c	
  interoperability.	
  In:	
  Third	
  Interna:onal	
  Workshop	
  on	
  Database	
  Interoperability	
  (InterDB	
  2007),	
  held	
  in	
  conjunc:on	
  with	
  
VLDB	
  2007	
  (2007)	
  

•

Gruber,	
  T.	
  R.	
  (1993).	
  "A	
  Transla:on	
  Approach	
  to	
  Portable	
  Ontologies".	
  Knowledge	
  Acquisi:on,	
  5(2):	
  199-­‐220.	
  hip://tomgruber.org/wri:ng/ontolingua-­‐kaj-­‐1993.htm	
  

•

Hewlei	
  (2005).	
  Open	
  Educa:onal	
  Resources	
  Ini:a:ve	
  Overview.	
  William	
  and	
  Flora	
  Hewlei	
  Founda:on.	
  Recuperado	
  Dec	
  15,	
  2009	
  Desde:	
  hip://www.hewlei.org/Programs/Educa:on/OER/
Publica:ons/oeroverview.htm

•

Piedra,	
  N.	
  Chicaiza,	
  J.	
  López,	
  J.	
  MarSnez,	
  O.	
  Tovar,	
  M.	
  (2010)	
  'An	
  approach	
  for	
  descrip:on	
  of	
  Open	
  Educa:onal	
  Resources	
  based	
  on	
  seman:c	
  technologies',	
  Educa:on	
  Engineering	
  (EDUCON),	
  2010	
  
IEEE,	
  2010,	
  pp.	
  1111	
  -­‐1119	
  hip://ieeexplore.ieee.org/xpl/mostRecentIssue.jsp?punumber=5487606

•

W3C	
  (2009a).	
  Resource	
  Descrip:on	
  Framework	
  (RDF).	
  W3C,	
  Seman:c	
  Web	
  -­‐	
  RDF	
  Working	
  Group.	
  Recuperado	
  Nov,	
  2009	
  desde:	
  hip://www.w3.org/RDF/	
  

•

W3C(2009b).	
  SPARQL	
  Query	
  Language	
  for	
  RDF.	
  W3C.	
  Recuperado	
  Dec,	
  2009	
  desde:	
  hip://www.w3.org/TR/rdf-­‐sparql-­‐query/
Thank	
  you	
  for	
  your	
  
Aien:on
@nopiedra

this work is licensed under a Creative Commons Attribution 3.0 License http://creativecommons.org/licenses/by/3.0/ec/

Más contenido relacionado

La actualidad más candente (19)

Comunicación interactiva
Comunicación interactivaComunicación interactiva
Comunicación interactiva
 
A1 u1gb tabla comparativa1
A1 u1gb tabla comparativa1A1 u1gb tabla comparativa1
A1 u1gb tabla comparativa1
 
Multimedia en la Web
Multimedia en la WebMultimedia en la Web
Multimedia en la Web
 
Mauricio balseca
Mauricio balsecaMauricio balseca
Mauricio balseca
 
Tarea UNIDAD 4
Tarea UNIDAD 4Tarea UNIDAD 4
Tarea UNIDAD 4
 
Presentacion Web
Presentacion WebPresentacion Web
Presentacion Web
 
Internet
Internet Internet
Internet
 
Construyendo la web semantica
Construyendo la web semanticaConstruyendo la web semantica
Construyendo la web semantica
 
Investigaciòn sobre la web 3.0
Investigaciòn sobre la web 3.0Investigaciòn sobre la web 3.0
Investigaciòn sobre la web 3.0
 
Investigaciòn sobre la web 3.0.pdf
Investigaciòn sobre la web 3.0.pdfInvestigaciòn sobre la web 3.0.pdf
Investigaciòn sobre la web 3.0.pdf
 
La web educativa
La web educativaLa web educativa
La web educativa
 
Trabajo práctico nº3 internet
Trabajo práctico nº3 internetTrabajo práctico nº3 internet
Trabajo práctico nº3 internet
 
WEB SEMANTICA
WEB SEMANTICAWEB SEMANTICA
WEB SEMANTICA
 
creative commons y datos en la web
creative commons y datos en la webcreative commons y datos en la web
creative commons y datos en la web
 
Tarea 3
Tarea 3Tarea 3
Tarea 3
 
software libre
software libresoftware libre
software libre
 
ExpoMarcelo_Veronica
ExpoMarcelo_VeronicaExpoMarcelo_Veronica
ExpoMarcelo_Veronica
 
Internet y motores de búsqueda
Internet y motores de búsquedaInternet y motores de búsqueda
Internet y motores de búsqueda
 
Web Semántica
Web SemánticaWeb Semántica
Web Semántica
 

Similar a Chiclayo 2012

Similar a Chiclayo 2012 (20)

Suite de productos SemanticWebBuilder
Suite de productos SemanticWebBuilder Suite de productos SemanticWebBuilder
Suite de productos SemanticWebBuilder
 
SWB Suite
SWB SuiteSWB Suite
SWB Suite
 
Web 3.0
Web 3.0Web 3.0
Web 3.0
 
Introducción a la programación de la Web Semántica
Introducción a la programación de la Web Semántica Introducción a la programación de la Web Semántica
Introducción a la programación de la Web Semántica
 
Diapo tics 1234
Diapo tics 1234Diapo tics 1234
Diapo tics 1234
 
Webmaster20
Webmaster20Webmaster20
Webmaster20
 
Web Semantica
Web SemanticaWeb Semantica
Web Semantica
 
Herramientas web 3.0
Herramientas web 3.0Herramientas web 3.0
Herramientas web 3.0
 
Evolución de la web
Evolución de la webEvolución de la web
Evolución de la web
 
WEB 3.0 o Semántica
WEB 3.0 o SemánticaWEB 3.0 o Semántica
WEB 3.0 o Semántica
 
Tarea mapa inform
Tarea mapa informTarea mapa inform
Tarea mapa inform
 
Tarea mapa inform
Tarea mapa informTarea mapa inform
Tarea mapa inform
 
web 3.0
web 3.0web 3.0
web 3.0
 
Evolucion web(1)
Evolucion web(1)Evolucion web(1)
Evolucion web(1)
 
Evolucion web
Evolucion webEvolucion web
Evolucion web
 
Web 3.0 kelvin granda jason mejia .
Web 3.0 kelvin granda jason mejia .Web 3.0 kelvin granda jason mejia .
Web 3.0 kelvin granda jason mejia .
 
Web semántica y visiones de la web 3.0
Web semántica y visiones de la web 3.0 Web semántica y visiones de la web 3.0
Web semántica y visiones de la web 3.0
 
Web 3.0
Web 3.0Web 3.0
Web 3.0
 
Linked data
Linked dataLinked data
Linked data
 
Relación de una Web Semántica CIS-UNL
Relación de una Web Semántica CIS-UNLRelación de una Web Semántica CIS-UNL
Relación de una Web Semántica CIS-UNL
 

Chiclayo 2012

  • 1. Semantic Web: U Datos Heterogén Web SEMANTIC)WEB) Usando)Linked)Data)para)conectar)Datos) Heterogéneos)y)Distribuidos)a)través)de)la)Web ) Nelson Piedra (UTPL, nopiedra@utpl.edu.ec)! ! Edmundo Tovar (UPM etovar@fi.upm.es )! Jorge López UTPL, Janneth Chicaiza UTPL, Oscar Martínez UMH! ! XX"Congreso"Nacional"de"Estudiantes"de"Ingeniería"de"Sistemas"y" Computación,"2012)) Universidad)Santo)Toribio)de)Mogrovejo)Chiclayo,)Perú) this work is licensed under a Creative Commons Atribución-NoComercial-SinDerivadas 3.0 Ecuador #CONEISC #OpenEducationalResources #OpenCourseWare #linkeddata #ocw #oer #SemWeb #SemanticWeb #LOCWD #LOD
  • 2. Vint Cerf and Sir Tim Berners-Lee Texto By Adolfo Plasencia http://www.flickr.com/photos/adolfoplasencia/3529884072/
  • 4. INTERNET Sus orígenes se remontan a la década de 1960, dentro de ARPA (hoy DARPA) se crea el proyecto ARPANet (Advanced Research Projects Agency Network). En 1969, se estableció la primera conexión de computadoras, conocida como ARPANET, entre tres universidades en California y una en Utah, Estados Unidos. ... (años de inspiración y transpiración que se pueden ver en http://es.wikipedia.org/wiki/Internet) En el CERN de Ginebra, un grupo de físicos encabezado por Tim Berners-Lee creó el lenguaje HTML, basado en el SGML. En 1990 el mismo equipo construyó el primer cliente Web, llamado WorldWideWeb (WWW), y el primer servidor we En 1990 el CERN crea el código HTML y con él el primer cliente World Wide Web. En la imagen el código HTML con sintaxis coloreada.
  • 7. en la próxima Web, conectaremos DATA
  • 8. La Web está en evolución The Web principle of designed The Web was designed as an information space, with the goal that it should be useful not only for human-human communication, but also that machines would be able to participate and help. [Tim Berners-Lee]
  • 9. Estado Actual de la Web (1) Contenido Almacenado en Silos de Información Diversas Plataformas y Sistemas (CMS, APIs) almacenan Información. Millones de datos contenidos en Millones de Documentos Web, embebidos en CMS heterogéneos, de difícil acceso y procesamiento semántico. (2) Descubrimiento y Reusabilidad Limitadas No es posible reusar datos fuera de los CMS Muy pocos datos de las páginas Web están disponibles en formatos procesables por agentes máquina
  • 10. la Web actual es una Web de Documentos destinada para interpretación y consumo humano... de humanos para humanos Uno de los mayores obstáculos de la Web actual es que la mayoría de la Información en la Web está diseñada para consumo humano, incluso si el contenido está generado a partir de bases de datos estructuradas. El contenido está estructurado en un formato que no es entendible por las máquinas. ¿Y las máquinas? su acceso es restringido...
  • 11. Web of Documents from human to human Los links expresan relaciones entre documentos escritos en HTML, conectan páginas, pero no conectan datos/significados/información.
  • 13. Web of Documents from human to human Los links expresan relaciones entre documentos escritos en HTML, conectan páginas, pero no conectan datos/significados/información.
  • 14. la solución... ¿(1) máquinas inteligentes o (2)datos inteligentes ? dejando de lado el problema de la Inteligencia Artificial de entrenar a las máquinas para que se comporten como seres humanos, el enfoque de Web Semántica es desarrollar lenguajes para expresar la información en un formato procesable por las máquinas [TBL] A.I. Information Silos RDF data
  • 15. Tim Berners-Lee on the Next Web (TED, 2009) Wordle of the transcript of Sir Tim Berners-Lee TED talk, the Next Web. License: Some rights reserved by Chris P Jobling http://www.flickr.com/photos/cpjobling/5034035908/
  • 16. Web of Data Discovery, Access, and Usages of Resources in the Web
  • 17. Web of Data, Conectar cualquier cosa en la Web, enlazar DATOS más que Documentos Linked Data es (a) sobre usar la Web para conectar datos relacionados que antes no estaban enlazados, o (b) usar la Web para disminuir las barreras para enlazar datos que actualmente están enlazados por otros métodos. Linked Data (c) es una buena práctica para exponer, compartir y conectar piezas de datos, información, y conocimiento en la Web semántica, usando URIs para identificar las cosas y RDF para describir y enlazar semánticamente las cosas.
  • 18. Linked-Data Principles, back to TBL note from ’98 1.Usar URIs para identificar globalmente una cosa de interés en la Web (OCW, syllabus, test, autores, universidad, país, idioma, ...) 2.Usar HTTP para conectar y visualizar los recursos. 3.Describir los recursos a través del estándar; RDF*, y permitir la consulta de datos a través de SPARQL 4.Incluir links a otros URIs de manera que se posible descubrir otras cosas.
  • 19. COMPARACIÓN La Web Semántica no solo se trata de poner datos en la Web. Es sobre enlazar cosas, de manera que las personas o las máquinas puedan explorar la Web de Datos. Features The Web of Document The Web of Data Analogy a global filesystem a global database Designed for human consumption machines first, humans later Primary objects documents things (or descriptions of things) Links between documents (or subparts of) things Degree of structure in objects fairly low, disconnected data high Semantics of content and links implicit Implicit explicit adapted from: Tom Heath, Talis, 2009
  • 20. The Linking Open Data cloud diagram, evolution Next images sequence shows datasets that have been published in Linked Data format, by contributors to the Linking Open Data community project and other individuals and organisations. It is based on metadata collected and curated by contributors to the CKAN directory. Last updated: 2010-09-22. “Linking Open Data cloud diagram, by Richard Cyganiak and Anja Jentzsch. http://lod-cloud.net/”
  • 21. 20071008 “Linking Open Data cloud diagram, by Richard Cyganiak and Anja Jentzsch. http://lod-cloud.net/” This work is available under a CC-BY-SA license. 25 datasets http://richard.cyganiak.de/2007/10/lod/loddatasets_2007-10-08.png
  • 22. 20071107 “Linking Open Data cloud diagram, by Richard Cyganiak and Anja Jentzsch. http://lod-cloud.net/” This work is available under a CC-BY-SA license. 28 datasets http://richard.cyganiak.de/2007/10/lod/loddatasets_2007-11-07.png
  • 23. 20071110 “Linking Open Data cloud diagram, by Richard Cyganiak and Anja Jentzsch. http://lod-cloud.net/” This work is available under a CC-BY-SA license. 28 datasets http://richard.cyganiak.de/2007/10/lod/loddatasets_2007-11-10.png
  • 24. 20080228 “Linking Open Data cloud diagram, by Richard Cyganiak and Anja Jentzsch. http://lod-cloud.net/” This work is available under a CC-BY-SA license. 32 datasets http://richard.cyganiak.de/2007/10/lod/loddatasets_2008-02-28.png
  • 25. 20080331 “Linking Open Data cloud diagram, by Richard Cyganiak and Anja Jentzsch. http://lod-cloud.net/” This work is available under a CC-BY-SA license. 34 datasets http://richard.cyganiak.de/2007/10/lod/loddatasets_2008-03-31.png
  • 26. 20080919 “Linking Open Data cloud diagram, by Richard Cyganiak and Anja Jentzsch. http://lod-cloud.net/” This work is available under a CC-BY-SA license. 45 datasets http://richard.cyganiak.de/2007/10/lod/loddatasets_2008-09-18.png
  • 27. 20090305 “Linking Open Data cloud diagram, by Richard Cyganiak and Anja Jentzsch. http://lod-cloud.net/” This work is available under a CC-BY-SA license. 89 datasets http://richard.cyganiak.de/2007/10/lod/loddatasets_2009-03-05.png
  • 28. 20090327 “Linking Open Data cloud diagram, by Richard Cyganiak and Anja Jentzsch. http://lod-cloud.net/” This work is available under a CC-BY-SA license. 93 datasets http://richard.cyganiak.de/2007/10/lod/loddatasets_2009-03-27.png
  • 29. 20090714 “Linking Open Data cloud diagram, by Richard Cyganiak and Anja Jentzsch. http://lod-cloud.net/” This work is available under a CC-BY-SA license. 95 datasets http://richard.cyganiak.de/2007/10/lod/loddatasets_2009-07-14.png
  • 30. 20100922 “Linking Open Data cloud diagram, by Richard Cyganiak and Anja Jentzsch. http://lod-cloud.net/” This work is available under a CC-BY-SA license. 203 datasets http://richard.cyganiak.de/2007/10/lod/loddatasets_2010-09-22_colored.png
  • 31. OPEN: "A piece of knowledge is open if you are free to use, reuse, and redistribute it" http://www.opendefinition.org/okd Our OER semantic vision: Educational Content + Open Licenses + Data in Machine Format Open Educational Content and Open Education Practices represent the next stage of human knowledge organization
  • 32. EJEMPLO: DATA en la página web de un OCW de UPM OCW   University knowledge  area Title Author(s) Department syllabus bibliography year ects  credits :me  autoself descrip:on
  • 33. ‘Ontologies and Semantic Web’ subject has  a author-creator predicate whose  name  is Asunción Gómez Pérez object
  • 35. example for locwd dataset Subject Predicate Object locwd:opencourseware dc:creator foaf:Person locwd:opencourseware dc:title xsd:string locwd:opencourseware dc:description xsd:string locwd:opencourseware dc:subject skos:Concept, xsd:string locwd:biblio rdfs:subclassOf bibo:document locwd:biblio dcterms:isPartOf, bibo:DocumentPart, xsd:string dc:title locwd:ocwRepository dc:creator foaf:Organization
  • 36. Linked OpenCourseWare Data connected with the LinkedOpenData Cloud ! ! WHY!OCW/OER!+!LINKED!DATA?! ! IN#ORDER#TO#MOVE#FORWARD#AND#REALIZE# THE#PROMISE#OF#LINKED#DATA#FOR#OCW/OER# REPOSITORIES,#UNIVERSITIES# # 42
  • 37. General'Framework' The framework used is divided into five phases: •  (1) Identify and select heterogeneous data sources to determine the scope of the content. Of the information sources for evaluation, we selected OCW repositories, information stored in structured databases, Web page content, information accessible via RSS feeds, RDF available, etc.; •  (2) Model vocabularies; •  (3) Generate RDF data, •  (4) Publish linked data, and •  (5) Consume and display linked data. 43
  • 38.
  • 39. Why$publish$Linked$OCW$Data?$ •  Because$LinkedData$holds$the$poten9al$to$move$our$OCW$collec9ons$ out$of$their$silos$ •  Open$the$data$and$content$silos,$to$leverage$the$knowledge$capital$ represented$by$our$OCW$repositories$ •  To$enrich$our$informa9on$landscape,$to$mprove$visibility$ •  To$improve$ease$of$discovery$open$academic$resources$ •  To$improve$ease$of$consump9on$and$reuse$of$OCW$ •  To$reduce$redundancy$in$searched$of$OCW$ •  Promo9ng$innova9on$and$Added$Value$to$Open$$
  • 40. Enrichment Linked OCW Data Repository Monitoring for universities, organizations and courses LOCWD Triplestore Agent to include new Universities Organizations RDF data A new OCW organization OCW Directories Listener URI links A new OCW Agent to include new Legislation from universities stream of html content Linked  Universities  DataSet Map the terms mined to terms already in the LOD Cloud Connect University Data with Other RDF Repositories RDF  vocabularies URIs for universities things RDF for describe Universities resources Links to other Universities - things OCW Repositories Listener LUD Linked Universities Data Extraction of Universities data Legend Terms mined as RDF tripletes RDF triplestore Content extraction from HTML pages Extraction of content from each university page (CC license raw content stream of extracted content verified ) Use of crawling and scraping techniques Temporary  Repository  for   store  of    html  content   extracted   ocw data pattern Extraction of data patterns (Classification, and applying of clustering SNA techniques ) Publish the mined info as linked data and create RDF links to resources in the LOD cloud non-reliable data or erroneous data data corrected Relational database Software agent Get information from RSS subscription Cleasing Data (detecting and correcting corrupt or inaccurate data Get RDF content, if available Apply scraping technique Get embebed content in HTML pages
  • 41. Estrategia de Trabajo • Fase 1. Integrar repositorios heterogéneos de OCW. (Asegurar actualización de datos (ejemplo datos no entregados), Interoperabilidad) – Presencia de OCW-UNIVERSIA en el Cloud de Linked Data – Análisis y Limpieza de datos • Fase 2. Describir Semánticamente cada OCW. – Establecer el vocabulario Linked Universia Data, a través del que se integren los recursos OCW/OER con otros DataStores en el mundo – Identificar consultas de interés
  • 42. Fuentes de datos OCW – Interna: • UNIVERSIA, Excel con los siguientes datos: (Titulo del Curso, URL del Curso; Texto de Autores - no estaban separados por “;”-) – Externa: • WEB, Visita manual a cada sitio OCW, extracción de datos adicionales, Actualización de cursos OCW que no constaban en el EXCEL, nuestra fuente primaria. • La Nube de Datos de LinkedData: DBPedia, GeoNames, Vocabularios RDF. Con pocos atributos, la posibilidad de desambiguar información es limitada.
  • 43. university name University university oficial web site OCW repository name OCW repository state of repository Platform country URL OCW repository RSS link OCW001 Course title Knowledge Area Language Creation date Language Tag list Tag Meaning Course Description OERs tag Licensed FirstName Author LastName Gender OER link OER Subject OER type OER language university organization unit DBLP
  • 44. Vocabularios • Dublin Core, dc: http://purl.org/dc/elements/1.1/ • dcterms: http://purl.org/dc/terms/ • Person, foaf: http://xmlns.com/foaf/0.1/ • geo: http://www.w3.org/2003/01/geo/wgs84_pos# • sioc: http://rdfs.org/sioc/ns# • tag: http://twitlogic.fortytwo.net/hashtag/ • rdf: http://www.w3.org/1999/02/22-rdf-syntax-ns# • rdfs:http://www.w3.org/2000/01/rdf-schema# • owl: http://www.w3.org/2002/07/owl# • Concept, skos: http://www.w3.org/2004/02/skos/core# • Bibliographic Ontology, bibo: http://purl.org/ontology/bibo/ • fti: http://franz.com/ns/allegrograph/2.2/textindex/ • AIISO: http://vocab.org/aiiso
  • 45.
  • 46. Consultas  posibles  con  datos   vinculados • 1.  Consultar  Cursos  OCW,  relacionados  con  un  tema  determinado  y  que  se  devuelvan   ordenados  cronológicamente  (primero  los  más  recientes) – Datos  de  Entrada:  término  a  consultar,  ejemplo:  “Ontologies”,  “Web  2.0” – Datos  necesarios:  Cursos  OCW,  fecha  de  creación  del  curso,  fuente  de  conceptos   (temas,  categorías,  tags,  …)  y  la  relación  éntre  estos  y  cada  curso  OCW. – Técnica:  Filtrar  cursos  OCW  por  concepto,  ordenar  los  resultados • 2.  Consultar  docentes-­‐autores  de  cursos  OCW,  en  temas  específicos,  que  son     reconocidos  por  su  relevancia  cien@fica/académica  y/o  por  la  relevancia  de  sus  cursos   OCW  (medido  en  términos  de  visitas  al  OCW) – Datos  de  Entrada:  término  a  consultar,  ejemplo:  “eLearning”,  “Seman:c  Web” – Datos  necesarios:  Datos  de  Autores  de  OCW,  dato  de  impacto  cienSfico  (se  puede   consultar  el  indice_H  de  cada  autor,  haciendo  enlace  con  ISIWeb/DBLP),  dato  con  la   can:dad  de  visitas  y  calificación  social  del  curso  OCW    (este  dato  se  puede  recoger  a   través  de  la  herramienta  de  búsqueda) – Técnica:  Selección  de  autores  de  cursos  OCW  que  :enen  relación  con  el  concepto  a   consultar,    comparación  de  Autores  de  OCW  según  “índice  h”  (u  otro)  y  dato  sobre  uso   de  sus  curso  OCW  (o  calificación  social  del  OCW).
  • 47. Consultas  posibles  con  datos   vinculados  (II) • 3.  Consultar  Repositorios  OCW  según  información  geográfica  de  entrada  o  información   de  caracterísGcas  del  repositorio  buscado – Datos  de  Entrada:  (a)  Información  geográfica  (país,  longitud,  la:tud,  ciudad,  …)  (b)   Tipo  de  Plataforma,  idioma,  Licencia  CC  de  repositorio,  can:dad  de  cursos,   Universidad  asociada,  etc. – Datos  necesarios:  Datos  del  repositorio  OCW,  y  link  a  fuentes  de  datos  RDF  externos:   DBPEDIA,  GEONAMES,  FREEBASE,  …. – Técnica:  enlazar  las  propiedades  del  repositorio  con  Fuentes  de  datos  RDF  externas. • 4.  Consulta  de  Información  cien@fica  y  Académica  de  un  Autor  de  cursos  OCW  en   fuentes  externas  a  la  base  de  datos  (integración  de  autores  con  otras  fuentes  de  datos) – Datos  de  Entrada:  Datos  de  Persona – Datos  necesarios:  Datos  de  Autores  de  OCW,  dato  de  impacto  cienSfico  (se  puede   consultar  el  indice_H  de  cada  autor,  haciendo  enlace  con  ISIWeb/DBLP),  dato  con  la   can:dad  de  visitas  y  calificación  social  del  curso  OCW    (este  dato  se  puede  recoger  a   través  de  la  herramienta  de  búsqueda) – Técnica:  En  función  de  los  datos  de  entrada  para  la  consulta,  proponer  los  posibles   autores  de  cursos  OCW  que  sa:sfacen  tales  condiciones  de  búsqueda;  a  con:nuación   consultar  a  través  de  datos  de  enlace  hacia  las  fuentes  de  datos  externas  en  los  que  el   autor-­‐OCW  pueda  tener  información  que  podamos  extraer;  obtener  datos  potenciales   del  autor,  aplicar  proceso  de  conciliación/desambiguación;  mostrar  resultados.
  • 48. Consultas  FUTURAS.  El  mecanismo   existe,  pero  no  hay  datos 5.  Buscar  en  el  contenido  de  Cursos  OCW:  por  ciertos  OERs  o  ciertos  Conceptos  que  no   constan  en  el  Gtulo  (Ejemplo:  en  Universia  existe  un  curso  de  Web  SemánGca  dictado   por  UPM,  en  el  syllabus  de  este  curso  hay  capítulos  de  dos  temas:  RDF  y  SPARQL;  si  se   consulta  en  el  buscador  de  OCW-­‐Universia  por  algo  relacionado  a  RDF/SPARQL/ LinkedData  no  hay  resultados;  esto  se  puede  solucionar  con  LinkedData) – Datos  de  Entrada:  Buscar  por  el  Stulo  de  un  OER,  o  por  un  concepto,  etc – Datos  necesarios:  Datos  de  cursos  OCW,    Datos  de  Conceptos  que  se  enlacen  a  los   cursos  OCW,  y  Una  base  de  datos  de  OERs  enlazados  en  alguna  propiedad  a  Conceptos   y  a  otros  OERs/OCWs   – Técnica:  La  búsqueda  no  es  solamente  sobre  el  :tulo  de  un  Curso  OCW  o  un  recurso   OER.  Se  trata  de  la  aplicación  de  filtros  para  seleccionar  OERs/OCW  a  través  de  las   relaciones  que  se  dan  entre  recursos  educa:vos  abiertos  y  los  conceptos  (tags,   categorías,  etc)  que  se  dispongan  localmente  o  en  la  nube  de  Linked  Data.        Es   necesario  implementar  procesos  para  extraer  conceptos  desde  el  contenido  que  ya   existe  en  los  si4os  Web  de  los  OpenCourseWare.
  • 49. Buena Práctica para abrir datos de OER / OCW •★  publicar  recursos  en  la  Web  bajo  una  licencia  abierta •★★  preferir  publicar  datos  estructurados  en  lugar  de  no  estructurados   (ejemplo,  excel  en  lugar  de  imágenes) •★★★  usar  formatos  no-­‐propietarios  (ejemplo  CSV  en  lugar  de  EXCEL) •★★★★  usar  URIs  para  iden:ficar  cosas,  que  luego  la  gente  pueda  usar   para  hacer  enlaces •★★★★★  enlazar  los  datos  a  otros  datos  con  el  fin  de  describir  y  ampliar   el  contexto • Tim Berners-Lee suggested a 5-star deployment scheme for Linked Open Data and Ed Summers provided a nice rendering of it. from:   hip://lab.linkeddata.deri.ie/2010/star-­‐scheme-­‐by    
  • 50. TED2009 Tim Berners-Lee on the next Web Linked  Data  es  Interoperabiliad  de  Data La necesidad de comunicación e interoperación entre sistemas de información distribuidos y autónomos se ha incrementado con el uso de la Web. e.g. Interoperabilidad entre Repositorios OCW/OER heterogéneos y distribuidos
  • 51. concept extraction desambiguation entity equivalence You might like... LUD publication RDF Data Store recomendations Other OER OCW suggested Sistema  Recomendador  de  OCW
  • 52. Ejemplo  de  App  en  Capa  de  Visualización  de  Datos   Enlazados El repositorio conectado a GeoNames El repositorio conectado a DBPedia hip://oer.loxa.ec/ocwmap/
  • 53. LOCWD-Mobile Architecture Server RESTful web service SPARQL end point Client Controller ViewGroup 1 View 2 ViewGroup View Ways  for  user  interaction:   touch,  gestures,  type,  talk,   sensors,  and  so  on. Listens for events The  view  is   implemented  as  a   tree  of  subclasses  of   the  View  class View View 1) data binding to the model, 2) sending messages to the controller, and 3) handling messages from the controller 7 Model The  model  manages   the  behavior  and  data   of  the  APP  domain. event queue The  controller   interprets  the  user   inputs,  translates   external  actions  into   events  that  are  enqueued   and  then  passed  into  the   model    informing  the   model  and/or  the   view  to  change  as   appropriate. 3 Content Provider send  and  receive  messages 4 LOCWD LUD LOERD Linked Open Course Ware Data Linked Universities Data Linked OER Data RDF  vocabularies RESTful 6 SQLLite  to  manage   the  remote  data  as   local  data  in  Android   applications DataDroid Lib KeyEvent  HTTP  REST   View OCW Users: Teachers, Students and Self-learners 5 Web services LOCWD SPARQL endpoint Triplestore Linked OpenCourseWare DataSet - LOCWD URIs  for  OCW  things RDF  for  describe  resources Links  to  other  LOD  -­‐  things  
  • 54. Screen from LOCWD-Mobil to browse and select OCW Points of Interest Mobile’s map view of OCW repositories in the user’s proximity Screen from OCW-Recommender mobil app
  • 55. OCW and OER raw data now!
  • 56. References • The  Seman:c  Web,  Scien:fic  American,  May  2001,  Berners-­‐Lee,  Hendler  and  Lassila  W3C  Seman:c  Web  Ac:vity,  February  2001 • Dave  Beckei's  RDF  Resource  Guide  hip://ilrt.org/discovery/rdf/resources/ Everything  about  RDF. • Seman:c  Web  History:  Nodes  and  Arcs  1989-­‐1999  -­‐  The  WWW  Proposal  and  RDF,  Dan  Brickley,  1999-­‐11-­‐12 • BERNERS-­‐LEE,  Tim.  Linked  data  [online].  W3C,  Last  change  2009/06/18.  Available  from  WWW:  hip://www.w3.org/DesignIssues/LinkedData.html • Auer,  S.,  Bizer,  C.,  Kobilarov,  G.,  Lehmann,  J.,  Ives,  Z.:  Dbpedia:  A  nucleus  for  a  web  of  open  data.  In:  Aberer,  K.,  Choi,  K.-­‐S.,  Noy,  N.,  Allemang,  D.,  Lee,  K.-­‐I.,  Nixon,  L.J.B.,  Golbeck,  J.,  Mika,  P.,  Maynard,   D.,  Mizoguchi,  R.,  Schreiber,  G.,  Cudr  ́e-­‐Mauroux,  P.  (eds.)  ASWC  2007  and  ISWC  2007.  LNCS,  vol.  4825,  pp.  722–735.  Springer,  Heidelberg  (2007) • Auer,  S.,  Dietzold,  S.,  Lehmann,  J.,  Hellmann,  S.,  Aumueller,  D.:  Triplify  -­‐  lightweight  linked  data  publica:on  from  rela:onal  databases.  In:  Proceedings  of  the  17th  Interna:onal  Conference  on  World   Wide  Web,  WWW  2009,  Madrid,  Spain,  April  20-­‐24,  pp.  621–630  (2009) • Berners-­‐Lee,  T.,  Hendler  J.,  and  Lassila  O.  (2001)  “The  seman:c  web.  A  new  form  of  web  content  that  is  meaningful  to  computers  will  unleash  a  revolu:on  of  new  possibili:es”,  Scien:fic  American,   2001.   • Berners-­‐Lee,  T.,  et  al.:  Tabulator:  Exploring  and  analyzing  linked  data  on  the  seman:c  web.  In:  Proceedings  of  the  3rd  Interna:onal  Seman:c  Web  User  Inter-­‐  ac:on  Workshop  (2006),  hip:// swui.seman:cweb.org/swui06/papers/Berners-­‐Lee/Berners-­‐Lee.pdf • Bizer,  C.,  Cyganiak,  R.,  Heath,  T.:  How  to  publish  linked  data  on  the  web  (2007),  hip://sites.wiwiss.fu-­‐berlin.de/suhl/bizer/pub/LinkedDataTutorial/   • Buneman,  P.,  Khanna,  S.,  Tan,  W.C.:  Why  and  where:  A  characteriza:on  of  data  provenance.  In:  Van  den  Bussche,  J.,  Vianu,  V.  (eds.)  ICDT  2001.  LNCS,  vol.  1973,  Springer,  Heidelberg  (2000) • Erling,  O.,  Mikhailov,  I.:  RDF  support  in  the  Virtuoso  DBMS.  volume  P-­‐113  of  GI-­‐Edi:on  -­‐  Lecture  Notes  in  Informa:cs  (LNI),  Bonner  Ko  ̈llen  Verlag  (September  2007)  (ISSN  1617-­‐5468)  hip:// esw.w3.org/topic/SweoIG/TaskForces/CommunityProjects/Linking  OpenData  DBpedia:  A  Nucleus  for  a  Web  of  Open  Data • Ghawi,  R.,  Cullot,  N.:  Database-­‐to-­‐ontology  mapping  genera:on  for  seman:c  interoperability.  In:  Third  Interna:onal  Workshop  on  Database  Interoperability  (InterDB  2007),  held  in  conjunc:on  with   VLDB  2007  (2007)   • Gruber,  T.  R.  (1993).  "A  Transla:on  Approach  to  Portable  Ontologies".  Knowledge  Acquisi:on,  5(2):  199-­‐220.  hip://tomgruber.org/wri:ng/ontolingua-­‐kaj-­‐1993.htm   • Hewlei  (2005).  Open  Educa:onal  Resources  Ini:a:ve  Overview.  William  and  Flora  Hewlei  Founda:on.  Recuperado  Dec  15,  2009  Desde:  hip://www.hewlei.org/Programs/Educa:on/OER/ Publica:ons/oeroverview.htm • Piedra,  N.  Chicaiza,  J.  López,  J.  MarSnez,  O.  Tovar,  M.  (2010)  'An  approach  for  descrip:on  of  Open  Educa:onal  Resources  based  on  seman:c  technologies',  Educa:on  Engineering  (EDUCON),  2010   IEEE,  2010,  pp.  1111  -­‐1119  hip://ieeexplore.ieee.org/xpl/mostRecentIssue.jsp?punumber=5487606 • W3C  (2009a).  Resource  Descrip:on  Framework  (RDF).  W3C,  Seman:c  Web  -­‐  RDF  Working  Group.  Recuperado  Nov,  2009  desde:  hip://www.w3.org/RDF/   • W3C(2009b).  SPARQL  Query  Language  for  RDF.  W3C.  Recuperado  Dec,  2009  desde:  hip://www.w3.org/TR/rdf-­‐sparql-­‐query/
  • 57. Thank  you  for  your   Aien:on @nopiedra this work is licensed under a Creative Commons Attribution 3.0 License http://creativecommons.org/licenses/by/3.0/ec/