Datos vinculados bibliotecarios la web 3.0 en las bibliotecas
1. Datos abiertos y
datos vinculados:
las bibliotecas en la
era de la Web
Semántica
Dr. Wilmer Arturo Moyano
Grimaldo
Biblioteca Nacional de
Colombia
2. De que hablaremos…
• Lenguajes y transmisión de conocimiento
• Recuperación de información en la Web
• La Web:
• Usuarios en la Web y su comportamiento
• y sus versiones… 1.0 - 2.0 - 3.0…
• Web semántica (web de datos)
• Datos vinculados
• Datos abiertos
• Datos bibliográficos vinculados
4. ¿Cómo se ve en la Web?
Productor de
conocimiento
Consumidor de
conocimiento
• Grandes organizaciones:
₋ Producen y consumen (enfocadas a su línea de
trabajo)
• Usuario de la Web
₋ Produce y consume (para cualquier cosa)
5. Usuario consumidor en
la Web
Encontrar
Identificar
Seleccionar
Adquirir
Los servicios Web más exitosos son aquellos que permiten agregar información que nos
interesa: Google, Facebook, entre otros
6. La representación y
recuperación de
información en Internet
El Problema de la organización,
gestión y recuperación de
información:
-
-
Publicación de contenidos
Acceso a la información y
cambio constante de la
información
Integración de recursos
distribuidos
Categorización y valoración
de contenidos
Confianza o fiabilidad de los
contenidos.
SOLUCIÓN tradicional:
8. ¿Realmente son
soluciones?
1. Ambigüedad en el significado de las cadenas
de búsqueda
2. Multitud de resultados sin orden lógico
(Google)
3. Imposible trasladar la relevancia subjetiva del
usuario (incapacidad de entender el
significado que el usuario tiene en mente)
4. No garantía de fiabilidad
5. Falta ayuda para la formulación de las
búsquedas
10. Usuario productor en la
Web
• Necesita visibilidad de sus
contenidos/productos/servicios, y debería:
₋ Reutilizar información de otros para potenciar
sus servicios
₋ Compartir información de la manera más sencilla
posible, aunque no siempre estandarizada
₋ Enlazar su información con posibles socios
estratégicos (redes de servicios)
₋ Diversificar sus servicios y contenidos
11. La evolución de la Web
• Web 1.0: Web como
portal de información
– Información exclusiva
de pocos
– Directorios de sitios
web útiles
– Sin contexto, sin
interacción, sin
escalabilidad
12. La evolución de la Web
• Web 2.0: Web como
plataforma de información
– Se centra en el compartir
contenidos
– El usuario consumidor
tiene poder y es más libre
– Enlaza contenidos por si
mismo y con sus propias
herramientas
– No hay buena
personalización,
portabilidad ni
interoperabilidad
(CC) Licensed 2007 Eboy
13. La evolución de la Web
• Web 3.0 (Web
Semántica
– Personalizable
– Ubicuidad
– Movilidad
– Datos abiertos
– Datos enlazados
¡Web de datos!
14. La Web de datos
• Semejante a un sistema de
almacenamiento de
ficheros
• Conformado
principalmente por
objetos digitales
• Documentos o sus partes
(datos) enlazados
• Baja estructura de los
objetos
• Diseñada para consumo
humano y para su servicio
La Web actual es una Web de
documentos donde la mayoría
de los datos funcionan como
islas semánticas
Tim Berners-Lee http://www.ted.com/talks/tim_berners_lee_on_the_next_web.html
15. Datos vinculados
(Linked data)
• Es la forma en que la Web espera
enlazar todo tipo de datos
porque se encuentran
diversificados
• Publicar bajo ciertos parámetros
y estándares y también ligarlos
para permitir la generación de
contenidos enriquecidos
(conocimiento).
– Ser parte de la WEB, no solo
publicar para la Web
(reutilización de contenidos)
– Colaboración
• Una gran Base de datos
interconectados y consultables
por una interfaz convencional
(con HTML)
http://www.w3.org/2009/Talks/0204-tedtbl/#%281%29
16. ¿Qué se puede publicar
con datos vinculados?
• Información relativa a cualquier cosa:
– Lugares:
Granada (España)
http://dbpedia.org/page/Granada
– Registros de autoridades
Federico García Lorca
http://id.loc.gov/authorities/names/n79034425.html
– Números de Clasificación
861 Poesía española
http://dewey.info/class/861/2009-08/about.es
17. ¿Que se necesita?
• Usar URIs como nombres para
las cosas.
• Usar URIs HTTP, de modo que
la gente pueda buscar y
localizar esos nombres.
• Cuando alguien busque
empleando un URI,
proporcionar información útil,
utilizando estándares (RDF,
SPARQL).
• Incluir enlaces a otros URIs,
para que se puedan descubrir
y localizar más cosas.
18. ¿En qué consiste?
• RDF (Resource Description Framework)
Recurso
TIPO DE
VALOR
PROPIEDAD
Sujeto Predicado Objeto
Federico García Lorca Es autor de Romancero
Gitano
19. ¿En qué consiste?
• Vocabularios que describen (propiedades) o
indican que tipo (Clases) de recursos estamos
usando
Federico García Lorca es una Persona
Romancero gitano es una Obra
Ejemplo de vocabulario: Schema.org
(Apodo, dirección física, etc.)
20. Enlazado de datos
Recurso
Tipo de Propiedad
Valor
Federico García Lorca
Nacido en
Granada
Federico García Lorca
Autor de
Romancero Gitano
Recurso
Tipo de Propiedad
Valor
http://id.loc.gov/authoritie
s/names/n79034425.html
foaf:birthPlace
http://dbpedia.org/page/G
ranada
http://id.loc.gov/authoritie
s/names/n79034425.html
frbr:isCreatorOf
http://datos.bne.es/page/r
esource/bimo0000036030
22. Archivo
digital de El
Espectador
Cámara Colombiana
del libro
978-958-8774-06-0
Bib. Piloto de
Medellín
Co863,64 23
Museo Nacional de
Colombia
Bib. Luis Ángel Arango
Título uniforme: [Cien
años de Soledad
Español]
Biblioteca Nacional
de Colombia
29. Informe Final del Grupo
Incubador de Datos Vinculados
de Bibliotecas del W3C*
• Desarrollado por el
Library Linked Data
Incubator Group
– Entre mayo y agosto
de 2011
– Informe final:
Octubre de 2011
• Objetivo:
“contribuir a incrementar la
interoperabilidad global de
los datos de las bibliotecas en
la Web, reuniendo a personas
implicadas en actividades de
la Web Semántica —
centradas en los Datos
Vinculados— en bibliotecas e
instituciones afines, mediante
el examen de las iniciativas
en curso e identificando
futuras vías de colaboración”
* http://www.larramendi.es/LAM/Incubator/lld/XGR-lld-20111025.html
29
30. Partes del informe
• Alcance del informe • Apendices:
A. Inventario de
• Ventajas del enfoque
recursos existentes
de Datos Vinculados
de Datos Vinculados
• Situación actual
de bibliotecas
• Recomendaciones
B. Tecnologías
pertinentes
• Referencias
C. Alineamiento
• Agradecimientos
semántico
31. Conceptos
• Para “Bibliotecas” = todo tipo de unidad de
información (Bibliotecas, archivos y museos LAM)
• Datos de bibliotecas: información digital que permite
describir y recuperar información en las bibliotecas
• Datos vinculados (Interoperabilidad técnica)
• Datos abiertos (desde el aspecto legal)
• Datos vinculados de bibliotecas (library linked data)
Para que las bibliotecas puedan compartir, extender y
reutilizar sus recursos con otras bibliotecas
32. ¿A quién se dirige?
• Directores de bibliotecas
• Organismos de
normalización de
bibliotecas
• Ingenieros de datos y de
sistemas
• Bibliotecarios y archiveros
33. ¿A quién beneficia?
• Investigadores, los
estudiantes y los
usuarios
• Las organizaciones
• Los bibliotecarios,
archiveros y
conservadores de
museos
• Desarrolladores y
firmas comerciales
34. ¿Cómo beneficia?
• General
– Creación y distribución de
datos
• Colaboración, reutilización
de datos, economía en los
procesos e incremento en
el valor de los datos
– Descripciones de
metadatos más accesibles
– Compartir parte de sus
datos, no la totalidad de
los mismos
– Reducción de
descripciones
• Específicos
– Investigadores, los
estudiantes y los usuarios.
(Centralización, mejor
navegación, investigación
multidisciplinar)
– Las organizaciones (mejor
tratamiento de datos,
desarrollo de Servicios)
– Los bibliotecarios,
archiveros y conservadores
de museos. (Colaboración)
– Desarrolladores y firmas
comerciales (Uso de
formatos abiertos,
creación de productos y
herramientas nuevas)
35. ¿Están preparadas las
bibliotecas?
• Los datos de las
bibliotecas no están
integrados con los
recursos Web
• Las normas de las
bibliotecas están
diseñadas únicamente
para la comunidad
bibliotecaria
• La comunidad
bibliotecaria y la
comunidad de la Web
Semántica utilizan una
terminología diferente
para conceptos similares
sobre metadatos
• Los cambios tecnológicos
en las bibliotecas
dependen del desarrollo
de sistemas comerciales
36. ¿Y los derechos de
autor?
Propiedad de los derechos de
autor
Derechos de autor como
negocio para las
organizaciones
• Algunas bibliotecas tienen
un uso restringido de sus
datos
• Depende mucho de la
legislación del país
• Presencia de pocos registros
originalmente desarrollados
por las bibliotecas
• Algunas agencias tienen su
negocio en la creación de
registros
– Catalogación cooperativa
– No publicación abierta
– Publicación limitada
– Datos vinculados pero no
abiertos
37. Recomendaciones
• Directores de bibliotecas: Identificación de datos
• Organismos de normalización: desarrollo de
normas y estandarización de bibliotecas
• Ingenieros de datos y de sistemas: diseño de
servicios basados en Datos Vinculados
• Bibliotecarios y archiveros: preservar los
conjuntos de elementos y los vocabularios de
valores de Datos Vinculados, a través de la
experiencia profesional.
38. ¿Y en Colombia?
• No hay iniciativas desde
ninguna biblioteca
– Desconocimiento del tema
– Estrategias de Gobierno en
Línea
• Guía para datos abiertos en
Colombia (2011)
• Datos abiertos de gobierno
electrónico
http://datosabiertoscolombia
.cloudapp.net/frm/buscador/
frmBuscador.aspx
– Biblioteca Nacional de
Colombia