SlideShare una empresa de Scribd logo
1 de 37
Web Of Data y los Repositorios Institucionales Consorcio SIU – Módulo Bibliotecas Jornada Virtual Acceso Abierto 2011 MINCyT - CAICyT – OPS/OMS Jueves 27 de Octubre de 2011
Un poco de Historia (reciente) Se puede situar en el año 2010 la expansión del movimiento  Open Data  consistente en la puesta  a disposición de la sociedad, de manera libre, de datos procedentes de diferentes organizaciones , fundamentalmente del ámbito de la Administración Pública o de aquellos proyectos que han sido financiados con dinero público o creados por una institución pública. Los datos proporcionados suelen tratan sobre diferentes temáticas (médicos, geográficos, metereológicos, sobre biodiversidad, relativos a servicios públicos, etc.).  El  objetivo  de exponer los datos a la sociedad, es aumentar los resultados que se pueden extraer de ellos. De esta forma cualquier persona u organización puede construir en base a esos datos una  nueva idea, que produzca nuevos datos ,  conocimientos  o incluso  servicios . Se trata de abrir una puerta a la innovación y al conocimiento así como ofrecer nuevas oportunidades de negocio.  Por otro lado, en el caso de la Administración Pública,  el movimiento Open Data viene a apoyar la tendencia Open Government ,  por la transparencia sobre la gestión pública y el fomento de la interoperabilidad entre Administraciones. 
Portal Open Data Euskadi
http://data.gov
http://data.gov.uk
http://ec.europa.eu/information_society/policy/psi/index_en.htm
¿Y para que puede servir?
Aspectos conceptuales ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],Procesamiento Aplicaciones
La principal diferencia entre la web del hipertexto (1.0 y 2.0) y la web semántica es que mientras la primera vincula páginas o documentos en html, la segunda aboga por ir más allá del concepto documento y enlaza datos estructurados. Web Of Data = Web semántica = Web 3.0 ...La web semántica trata de dos cosas: Por un lado,  formatos comunes para la integración y combinación de datos provenientes de diversas fuentes, mientras que la Web original se concentró principalmente en el intercambio de documentos. También se trata de lenguaje para el registro de cómo los datos se relacionan con los objetos del mundo real. Esto permite a una persona o una máquina, comenzar en una base de datos, y luego moverse a través de una serie interminable de bases de datos... Web Semántica
RDF Resource Description Framework.  El RDF es un esquema para definir e intercambiar metadatos, que se ocupa de la semántica y permite, mediante relaciones de clasificación, crear una jerarquía de conceptos de un dominio.  Es el modelo que establece el formato de datos que permite al usuario crear lenguajes entendibles para las computadoras de manera que estas puedan procesar y clasificar semánticamente la información.  Como su nombre lo indica (Marco de descripción de recursos) su principal objetivo es la descripción de los  recursos  en Internet, es decir, una imagen, un documento, una animación, una película, un autor, etc. pueden ser descriptas en término de propiedades y reconocibles unívocamente a través del URI,   RDA
(más) RDF Se basa en la idea de declarar recursos usando la expresión en la forma sujeto-predicado-objeto. Esta expresión es conocida en la terminología RDF como tripla o triplete. Una tripla RDF contiene tres componentes, todos con referencia en un URI: –  sujeto , una referencia URI, una persona, o  un  nodo, es el ente al cual nos referimos; –  predicado   es la propiedad o relación que se  desea establecer acerca del sujeto; –  objeto  es el valor de la propiedad o del otro  recurso con el que se establece la relación.
Sujeto Propiedades Propiedades Propiedades Objeto Objeto Objeto
Linked Open Data (2007) 4 reglas básicas 1. usar URIs ( uniform resource identifiers)  identificando los recursos de forma unívoca 2. usar URIs http para que la gente pueda acceder a la información del recurso. 3. ofrecer información sobre los recursos usando RDF. 4. incluir enlaces a otros URIs, facilitando el vínculo entre distintos datos distribuidos en la web.
Un ejemplo (hipótético) posible aplicable a los RI Registro OAI  con esteroides RDF Datos  académicos de  sus autores (ej: CV) Proyectos de  investigación  financiados  en una disciplina BDD Terminológica Específica RDF RDF RDF Patentes para esa  disciplina Publicaciones en editores comerciales Datos geoespaciales
Elemento que faltaba: SPARQL SPARQL permite realizar consultas “semánticas” recorriendo las diferentes relaciones establecidas en los grafos. Así, usando SPARQL, podría querer obtener:  “…todas las publicaciones en RI, que tengan al menos dos disciplinas que hayan sido financiadas en el último año y cuyos autores tengan afiliación a universidades del norte del país…”
Más de SPARQL. Comparativo.
Data cloud  (Nube de datos) Diagrama de todas las fuentes de datos disponibls y sus relaciones. A mayor cantidad de relaciones entre los datos, que resulten procesables, mayor complejidad posible de implementar en las consultas y en los cruces de los mismos a realizar. Dataset Fuente de información que se mide en número  de triplas RDF que publican datos. Algunas publican una interfaz SPARQL, otras no.
2007
2008
2009
2011
Leyendo un poco la nube Hay absolutamente de todo, desde datos de programas de TV, radio, hasta información de Censos en diversos países, estadísticas de turismo en Zaragoza, pasando por fuentes de artículos científicos como PubMed o fuentes terminológicas como Agrovoc. Hay (casi) nula presencia de Latinoamérica en el cloud (por ahora).
DBPedia (I) Hemos visto que en los 3 años analizados, el centro de la nube reside en DBPedia…Pero que es DBPedia? DBpedia  is a community effort to extract structured information from  Wikipedia  and to make this information available on the Web. DBpedia allows you to ask sophisticated queries against Wikipedia, and to link other data sets on the Web to Wikipedia data. We hope this will make it easier for the amazing amount of information in Wikipedia to be used in new and interesting ways, and that it might inspire new mechanisms for navigating, linking and improving the encyclopaedia itself.  Otra vez… RDF
DBPedia (II) Podríamos decir (sucintamente) que DBPedia entonces es la versión RDFizada de la Wikipedia.  … We are happy to announce the release of DBpedia 3.7. The new release is based on Wikipedia dumps dating from late July 2011.The new DBpedia data set describes more than 3.64 million things, of which 1.83 million are classified in a consistent ontology, including 416,000 persons, 526,000 places, 106,000 music albums, 60,000 films, 17,500 video games, 169,000 organizations, 183,000 species and 5,400 diseases. The DBpedia data set features labels and abstracts for 3.64 million things in up to 97 different languages; 2,724,000 links to images and 6,300,000 links to external web pages; 6,200,000 external links into other RDF datasets, and 740,000 Wikipedia categories. The dataset consists of 1 billion pieces of information (RDF triples) out of which 385 million were extracted from the English edition of Wikipedia and roughly 665 million were extracted from other language editions and links to external datasets. Si, Otra vez… RDF
http://dbpedia.org
Nuestro contexto. Antecedentes SIU (I) Organizamos en el año 2009 un seminario dictado por la Dra Eva Méndez que trató sobre la web semántica. En la misma, se puede ver que muchos de los temas de esta presentación, fueron desarrollados… El módulo Bibliotecas del Consorcio SIU viene colaborando en un proyecto de investigación UNNOBA-SIU aplicable a Guaraní 3, para la expresión de competencias educativas, a través del posible uso de ontologías.
BDU 2 Desde fines de 2009 el Consorcio SIU administra la Base de Datos Unificada 2, la cual es un Service Provider de OAI-PMH (cosechador) sobre los Repositorios Institucionales argentinos. La misma cuenta con alrededor de 55.000 registros / metadatos obtenidos de 18 repositorios nacionales. Se ha participado en las iniciativas generadas por el MINCyT, particularmente en el Sistema Nacional de Repositorios Digitales.
 
¿Como se podrían integrar los RI al cloud? OAI2LOD Server . Experiencia Como experiencia inicial hemos querido consumir servicios de DBPedia como recurso terminológico para encontrar términos relacionados con una expresión de consulta. Se podrían consumir las imágenes de composición química de drogas, artículos relacionados de PubMed o IEEE, se podrían utilizar otros recursos terminológicos tales como Agrovoc, y muchos etc.
 
 
Conclusiones Esta presentación ha recorrido  dos ejes principales : El movimiento  Open Data  como complementario del Acceso Abierto y la  Web Semántica  o web 3.0 o Web of data. Hemos visto que ambos temas están fuertemente relacionados. Dado el impresionante crecimiento que el Data Cloud manifiesta año a año y a su vez la mayor cantidad de relaciones entre cada Dataset, es que se pueden construir aplicaciones que interrelaciones y recorran el grafo cada vez mas complejas y eficientes. Eso tendrá una relación directa con la percepción del  usuario   sobre el  comportamiento de las aplicaciones  pudiendo relacionar datos y responder a consultas que serán percibidas como  “más inteligentes” .
Conclusiones (II) Los  Repositorios Institucionales  son una fuente de información sumamente rica, sea como punto de entrada para relacionar con otras fuentes o incluso como f uente de información primaria  (potencial dataset). Las interfaces de búsqueda deben hacer uso de estas posibilidades. El desafío es ocultar la complejidad de SPARQL, trabajar sobre aproximaciones que permitan escalar y recorrer un número rico de grafos y relaciones. Definitivamente las  aplicaciones  de consulta de información, deben dar paso a convertirse en aplicaciones para el  descubrimiento de nuevo conocimiento .
¿Preguntas? Jornada Virtual Acceso Abierto 2011 MINCyT - CAICyT – OPS/PAHO Jueves 27 de Octubre de 2011
Agradecimientos Dra. Eva Méndez  por las correcciones y ayuda conceptual. Lic. Sandra Raiher  por la asistencia sobre bibliografía relevante. Bib. Paola Azrilevich  del MINCyT y equipo OPS/ARG por ayudarnos a salvar la distancia geográfica en esta exposición.
Lic.Luján Gurmendi Directora Ejecutiva Consorcio SIU [email_address] Isabel Piñeiro Coordinadora Módulo Bibliotecas Consorcio SIU [email_address] Emiliano Marmonti Informático Módulo Bibliotecas Consorcio SIU [email_address] Jornada del Acceso Abierto 2011 MINCyT - CAICyT – OPS/OMS Jueves 27 de Octubre de 2011
Muchas gracias por su atención. Jornada del Acceso Abierto 2011 MINCyT - CAICyT – OPS/OMS Jueves 27 de Octubre de 2011

Más contenido relacionado

La actualidad más candente

La actualidad más candente (20)

Curs 2.5 Datos Enlazados
Curs 2.5 Datos EnlazadosCurs 2.5 Datos Enlazados
Curs 2.5 Datos Enlazados
 
Curs 2.5 Dades enllaçades
Curs 2.5 Dades enllaçadesCurs 2.5 Dades enllaçades
Curs 2.5 Dades enllaçades
 
Empresas con BDOO
Empresas con BDOOEmpresas con BDOO
Empresas con BDOO
 
Apresentação - II Jornada Nacional de Investigación - ULADECH - Peru
Apresentação - II Jornada Nacional de Investigación - ULADECH - PeruApresentação - II Jornada Nacional de Investigación - ULADECH - Peru
Apresentação - II Jornada Nacional de Investigación - ULADECH - Peru
 
Base de datos
Base de datosBase de datos
Base de datos
 
Las 10 grandes bases de datos
Las 10 grandes bases de datosLas 10 grandes bases de datos
Las 10 grandes bases de datos
 
05 baeza cap1
05 baeza cap105 baeza cap1
05 baeza cap1
 
Ensayo argumentativo
Ensayo argumentativoEnsayo argumentativo
Ensayo argumentativo
 
Web mining
Web miningWeb mining
Web mining
 
Libro Base de Datos
Libro Base de DatosLibro Base de Datos
Libro Base de Datos
 
Recuperación de la Informacion
Recuperación de la InformacionRecuperación de la Informacion
Recuperación de la Informacion
 
Que es una base de datos power 2
Que es una base de datos power 2Que es una base de datos power 2
Que es una base de datos power 2
 
Taller: Ontologías: diseño y acceso a datos con SPARQL (18 de mayo de 2018)
Taller: Ontologías: diseño y acceso a datos con SPARQL (18 de mayo de 2018)Taller: Ontologías: diseño y acceso a datos con SPARQL (18 de mayo de 2018)
Taller: Ontologías: diseño y acceso a datos con SPARQL (18 de mayo de 2018)
 
Access 2013
Access 2013Access 2013
Access 2013
 
Curs 1.6. Dades Enllaçades (14/02)
Curs 1.6. Dades Enllaçades (14/02)Curs 1.6. Dades Enllaçades (14/02)
Curs 1.6. Dades Enllaçades (14/02)
 
Recuperacion
RecuperacionRecuperacion
Recuperacion
 
Usando dublin core
Usando dublin coreUsando dublin core
Usando dublin core
 
Base de datos
Base de datosBase de datos
Base de datos
 
Base de datos chuby piolo y maricarmen
Base de datos chuby piolo y maricarmenBase de datos chuby piolo y maricarmen
Base de datos chuby piolo y maricarmen
 
El libro de 01
El libro de 01El libro de 01
El libro de 01
 

Destacado (20)

Reunión del 02 de noviembre del 2011 bueno
Reunión del 02 de noviembre del 2011 buenoReunión del 02 de noviembre del 2011 bueno
Reunión del 02 de noviembre del 2011 bueno
 
Ordenanza de participación ciudadana
Ordenanza de participación ciudadanaOrdenanza de participación ciudadana
Ordenanza de participación ciudadana
 
youtube
youtubeyoutube
youtube
 
Imágenes
ImágenesImágenes
Imágenes
 
Evaluacion del proyecto
Evaluacion del proyectoEvaluacion del proyecto
Evaluacion del proyecto
 
La cordoba de_ayer
La cordoba de_ayerLa cordoba de_ayer
La cordoba de_ayer
 
Yohana altamirano collado
Yohana altamirano colladoYohana altamirano collado
Yohana altamirano collado
 
Modelo b2 b
Modelo b2 bModelo b2 b
Modelo b2 b
 
Actos y conferencias de Rosa Díez
Actos y conferencias de Rosa DíezActos y conferencias de Rosa Díez
Actos y conferencias de Rosa Díez
 
Què és la informàtica
Què és la informàticaQuè és la informàtica
Què és la informàtica
 
Inteligencia artificial
Inteligencia artificialInteligencia artificial
Inteligencia artificial
 
Resumen junta gobierno local 29072011
Resumen junta gobierno local 29072011Resumen junta gobierno local 29072011
Resumen junta gobierno local 29072011
 
Diapositivas capitulo 6
Diapositivas capitulo 6Diapositivas capitulo 6
Diapositivas capitulo 6
 
Proyecto Naife
Proyecto NaifeProyecto Naife
Proyecto Naife
 
El ciudadano, la clave de la ciudad inteligente. #smartcities
El ciudadano, la clave de la ciudad inteligente. #smartcitiesEl ciudadano, la clave de la ciudad inteligente. #smartcities
El ciudadano, la clave de la ciudad inteligente. #smartcities
 
Evaluación del desempeño profesional docente
Evaluación del desempeño profesional docenteEvaluación del desempeño profesional docente
Evaluación del desempeño profesional docente
 
Grado en Administración y Dirección de Empresas UAX
Grado en Administración y Dirección de Empresas UAXGrado en Administración y Dirección de Empresas UAX
Grado en Administración y Dirección de Empresas UAX
 
Sopa ley nueva
Sopa ley nuevaSopa ley nueva
Sopa ley nueva
 
Peresentacion nomina
Peresentacion nominaPeresentacion nomina
Peresentacion nomina
 
Redes Sociales
Redes SocialesRedes Sociales
Redes Sociales
 

Similar a Web of data y los repositorios institucionales

Suite de productos SemanticWebBuilder
Suite de productos SemanticWebBuilder Suite de productos SemanticWebBuilder
Suite de productos SemanticWebBuilder SemanticWebBuilder
 
Retos y oportunidades en Archivos y Gestión documental ante la Web Semántica....
Retos y oportunidades en Archivos y Gestión documental ante la Web Semántica....Retos y oportunidades en Archivos y Gestión documental ante la Web Semántica....
Retos y oportunidades en Archivos y Gestión documental ante la Web Semántica....Biblioteca Nacional de España
 
Retos y oportunidades en Archivos y Gestión Documental ante la Web Semántica
Retos y oportunidades en Archivos y Gestión Documental ante la Web SemánticaRetos y oportunidades en Archivos y Gestión Documental ante la Web Semántica
Retos y oportunidades en Archivos y Gestión Documental ante la Web SemánticaAna Carrillo Pozas
 
Anotaciones semanticas recursos
Anotaciones semanticas recursosAnotaciones semanticas recursos
Anotaciones semanticas recursosMartin Coronel
 
Datos abiertos en el Ayuntamiento de Lorca
Datos abiertos en el Ayuntamiento de LorcaDatos abiertos en el Ayuntamiento de Lorca
Datos abiertos en el Ayuntamiento de LorcaAntonio Galindo Galindo
 
Web Semantica. La nueva Generación de Portales. (Infotec - SemanticWebBuilder...
Web Semantica. La nueva Generación de Portales. (Infotec - SemanticWebBuilder...Web Semantica. La nueva Generación de Portales. (Infotec - SemanticWebBuilder...
Web Semantica. La nueva Generación de Portales. (Infotec - SemanticWebBuilder...Víctor Jesús Hernández
 
Trabajo compu
Trabajo compuTrabajo compu
Trabajo compumolecuik
 
Qué es la web dfjg 1101
Qué es la web dfjg 1101Qué es la web dfjg 1101
Qué es la web dfjg 1101DavidJara20
 
Introducción a la programación de la Web Semántica
Introducción a la programación de la Web Semántica Introducción a la programación de la Web Semántica
Introducción a la programación de la Web Semántica Taniana Rodriguez
 
Indización automatizada
Indización automatizadaIndización automatizada
Indización automatizadaJavier Gascón
 
Educomunicacion la ewb 3.0
Educomunicacion la ewb 3.0Educomunicacion la ewb 3.0
Educomunicacion la ewb 3.0Yuly Echeverria
 
Información textual y documental
Información textual y documentalInformación textual y documental
Información textual y documentalesthermorenoestevez
 

Similar a Web of data y los repositorios institucionales (20)

Dbpedia
DbpediaDbpedia
Dbpedia
 
Suite de productos SemanticWebBuilder
Suite de productos SemanticWebBuilder Suite de productos SemanticWebBuilder
Suite de productos SemanticWebBuilder
 
33022200 Cesar
33022200 Cesar33022200 Cesar
33022200 Cesar
 
Retos y oportunidades en Archivos y Gestión documental ante la Web Semántica....
Retos y oportunidades en Archivos y Gestión documental ante la Web Semántica....Retos y oportunidades en Archivos y Gestión documental ante la Web Semántica....
Retos y oportunidades en Archivos y Gestión documental ante la Web Semántica....
 
Retos y oportunidades en Archivos y Gestión Documental ante la Web Semántica
Retos y oportunidades en Archivos y Gestión Documental ante la Web SemánticaRetos y oportunidades en Archivos y Gestión Documental ante la Web Semántica
Retos y oportunidades en Archivos y Gestión Documental ante la Web Semántica
 
SeDiCI (Servicio de Difusión de la Creación Intelectual): un recorrido de exp...
SeDiCI (Servicio de Difusión de la Creación Intelectual): un recorrido de exp...SeDiCI (Servicio de Difusión de la Creación Intelectual): un recorrido de exp...
SeDiCI (Servicio de Difusión de la Creación Intelectual): un recorrido de exp...
 
Anotaciones semanticas recursos
Anotaciones semanticas recursosAnotaciones semanticas recursos
Anotaciones semanticas recursos
 
Datos abiertos en el Ayuntamiento de Lorca
Datos abiertos en el Ayuntamiento de LorcaDatos abiertos en el Ayuntamiento de Lorca
Datos abiertos en el Ayuntamiento de Lorca
 
Plataforma de recolección en fuentes heterogéneas de la web y su aplicación a...
Plataforma de recolección en fuentes heterogéneas de la web y su aplicación a...Plataforma de recolección en fuentes heterogéneas de la web y su aplicación a...
Plataforma de recolección en fuentes heterogéneas de la web y su aplicación a...
 
Web Semantica. La nueva Generación de Portales. (Infotec - SemanticWebBuilder...
Web Semantica. La nueva Generación de Portales. (Infotec - SemanticWebBuilder...Web Semantica. La nueva Generación de Portales. (Infotec - SemanticWebBuilder...
Web Semantica. La nueva Generación de Portales. (Infotec - SemanticWebBuilder...
 
Linked data
Linked dataLinked data
Linked data
 
Curs 1.6 Datos Enlazados
Curs 1.6 Datos EnlazadosCurs 1.6 Datos Enlazados
Curs 1.6 Datos Enlazados
 
Trabajo compu
Trabajo compuTrabajo compu
Trabajo compu
 
Qué es la web dfjg 1101
Qué es la web dfjg 1101Qué es la web dfjg 1101
Qué es la web dfjg 1101
 
Introducción a la programación de la Web Semántica
Introducción a la programación de la Web Semántica Introducción a la programación de la Web Semántica
Introducción a la programación de la Web Semántica
 
Indización automatizada
Indización automatizadaIndización automatizada
Indización automatizada
 
Educomunicacion la ewb 3.0
Educomunicacion la ewb 3.0Educomunicacion la ewb 3.0
Educomunicacion la ewb 3.0
 
Red Ontologías Hércules – ROH
Red Ontologías Hércules – ROHRed Ontologías Hércules – ROH
Red Ontologías Hércules – ROH
 
Información textual y documental
Información textual y documentalInformación textual y documental
Información textual y documental
 
Trabajos de internet
Trabajos de internetTrabajos de internet
Trabajos de internet
 

Último

9egb-lengua y Literatura.pdf_texto del estudiante
9egb-lengua y Literatura.pdf_texto del estudiante9egb-lengua y Literatura.pdf_texto del estudiante
9egb-lengua y Literatura.pdf_texto del estudianteAndreaHuertas24
 
International Women's Day Sucre 2024 (IWD)
International Women's Day Sucre 2024 (IWD)International Women's Day Sucre 2024 (IWD)
International Women's Day Sucre 2024 (IWD)GDGSucre
 
Trabajo Mas Completo De Excel en clase tecnología
Trabajo Mas Completo De Excel en clase tecnologíaTrabajo Mas Completo De Excel en clase tecnología
Trabajo Mas Completo De Excel en clase tecnologíassuserf18419
 
guía de registro de slideshare por Brayan Joseph
guía de registro de slideshare por Brayan Josephguía de registro de slideshare por Brayan Joseph
guía de registro de slideshare por Brayan JosephBRAYANJOSEPHPEREZGOM
 
pruebas unitarias unitarias en java con JUNIT
pruebas unitarias unitarias en java con JUNITpruebas unitarias unitarias en java con JUNIT
pruebas unitarias unitarias en java con JUNITMaricarmen Sánchez Ruiz
 
Redes direccionamiento y subredes ipv4 2024 .pdf
Redes direccionamiento y subredes ipv4 2024 .pdfRedes direccionamiento y subredes ipv4 2024 .pdf
Redes direccionamiento y subredes ipv4 2024 .pdfsoporteupcology
 
Desarrollo Web Moderno con Svelte 2024.pdf
Desarrollo Web Moderno con Svelte 2024.pdfDesarrollo Web Moderno con Svelte 2024.pdf
Desarrollo Web Moderno con Svelte 2024.pdfJulian Lamprea
 
Presentación guía sencilla en Microsoft Excel.pptx
Presentación guía sencilla en Microsoft Excel.pptxPresentación guía sencilla en Microsoft Excel.pptx
Presentación guía sencilla en Microsoft Excel.pptxLolaBunny11
 
POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...
POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...
POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...silviayucra2
 
Global Azure Lima 2024 - Integración de Datos con Microsoft Fabric
Global Azure Lima 2024 - Integración de Datos con Microsoft FabricGlobal Azure Lima 2024 - Integración de Datos con Microsoft Fabric
Global Azure Lima 2024 - Integración de Datos con Microsoft FabricKeyla Dolores Méndez
 
CLASE DE TECNOLOGIA E INFORMATICA PRIMARIA
CLASE  DE TECNOLOGIA E INFORMATICA PRIMARIACLASE  DE TECNOLOGIA E INFORMATICA PRIMARIA
CLASE DE TECNOLOGIA E INFORMATICA PRIMARIAWilbisVega
 
Proyecto integrador. Las TIC en la sociedad S4.pptx
Proyecto integrador. Las TIC en la sociedad S4.pptxProyecto integrador. Las TIC en la sociedad S4.pptx
Proyecto integrador. Las TIC en la sociedad S4.pptx241521559
 
EPA-pdf resultado da prova presencial Uninove
EPA-pdf resultado da prova presencial UninoveEPA-pdf resultado da prova presencial Uninove
EPA-pdf resultado da prova presencial UninoveFagnerLisboa3
 

Último (13)

9egb-lengua y Literatura.pdf_texto del estudiante
9egb-lengua y Literatura.pdf_texto del estudiante9egb-lengua y Literatura.pdf_texto del estudiante
9egb-lengua y Literatura.pdf_texto del estudiante
 
International Women's Day Sucre 2024 (IWD)
International Women's Day Sucre 2024 (IWD)International Women's Day Sucre 2024 (IWD)
International Women's Day Sucre 2024 (IWD)
 
Trabajo Mas Completo De Excel en clase tecnología
Trabajo Mas Completo De Excel en clase tecnologíaTrabajo Mas Completo De Excel en clase tecnología
Trabajo Mas Completo De Excel en clase tecnología
 
guía de registro de slideshare por Brayan Joseph
guía de registro de slideshare por Brayan Josephguía de registro de slideshare por Brayan Joseph
guía de registro de slideshare por Brayan Joseph
 
pruebas unitarias unitarias en java con JUNIT
pruebas unitarias unitarias en java con JUNITpruebas unitarias unitarias en java con JUNIT
pruebas unitarias unitarias en java con JUNIT
 
Redes direccionamiento y subredes ipv4 2024 .pdf
Redes direccionamiento y subredes ipv4 2024 .pdfRedes direccionamiento y subredes ipv4 2024 .pdf
Redes direccionamiento y subredes ipv4 2024 .pdf
 
Desarrollo Web Moderno con Svelte 2024.pdf
Desarrollo Web Moderno con Svelte 2024.pdfDesarrollo Web Moderno con Svelte 2024.pdf
Desarrollo Web Moderno con Svelte 2024.pdf
 
Presentación guía sencilla en Microsoft Excel.pptx
Presentación guía sencilla en Microsoft Excel.pptxPresentación guía sencilla en Microsoft Excel.pptx
Presentación guía sencilla en Microsoft Excel.pptx
 
POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...
POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...
POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...
 
Global Azure Lima 2024 - Integración de Datos con Microsoft Fabric
Global Azure Lima 2024 - Integración de Datos con Microsoft FabricGlobal Azure Lima 2024 - Integración de Datos con Microsoft Fabric
Global Azure Lima 2024 - Integración de Datos con Microsoft Fabric
 
CLASE DE TECNOLOGIA E INFORMATICA PRIMARIA
CLASE  DE TECNOLOGIA E INFORMATICA PRIMARIACLASE  DE TECNOLOGIA E INFORMATICA PRIMARIA
CLASE DE TECNOLOGIA E INFORMATICA PRIMARIA
 
Proyecto integrador. Las TIC en la sociedad S4.pptx
Proyecto integrador. Las TIC en la sociedad S4.pptxProyecto integrador. Las TIC en la sociedad S4.pptx
Proyecto integrador. Las TIC en la sociedad S4.pptx
 
EPA-pdf resultado da prova presencial Uninove
EPA-pdf resultado da prova presencial UninoveEPA-pdf resultado da prova presencial Uninove
EPA-pdf resultado da prova presencial Uninove
 

Web of data y los repositorios institucionales

  • 1. Web Of Data y los Repositorios Institucionales Consorcio SIU – Módulo Bibliotecas Jornada Virtual Acceso Abierto 2011 MINCyT - CAICyT – OPS/OMS Jueves 27 de Octubre de 2011
  • 2. Un poco de Historia (reciente) Se puede situar en el año 2010 la expansión del movimiento  Open Data consistente en la puesta  a disposición de la sociedad, de manera libre, de datos procedentes de diferentes organizaciones , fundamentalmente del ámbito de la Administración Pública o de aquellos proyectos que han sido financiados con dinero público o creados por una institución pública. Los datos proporcionados suelen tratan sobre diferentes temáticas (médicos, geográficos, metereológicos, sobre biodiversidad, relativos a servicios públicos, etc.).  El objetivo de exponer los datos a la sociedad, es aumentar los resultados que se pueden extraer de ellos. De esta forma cualquier persona u organización puede construir en base a esos datos una nueva idea, que produzca nuevos datos , conocimientos o incluso servicios . Se trata de abrir una puerta a la innovación y al conocimiento así como ofrecer nuevas oportunidades de negocio. Por otro lado, en el caso de la Administración Pública,  el movimiento Open Data viene a apoyar la tendencia Open Government ,  por la transparencia sobre la gestión pública y el fomento de la interoperabilidad entre Administraciones. 
  • 7. ¿Y para que puede servir?
  • 8.
  • 9. La principal diferencia entre la web del hipertexto (1.0 y 2.0) y la web semántica es que mientras la primera vincula páginas o documentos en html, la segunda aboga por ir más allá del concepto documento y enlaza datos estructurados. Web Of Data = Web semántica = Web 3.0 ...La web semántica trata de dos cosas: Por un lado, formatos comunes para la integración y combinación de datos provenientes de diversas fuentes, mientras que la Web original se concentró principalmente en el intercambio de documentos. También se trata de lenguaje para el registro de cómo los datos se relacionan con los objetos del mundo real. Esto permite a una persona o una máquina, comenzar en una base de datos, y luego moverse a través de una serie interminable de bases de datos... Web Semántica
  • 10. RDF Resource Description Framework. El RDF es un esquema para definir e intercambiar metadatos, que se ocupa de la semántica y permite, mediante relaciones de clasificación, crear una jerarquía de conceptos de un dominio. Es el modelo que establece el formato de datos que permite al usuario crear lenguajes entendibles para las computadoras de manera que estas puedan procesar y clasificar semánticamente la información. Como su nombre lo indica (Marco de descripción de recursos) su principal objetivo es la descripción de los recursos en Internet, es decir, una imagen, un documento, una animación, una película, un autor, etc. pueden ser descriptas en término de propiedades y reconocibles unívocamente a través del URI,  RDA
  • 11. (más) RDF Se basa en la idea de declarar recursos usando la expresión en la forma sujeto-predicado-objeto. Esta expresión es conocida en la terminología RDF como tripla o triplete. Una tripla RDF contiene tres componentes, todos con referencia en un URI: – sujeto , una referencia URI, una persona, o un nodo, es el ente al cual nos referimos; – predicado es la propiedad o relación que se desea establecer acerca del sujeto; – objeto es el valor de la propiedad o del otro recurso con el que se establece la relación.
  • 12. Sujeto Propiedades Propiedades Propiedades Objeto Objeto Objeto
  • 13. Linked Open Data (2007) 4 reglas básicas 1. usar URIs ( uniform resource identifiers) identificando los recursos de forma unívoca 2. usar URIs http para que la gente pueda acceder a la información del recurso. 3. ofrecer información sobre los recursos usando RDF. 4. incluir enlaces a otros URIs, facilitando el vínculo entre distintos datos distribuidos en la web.
  • 14. Un ejemplo (hipótético) posible aplicable a los RI Registro OAI con esteroides RDF Datos académicos de sus autores (ej: CV) Proyectos de investigación financiados en una disciplina BDD Terminológica Específica RDF RDF RDF Patentes para esa disciplina Publicaciones en editores comerciales Datos geoespaciales
  • 15. Elemento que faltaba: SPARQL SPARQL permite realizar consultas “semánticas” recorriendo las diferentes relaciones establecidas en los grafos. Así, usando SPARQL, podría querer obtener: “…todas las publicaciones en RI, que tengan al menos dos disciplinas que hayan sido financiadas en el último año y cuyos autores tengan afiliación a universidades del norte del país…”
  • 16. Más de SPARQL. Comparativo.
  • 17. Data cloud (Nube de datos) Diagrama de todas las fuentes de datos disponibls y sus relaciones. A mayor cantidad de relaciones entre los datos, que resulten procesables, mayor complejidad posible de implementar en las consultas y en los cruces de los mismos a realizar. Dataset Fuente de información que se mide en número de triplas RDF que publican datos. Algunas publican una interfaz SPARQL, otras no.
  • 18. 2007
  • 19. 2008
  • 20. 2009
  • 21. 2011
  • 22. Leyendo un poco la nube Hay absolutamente de todo, desde datos de programas de TV, radio, hasta información de Censos en diversos países, estadísticas de turismo en Zaragoza, pasando por fuentes de artículos científicos como PubMed o fuentes terminológicas como Agrovoc. Hay (casi) nula presencia de Latinoamérica en el cloud (por ahora).
  • 23. DBPedia (I) Hemos visto que en los 3 años analizados, el centro de la nube reside en DBPedia…Pero que es DBPedia? DBpedia  is a community effort to extract structured information from  Wikipedia  and to make this information available on the Web. DBpedia allows you to ask sophisticated queries against Wikipedia, and to link other data sets on the Web to Wikipedia data. We hope this will make it easier for the amazing amount of information in Wikipedia to be used in new and interesting ways, and that it might inspire new mechanisms for navigating, linking and improving the encyclopaedia itself. Otra vez… RDF
  • 24. DBPedia (II) Podríamos decir (sucintamente) que DBPedia entonces es la versión RDFizada de la Wikipedia. … We are happy to announce the release of DBpedia 3.7. The new release is based on Wikipedia dumps dating from late July 2011.The new DBpedia data set describes more than 3.64 million things, of which 1.83 million are classified in a consistent ontology, including 416,000 persons, 526,000 places, 106,000 music albums, 60,000 films, 17,500 video games, 169,000 organizations, 183,000 species and 5,400 diseases. The DBpedia data set features labels and abstracts for 3.64 million things in up to 97 different languages; 2,724,000 links to images and 6,300,000 links to external web pages; 6,200,000 external links into other RDF datasets, and 740,000 Wikipedia categories. The dataset consists of 1 billion pieces of information (RDF triples) out of which 385 million were extracted from the English edition of Wikipedia and roughly 665 million were extracted from other language editions and links to external datasets. Si, Otra vez… RDF
  • 26. Nuestro contexto. Antecedentes SIU (I) Organizamos en el año 2009 un seminario dictado por la Dra Eva Méndez que trató sobre la web semántica. En la misma, se puede ver que muchos de los temas de esta presentación, fueron desarrollados… El módulo Bibliotecas del Consorcio SIU viene colaborando en un proyecto de investigación UNNOBA-SIU aplicable a Guaraní 3, para la expresión de competencias educativas, a través del posible uso de ontologías.
  • 27. BDU 2 Desde fines de 2009 el Consorcio SIU administra la Base de Datos Unificada 2, la cual es un Service Provider de OAI-PMH (cosechador) sobre los Repositorios Institucionales argentinos. La misma cuenta con alrededor de 55.000 registros / metadatos obtenidos de 18 repositorios nacionales. Se ha participado en las iniciativas generadas por el MINCyT, particularmente en el Sistema Nacional de Repositorios Digitales.
  • 28.  
  • 29. ¿Como se podrían integrar los RI al cloud? OAI2LOD Server . Experiencia Como experiencia inicial hemos querido consumir servicios de DBPedia como recurso terminológico para encontrar términos relacionados con una expresión de consulta. Se podrían consumir las imágenes de composición química de drogas, artículos relacionados de PubMed o IEEE, se podrían utilizar otros recursos terminológicos tales como Agrovoc, y muchos etc.
  • 30.  
  • 31.  
  • 32. Conclusiones Esta presentación ha recorrido dos ejes principales : El movimiento Open Data como complementario del Acceso Abierto y la Web Semántica o web 3.0 o Web of data. Hemos visto que ambos temas están fuertemente relacionados. Dado el impresionante crecimiento que el Data Cloud manifiesta año a año y a su vez la mayor cantidad de relaciones entre cada Dataset, es que se pueden construir aplicaciones que interrelaciones y recorran el grafo cada vez mas complejas y eficientes. Eso tendrá una relación directa con la percepción del usuario sobre el comportamiento de las aplicaciones pudiendo relacionar datos y responder a consultas que serán percibidas como “más inteligentes” .
  • 33. Conclusiones (II) Los Repositorios Institucionales son una fuente de información sumamente rica, sea como punto de entrada para relacionar con otras fuentes o incluso como f uente de información primaria (potencial dataset). Las interfaces de búsqueda deben hacer uso de estas posibilidades. El desafío es ocultar la complejidad de SPARQL, trabajar sobre aproximaciones que permitan escalar y recorrer un número rico de grafos y relaciones. Definitivamente las aplicaciones de consulta de información, deben dar paso a convertirse en aplicaciones para el descubrimiento de nuevo conocimiento .
  • 34. ¿Preguntas? Jornada Virtual Acceso Abierto 2011 MINCyT - CAICyT – OPS/PAHO Jueves 27 de Octubre de 2011
  • 35. Agradecimientos Dra. Eva Méndez por las correcciones y ayuda conceptual. Lic. Sandra Raiher por la asistencia sobre bibliografía relevante. Bib. Paola Azrilevich del MINCyT y equipo OPS/ARG por ayudarnos a salvar la distancia geográfica en esta exposición.
  • 36. Lic.Luján Gurmendi Directora Ejecutiva Consorcio SIU [email_address] Isabel Piñeiro Coordinadora Módulo Bibliotecas Consorcio SIU [email_address] Emiliano Marmonti Informático Módulo Bibliotecas Consorcio SIU [email_address] Jornada del Acceso Abierto 2011 MINCyT - CAICyT – OPS/OMS Jueves 27 de Octubre de 2011
  • 37. Muchas gracias por su atención. Jornada del Acceso Abierto 2011 MINCyT - CAICyT – OPS/OMS Jueves 27 de Octubre de 2011