Este documento presenta una introducción a los datos enlazados. Explica conceptos clave como los datos enlazados, la web semántica, vocabularios como DCAT y RDF, y tecnologías para publicar, enlazar y consultar datos enlazados como triplestores, SPARQL y herramientas como Pubby y Silk. El objetivo es capacitar a los participantes para enlazar y usar datos abiertos.
El exponencial crecimiento de aplicaciones web, móviles y la entrada permanente de dispositivos conectados a internet trajo consigo un cambio en la administración de los datos y una transformación sin precedentes con respecto a como se hacía décadas atrás y de la forma como se diseñaba y operaba a nivel plataformas tecnológicas. Requerimientos provenientes de la nueva economía de Internet presionaron a las empresas emprendedoras de nuevos proyectos y soluciones, más allá de los límites de las bases de datos relacionales (RDBMS) e introdujeron un nuevo tipo de base de datos al dominio de los entornos tecnológicos: Las Arquitecturas de Tipo NoSQL.
Hay un largo camino por recorrer antes de contemplar la posibilidad de implementar una solución en una plataforma que para nuestro entorno local es totalmente nueva y está relacionado con el hecho del poco o ningún conocimiento o referencia de implementaciones que se tiene sobre las mismas.
Es por eso que se habla de un cambio de paradigma, dado que es un nuevo planteamiento para construir, implementar y soportar arquitecturas de TI de alcance masivo. Hoy estamos acostumbrados que muchos temas sean hechos a veces incuestionables, es el resultado de campañas de mercadeo y ventas de la oferta, que unido a la resignación de la demanda que ha creído y crecido pensando que no hay nada mejor disponible.
Authentication & Authorization in GraphQL with AWS AppSync (MOB402) - AWS re:...Amazon Web Services
Modern apps require special consideration for the security and privacy of user data, especially in today’s compliance-driven world. In this session, we provide some of the common use cases and design patterns to secure user data in a globally available GraphQL API, and discuss best practices for authentication and authorization in AWS AppSync.
Presentación Taller Herramientas Rendimiento DB2 en IBM i y GenexusXavier Espinoza
Presentación Taller Herramientas Rendimiento DB2 en IBM i y Genexus generando contra RPG y Java. Contiene recomendaciones de como escribir las consultas en Genexus en un entorno específico en ETAPA EP
OSCON 2018 Getting Started with Hyperledger IndyTracy Kuhrt
Presented at OSCON 2018. Hyperledger Indy is a distributed ledger built for decentralized identity and is one of the open source frameworks hosted by Hyperledger. It provides tools, libraries, and reusable components for creating and using independent digital identities rooted on blockchains or other distributed ledgers. In this presentation, I introduce The Linux Foundation and Hyperledger. We look at Decentralized Identity Concepts -- identity models, decentralized identity, zero-knowledge proofs, and verifiable credentials. We look at a demo that utilizes Hyperledger Indy and these concepts. We then look at Hyperledger Indy's software stack and roadmap and touch on how you can get involved.
Iniciativa Barcelona Open Data va tenir el plaer de participar en l'Open Lab de l'Escola d'Administració Pública de Catalunya. Amb aquest motiu, la fundadora de iOpenDataBCN va fer una xerrada que responia, entre d'altres preguntes a "Per què la ciutadania ha de fer servir les dades obertes?".
El exponencial crecimiento de aplicaciones web, móviles y la entrada permanente de dispositivos conectados a internet trajo consigo un cambio en la administración de los datos y una transformación sin precedentes con respecto a como se hacía décadas atrás y de la forma como se diseñaba y operaba a nivel plataformas tecnológicas. Requerimientos provenientes de la nueva economía de Internet presionaron a las empresas emprendedoras de nuevos proyectos y soluciones, más allá de los límites de las bases de datos relacionales (RDBMS) e introdujeron un nuevo tipo de base de datos al dominio de los entornos tecnológicos: Las Arquitecturas de Tipo NoSQL.
Hay un largo camino por recorrer antes de contemplar la posibilidad de implementar una solución en una plataforma que para nuestro entorno local es totalmente nueva y está relacionado con el hecho del poco o ningún conocimiento o referencia de implementaciones que se tiene sobre las mismas.
Es por eso que se habla de un cambio de paradigma, dado que es un nuevo planteamiento para construir, implementar y soportar arquitecturas de TI de alcance masivo. Hoy estamos acostumbrados que muchos temas sean hechos a veces incuestionables, es el resultado de campañas de mercadeo y ventas de la oferta, que unido a la resignación de la demanda que ha creído y crecido pensando que no hay nada mejor disponible.
Authentication & Authorization in GraphQL with AWS AppSync (MOB402) - AWS re:...Amazon Web Services
Modern apps require special consideration for the security and privacy of user data, especially in today’s compliance-driven world. In this session, we provide some of the common use cases and design patterns to secure user data in a globally available GraphQL API, and discuss best practices for authentication and authorization in AWS AppSync.
Presentación Taller Herramientas Rendimiento DB2 en IBM i y GenexusXavier Espinoza
Presentación Taller Herramientas Rendimiento DB2 en IBM i y Genexus generando contra RPG y Java. Contiene recomendaciones de como escribir las consultas en Genexus en un entorno específico en ETAPA EP
OSCON 2018 Getting Started with Hyperledger IndyTracy Kuhrt
Presented at OSCON 2018. Hyperledger Indy is a distributed ledger built for decentralized identity and is one of the open source frameworks hosted by Hyperledger. It provides tools, libraries, and reusable components for creating and using independent digital identities rooted on blockchains or other distributed ledgers. In this presentation, I introduce The Linux Foundation and Hyperledger. We look at Decentralized Identity Concepts -- identity models, decentralized identity, zero-knowledge proofs, and verifiable credentials. We look at a demo that utilizes Hyperledger Indy and these concepts. We then look at Hyperledger Indy's software stack and roadmap and touch on how you can get involved.
Iniciativa Barcelona Open Data va tenir el plaer de participar en l'Open Lab de l'Escola d'Administració Pública de Catalunya. Amb aquest motiu, la fundadora de iOpenDataBCN va fer una xerrada que responia, entre d'altres preguntes a "Per què la ciutadania ha de fer servir les dades obertes?".
Presentació de la Lourdes Muñoz, presidenta d'Iniciativa Barcelona Open Data, sobre per què són importants les dades obertes i les principals activitats d'aquesta iniciativa
El passat 22 de Novembre de 2016 va tenir lloc el primer Drinks & Data a Barcelona, organitzat per Iniciativa Barcelona Open Data i Ideograma a la Fàbrica Lehmann. Vam tenir el gust de tenir com a convidat a en Jordi Graells, director general d'Atenció Ciutadana de la Generalitat de Catalunya, i vam presentar a la nostra #ComunitatXarxa la nostra nova web on poder compartir #Coneixement #OpenData: http://comunitat.iniciativabarcelonaopendata.cat/ca/
Presentación a cargo de de Isabel Piñeiro y Emiliano Marmonti (Módulo Bibliotecas -- Consorcio SIU).
Jornada Argentina de Acceso Abierto 2011 en el marco de la Internacional Semana de Acceso Abierto. 27 de octubre de 2011 | http://accesoabierto2011.caicyt.gov.ar/
En el marco de la XVI Asamblea General del Consorcio Iberoamericano para la Educación en Ciencia y Tecnología ISTEC celebrada en Loja – Ecuador del 4 al 8 de junio de 2007, el profesor Laureano Felipe Gómez presento el curso Dspace para Bibliotecólogos. DSpace, es un sistema de información con arquitectura de repositorio digital cuyo propósito es garantizar que se preserve y distribuya toda la producción intelectual que se genera al interior de las instituciones.
Projecte de formació en dades obertes per a dones als barris. Aquest projecte vol millorar les capacitats digitals de dones en les tecnologies de dades per millorar les seves oportunitats professionals i de trobar feina, amb l’edició del Certificat Professional Open Data Social Visual que compta amb reconeixement internacional del Open Data Institute.
Projecte de formació en dades obertes per a dones als barris. Aquest projecte vol millorar les capacitats digitals de dones en les tecnologies de dades per millorar les seves oportunitats professionals i de trobar feina, amb l’edició del Certificat Professional Open Data Social Visual que compta amb reconeixement internacional del Open Data Institute.
“Para implantar una aplicación de inteligencia artificial necesitamos que el nivel de digitalización de la empresa sea elevado porque debe ser conscientes de la importancia de su implicación”.
Isadora, ens ha parlat de les dades obertes i com es fan servir en l’àmbit del canvi climàtic dins el workshop online que es va portar a terme el dia 7 d'abril de 2020
Workshop Open Data X social. Iniciativa Barcelona Open Data Marzo 2020
Proyecto Citizenlab de Piperlab por Alejandro Llorente
Crónica + todos materiales del evento: http://iniciativabarcelonaopendata.cat/es/2020/03/cronica-26-03-workshop-sobre-open-data-y-proyectos-sociales/
Ponencia de l'Alberto Abella, co-fundador d'Iniciativa Barcelona Open Data, dins el cicle Estiu Open Data al Cibernarium. L'eix de la jornada és com les empreses poden aprofitar les dades obertes per generar valor econòmic.
Diapositivas D.I.P.. sobre la importancia que tiene la interpol en HonduraspptxWalterOrdoez22
Es un conjunto de diapositivas creadas para la información sobre la importancia que tienen la interpol en honduras y los tratados entre ambas instituciones
Ipsos, empresa de investigación de mercados y opinión pública, divulgó su informe N°29 “Claves Ipsos” correspondiente al mes de abril, que encuestó a 800 personas con el fin de identificar las principales opiniones y comportamientos de las y los ciudadanos respecto de temas de interés para el país. En esta edición se abordó la a Carabineros de Chile, su evaluación, legitimidad en su actuar y el asesinato de tres funcionarios en Cañete. Además, se consultó sobre el Ejército y la opinión respecto de la marcha en Putre.
1. INICIATIVA BARCELONA OPEN DATA
EL VALOR D’OBRIR LES DADES
Datos enlazados
curso 1.6
Docente:
Álvaro Sicilia @alvarosiciliago
2. OBJECTIVO DE LA SESIÓN
● Al final de la sesión seréis capaces de:
● Definir que son los datos enlazados y la web semántica
● Identificar datos enlazados y saber navegar por ellos
● Describir recursos en la web (RDF)
● Identificar tecnologías para enlazar datos
Facultar a los participantes para enlazar datos abiertos y su uso
Datos enlazados
3. ÍNDICE
1. Introducción a los datos enlazados
2. De datos abiertos a datos enlazados
3. Uso de vocabularios y DCAT
4. Enlazar datos abiertos
5. Describir recursos en la web
6. Como transformar datos abiertos a RDF
7. Tecnologías utilizadas en la web semántica
8. Consultar datos enlazados
4. ¿Que son los datos
enlazados?
Preparad una definición de este
concepto
Actividad colectiva
Tiempo: 2 minutos
Actividad
5. * http://www.w3c.es/Divulgacion/GuiasBreves/LinkedData
** http://www.w3c.es/Divulgacion/GuiasBreves/WebSemantica
Los Datos Enlazados es la forma que tiene la Web Semántica
de vincular los distintos datos que están distribuidos en la
Web, de forma que se referencian de la misma forma que lo
hacen los enlaces de las páginas web*
La Web Semántica es una Web extendida, dotada de mayor
significado en la que cualquier usuario en Internet podrá
encontrar respuestas a sus preguntas de forma más rápida y
sencilla gracias a una información mejor definida**
INTRODUCCIÓN A LOS DATOS ENLAZADOS
8. IMDB Wikipedia
¿Lugar de nacimiento
de Harrison Ford?
¿Número de habitantes
de Chicago?
DE DATOS ABIERTOS A DATOS ENLAZADOS
¿Preguntas sobre una fuente de datos?
9. IMDB Wikipedia
¿Qué actores que han nacido en poblaciones de más
de 2 millones de habitantes?
DE DATOS ABIERTOS A DATOS ENLAZADOS
¿Preguntas complejas sobre múltiples
fuentes de datos?
10. IMDB Wikipedia
Usar la Web como una única gran base de datos global
Movernos de una Web de documentos a una Web de Datos
DE DATOS ABIERTOS A DATOS ENLAZADOS
¿Preguntas complejas sobre múltiples
fuentes de datos?
11. DE DATOS ABIERTOS A DATOS ENLAZADOS
1. Usar URIs como nombres de las cosas
2. Usar HTTP URIs, para que cualquiera los pueda consultar
3. Cuando alguien consulta una URI, proporcionar información
útil en lenguajes estándar (RDF, SPARQL)
4. Incluir enlaces a otras URIs
* http://www.w3.org/DesignIssues/LinkedData.html
Los Cuatro principios de la Web de datos
enlazados (Tim Berners Lee, 2006)*
12. ★ publicar los datos en la Web (en cualquier format) con una licencia abierta
★★ publicar los datos estructurados (ex: en Excel lugar de una imagen con datos)
★★★ publicar daots utilizando formatos no propietarios (ex:: CSV en lugar de Excel)
★★★★ utilitzar URIs para apuntar a cosas
★★★★★ Enlazar datos con otros datos
DE DATOS ABIERTOS A DATOS ENLAZADOS
Las 5 estrellas de Tim Berners Lee
15. Navegar por portales
de datos abiertos y
enlazados listar los
diferentes portales
Actividad individual
Tiempo: 15 minutos
Actividad
16. DE DATOS ABIERTOS A DATOS ENLAZADOS
¿Cómo publicar datos enlazados?
1.
Empezar
por un
plan
5.
Mantenerlo
2.
Seleccionar
los datos
4. Publicación
3.
Creación
de un
dataset
Proceso de
los datos
abiertos
17. DE DATOS ABIERTOS A DATOS ENLAZADOS
¿Cómo publicar datos enlazados?
Aplicar un formato
abierto
Capturar los
metadatos
Aplicar una licencia
abierta
Revisar el dataset
19. USO DE VOCABULARIOS Y DCAT
¿Qué es un vocabulario?
Los vocabularios definen los conceptos y relaciones
utilizados para describir y representar un área de
interés.
Definition taken from: http://www.w3.org/standards/semanticweb/ontology
23. USO DE VOCABULARIOS Y DCAT
¿Dónde está el vocabulario?
Estado
Ciudad
Ciudad Fecha creación Fundación Long Lat Alt Estado
24. USO DE VOCABULARIOS Y DCAT
¿Dónde está el vocabulario?
RAE:
1. f. Conjunto de edificios y calles, regidos por un ayu
ntamiento, cuya población densa y numerosa se
dedica por lo común a actividades no agrícolas.
RAE:
5. m. País soberano, reconocido como tal en el
orden internacional, asentado en un territorio
determinado y dotado de órganos de gobierno
propios..
Estado
Ciudad
Ciudad Fecha creación Fundación Long Lat Alt Estado
25. Uso de vocabularios y DCAT
¿Dónde está el vocabulario?
City Creation date
Establishment
date
Long Lat Alt State
Pertenece a
Estado
Ciudad
Ciudad Fecha creación Fundación Long Lat Alt Estado
26. USO DE VOCABULARIOS Y DCAT
¿Dónde está el vocabulario?
- fecha creación
- fundación
City Creation date
Establishment
date
Long Lat Alt State
Pertenece a
Estado
Ciudad
Ciudad Fecha creación Fundación Long Lat Alt Estado
27. USO DE VOCABULARIOS Y DCAT
¿Dónde está el vocabulario?
Punto
Localización
- longitud
- latitud
- altitud
- fecha creación
- fundación
City Creation date
Establishment
date
Long Lat Alt State
Pertenece a
Estado
Ciudad
Ciudad Fecha creación Fundación Long Lat Alt Estado
28. USO DE VOCABULARIOS Y DCAT
¿Dónde está el vocabulario?
• Un vocabulario puede representar muchos datasets
• Los vocabularios son utilizados para integrar o
armonizar datos de diferentes fuentes (CSV, bases de
datos, páginas web…)
Punto
Localización
- longitud
- latitud
- altitud
- fecha creación
- fundación
City Creation date
Establishment
date
Long Lat Alt State
Pertenece a
Estado
Ciudad
Ciudad Fecha creación Fundación Long Lat Alt Estado
29. USO DE VOCABULARIOS Y DCAT
Ventajas de utilizar vocabularios
Un vocabulario:
- Da contexto (para moverse de datos a información)
- Facilita reutilización de los datos
- Reduce ambigüedad
- Facilita la integración
- Facilita el mantenimiento
30. USO DE VOCABULARIOS Y DCAT
Data Catalog Vocabulary (DCAT)
DCAT es una especificación (vocabulario) para la
descripción de catálogos de datos en la red. La
especificación oficial ha sido elaborada por el W3C, basada
en algunos proyectos anteriores.
DCAT-AP (Application Profile) es una especificación
basada en DCAT para describir datasets del sector público
en Europa.
31. USO DE VOCABULARIOS Y DCAT
Data Catalog Vocabulary (DCAT)
https://www.w3.org/TR/vocab-dcat/
32. USO DE VOCABULARIOS Y DCAT
Data Catalog Vocabulary (DCAT)
Identificadores temáticos DCAT-AP Identificadores temáticos NTI-RISP
ciencia-tecnologia Ciencia-tecnologia
Agricultura, pesca, forestal y alimentación Medio-rural-pesca
Economía y finanzas Economía
Comercio
Hacienda
Educación, cultura y deporte Educación
Cultura-ocio
Deporte
Energía Energía
Medio ambiente Medio-ambiente
Gobierno y sector público Sector-publico
Salud Salud
Asuntos internacionales
Justicia, sistema legal y seguridad Legislacion-justicia
Seguridad
Regiones y ciudades Urbanismos-infraestructuras
Vivienda
Población y sociedad Demografía
Sociedad-bienestar
Empleo
Transporte Transporte
Industria
Turismo
Las temáticas de DCAT-AP han sido traducidas de su original en inglés. Esta equivalencia es realizada por
Alberto Abella y no hay una guía oficial refrendándola
33. USO DE VOCABULARIOS Y DCAT
Vocabulary of Interlinked Datasets (VoiD)
http://richard.cyganiak.de/2011/gld/gld-dcat-and-void.pdf
34. ENLAZAR DATOS ABIERTOS
¿Cómo publicar datos enlazados?
Aplicar un formato
abierto
Capturar los
metadatos
Aplicar una licencia
abierta
Revisar el dataset
Identificar enlaces
con otros datasets
Enlazar las instancias de
los diferentes datasets
35. ENLAZAR DATOS ABIERTOS
Enlazando datos abiertos
Procedimiento
1. Identificar aquellos conceptos cuyos individuos puedan ser
enlazados dado su interés y potencial.
2. Identificar qué conjuntos de datos pueden contener
instancias de los conceptos inidentificados previamente.
3. Seleccionar las herramientas mas adecuadas para llevar a
cabo el enlazado (semi) automático.
4. Ejecutar estas herramientas sobre las fuentes de datos
para obtener los correspondientes enlaces.
36. ENLAZAR DATOS ABIERTOS
Enlazando datos abiertos
• Alineación por valores. Determinar cuando dos valores de
dos propiedades expresados de forma diferente son
equivalentes
• Alineación por instancias. Determinar si dos instancias son
equivalentes
• De acuerdo a las descripciones disponibles para dichas
instancias
• Basado en agregación de técnicas de alineación de
valores, transitividad de owl:sameAs, mapeos de
ontologías, etc.
• Alineación por dataset. Utilizando un conjunto de
potenciales mapeos de individuos entre dos datasets
38. DESCRIBIR RECURSOS EN LA WEB
Describir la semántica de la información de manera
procesable por máquinas
Resource Description Framework (RDF)
Tripletas: Sujeto – Predicado – Objecto
Harrison Ford es un Actor
Harrison Ford mide 1,85
Harrison Ford nació en Chicago
40. DESCRIBIR RECURSOS EN LA WEB
Describir la semántica de la información de manera
procesable por máquinas
Resource Description Framework (RDF)
Tripletas: Sujeto – Predicado – Objecto
http://es.dbpedia.org/resource/Harrison_Ford
http://es.dbpedia.org/ontology/Actor
https://www.w3.org/1999/02/22-rdf-syntax-ns#type
41. DESCRIBIR RECURSOS EN LA WEB
Describir la semántica de la información de manera
procesable por máquinas
Resource Description Framework (RDF)
Tripletas: Sujeto – Predicado – Objecto
http://es.dbpedia.org/resource/Harrison_Ford
http://es.dbpedia.org/resource/Chicago
http://es.dbpedia.org/ontology/birthPlace
42. DESCRIBIR RECURSOS EN LA WEB
Describir la semántica de la información de manera
procesable por máquinas
Resource Description Framework (RDF)
Tripletas: Sujeto – Predicado – Objecto
http://es.dbpedia.org/resource/Harrison_Ford
“1.85”
http://es.dbpedia.org/ontology/height
43. height
DESCRIBIR RECURSOS EN LA WEB
Describir la semántica de la información de manera
procesable por máquinas
Resource Description Framework (RDF)
Tripletas: Sujeto – Predicado – Objecto
…/Harrison_Ford
“1.85”
…/Chicago
…Actor
type
birthPlace
44. height
height
DESCRIBIR RECURSOS EN LA WEB
Describir la semántica de la información de manera
procesable por máquinas
Resource Description Framework (RDF)
Tripletas: Sujeto – Predicado – Objecto
…/Harrison_Ford
“1.85”
…/Chicago
…Actor
type
…/RobinWilliams
“1.7”
type
birthPlace
45. COMO TRANSFORMAR DATOS ABIERTOS A RDF
dataset
Rdf
dump Triple store
Consultas
Sparql
dataset SQL RDF
wrapper
Consultas
Sparql
• Rápido
• No actualizado
• Materializado
• No es rápido
• Actualizado
• Bases de datos relacionales
Mapeos R2RML
48. TECNOLOGÍAS UTILIZADAS EN LA WEB SEMÁNTICA
Triple stores:
- Virtuoso Universal Server virtuoso.openlinksw.com
- RDF4J www.rdf4j.org
Publicar datos
- Pubby wifo5-03.informatik.uni-mannheim.de/pubby
- Elda github.com/epimorphics/elda
Enlazar datos
- Silk silkframework.org
- Limes aksw.org/Projects/LIMES.html
W3C listado de recursos:
www.w3.org/wiki/TaskForces/CommunityProjects/LinkingOp
enData/SemWebClients
49. CONSULTAR DATOS ENLAZADOS
Breve introducción a SPARQL
SELECT Distinct ?Concepto
WHERE {
?x a ?Concepto.
}
http://es.dbpedia.org/sparql
SELECT Distinct ?x
WHERE {
?x a <http://schema.org/Airport>.
}
51. OBJECTIVO DE LA SESIÓN
● Ara sois capaces de:
● Definir que son los datos enlazados y la web semántica
● Identificar datos enlazados y saber navegar por ellos
● Describir recursos en la web (RDF)
● Identificar tecnologías para enlazar datos
Facultar a los participantes para enlazar datos abiertos y su uso
Datos enlazados
Ejercicio- Individual.
Profesor Pide que Cada alumno describa que entiende que son los datos enlazados
Dar 2 minuto. Discutir las descripciones de los alumnos de forma colectiva.
Dotar de mayor significado a la web que los datos tengan significado
Datos esten vinculados entre sí para poder hacer consultas complejas
Pe: vuelos a ciudades que tengan el aeropuerto como máximo a 20km
La información de distancia entre ciudades y aeropuertos igual no está guardada en ningun sitio, pero si cada uno está geolocalizado entonces el buscador semántico puede calcular la distancia entre ellos.