SlideShare una empresa de Scribd logo
1 de 14
Lecciones aprendidas en la
publicación de datos
enlazados
Asunción Gómez-Pérez
Facultad de Informática, Universidad Politécnica de Madrid
Campus de Montegancedo sn, 28660 Boadilla del Monte, Madrid
http://www.oeg-upm.net
asun@fi.upm.es
Agradecimientos:
O. Corcho, D. Vila
Jornada de Web semántica en archivos, bibliotecas y museos.
Madrid, 10 de abril de 2014
Lecciones aprendidas en la publicación de datos enlazados A. Gómez-Pérez Madrid 10 de abril de 2014
Los datos enlazados son para las máquinas, también para los humanos
Lecciones aprendidas en la publicación de datos enlazados A. Gómez-Pérez Madrid 10 de abril de 2014
Casuística
Dominios FuentesProveedores Idiomas
Lecciones aprendidas en la publicación de datos enlazados A. Gómez-Pérez Madrid 10 de abril de 2014
¿Qué busca el usuario de datos enlazados?
• ¿Quién generó el conjunto de datos?
• ¿Cuándo se creó el conjunto de datos?
• ¿Cómo se creó el conjunto de datos?
• ¿Es ésta la última versión?
• ¿Está la información sobre licencias de uso claramente identificada?
• ¿En qué formatos se me ofrecen los datos abiertos?
• ¿Son los datos monoligües o multilingües?
Lecciones aprendidas en la publicación de datos enlazados A. Gómez-Pérez Madrid 10 de abril de 2014
Lección 1. La institución debe estar convencida
Convencimiento institucional
• Aportar recursos humanos
• Antes de empezar:
• Datos recopilados
• Datos de calidad en origen
• No es una solución a coste cero
• Presupuesto asignado interno
• Presupuesto externo,si solita la ayuda de terceros
• Plan de formación interno en tecnologías semánticas
• Otra tecnología a mantener
• Persistencia y sostenibilidad
• Los datos evolucionan
5
Lecciones aprendidas en la publicación de datos enlazados A. Gómez-Pérez Madrid 10 de abril de 2014
Lección 2: Usar datos curados
6
No se debe generar datos
enlazados a partir de
cualquier dato
Lecciones aprendidas en la publicación de datos enlazados A. Gómez-Pérez Madrid 10 de abril de 2014
Lección 3: Los aspectos metodológicos son importantes
Especificación
Modelado del
vocabulario
(ontología)
Generación
en RDF
Publicación
Explotacion
Enlazado con
otros datos
7
Limpieza
de los
datos
Muchas
tecnologías
involucradas
Lecciones aprendidas en la publicación de datos enlazados A. Gómez-Pérez Madrid 10 de abril de 2014
Lección 4: Utilizar ontologías
http://www.server1.org/resource/Cervantes
http://www.server2.es/resource/Cervantes
http://datos.bne.es/resource/XX1718747
http://d-nb.info/gnd/11851993X
http://geo.linkeddata.es/page/resource/Municipio/Cervantes
Same as
Same as
Same as
Same as
URI
URI
URI
URI
URI
914 296 093
276,4 km²
Phone
Size
1547
#People
1547
Date of Birth
Author
D. Quijote
Cervantes
(persona)
Lecciones aprendidas en la publicación de datos enlazados A. Gómez-Pérez Madrid 10 de abril de 2014
Cervantes y un poco de semántica
http://www.server1.org/resource/Cervantes
http://www.server2.es/resource/Cervantes
http://datos.bne.es/resource/XX1718747
http://d-nb.info/gnd/11851993X
http://geo.linkeddata.es/page/resource/Municipio/Cervantes
Same as
Person
rdf:type
rdf:type
Retaurant
rdf:type
Street
rdf:type
Municipality
rdf:type
URI
URI
URI
URI
URI
1547
Date of Birth
Author
D. Quijote
Cervantes
(Person)
Asunción Gómez-Pérez W3C @ Spain – 2013 Madrid, 18th December
Lecciones aprendidas en la publicación de datos enlazados A. Gómez-Pérez Madrid 10 de abril de 2014
Lección 5: Introducir metadatos adicionales siguiendo estándares
• Propiedad Intelectual
• Licencias de uso
• Procedencia (Provenance) del dato
• Proceso seguido para:
• obtener el dato en su formato original
• generar el dato en RDF
• Idioma
10
Lecciones aprendidas en la publicación de datos enlazados A. Gómez-Pérez Madrid 10 de abril de 2014
Lección 6: Ser selectivos con los enlaces
• No hay que enlazar con todo
• Enlaces con recursos
• De calidad
• Relevantes
• que abren la puerta a otros recursos
• Enlaces persistentes
11
Lecciones aprendidas en la publicación de datos enlazados A. Gómez-Pérez Madrid 10 de abril de 2014
Efectos colaterales importantes
12
El proceso de generar RDF incrementa la
calidad de los datos en el formato origen
• Detección automática de anomalías
• Reducción de costes
Lecciones aprendidas en la publicación de datos enlazados A. Gómez-Pérez Madrid 10 de abril de 2014
Conclusiones
1. Convencimiento institucional
2. Generar con datos de calidad
3. Los aspectos metodológicos son importantes
4. Las ontologías proporcionan contexto al dato
5. Introducir metadatos de procedencia, licencias e
idiomas
6. Ser selectivos con los enlaces
7. Efectos colaterales importantes
• Mejora de los datos de la institución
• Reducción de costes
8. Plan de formación en Tecnologías Semánticas y
Datos enlazados
• (cursos disponibles en http://www.oeg-upm.net/)
Lecciones aprendidas en la
publicación de datos
enlazados
Asunción Gómez-Pérez
Facultad de Informática, Universidad Politécnica de Madrid
Campus de Montegancedo sn, 28660 Boadilla del Monte, Madrid
http://www.oeg-upm.net
asun@fi.upm.es
Agradecimientos:
O. Corcho, D. Vila
Jornada de Web semántica en archivos, bibliotecas y museos.
Madrid, 10 de abril de 2014

Más contenido relacionado

Similar a Lecciones datos enlazados

Gestionar y compartir Datos de Investigación: los retos y los principales com...
Gestionar y compartir Datos de Investigación: los retos y los principales com...Gestionar y compartir Datos de Investigación: los retos y los principales com...
Gestionar y compartir Datos de Investigación: los retos y los principales com...Pedro Príncipe
 
Reutilización de datos abiertos en el aprendizaje de diseño de bases de datos...
Reutilización de datos abiertos en el aprendizaje de diseño de bases de datos...Reutilización de datos abiertos en el aprendizaje de diseño de bases de datos...
Reutilización de datos abiertos en el aprendizaje de diseño de bases de datos...Jose Norberto Mazon
 
A. Fuster. La era del Open Data: Caso de éxito y oportunidades. Semanainforma...
A. Fuster. La era del Open Data: Caso de éxito y oportunidades. Semanainforma...A. Fuster. La era del Open Data: Caso de éxito y oportunidades. Semanainforma...
A. Fuster. La era del Open Data: Caso de éxito y oportunidades. Semanainforma...COIICV
 
Herramientas de la web 3
Herramientas de la web 3Herramientas de la web 3
Herramientas de la web 3Matsukasaki
 
Objetivo y temario de bda
Objetivo y temario de bdaObjetivo y temario de bda
Objetivo y temario de bdaJaime Lara
 
Silabo tbd 2019_n_v1
Silabo tbd 2019_n_v1Silabo tbd 2019_n_v1
Silabo tbd 2019_n_v1UNFV
 
Presentacion del programa de formacion profesional de Informática en Salud, E...
Presentacion del programa de formacion profesional de Informática en Salud, E...Presentacion del programa de formacion profesional de Informática en Salud, E...
Presentacion del programa de formacion profesional de Informática en Salud, E...Pablo Pazos
 
Linked Data en el dominio geográfico español
Linked Data en el dominio geográfico españolLinked Data en el dominio geográfico español
Linked Data en el dominio geográfico españolOscar Corcho
 
Escuela de Datos
Escuela de DatosEscuela de Datos
Escuela de DatosSocialTIC
 
Edutec16 - Investigación Abierta / Open research
Edutec16 - Investigación Abierta / Open researchEdutec16 - Investigación Abierta / Open research
Edutec16 - Investigación Abierta / Open researchThieme Hennis
 
Trabajo de la tic s
Trabajo de la tic s Trabajo de la tic s
Trabajo de la tic s Naykamparan
 
Silabo base de datos 2013
Silabo base de datos 2013Silabo base de datos 2013
Silabo base de datos 2013gonzalopomboza
 
Ciencia Abierta y Gestión de Datos de Investigación (RDM)
Ciencia Abierta y Gestión de Datos de Investigación (RDM)Ciencia Abierta y Gestión de Datos de Investigación (RDM)
Ciencia Abierta y Gestión de Datos de Investigación (RDM)Paola Andrea Ramirez
 

Similar a Lecciones datos enlazados (20)

Gestionar y compartir Datos de Investigación: los retos y los principales com...
Gestionar y compartir Datos de Investigación: los retos y los principales com...Gestionar y compartir Datos de Investigación: los retos y los principales com...
Gestionar y compartir Datos de Investigación: los retos y los principales com...
 
Reutilización de datos abiertos en el aprendizaje de diseño de bases de datos...
Reutilización de datos abiertos en el aprendizaje de diseño de bases de datos...Reutilización de datos abiertos en el aprendizaje de diseño de bases de datos...
Reutilización de datos abiertos en el aprendizaje de diseño de bases de datos...
 
A. Fuster. La era del Open Data: Caso de éxito y oportunidades. Semanainforma...
A. Fuster. La era del Open Data: Caso de éxito y oportunidades. Semanainforma...A. Fuster. La era del Open Data: Caso de éxito y oportunidades. Semanainforma...
A. Fuster. La era del Open Data: Caso de éxito y oportunidades. Semanainforma...
 
Taller 080324 DBD-01 - Diseño de bases de datos
Taller 080324 DBD-01 - Diseño de bases de datosTaller 080324 DBD-01 - Diseño de bases de datos
Taller 080324 DBD-01 - Diseño de bases de datos
 
Silabus de base de datos i 2014
Silabus de base de datos i 2014 Silabus de base de datos i 2014
Silabus de base de datos i 2014
 
Portafolio de Trabajo REA
Portafolio de Trabajo REAPortafolio de Trabajo REA
Portafolio de Trabajo REA
 
Portafolio de trabajo
Portafolio de trabajoPortafolio de trabajo
Portafolio de trabajo
 
Implementação de serviços nacionais e estratégias institucionais para a Gestã...
Implementação de serviços nacionais e estratégias institucionais para a Gestã...Implementação de serviços nacionais e estratégias institucionais para a Gestã...
Implementação de serviços nacionais e estratégias institucionais para a Gestã...
 
Herramientas de la web 3
Herramientas de la web 3Herramientas de la web 3
Herramientas de la web 3
 
Objetivo y temario de bda
Objetivo y temario de bdaObjetivo y temario de bda
Objetivo y temario de bda
 
Silabo tbd 2019_n_v1
Silabo tbd 2019_n_v1Silabo tbd 2019_n_v1
Silabo tbd 2019_n_v1
 
Presentacion del programa de formacion profesional de Informática en Salud, E...
Presentacion del programa de formacion profesional de Informática en Salud, E...Presentacion del programa de formacion profesional de Informática en Salud, E...
Presentacion del programa de formacion profesional de Informática en Salud, E...
 
Linked Data en el dominio geográfico español
Linked Data en el dominio geográfico españolLinked Data en el dominio geográfico español
Linked Data en el dominio geográfico español
 
Elaboración de sílabo 2
Elaboración de sílabo 2Elaboración de sílabo 2
Elaboración de sílabo 2
 
Escuela de Datos
Escuela de DatosEscuela de Datos
Escuela de Datos
 
Edutec16 - Investigación Abierta / Open research
Edutec16 - Investigación Abierta / Open researchEdutec16 - Investigación Abierta / Open research
Edutec16 - Investigación Abierta / Open research
 
Conole barcelona
Conole barcelonaConole barcelona
Conole barcelona
 
Trabajo de la tic s
Trabajo de la tic s Trabajo de la tic s
Trabajo de la tic s
 
Silabo base de datos 2013
Silabo base de datos 2013Silabo base de datos 2013
Silabo base de datos 2013
 
Ciencia Abierta y Gestión de Datos de Investigación (RDM)
Ciencia Abierta y Gestión de Datos de Investigación (RDM)Ciencia Abierta y Gestión de Datos de Investigación (RDM)
Ciencia Abierta y Gestión de Datos de Investigación (RDM)
 

Más de Asuncion Gomez-Perez

Maximising (Re)Usability of Library metadata using Linked Data
Maximising (Re)Usability of Library metadata using Linked Data Maximising (Re)Usability of Library metadata using Linked Data
Maximising (Re)Usability of Library metadata using Linked Data Asuncion Gomez-Perez
 
Maximising (Re)Usability of Resources using Linked Data
Maximising (Re)Usability of Resources using Linked DataMaximising (Re)Usability of Resources using Linked Data
Maximising (Re)Usability of Resources using Linked DataAsuncion Gomez-Perez
 
Uso de datos.bne.es: imaginando el futuro
Uso de datos.bne.es: imaginando el futuroUso de datos.bne.es: imaginando el futuro
Uso de datos.bne.es: imaginando el futuroAsuncion Gomez-Perez
 
Linked data and language technologies
Linked data and language technologies Linked data and language technologies
Linked data and language technologies Asuncion Gomez-Perez
 
Linked DAta Applications: There is no One-Size-Fits All Formula (Long present...
Linked DAta Applications: There is no One-Size-Fits All Formula (Long present...Linked DAta Applications: There is no One-Size-Fits All Formula (Long present...
Linked DAta Applications: There is no One-Size-Fits All Formula (Long present...Asuncion Gomez-Perez
 
Linked DAta Applications: There is no One-Size-Fits All Formula (Short presen...
Linked DAta Applications: There is no One-Size-Fits All Formula (Short presen...Linked DAta Applications: There is no One-Size-Fits All Formula (Short presen...
Linked DAta Applications: There is no One-Size-Fits All Formula (Short presen...Asuncion Gomez-Perez
 
Datos enlazados en la Biblioteca Nacional de España
Datos enlazados en la Biblioteca Nacional  de EspañaDatos enlazados en la Biblioteca Nacional  de España
Datos enlazados en la Biblioteca Nacional de EspañaAsuncion Gomez-Perez
 

Más de Asuncion Gomez-Perez (8)

Maximising (Re)Usability of Library metadata using Linked Data
Maximising (Re)Usability of Library metadata using Linked Data Maximising (Re)Usability of Library metadata using Linked Data
Maximising (Re)Usability of Library metadata using Linked Data
 
Maximising (Re)Usability of Resources using Linked Data
Maximising (Re)Usability of Resources using Linked DataMaximising (Re)Usability of Resources using Linked Data
Maximising (Re)Usability of Resources using Linked Data
 
Uso de datos.bne.es: imaginando el futuro
Uso de datos.bne.es: imaginando el futuroUso de datos.bne.es: imaginando el futuro
Uso de datos.bne.es: imaginando el futuro
 
Linked data and language technologies
Linked data and language technologies Linked data and language technologies
Linked data and language technologies
 
Linked DAta Applications: There is no One-Size-Fits All Formula (Long present...
Linked DAta Applications: There is no One-Size-Fits All Formula (Long present...Linked DAta Applications: There is no One-Size-Fits All Formula (Long present...
Linked DAta Applications: There is no One-Size-Fits All Formula (Long present...
 
Linked DAta Applications: There is no One-Size-Fits All Formula (Short presen...
Linked DAta Applications: There is no One-Size-Fits All Formula (Short presen...Linked DAta Applications: There is no One-Size-Fits All Formula (Short presen...
Linked DAta Applications: There is no One-Size-Fits All Formula (Short presen...
 
W3c app ld-asun(v5)-final
W3c app ld-asun(v5)-finalW3c app ld-asun(v5)-final
W3c app ld-asun(v5)-final
 
Datos enlazados en la Biblioteca Nacional de España
Datos enlazados en la Biblioteca Nacional  de EspañaDatos enlazados en la Biblioteca Nacional  de España
Datos enlazados en la Biblioteca Nacional de España
 

Último

Presentación guía sencilla en Microsoft Excel.pptx
Presentación guía sencilla en Microsoft Excel.pptxPresentación guía sencilla en Microsoft Excel.pptx
Presentación guía sencilla en Microsoft Excel.pptxLolaBunny11
 
guía de registro de slideshare por Brayan Joseph
guía de registro de slideshare por Brayan Josephguía de registro de slideshare por Brayan Joseph
guía de registro de slideshare por Brayan JosephBRAYANJOSEPHPEREZGOM
 
9egb-lengua y Literatura.pdf_texto del estudiante
9egb-lengua y Literatura.pdf_texto del estudiante9egb-lengua y Literatura.pdf_texto del estudiante
9egb-lengua y Literatura.pdf_texto del estudianteAndreaHuertas24
 
CLASE DE TECNOLOGIA E INFORMATICA PRIMARIA
CLASE  DE TECNOLOGIA E INFORMATICA PRIMARIACLASE  DE TECNOLOGIA E INFORMATICA PRIMARIA
CLASE DE TECNOLOGIA E INFORMATICA PRIMARIAWilbisVega
 
Desarrollo Web Moderno con Svelte 2024.pdf
Desarrollo Web Moderno con Svelte 2024.pdfDesarrollo Web Moderno con Svelte 2024.pdf
Desarrollo Web Moderno con Svelte 2024.pdfJulian Lamprea
 
pruebas unitarias unitarias en java con JUNIT
pruebas unitarias unitarias en java con JUNITpruebas unitarias unitarias en java con JUNIT
pruebas unitarias unitarias en java con JUNITMaricarmen Sánchez Ruiz
 
International Women's Day Sucre 2024 (IWD)
International Women's Day Sucre 2024 (IWD)International Women's Day Sucre 2024 (IWD)
International Women's Day Sucre 2024 (IWD)GDGSucre
 
Trabajo Mas Completo De Excel en clase tecnología
Trabajo Mas Completo De Excel en clase tecnologíaTrabajo Mas Completo De Excel en clase tecnología
Trabajo Mas Completo De Excel en clase tecnologíassuserf18419
 
Proyecto integrador. Las TIC en la sociedad S4.pptx
Proyecto integrador. Las TIC en la sociedad S4.pptxProyecto integrador. Las TIC en la sociedad S4.pptx
Proyecto integrador. Las TIC en la sociedad S4.pptx241521559
 
Global Azure Lima 2024 - Integración de Datos con Microsoft Fabric
Global Azure Lima 2024 - Integración de Datos con Microsoft FabricGlobal Azure Lima 2024 - Integración de Datos con Microsoft Fabric
Global Azure Lima 2024 - Integración de Datos con Microsoft FabricKeyla Dolores Méndez
 
Redes direccionamiento y subredes ipv4 2024 .pdf
Redes direccionamiento y subredes ipv4 2024 .pdfRedes direccionamiento y subredes ipv4 2024 .pdf
Redes direccionamiento y subredes ipv4 2024 .pdfsoporteupcology
 
POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...
POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...
POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...silviayucra2
 
EPA-pdf resultado da prova presencial Uninove
EPA-pdf resultado da prova presencial UninoveEPA-pdf resultado da prova presencial Uninove
EPA-pdf resultado da prova presencial UninoveFagnerLisboa3
 

Último (13)

Presentación guía sencilla en Microsoft Excel.pptx
Presentación guía sencilla en Microsoft Excel.pptxPresentación guía sencilla en Microsoft Excel.pptx
Presentación guía sencilla en Microsoft Excel.pptx
 
guía de registro de slideshare por Brayan Joseph
guía de registro de slideshare por Brayan Josephguía de registro de slideshare por Brayan Joseph
guía de registro de slideshare por Brayan Joseph
 
9egb-lengua y Literatura.pdf_texto del estudiante
9egb-lengua y Literatura.pdf_texto del estudiante9egb-lengua y Literatura.pdf_texto del estudiante
9egb-lengua y Literatura.pdf_texto del estudiante
 
CLASE DE TECNOLOGIA E INFORMATICA PRIMARIA
CLASE  DE TECNOLOGIA E INFORMATICA PRIMARIACLASE  DE TECNOLOGIA E INFORMATICA PRIMARIA
CLASE DE TECNOLOGIA E INFORMATICA PRIMARIA
 
Desarrollo Web Moderno con Svelte 2024.pdf
Desarrollo Web Moderno con Svelte 2024.pdfDesarrollo Web Moderno con Svelte 2024.pdf
Desarrollo Web Moderno con Svelte 2024.pdf
 
pruebas unitarias unitarias en java con JUNIT
pruebas unitarias unitarias en java con JUNITpruebas unitarias unitarias en java con JUNIT
pruebas unitarias unitarias en java con JUNIT
 
International Women's Day Sucre 2024 (IWD)
International Women's Day Sucre 2024 (IWD)International Women's Day Sucre 2024 (IWD)
International Women's Day Sucre 2024 (IWD)
 
Trabajo Mas Completo De Excel en clase tecnología
Trabajo Mas Completo De Excel en clase tecnologíaTrabajo Mas Completo De Excel en clase tecnología
Trabajo Mas Completo De Excel en clase tecnología
 
Proyecto integrador. Las TIC en la sociedad S4.pptx
Proyecto integrador. Las TIC en la sociedad S4.pptxProyecto integrador. Las TIC en la sociedad S4.pptx
Proyecto integrador. Las TIC en la sociedad S4.pptx
 
Global Azure Lima 2024 - Integración de Datos con Microsoft Fabric
Global Azure Lima 2024 - Integración de Datos con Microsoft FabricGlobal Azure Lima 2024 - Integración de Datos con Microsoft Fabric
Global Azure Lima 2024 - Integración de Datos con Microsoft Fabric
 
Redes direccionamiento y subredes ipv4 2024 .pdf
Redes direccionamiento y subredes ipv4 2024 .pdfRedes direccionamiento y subredes ipv4 2024 .pdf
Redes direccionamiento y subredes ipv4 2024 .pdf
 
POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...
POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...
POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...
 
EPA-pdf resultado da prova presencial Uninove
EPA-pdf resultado da prova presencial UninoveEPA-pdf resultado da prova presencial Uninove
EPA-pdf resultado da prova presencial Uninove
 

Lecciones datos enlazados

  • 1. Lecciones aprendidas en la publicación de datos enlazados Asunción Gómez-Pérez Facultad de Informática, Universidad Politécnica de Madrid Campus de Montegancedo sn, 28660 Boadilla del Monte, Madrid http://www.oeg-upm.net asun@fi.upm.es Agradecimientos: O. Corcho, D. Vila Jornada de Web semántica en archivos, bibliotecas y museos. Madrid, 10 de abril de 2014
  • 2. Lecciones aprendidas en la publicación de datos enlazados A. Gómez-Pérez Madrid 10 de abril de 2014 Los datos enlazados son para las máquinas, también para los humanos
  • 3. Lecciones aprendidas en la publicación de datos enlazados A. Gómez-Pérez Madrid 10 de abril de 2014 Casuística Dominios FuentesProveedores Idiomas
  • 4. Lecciones aprendidas en la publicación de datos enlazados A. Gómez-Pérez Madrid 10 de abril de 2014 ¿Qué busca el usuario de datos enlazados? • ¿Quién generó el conjunto de datos? • ¿Cuándo se creó el conjunto de datos? • ¿Cómo se creó el conjunto de datos? • ¿Es ésta la última versión? • ¿Está la información sobre licencias de uso claramente identificada? • ¿En qué formatos se me ofrecen los datos abiertos? • ¿Son los datos monoligües o multilingües?
  • 5. Lecciones aprendidas en la publicación de datos enlazados A. Gómez-Pérez Madrid 10 de abril de 2014 Lección 1. La institución debe estar convencida Convencimiento institucional • Aportar recursos humanos • Antes de empezar: • Datos recopilados • Datos de calidad en origen • No es una solución a coste cero • Presupuesto asignado interno • Presupuesto externo,si solita la ayuda de terceros • Plan de formación interno en tecnologías semánticas • Otra tecnología a mantener • Persistencia y sostenibilidad • Los datos evolucionan 5
  • 6. Lecciones aprendidas en la publicación de datos enlazados A. Gómez-Pérez Madrid 10 de abril de 2014 Lección 2: Usar datos curados 6 No se debe generar datos enlazados a partir de cualquier dato
  • 7. Lecciones aprendidas en la publicación de datos enlazados A. Gómez-Pérez Madrid 10 de abril de 2014 Lección 3: Los aspectos metodológicos son importantes Especificación Modelado del vocabulario (ontología) Generación en RDF Publicación Explotacion Enlazado con otros datos 7 Limpieza de los datos Muchas tecnologías involucradas
  • 8. Lecciones aprendidas en la publicación de datos enlazados A. Gómez-Pérez Madrid 10 de abril de 2014 Lección 4: Utilizar ontologías http://www.server1.org/resource/Cervantes http://www.server2.es/resource/Cervantes http://datos.bne.es/resource/XX1718747 http://d-nb.info/gnd/11851993X http://geo.linkeddata.es/page/resource/Municipio/Cervantes Same as Same as Same as Same as URI URI URI URI URI 914 296 093 276,4 km² Phone Size 1547 #People 1547 Date of Birth Author D. Quijote Cervantes (persona)
  • 9. Lecciones aprendidas en la publicación de datos enlazados A. Gómez-Pérez Madrid 10 de abril de 2014 Cervantes y un poco de semántica http://www.server1.org/resource/Cervantes http://www.server2.es/resource/Cervantes http://datos.bne.es/resource/XX1718747 http://d-nb.info/gnd/11851993X http://geo.linkeddata.es/page/resource/Municipio/Cervantes Same as Person rdf:type rdf:type Retaurant rdf:type Street rdf:type Municipality rdf:type URI URI URI URI URI 1547 Date of Birth Author D. Quijote Cervantes (Person) Asunción Gómez-Pérez W3C @ Spain – 2013 Madrid, 18th December
  • 10. Lecciones aprendidas en la publicación de datos enlazados A. Gómez-Pérez Madrid 10 de abril de 2014 Lección 5: Introducir metadatos adicionales siguiendo estándares • Propiedad Intelectual • Licencias de uso • Procedencia (Provenance) del dato • Proceso seguido para: • obtener el dato en su formato original • generar el dato en RDF • Idioma 10
  • 11. Lecciones aprendidas en la publicación de datos enlazados A. Gómez-Pérez Madrid 10 de abril de 2014 Lección 6: Ser selectivos con los enlaces • No hay que enlazar con todo • Enlaces con recursos • De calidad • Relevantes • que abren la puerta a otros recursos • Enlaces persistentes 11
  • 12. Lecciones aprendidas en la publicación de datos enlazados A. Gómez-Pérez Madrid 10 de abril de 2014 Efectos colaterales importantes 12 El proceso de generar RDF incrementa la calidad de los datos en el formato origen • Detección automática de anomalías • Reducción de costes
  • 13. Lecciones aprendidas en la publicación de datos enlazados A. Gómez-Pérez Madrid 10 de abril de 2014 Conclusiones 1. Convencimiento institucional 2. Generar con datos de calidad 3. Los aspectos metodológicos son importantes 4. Las ontologías proporcionan contexto al dato 5. Introducir metadatos de procedencia, licencias e idiomas 6. Ser selectivos con los enlaces 7. Efectos colaterales importantes • Mejora de los datos de la institución • Reducción de costes 8. Plan de formación en Tecnologías Semánticas y Datos enlazados • (cursos disponibles en http://www.oeg-upm.net/)
  • 14. Lecciones aprendidas en la publicación de datos enlazados Asunción Gómez-Pérez Facultad de Informática, Universidad Politécnica de Madrid Campus de Montegancedo sn, 28660 Boadilla del Monte, Madrid http://www.oeg-upm.net asun@fi.upm.es Agradecimientos: O. Corcho, D. Vila Jornada de Web semántica en archivos, bibliotecas y museos. Madrid, 10 de abril de 2014