SlideShare una empresa de Scribd logo
1 de 44
Wikidata: qué es y
cómo subirse al carro
Daniel Fernández Álvarez
fernandezalvdaniel@uniovi.es
¿Qué es Wikidata?
• Un enorme grafo dirigido de datos de temática general.
• Un proyecto hermano de Wikipedia mantenido por una comunidad
internacional de usuarios.
• Una base de datos legible tanto para humanos como para máquinas.
• Una fuente de información pública con grandes oportunidades para
quien sepa sacar provecho de ella.
Grafo de información
Alejandro
Casona
Besullo
lugar de
nacimiento
pais
España
Alejandro
Casona
Besullo
lugar de
nacimiento
pais
España
es estudiado
por Humano
Antropología
Marcela
Lagarde
es una
Antropóloga
profesión
es un
campo de estudio
Temática general. Interconexión
Tamaño
• Nº de entidades:
• Nº de ediciones:
• Vistas de páginas:
• Nº de idiomas:
• Nº de usuarios activos:
76 millones
1.100 millones
158.000 millones
438
24.000
Crecimiento desde 2012
2012 (fundación) Enero 2020
40 M
80 M
20 M
60 M
Nº de items
NÚMERO DE STATEMENTS POR ITEM
¿Cómo representar el grafo?
• Modelo basado en Resource Description Language (RDF).
• La unidad mínima de conocimiento es la tripleta. Una tripleta
relaciona un sujeto con un objeto mediante un predicado:
Besullo
pais
España
SUJETO predicado OBJETO
¿Cómo representar el grafo?
• Cada elemento y cada propiedad en RDF son representadas como una
URI (Universal Resource Identifier).
• Elementos sin entidad (números, fechas, cadenas de texto) son
llamados literales, no tienen una URI asociada.
• Se pueden utilizar nodos anónimos. Son elementos especiales cuya
identidad no importa pero pueden ayudar a agrupar otros elementos
o a crear topologías más complejas que la tripleta.
¿Cómo representar el grafo?
• RDF es una abstracción. Un mismo contenido puede ser expresado en
diferentes sintaxis concretas de RDF
http://ex.org/Besullo
http://ex.org/pais
http://ex.org/España
Turtle
@prefix ns0: <http://ex.org/> .
<http://ex.org/Besullo> ns0:pais ns0:España .
JSON-LD
[{
"@id": "http://ex.org/Besullo",
"http://ex.org/pais":
[{ "@id": "http://ex.org/España"}]
},
{
"@id": "http://ex.org/España"
}]
<?xml version="1.0" encoding="utf-8" ?>
<rdf:RDF
xmlns:rdf="http://www.w3.org/1999/02/22-
rdf-syntax-ns#" xmlns:ns0="http://ex.org/">
<rdf:Description
rdf:about="http://ex.org/Besullo"> <ns0:pais
rdf:resource="http://ex.org/España"/>
</rdf:Description> </rdf:RDF>
RDF/XML
Wikipedia vs Wikidata
Forma de
representar la
información
Entendible por
humanos
Entendible por
máquinas
Páginas
de texto
Grafo de
información
X
Visualización de la información (humanos)
Alejandro
Casona
Humano
es un
Huellas de Wikidata
Wikipedia Google
Acceso avanzado a la información
Lenguaje de consultas SPARQL
¿Qué museos en el mundo almacenan al menos un cuadro de
algún pintor asturiano? ¿Cuáles son sus coordenadas?
Acceso avanzado a la información
SPARQL endpoint de Wikidata
https://query.wikidata.org/
• Diferentes herramientas de
visualización
• Sugerencias de términos
• Consultas de ejemplo y manuales
• Traducción de consultas a distintos
lenguajes de programación
Museos con cuadros de pintores asturianos
Museo de Historia del Arte de Viena
Museo Pau Casals
Rijksmuseum
Museo de Bellas Artes de Bilbao
Biblioteca Museo Víctor Balaguer
Museo Nacional Thyssen-
Bornemisza
Museo Nacional Centro de Arte
Reina Sofía
Museo de Bellas Artes de Houston
National Gallery de Londres
Museo del Prado
...
Ejecutar consulta
¿Limitaciones?
Principalmente,
ausencia de información
¿No hay cuadros de
pintores asturianos en
Asturias?
Sí, pero no en Wikidata
¡¡ !!
Integración: consultas federadas
Las tecnologías de web semántica nos permiten lanzar consultas que
involucren más de una fuente de información
Comparación de títulos de cuadros de
El Greco en distintas fuentes
Ejecutar la consulta
Representando información en Wikidata
Todas las entidades y todas las propiedades tienen una URI (identificador)
Entidades
http://www.wikidata.org/entity/ + Qxxxx
Propiedades
http://www.wikidata.org/prop/direct/ + Pxxx
Alejandro Casona  Q289215
Besullo  Q600783
Humano  Q5
es un  P31
lugar de nacimiento  P19
país  P17
Una única Wikidata
https://es.wikipedia.org/wiki/Asturias
https://en.wikipedia.org/wiki/Asturias
https://fr.wikipedia.org/wiki/Asturias
• Potenciales repeticiones
• Potenciales ausencias en distintos capítulos
• Potenciales contradicciones
https://www.wikidata.org/wiki/Q39746937
• Única entrada para cualquier entidad
• Cada texto se traduce a diferentes idiomas
• El navegador te muestra la información en tu
idioma de preferencia si es posible
¿Cómo llega la información a Wikidata?
2 vías
Edición manual Bots
A través de un formulario web
Creación de nuevas entidades
Edición de entidades existentes
Creación de nuevas propiedades
Grandes modificaciones de información
Necesario solicitar permiso
Añadir una nueva entidad
Necesario estar logueado
1º: Asegurarse de que la entidad no existe ya
Uso del buscador de Wikidata
(y/o otros buscadores)
2º: Click en “Crear un elemento nuevo”
3º: Añadir información básica en algún(os) idioma(s)
Nombre, descripción, alias(es)
Modificar entidad existente con una sentencia
nueva
Necesario estar logueado
1º: Selección de propiedad adecuada
Sugerencias de autocompletar
Comprobación de otras entidades similares
2º: Selección de valor
Bien otra entidad de Wikidata, bien un literal
3º: Añadir calificadores y referencias
Sobre las referencias
Fuentes autoritativas
No hace falta referencia para hechos obvios/sin disputa
No usar Wikipedia como referencia
Dos propiedades principales
P854 – Afirmado en la dirección web
P248 – Afirmado en
Para información en páginas web
No es necesario crear una nueva entidad
Para casi todo lo demás: libros, revistas,
artículos científicos…
Necesario que exista en Wikidata la
entidad referenciada
Sobre las referencias
Sobre los calificadores
Conocimiento sobre el propio conocimiento
Barack Obama
Presidente de USA
cargo
ocupado
Modelo de datos de calificadores:
Reificación
Barack Obama Presidente de USA
cargo
ocupado
Sujeto Objeto
Modelo de datos de calificadores:
Reificación
Barack Obama Presidente de USA
cargo
ocupado
Sujeto Objeto
Sujeto
Fecha
de inicio “20 ene 2009”
Sucede a
George W. Bush…
…
Modelo de datos de calificadores:
Reificación
cargo
Ocupado
(indirecto A)
Barack Obama Presidente de USA
Fecha
de inicio
“20 ene 2009”
Sucede a
George W. Bush
…
…
Nodo
anónimo
cargo
Ocupado
(indirecto B)
Modelo de datos de calificadores:
Reificación
cargo
Ocupado
(indirecto A)
Barack Obama Presidente de USA
Fecha
de inicio
“20 ene 2009”
Sucede a
George W. Bush
…
…
Nodo
anónimo
cargo
Ocupado
(indirecto B)
:Obama :cargo_ind_A _:1 .
_:1 :fecha_inicio “20 ene 2009” ;
:sucede_a :George_Bush ;
:cargo_ind_B :Presidente_US .
Representación turtle
Aplicaciones
Múltiples aplicaciones pueden ser
desarrolladas usando estos datos
como base….
… pero para eso se necesitan
técnicos.
Histropedia
Timelines ad-hoc interactivos
Platypus
Aplicación de preguntas
Inventaire
• Librería colaborativa
• El core es una base de
usuarios y libros propia…
• … pero toda la
información relativa a los
libros se trae de Wikidata
Otras aplicaciones
• Muchas propuestas y posibilidades:
• Juegos
• Fotografía
• Entornos GLAM (Galerías, Librerías, Archivos, Museos).
• Turismo
• …
• Herramientas para la comunidad de Wikimedia:
Wikimedia Toolforge
• Proximamente en la EII: Hackaton de Wikidata
Retos
Homogeneidad estructural de datos
Humano
Marcela
Lagarde
es una
Mujer
Marcela
Lagarde
Humano
clase
es una
clase
VS
Mujer
Retos
• Diferentes consultas SPARQL:
1. Mujeres que estudian antropología.
2. Humanos que estudian antropología cuyo género es mujer.
• Si los datos se representan usando diferentes esquemas, cada
consulta ignorará parte de los datos.
• Posible solución: Shape Expression (ShEx).
Homogeneidad estructural de datos
VS
ShEx
• ShEx es un lenguaje para validar y describir datos en RDF.
ShEx en Wikidata
• Descripción:
• Guía para editores.
• Guía para elaborar consultas SPARQL.
• Validación:
• Comprobación de uniformidad de algún tipo de entidad.
• Construcción automática de shapes a partir de datos existentes
ShEx en Wikidata
ShEx en Wikidata
Grupo WESO y Wikidata
Asturias y Wikidata
Conclusiones
• Wikidata:
• Base de datos pública.
• Propósito general.
• Gran cantidad de información, y creciendo.
• Fácil integración con otras fuentes de Linked Data.
• Oportunidades:
• Participación altruista (edición de contenido).
• Desarrollo de aplicaciones.
• Investigación / Colaboración a través de:
• Grupo WESO.
• Comunidad local de Wikimedia.
Wikidata: qué es y
cómo subirse al carro
Daniel Fernández Álvarez
fernandezalvdaniel@uniovi.es

Más contenido relacionado

Similar a Wikidata: qué es y cómo subirse al carro

aporte de internet
aporte de internetaporte de internet
aporte de internetanjogonz
 
Charla II Congreso de Bibliotecas Universitarias y Especializadas
Charla II Congreso de Bibliotecas Universitarias y EspecializadasCharla II Congreso de Bibliotecas Universitarias y Especializadas
Charla II Congreso de Bibliotecas Universitarias y EspecializadasChristian Sifaqui
 
Repositorios digitales como apoyo a la investigación científica
Repositorios digitales como apoyo a la investigación científicaRepositorios digitales como apoyo a la investigación científica
Repositorios digitales como apoyo a la investigación científicaLibio Huaroto
 
Repositorios digitales
Repositorios digitales Repositorios digitales
Repositorios digitales Yvette Criado
 
Estrategias de búsqueda en Internet
Estrategias de búsqueda en InternetEstrategias de búsqueda en Internet
Estrategias de búsqueda en Internetmrojanotrak
 
BÚSQUEDA de fuentes confiables con TIC.pptx
BÚSQUEDA de fuentes confiables con TIC.pptxBÚSQUEDA de fuentes confiables con TIC.pptx
BÚSQUEDA de fuentes confiables con TIC.pptxSegundoClementeMendo
 
Indización automatizada
Indización automatizadaIndización automatizada
Indización automatizadaJavier Gascón
 
Recursos de Información en Internet para investigación en el ámbito de la Co...
Recursos de Información en Internet  para investigación en el ámbito de la Co...Recursos de Información en Internet  para investigación en el ámbito de la Co...
Recursos de Información en Internet para investigación en el ámbito de la Co...Renata Rodrigues
 
unidad de aprendizaje 1.
unidad de aprendizaje 1.unidad de aprendizaje 1.
unidad de aprendizaje 1.Get18
 
Seminario "Uso de TICs en la Enseñanza de la Historia y el Patrimonio Cultura...
Seminario "Uso de TICs en la Enseñanza de la Historia y el Patrimonio Cultura...Seminario "Uso de TICs en la Enseñanza de la Historia y el Patrimonio Cultura...
Seminario "Uso de TICs en la Enseñanza de la Historia y el Patrimonio Cultura...Christian Sifaqui
 
Exposicion tema 2
Exposicion tema 2Exposicion tema 2
Exposicion tema 2CAROLINA
 

Similar a Wikidata: qué es y cómo subirse al carro (20)

Wikidata intro
Wikidata introWikidata intro
Wikidata intro
 
aporte de internet
aporte de internetaporte de internet
aporte de internet
 
Researching Semantic Web-Overview
Researching Semantic Web-OverviewResearching Semantic Web-Overview
Researching Semantic Web-Overview
 
Internet
InternetInternet
Internet
 
Tecnología e Igualdad
Tecnología e IgualdadTecnología e Igualdad
Tecnología e Igualdad
 
Charla II Congreso de Bibliotecas Universitarias y Especializadas
Charla II Congreso de Bibliotecas Universitarias y EspecializadasCharla II Congreso de Bibliotecas Universitarias y Especializadas
Charla II Congreso de Bibliotecas Universitarias y Especializadas
 
Datos abiertos enlazados: situación actual y perspectivas
Datos abiertos enlazados: situación actual y perspectivasDatos abiertos enlazados: situación actual y perspectivas
Datos abiertos enlazados: situación actual y perspectivas
 
Repositorios digitales como apoyo a la investigación científica
Repositorios digitales como apoyo a la investigación científicaRepositorios digitales como apoyo a la investigación científica
Repositorios digitales como apoyo a la investigación científica
 
Red Ontologías Hércules – ROH
Red Ontologías Hércules – ROHRed Ontologías Hércules – ROH
Red Ontologías Hércules – ROH
 
Repositorios digitales
Repositorios digitales Repositorios digitales
Repositorios digitales
 
Consulto General
Consulto GeneralConsulto General
Consulto General
 
TICs
TICsTICs
TICs
 
Web 2.0 para bibliotecas
Web 2.0 para bibliotecasWeb 2.0 para bibliotecas
Web 2.0 para bibliotecas
 
Estrategias de búsqueda en Internet
Estrategias de búsqueda en InternetEstrategias de búsqueda en Internet
Estrategias de búsqueda en Internet
 
BÚSQUEDA de fuentes confiables con TIC.pptx
BÚSQUEDA de fuentes confiables con TIC.pptxBÚSQUEDA de fuentes confiables con TIC.pptx
BÚSQUEDA de fuentes confiables con TIC.pptx
 
Indización automatizada
Indización automatizadaIndización automatizada
Indización automatizada
 
Recursos de Información en Internet para investigación en el ámbito de la Co...
Recursos de Información en Internet  para investigación en el ámbito de la Co...Recursos de Información en Internet  para investigación en el ámbito de la Co...
Recursos de Información en Internet para investigación en el ámbito de la Co...
 
unidad de aprendizaje 1.
unidad de aprendizaje 1.unidad de aprendizaje 1.
unidad de aprendizaje 1.
 
Seminario "Uso de TICs en la Enseñanza de la Historia y el Patrimonio Cultura...
Seminario "Uso de TICs en la Enseñanza de la Historia y el Patrimonio Cultura...Seminario "Uso de TICs en la Enseñanza de la Historia y el Patrimonio Cultura...
Seminario "Uso de TICs en la Enseñanza de la Historia y el Patrimonio Cultura...
 
Exposicion tema 2
Exposicion tema 2Exposicion tema 2
Exposicion tema 2
 

Último

Presentación inteligencia artificial en la actualidad
Presentación inteligencia artificial en la actualidadPresentación inteligencia artificial en la actualidad
Presentación inteligencia artificial en la actualidadMiguelAngelVillanuev48
 
Instrumentación Hoy_ INTERPRETAR EL DIAGRAMA UNIFILAR GENERAL DE UNA PLANTA I...
Instrumentación Hoy_ INTERPRETAR EL DIAGRAMA UNIFILAR GENERAL DE UNA PLANTA I...Instrumentación Hoy_ INTERPRETAR EL DIAGRAMA UNIFILAR GENERAL DE UNA PLANTA I...
Instrumentación Hoy_ INTERPRETAR EL DIAGRAMA UNIFILAR GENERAL DE UNA PLANTA I...AlanCedillo9
 
SalmorejoTech 2024 - Spring Boot <3 Testcontainers
SalmorejoTech 2024 - Spring Boot <3 TestcontainersSalmorejoTech 2024 - Spring Boot <3 Testcontainers
SalmorejoTech 2024 - Spring Boot <3 TestcontainersIván López Martín
 
Hernandez_Hernandez_Practica web de la sesion 12.pptx
Hernandez_Hernandez_Practica web de la sesion 12.pptxHernandez_Hernandez_Practica web de la sesion 12.pptx
Hernandez_Hernandez_Practica web de la sesion 12.pptxJOSEMANUELHERNANDEZH11
 
Cortes-24-de-abril-Tungurahua-3 año 2024
Cortes-24-de-abril-Tungurahua-3 año 2024Cortes-24-de-abril-Tungurahua-3 año 2024
Cortes-24-de-abril-Tungurahua-3 año 2024GiovanniJavierHidalg
 
KELA Presentacion Costa Rica 2024 - evento Protégeles
KELA Presentacion Costa Rica 2024 - evento ProtégelesKELA Presentacion Costa Rica 2024 - evento Protégeles
KELA Presentacion Costa Rica 2024 - evento ProtégelesFundación YOD YOD
 
Plan de aula informatica segundo periodo.docx
Plan de aula informatica segundo periodo.docxPlan de aula informatica segundo periodo.docx
Plan de aula informatica segundo periodo.docxpabonheidy28
 
guía de registro de slideshare por Brayan Joseph
guía de registro de slideshare por Brayan Josephguía de registro de slideshare por Brayan Joseph
guía de registro de slideshare por Brayan JosephBRAYANJOSEPHPEREZGOM
 
Global Azure Lima 2024 - Integración de Datos con Microsoft Fabric
Global Azure Lima 2024 - Integración de Datos con Microsoft FabricGlobal Azure Lima 2024 - Integración de Datos con Microsoft Fabric
Global Azure Lima 2024 - Integración de Datos con Microsoft FabricKeyla Dolores Méndez
 
Proyecto integrador. Las TIC en la sociedad S4.pptx
Proyecto integrador. Las TIC en la sociedad S4.pptxProyecto integrador. Las TIC en la sociedad S4.pptx
Proyecto integrador. Las TIC en la sociedad S4.pptx241521559
 
Medidas de formas, coeficiente de asimetría y coeficiente de curtosis.pptx
Medidas de formas, coeficiente de asimetría y coeficiente de curtosis.pptxMedidas de formas, coeficiente de asimetría y coeficiente de curtosis.pptx
Medidas de formas, coeficiente de asimetría y coeficiente de curtosis.pptxaylincamaho
 
CLASE DE TECNOLOGIA E INFORMATICA PRIMARIA
CLASE  DE TECNOLOGIA E INFORMATICA PRIMARIACLASE  DE TECNOLOGIA E INFORMATICA PRIMARIA
CLASE DE TECNOLOGIA E INFORMATICA PRIMARIAWilbisVega
 
ejercicios pseint para aprogramacion sof
ejercicios pseint para aprogramacion sofejercicios pseint para aprogramacion sof
ejercicios pseint para aprogramacion sofJuancarlosHuertasNio1
 
ATAJOS DE WINDOWS. Los diferentes atajos para utilizar en windows y ser más e...
ATAJOS DE WINDOWS. Los diferentes atajos para utilizar en windows y ser más e...ATAJOS DE WINDOWS. Los diferentes atajos para utilizar en windows y ser más e...
ATAJOS DE WINDOWS. Los diferentes atajos para utilizar en windows y ser más e...FacuMeza2
 
trabajotecologiaisabella-240424003133-8f126965.pdf
trabajotecologiaisabella-240424003133-8f126965.pdftrabajotecologiaisabella-240424003133-8f126965.pdf
trabajotecologiaisabella-240424003133-8f126965.pdfIsabellaMontaomurill
 
El gusano informático Morris (1988) - Julio Ardita (1995) - Citizenfour (2014...
El gusano informático Morris (1988) - Julio Ardita (1995) - Citizenfour (2014...El gusano informático Morris (1988) - Julio Ardita (1995) - Citizenfour (2014...
El gusano informático Morris (1988) - Julio Ardita (1995) - Citizenfour (2014...JaquelineJuarez15
 
PARTES DE UN OSCILOSCOPIO ANALOGICO .pdf
PARTES DE UN OSCILOSCOPIO ANALOGICO .pdfPARTES DE UN OSCILOSCOPIO ANALOGICO .pdf
PARTES DE UN OSCILOSCOPIO ANALOGICO .pdfSergioMendoza354770
 
International Women's Day Sucre 2024 (IWD)
International Women's Day Sucre 2024 (IWD)International Women's Day Sucre 2024 (IWD)
International Women's Day Sucre 2024 (IWD)GDGSucre
 
La era de la educación digital y sus desafios
La era de la educación digital y sus desafiosLa era de la educación digital y sus desafios
La era de la educación digital y sus desafiosFundación YOD YOD
 
Redes direccionamiento y subredes ipv4 2024 .pdf
Redes direccionamiento y subredes ipv4 2024 .pdfRedes direccionamiento y subredes ipv4 2024 .pdf
Redes direccionamiento y subredes ipv4 2024 .pdfsoporteupcology
 

Último (20)

Presentación inteligencia artificial en la actualidad
Presentación inteligencia artificial en la actualidadPresentación inteligencia artificial en la actualidad
Presentación inteligencia artificial en la actualidad
 
Instrumentación Hoy_ INTERPRETAR EL DIAGRAMA UNIFILAR GENERAL DE UNA PLANTA I...
Instrumentación Hoy_ INTERPRETAR EL DIAGRAMA UNIFILAR GENERAL DE UNA PLANTA I...Instrumentación Hoy_ INTERPRETAR EL DIAGRAMA UNIFILAR GENERAL DE UNA PLANTA I...
Instrumentación Hoy_ INTERPRETAR EL DIAGRAMA UNIFILAR GENERAL DE UNA PLANTA I...
 
SalmorejoTech 2024 - Spring Boot <3 Testcontainers
SalmorejoTech 2024 - Spring Boot <3 TestcontainersSalmorejoTech 2024 - Spring Boot <3 Testcontainers
SalmorejoTech 2024 - Spring Boot <3 Testcontainers
 
Hernandez_Hernandez_Practica web de la sesion 12.pptx
Hernandez_Hernandez_Practica web de la sesion 12.pptxHernandez_Hernandez_Practica web de la sesion 12.pptx
Hernandez_Hernandez_Practica web de la sesion 12.pptx
 
Cortes-24-de-abril-Tungurahua-3 año 2024
Cortes-24-de-abril-Tungurahua-3 año 2024Cortes-24-de-abril-Tungurahua-3 año 2024
Cortes-24-de-abril-Tungurahua-3 año 2024
 
KELA Presentacion Costa Rica 2024 - evento Protégeles
KELA Presentacion Costa Rica 2024 - evento ProtégelesKELA Presentacion Costa Rica 2024 - evento Protégeles
KELA Presentacion Costa Rica 2024 - evento Protégeles
 
Plan de aula informatica segundo periodo.docx
Plan de aula informatica segundo periodo.docxPlan de aula informatica segundo periodo.docx
Plan de aula informatica segundo periodo.docx
 
guía de registro de slideshare por Brayan Joseph
guía de registro de slideshare por Brayan Josephguía de registro de slideshare por Brayan Joseph
guía de registro de slideshare por Brayan Joseph
 
Global Azure Lima 2024 - Integración de Datos con Microsoft Fabric
Global Azure Lima 2024 - Integración de Datos con Microsoft FabricGlobal Azure Lima 2024 - Integración de Datos con Microsoft Fabric
Global Azure Lima 2024 - Integración de Datos con Microsoft Fabric
 
Proyecto integrador. Las TIC en la sociedad S4.pptx
Proyecto integrador. Las TIC en la sociedad S4.pptxProyecto integrador. Las TIC en la sociedad S4.pptx
Proyecto integrador. Las TIC en la sociedad S4.pptx
 
Medidas de formas, coeficiente de asimetría y coeficiente de curtosis.pptx
Medidas de formas, coeficiente de asimetría y coeficiente de curtosis.pptxMedidas de formas, coeficiente de asimetría y coeficiente de curtosis.pptx
Medidas de formas, coeficiente de asimetría y coeficiente de curtosis.pptx
 
CLASE DE TECNOLOGIA E INFORMATICA PRIMARIA
CLASE  DE TECNOLOGIA E INFORMATICA PRIMARIACLASE  DE TECNOLOGIA E INFORMATICA PRIMARIA
CLASE DE TECNOLOGIA E INFORMATICA PRIMARIA
 
ejercicios pseint para aprogramacion sof
ejercicios pseint para aprogramacion sofejercicios pseint para aprogramacion sof
ejercicios pseint para aprogramacion sof
 
ATAJOS DE WINDOWS. Los diferentes atajos para utilizar en windows y ser más e...
ATAJOS DE WINDOWS. Los diferentes atajos para utilizar en windows y ser más e...ATAJOS DE WINDOWS. Los diferentes atajos para utilizar en windows y ser más e...
ATAJOS DE WINDOWS. Los diferentes atajos para utilizar en windows y ser más e...
 
trabajotecologiaisabella-240424003133-8f126965.pdf
trabajotecologiaisabella-240424003133-8f126965.pdftrabajotecologiaisabella-240424003133-8f126965.pdf
trabajotecologiaisabella-240424003133-8f126965.pdf
 
El gusano informático Morris (1988) - Julio Ardita (1995) - Citizenfour (2014...
El gusano informático Morris (1988) - Julio Ardita (1995) - Citizenfour (2014...El gusano informático Morris (1988) - Julio Ardita (1995) - Citizenfour (2014...
El gusano informático Morris (1988) - Julio Ardita (1995) - Citizenfour (2014...
 
PARTES DE UN OSCILOSCOPIO ANALOGICO .pdf
PARTES DE UN OSCILOSCOPIO ANALOGICO .pdfPARTES DE UN OSCILOSCOPIO ANALOGICO .pdf
PARTES DE UN OSCILOSCOPIO ANALOGICO .pdf
 
International Women's Day Sucre 2024 (IWD)
International Women's Day Sucre 2024 (IWD)International Women's Day Sucre 2024 (IWD)
International Women's Day Sucre 2024 (IWD)
 
La era de la educación digital y sus desafios
La era de la educación digital y sus desafiosLa era de la educación digital y sus desafios
La era de la educación digital y sus desafios
 
Redes direccionamiento y subredes ipv4 2024 .pdf
Redes direccionamiento y subredes ipv4 2024 .pdfRedes direccionamiento y subredes ipv4 2024 .pdf
Redes direccionamiento y subredes ipv4 2024 .pdf
 

Wikidata: qué es y cómo subirse al carro

  • 1. Wikidata: qué es y cómo subirse al carro Daniel Fernández Álvarez fernandezalvdaniel@uniovi.es
  • 2. ¿Qué es Wikidata? • Un enorme grafo dirigido de datos de temática general. • Un proyecto hermano de Wikipedia mantenido por una comunidad internacional de usuarios. • Una base de datos legible tanto para humanos como para máquinas. • Una fuente de información pública con grandes oportunidades para quien sepa sacar provecho de ella.
  • 4. Alejandro Casona Besullo lugar de nacimiento pais España es estudiado por Humano Antropología Marcela Lagarde es una Antropóloga profesión es un campo de estudio Temática general. Interconexión
  • 5. Tamaño • Nº de entidades: • Nº de ediciones: • Vistas de páginas: • Nº de idiomas: • Nº de usuarios activos: 76 millones 1.100 millones 158.000 millones 438 24.000
  • 6. Crecimiento desde 2012 2012 (fundación) Enero 2020 40 M 80 M 20 M 60 M Nº de items NÚMERO DE STATEMENTS POR ITEM
  • 7. ¿Cómo representar el grafo? • Modelo basado en Resource Description Language (RDF). • La unidad mínima de conocimiento es la tripleta. Una tripleta relaciona un sujeto con un objeto mediante un predicado: Besullo pais España SUJETO predicado OBJETO
  • 8. ¿Cómo representar el grafo? • Cada elemento y cada propiedad en RDF son representadas como una URI (Universal Resource Identifier). • Elementos sin entidad (números, fechas, cadenas de texto) son llamados literales, no tienen una URI asociada. • Se pueden utilizar nodos anónimos. Son elementos especiales cuya identidad no importa pero pueden ayudar a agrupar otros elementos o a crear topologías más complejas que la tripleta.
  • 9. ¿Cómo representar el grafo? • RDF es una abstracción. Un mismo contenido puede ser expresado en diferentes sintaxis concretas de RDF http://ex.org/Besullo http://ex.org/pais http://ex.org/España Turtle @prefix ns0: <http://ex.org/> . <http://ex.org/Besullo> ns0:pais ns0:España . JSON-LD [{ "@id": "http://ex.org/Besullo", "http://ex.org/pais": [{ "@id": "http://ex.org/España"}] }, { "@id": "http://ex.org/España" }] <?xml version="1.0" encoding="utf-8" ?> <rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22- rdf-syntax-ns#" xmlns:ns0="http://ex.org/"> <rdf:Description rdf:about="http://ex.org/Besullo"> <ns0:pais rdf:resource="http://ex.org/España"/> </rdf:Description> </rdf:RDF> RDF/XML
  • 10. Wikipedia vs Wikidata Forma de representar la información Entendible por humanos Entendible por máquinas Páginas de texto Grafo de información X
  • 11. Visualización de la información (humanos) Alejandro Casona Humano es un
  • 13. Acceso avanzado a la información Lenguaje de consultas SPARQL ¿Qué museos en el mundo almacenan al menos un cuadro de algún pintor asturiano? ¿Cuáles son sus coordenadas?
  • 14. Acceso avanzado a la información SPARQL endpoint de Wikidata https://query.wikidata.org/ • Diferentes herramientas de visualización • Sugerencias de términos • Consultas de ejemplo y manuales • Traducción de consultas a distintos lenguajes de programación
  • 15. Museos con cuadros de pintores asturianos Museo de Historia del Arte de Viena Museo Pau Casals Rijksmuseum Museo de Bellas Artes de Bilbao Biblioteca Museo Víctor Balaguer Museo Nacional Thyssen- Bornemisza Museo Nacional Centro de Arte Reina Sofía Museo de Bellas Artes de Houston National Gallery de Londres Museo del Prado ... Ejecutar consulta
  • 16. ¿Limitaciones? Principalmente, ausencia de información ¿No hay cuadros de pintores asturianos en Asturias? Sí, pero no en Wikidata ¡¡ !!
  • 17. Integración: consultas federadas Las tecnologías de web semántica nos permiten lanzar consultas que involucren más de una fuente de información Comparación de títulos de cuadros de El Greco en distintas fuentes Ejecutar la consulta
  • 18. Representando información en Wikidata Todas las entidades y todas las propiedades tienen una URI (identificador) Entidades http://www.wikidata.org/entity/ + Qxxxx Propiedades http://www.wikidata.org/prop/direct/ + Pxxx Alejandro Casona  Q289215 Besullo  Q600783 Humano  Q5 es un  P31 lugar de nacimiento  P19 país  P17
  • 19. Una única Wikidata https://es.wikipedia.org/wiki/Asturias https://en.wikipedia.org/wiki/Asturias https://fr.wikipedia.org/wiki/Asturias • Potenciales repeticiones • Potenciales ausencias en distintos capítulos • Potenciales contradicciones https://www.wikidata.org/wiki/Q39746937 • Única entrada para cualquier entidad • Cada texto se traduce a diferentes idiomas • El navegador te muestra la información en tu idioma de preferencia si es posible
  • 20. ¿Cómo llega la información a Wikidata? 2 vías Edición manual Bots A través de un formulario web Creación de nuevas entidades Edición de entidades existentes Creación de nuevas propiedades Grandes modificaciones de información Necesario solicitar permiso
  • 21. Añadir una nueva entidad Necesario estar logueado 1º: Asegurarse de que la entidad no existe ya Uso del buscador de Wikidata (y/o otros buscadores) 2º: Click en “Crear un elemento nuevo” 3º: Añadir información básica en algún(os) idioma(s) Nombre, descripción, alias(es)
  • 22. Modificar entidad existente con una sentencia nueva Necesario estar logueado 1º: Selección de propiedad adecuada Sugerencias de autocompletar Comprobación de otras entidades similares 2º: Selección de valor Bien otra entidad de Wikidata, bien un literal 3º: Añadir calificadores y referencias
  • 23. Sobre las referencias Fuentes autoritativas No hace falta referencia para hechos obvios/sin disputa No usar Wikipedia como referencia Dos propiedades principales P854 – Afirmado en la dirección web P248 – Afirmado en Para información en páginas web No es necesario crear una nueva entidad Para casi todo lo demás: libros, revistas, artículos científicos… Necesario que exista en Wikidata la entidad referenciada
  • 25. Sobre los calificadores Conocimiento sobre el propio conocimiento Barack Obama Presidente de USA cargo ocupado
  • 26. Modelo de datos de calificadores: Reificación Barack Obama Presidente de USA cargo ocupado Sujeto Objeto
  • 27. Modelo de datos de calificadores: Reificación Barack Obama Presidente de USA cargo ocupado Sujeto Objeto Sujeto Fecha de inicio “20 ene 2009” Sucede a George W. Bush… …
  • 28. Modelo de datos de calificadores: Reificación cargo Ocupado (indirecto A) Barack Obama Presidente de USA Fecha de inicio “20 ene 2009” Sucede a George W. Bush … … Nodo anónimo cargo Ocupado (indirecto B)
  • 29. Modelo de datos de calificadores: Reificación cargo Ocupado (indirecto A) Barack Obama Presidente de USA Fecha de inicio “20 ene 2009” Sucede a George W. Bush … … Nodo anónimo cargo Ocupado (indirecto B) :Obama :cargo_ind_A _:1 . _:1 :fecha_inicio “20 ene 2009” ; :sucede_a :George_Bush ; :cargo_ind_B :Presidente_US . Representación turtle
  • 30. Aplicaciones Múltiples aplicaciones pueden ser desarrolladas usando estos datos como base…. … pero para eso se necesitan técnicos.
  • 33. Inventaire • Librería colaborativa • El core es una base de usuarios y libros propia… • … pero toda la información relativa a los libros se trae de Wikidata
  • 34. Otras aplicaciones • Muchas propuestas y posibilidades: • Juegos • Fotografía • Entornos GLAM (Galerías, Librerías, Archivos, Museos). • Turismo • … • Herramientas para la comunidad de Wikimedia: Wikimedia Toolforge • Proximamente en la EII: Hackaton de Wikidata
  • 35. Retos Homogeneidad estructural de datos Humano Marcela Lagarde es una Mujer Marcela Lagarde Humano clase es una clase VS Mujer
  • 36. Retos • Diferentes consultas SPARQL: 1. Mujeres que estudian antropología. 2. Humanos que estudian antropología cuyo género es mujer. • Si los datos se representan usando diferentes esquemas, cada consulta ignorará parte de los datos. • Posible solución: Shape Expression (ShEx). Homogeneidad estructural de datos VS
  • 37. ShEx • ShEx es un lenguaje para validar y describir datos en RDF.
  • 38. ShEx en Wikidata • Descripción: • Guía para editores. • Guía para elaborar consultas SPARQL. • Validación: • Comprobación de uniformidad de algún tipo de entidad. • Construcción automática de shapes a partir de datos existentes
  • 41. Grupo WESO y Wikidata
  • 43. Conclusiones • Wikidata: • Base de datos pública. • Propósito general. • Gran cantidad de información, y creciendo. • Fácil integración con otras fuentes de Linked Data. • Oportunidades: • Participación altruista (edición de contenido). • Desarrollo de aplicaciones. • Investigación / Colaboración a través de: • Grupo WESO. • Comunidad local de Wikimedia.
  • 44. Wikidata: qué es y cómo subirse al carro Daniel Fernández Álvarez fernandezalvdaniel@uniovi.es

Notas del editor

  1. https://query.wikidata.org/
  2. https://query.wikidata.org/#prefix%20wdt%3A%20%3Chttp%3A%2F%2Fwww.wikidata.org%2Fprop%2Fdirect%2F%3E%0Aprefix%20wd%3A%20%3Chttp%3A%2F%2Fwww.wikidata.org%2Fentity%2F%3E%0Aprefix%20wikibase%3A%20%3Chttp%3A%2F%2Fwikiba.se%2Fontology%23%3E%0A%0ASELECT%20distinct%20%3FmuseoLabel%20%3FgeoLocation%20%3FpintorLabel%20%3FcuadroLabel%20WHERE%20%7B%20%20%20%20%20%0A%20%20%3Fcuadro%20%20wdt%3AP31%20%20wd%3AQ3305213%20%3B%20%20%20%20%0A%20%20%20%20%20%20%20%20%20%20%20wdt%3AP170%20%3Fpintor%20%3B%20%20%20%20%0A%20%20%20%20%20%20%09%20%20%20wdt%3AP195%20%3Fmuseo%20.%20%20%20%20%0A%20%20%3Fpintor%20wdt%3AP19%20%3Flugar%20.%0A%20%20%3Flugar%20wdt%3AP131%20wd%3AQ39746937%20.%0A%20%20%3Fmuseo%20wdt%3AP625%20%3FgeoLocation%20.%0A%20%20%0A%20%20SERVICE%20wikibase%3Alabel%20%7B%0A%20%20%20%20bd%3AserviceParam%20wikibase%3Alanguage%20%22es%2C%20en%2C%20%5BAUTO_LANGUAGE%5D%22.%0A%20%20%7D%0A%20%20%0A%7D%20
  3. https://query.wikidata.org/#prefix%20wdt%3A%20%3Chttp%3A%2F%2Fwww.wikidata.org%2Fprop%2Fdirect%2F%3E%0Aprefix%20wd%3A%20%3Chttp%3A%2F%2Fwww.wikidata.org%2Fentity%2F%3E%0Aprefix%20wikibase%3A%20%3Chttp%3A%2F%2Fwikiba.se%2Fontology%23%3E%0Aprefix%20dbr%3A%20%3Chttp%3A%2F%2Fdbpedia.org%2Fresource%2F%3E%0Aprefix%20dbo%3A%20%3Chttp%3A%2F%2Fdbpedia.org%2Fontology%2F%3E%0A%0ASELECT%20DISTINCT%20%3Fobra_wikidata%20%3Fobra_wikidataLabel%20%3Flabel_dbpedia%20WHERE%20%7B%0A%20%20%3Fobra_wikidata%20wdt%3AP170%20wd%3AQ301%20.%0A%20%20%0A%20%20SERVICE%20%3Chttp%3A%2F%2Fdbpedia.org%2Fsparql%3E%20%7B%0A%20%20%20%20%3Fobra_dbpedia%20owl%3AsameAs%20%3Fobra_wikidata%20%3B%0A%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20dbo%3Aauthor%20dbr%3AEl_Greco%20%3B%0A%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20rdfs%3Alabel%20%3Flabel_dbpedia%20.%0A%20%20%20%20FILTER%28lang%28%3Flabel_dbpedia%29%20%3D%20%27es%27%29%0A%20%20%20%20%0A%20%20%7D%0A%20%20%0A%20%20SERVICE%20wikibase%3Alabel%20%7B%0A%20%20%20%20bd%3AserviceParam%20wikibase%3Alanguage%20%22es%2C%20en%2C%20%5BAUTO_LANGUAGE%5D%22.%0A%20%20%7D%0A%7D%20
  4. Volver a proyectar la consulta
  5. Anécdota de la conferencia wikidatacon 2017  Navino con los pasos de cómo se edita Wikidata: 1º: saca una carrera de informática. 2º: edita Wikidata.
  6. Crear a Dani Gayo
  7. Modificar a Dani Gayo
  8. https://www.youtube.com/watch?v=yVNIq-JQdyc&feature=fvwrel#t=375
  9. http://histropedia.com/
  10. http://askplatyp.us/
  11. https://inventaire.io/welcome
  12. https://tools.wmflabs.org/admin/
  13. https://www.wikidata.org/wiki/EntitySchema:E10
  14. http://www.weso.es/YASHE/