SlideShare una empresa de Scribd logo
Periodismo de datos
y Linked Data
“El poder de los datos
enlazados para generar
historias”
UCM / #6eiiic, Madrid, 25/09/2013
Oscar Corcho
ocorcho@fi.upm.es, ocorcho@localidata.com
@ocorcho
Y MEJOR algo revueltos
Todos juntos…
Speaker:
Date: 25/09/13
Veamos un ejemplo…
• ¿Existe correlación entre el número de locutorios que
hay en un barrio y la población ecuatoriana o chilena
empadronada en él?
• ¿Qué datos necesito?
• Locutorios y su localización
• Idealmente procedente de un portal de datos abiertos
• Datos del padrón por barrios
• Procedente del portal de datos estadísticos de Madrid
Speaker:
?
Disclaimer…
4<<Texto libre: proyecto, speaker, etc.>>
Vamos a explorar tecnologías que en algunos casos
son aún poco usables
Paso 1. Descargar los datos que vamos a usar (I)
• Por ejemplo, datos de población del Instituto de
Estadística de Madrid
5<<Texto libre: proyecto, speaker, etc.>>
Paso 1. Descargar los datos que vamos a usar (II)
• Y también nos encontramos con una base de datos
de locales comerciales, que contiene locutorios
• O usamos Google Places, Open Street Map,
4square, etc.
• Que proporcionan APIs de datos
6<<Texto libre: proyecto, speaker, etc.>>
Paso 2. Nos fijamos en los datos y en cómo conectarlos
7<<Texto libre: proyecto, speaker, etc.>>
• ¿Cómo los conectamos?
• 079601001
• Madrid, Distrito 1, Sección 1
• http://datos.localidata.com/recurso/Provincia/Madrid/Municip
Paso 3. Y creamos una red de datos enlazados
• Linked Data
• Utilizar la Web como una base de datos global
• Movernos de una Web de documentos a una Web de
datos
• URIs, HTTP, RDF, enlaces y REST
8<<Texto libre: proyecto, speaker, etc.>>
Base de
datos del
INE
Base de
datos del
INE
Base de datos
de locales
comerciales
Base de datos
de locales
comerciales
Ejemplo: Integración de datos
9
Catas
tro
Catas
tro
BD
AEMET
BD
AEMET
BD
DBpedia
BD
DBpedia
BD
IGN
BD
IGN
C/ Alcalá, 54
1446403VK4714E0001AZ
971m2
refCatastral
superficie
28014
codPostal
1910
añoConstrucción
C/ Alcalá, 54 Madrid
Madrid
city
sameAs
Madrid
20º
Temperatura
C/ Alcalá, 54
Cafetería Simpatía
vcard:adr
11012723
NúmeroPortal
L-20
Código Local
Ayto
Madrid
Ayto
Madrid
Ejemplo: Integración de datos
10Asunción Gómez Pérez
Algunos ejemplos de uso de Linked Data en medios
• http://rtve.linkeddata.es
• http://webenemasuno.linkeddata.es/
11<<Texto libre: proyecto, speaker, etc.>>
Paso 3. Y creamos una red de datos enlazados
• Usando vocabularios estandarizados
• Así nuestros datos pueden ser reutilizados por otros más
fácilmente
• Ejemplos
• GeoSPARQL
• DataCube
• División administrativa de España (red.es)
• Y haciendo nuestros datos enlazados disponibles
como APIs
12<<Texto libre: proyecto, speaker, etc.>>
Paso 4. Y a explotar los datos… (I)
• Realizando consultas
• Dime cuántos locutorios hay en Madrid (aquí)
PREFIX localidata: <http://datos.localidata.com/def/City#>
PREFIX rdfs: <http://www.w3.org/2000/01/rdf-schema#>
SELECT (COUNT(DISTINCT ?item) AS ?numLocutorios) {
?item a localidata:LocalComercial .
?item localidata:clasificacionEconomica ?cE .
?cE localidata:epigrafeActividad ?epi .
{?epi localidata:codigo "610002"}
UNION
{?epi localidata:codigo "477808"}.
}
13<<Texto libre: proyecto, speaker, etc.>>
Paso 4. Y a explotar los datos… (I)
• Realizando consultas
• Dime cuántos locutorios hay en Usera (aquí)
PREFIX localidata: <http://datos.localidata.com/def/City#>
SELECT COUNT (DISTINCT ?item) AS ?
numLocutoriosUsera {
?item a localidata:LocalComercial .
?item localidata:clasificacionEconomica ?cE .
?cE localidata:epigrafeActividad ?epi .
{?epi localidata:codigo "610002"}
UNION {?epi localidata:codigo "477808"}.
?item localidata:enDivisionTerritorial ?seccion .
?seccion localidata:distrito
<http://datos.localidata.com/recurso/Provincia/Madrid/Muni
cipio/madrid/Distrito/12> .
} 14<<Texto libre: proyecto, speaker, etc.>>
Paso 4. Y a explotar los datos… (I)
• Realizando consultas
• ¿En qué barrios viven más ecuatorianos entre 20 y 59 años? (aquí)
PREFIX localidata: <http://datos.localidata.com/def/City#>
PREFIX rdfs: <http://www.w3.org/2000/01/rdf-schema#>
PREFIX qb: <http://purl.org/linked-data/cube#>
PREFIX localidata: <http://datos.localidata.com/def/City#>
PREFIX rdfs: <http://www.w3.org/2000/01/rdf-schema#>
PREFIX qb: <http://purl.org/linked-data/cube#>
PREFIX cityStats-dimension: <http://datos.localidata.com/def/CityStats/dimension#>
PREFIX sdmx-dimension: <http://purl.org/linked-data/sdmx/2009/dimension#>
PREFIX cityStats-code: <http://datos.localidata.com/def/CityStats/code#>
PREFIX cityStats: <http://datos.localidata.com/def/CityStats/stats#>
SELECT DISTINCT ?barrio (sum(?numHabitantesEC2065Seccion) as ?
numHabitantesEC2065Barrio)
WHERE
{
?seccion localidata:barrio ?bar . ?bar rdfs:label ?barrio .
{ 15<<Texto libre: proyecto, speaker, etc.>>
Paso 4. Y a explotar los datos… (II)
• Realizando gráficos con R
16<<Texto libre: proyecto, speaker, etc.>>
Paso 4. Y a explotar los datos… (III)
• Obteniendo correlaciones entre personas de Ecuador
empadronadas y locutorios por barrios de Madrid
q <-
"PREFIX localidata: <http://datos.localidata.com/def/City#>
PREFIX qb: http://purl.org/linked-data/cube#
…
SELECT DISTINCT ?distrito ?barrio …“
dLocutoriosEC <- SPARQL(url=endpointLocalidata, query=q, ns=prefix,
extra=options)
resLocutoriosEC <- dLocutoriosEC$results
loc_EC_frame <- data.frame(locutorios=resLocutoriosEC$numLocutorios,
ecuatorianosAdultos=resLocutoriosEC$numHabitantesEC2065,
chilenosAdultos=resLocutoriosEC$numHabitantesCL2065)
row.names(loc_EC_frame) <- resLocutoriosEC$barrio
cor <- cor(loc_EC_frame, method='pearson’)
17<<Texto libre: proyecto, speaker, etc.>>
Paso 4. Y a explotar los datos… (IV)
• Y visualizando los datos para nuestros lectores en la
Web, en un iPad…
18<<Texto libre: proyecto, speaker, etc.>>
¿Alguna historia más?
• Publicaremos en breve algunas en
http://www.localidata.com/
• Si alguno de vosotros está interesado en utilizar
nuestros datos para generar historias, hablad con
nosotros
19<<Texto libre: proyecto, speaker, etc.>>
Periodismo de datos
y Linked Data
“El poder de los datos
enlazados para generar
historias”
UCM / #6eiiic, Madrid, 25/09/2013
Oscar Corcho
ocorcho@fi.upm.es, ocorcho@localidata.com
@ocorcho

Más contenido relacionado

Destacado

Linked Open Data - Datos Abiertos Enlazados
Linked Open Data - Datos Abiertos EnlazadosLinked Open Data - Datos Abiertos Enlazados
Linked Open Data - Datos Abiertos Enlazados
Jose Emilio Labra Gayo
 
AnáLisis De 5to Maraca
AnáLisis De 5to  MaracaAnáLisis De 5to  Maraca
AnáLisis De 5to MaracaLogos Academy
 
DesafíO De Crecimiento En Pymes
DesafíO De Crecimiento En PymesDesafíO De Crecimiento En Pymes
DesafíO De Crecimiento En Pymes
Alejandro Delobelle
 
Ripples profile (1)
Ripples profile (1)Ripples profile (1)
Ripples profile (1)
Anwar Hussain
 
Tp358 sistemas operativos-2014-2
Tp358 sistemas operativos-2014-2Tp358 sistemas operativos-2014-2
Tp358 sistemas operativos-2014-2
Pablo Mora
 
Sillabus tics iv comp iv-carlos laurente
Sillabus tics iv   comp iv-carlos laurenteSillabus tics iv   comp iv-carlos laurente
Sillabus tics iv comp iv-carlos laurenteCarlos Laurente
 
Plan clase
Plan clasePlan clase
Plan clase
carpiop
 
Thésaurus par catégories
Thésaurus par catégoriesThésaurus par catégories
Thésaurus par catégories
junkyvista
 
COVENIN 389-98 bombillos de uso general
COVENIN 389-98 bombillos de uso generalCOVENIN 389-98 bombillos de uso general
COVENIN 389-98 bombillos de uso generalPablo Mora
 
Ficha # 5 - Formación humana 2016
Ficha # 5 - Formación humana 2016Ficha # 5 - Formación humana 2016
Ficha # 5 - Formación humana 2016
Logos Academy
 
El perrito valiente
El perrito valienteEl perrito valiente
El perrito valiente
Logos Academy
 
Parentalité et égalité professionnelle hommes-femmes : comment impliquer les ...
Parentalité et égalité professionnelle hommes-femmes : comment impliquer les ...Parentalité et égalité professionnelle hommes-femmes : comment impliquer les ...
Parentalité et égalité professionnelle hommes-femmes : comment impliquer les ...
Egalco
 
El Reciclaje en el colegio Santiago de las Atalayas
El Reciclaje en el colegio Santiago de las AtalayasEl Reciclaje en el colegio Santiago de las Atalayas
El Reciclaje en el colegio Santiago de las AtalayasAmgrajmg
 
Analizando educ@contic
Analizando educ@conticAnalizando educ@contic
Analizando educ@conticPepeA
 
Enjeux d'animation des réseaux d'assurance
Enjeux d'animation des réseaux d'assuranceEnjeux d'animation des réseaux d'assurance
Enjeux d'animation des réseaux d'assurance
Hervé Kayser
 
Acne advertisement
Acne advertisementAcne advertisement
Acne advertisementrea reyes
 

Destacado (20)

Linked data web
Linked data webLinked data web
Linked data web
 
Linked Open Data - Datos Abiertos Enlazados
Linked Open Data - Datos Abiertos EnlazadosLinked Open Data - Datos Abiertos Enlazados
Linked Open Data - Datos Abiertos Enlazados
 
AnáLisis De 5to Maraca
AnáLisis De 5to  MaracaAnáLisis De 5to  Maraca
AnáLisis De 5to Maraca
 
DesafíO De Crecimiento En Pymes
DesafíO De Crecimiento En PymesDesafíO De Crecimiento En Pymes
DesafíO De Crecimiento En Pymes
 
Ripples profile (1)
Ripples profile (1)Ripples profile (1)
Ripples profile (1)
 
Tp358 sistemas operativos-2014-2
Tp358 sistemas operativos-2014-2Tp358 sistemas operativos-2014-2
Tp358 sistemas operativos-2014-2
 
WEB 2.0
WEB 2.0WEB 2.0
WEB 2.0
 
Sillabus tics iv comp iv-carlos laurente
Sillabus tics iv   comp iv-carlos laurenteSillabus tics iv   comp iv-carlos laurente
Sillabus tics iv comp iv-carlos laurente
 
FEL Facturar En Línea
FEL Facturar En LíneaFEL Facturar En Línea
FEL Facturar En Línea
 
Plan clase
Plan clasePlan clase
Plan clase
 
Thésaurus par catégories
Thésaurus par catégoriesThésaurus par catégories
Thésaurus par catégories
 
COVENIN 389-98 bombillos de uso general
COVENIN 389-98 bombillos de uso generalCOVENIN 389-98 bombillos de uso general
COVENIN 389-98 bombillos de uso general
 
Ficha # 5 - Formación humana 2016
Ficha # 5 - Formación humana 2016Ficha # 5 - Formación humana 2016
Ficha # 5 - Formación humana 2016
 
Intro Logos
Intro LogosIntro Logos
Intro Logos
 
El perrito valiente
El perrito valienteEl perrito valiente
El perrito valiente
 
Parentalité et égalité professionnelle hommes-femmes : comment impliquer les ...
Parentalité et égalité professionnelle hommes-femmes : comment impliquer les ...Parentalité et égalité professionnelle hommes-femmes : comment impliquer les ...
Parentalité et égalité professionnelle hommes-femmes : comment impliquer les ...
 
El Reciclaje en el colegio Santiago de las Atalayas
El Reciclaje en el colegio Santiago de las AtalayasEl Reciclaje en el colegio Santiago de las Atalayas
El Reciclaje en el colegio Santiago de las Atalayas
 
Analizando educ@contic
Analizando educ@conticAnalizando educ@contic
Analizando educ@contic
 
Enjeux d'animation des réseaux d'assurance
Enjeux d'animation des réseaux d'assuranceEnjeux d'animation des réseaux d'assurance
Enjeux d'animation des réseaux d'assurance
 
Acne advertisement
Acne advertisementAcne advertisement
Acne advertisement
 

Similar a Periodismo de datos y Linked Data: El poder de los datos enlazados para generar historias

100^ safe in Dubai%)( UAE))((☎️^+971[563[407[584[** *)) Abortion Pills for Sa...
100^ safe in Dubai%)( UAE))((☎️^+971[563[407[584[** *)) Abortion Pills for Sa...100^ safe in Dubai%)( UAE))((☎️^+971[563[407[584[** *)) Abortion Pills for Sa...
100^ safe in Dubai%)( UAE))((☎️^+971[563[407[584[** *)) Abortion Pills for Sa...
ag5345936
 
200# safe in Dubai@]( UAE]]((☎️#+971(563(407(584(** *]] Abortion Pills for Sa...
200# safe in Dubai@]( UAE]]((☎️#+971(563(407(584(** *]] Abortion Pills for Sa...200# safe in Dubai@]( UAE]]((☎️#+971(563(407(584(** *]] Abortion Pills for Sa...
200# safe in Dubai@]( UAE]]((☎️#+971(563(407(584(** *]] Abortion Pills for Sa...
ag5345936
 
Generación de datos estadísticos enlazados del Instituto Aragonés de Estadística
Generación de datos estadísticos enlazados del Instituto Aragonés de EstadísticaGeneración de datos estadísticos enlazados del Instituto Aragonés de Estadística
Generación de datos estadísticos enlazados del Instituto Aragonés de Estadística
Oscar Corcho
 
Datos abiertos: Reutilización de información en el sector público
Datos abiertos: Reutilización de información en el sector públicoDatos abiertos: Reutilización de información en el sector público
Datos abiertos: Reutilización de información en el sector público
Jose Emilio Labra Gayo
 
Taller Gratuito de Datos Abiertos Ciudadanos con los datos de Málaga
Taller Gratuito de Datos Abiertos Ciudadanos con los datos de MálagaTaller Gratuito de Datos Abiertos Ciudadanos con los datos de Málaga
Taller Gratuito de Datos Abiertos Ciudadanos con los datos de Málaga
David Bueno Vallejo
 
Desarrollo práctico de aplicaciones Linked Data: metodología y herramientas
Desarrollo práctico de aplicaciones Linked Data: metodología y herramientasDesarrollo práctico de aplicaciones Linked Data: metodología y herramientas
Desarrollo práctico de aplicaciones Linked Data: metodología y herramientas
Guillermo Álvaro Rey
 
Introducción a arquitecturas y herramientas de Big Data.pdf
Introducción a arquitecturas y herramientas de Big Data.pdfIntroducción a arquitecturas y herramientas de Big Data.pdf
Introducción a arquitecturas y herramientas de Big Data.pdf
VernicaPaulinaChimbo
 
Anatomía de un proyecto de Big Data
Anatomía de un proyecto de Big DataAnatomía de un proyecto de Big Data
Anatomía de un proyecto de Big Data
Abel Alejandro Coronado Iruegas
 
Difusión Estadística en Cantabria
Difusión Estadística en CantabriaDifusión Estadística en Cantabria
Difusión Estadística en Cantabria
Miguel Expósito Martín
 
2016 ULL Cabildo KEEDIO - BigData
2016 ULL Cabildo KEEDIO - BigData2016 ULL Cabildo KEEDIO - BigData
2016 ULL Cabildo KEEDIO - BigData
KEEDIO
 
ASR_Tema_4.pdf
ASR_Tema_4.pdfASR_Tema_4.pdf
ASR_Tema_4.pdf
AnonymousNdBOr4
 
Datos Abiertos para Hackaton UMA - IBM Viewnext
Datos Abiertos para Hackaton UMA - IBM ViewnextDatos Abiertos para Hackaton UMA - IBM Viewnext
Datos Abiertos para Hackaton UMA - IBM Viewnext
David Bueno Vallejo
 
BIME HackDay EXTRAYENDO LOS DATOS EN LAS ADMINISTRACIONES PÚBLICAS
BIME HackDay  EXTRAYENDO LOS DATOS EN LAS ADMINISTRACIONES PÚBLICASBIME HackDay  EXTRAYENDO LOS DATOS EN LAS ADMINISTRACIONES PÚBLICAS
BIME HackDay EXTRAYENDO LOS DATOS EN LAS ADMINISTRACIONES PÚBLICASAragón Open Data
 
PaaS la plataforma como servicio IoT-M2M, ANTONIO SÁNCHEZ, CARRIOTS/WAIRBUT
PaaS la plataforma como servicio IoT-M2M, ANTONIO SÁNCHEZ, CARRIOTS/WAIRBUTPaaS la plataforma como servicio IoT-M2M, ANTONIO SÁNCHEZ, CARRIOTS/WAIRBUT
PaaS la plataforma como servicio IoT-M2M, ANTONIO SÁNCHEZ, CARRIOTS/WAIRBUT
Domotys
 
La difusión estadística y la apertura de datos gubernamentales
La difusión estadística y la apertura de datos gubernamentalesLa difusión estadística y la apertura de datos gubernamentales
La difusión estadística y la apertura de datos gubernamentales
Xavier Badosa
 
Datos abiertos en el Ayuntamiento de Lorca
Datos abiertos en el Ayuntamiento de LorcaDatos abiertos en el Ayuntamiento de Lorca
Datos abiertos en el Ayuntamiento de Lorca
Antonio Galindo Galindo
 
Revelando los secretos de twitter, Festival de Software Libre 2014
Revelando los secretos de twitter, Festival de Software Libre 2014Revelando los secretos de twitter, Festival de Software Libre 2014
Revelando los secretos de twitter, Festival de Software Libre 2014
Abel Alejandro Coronado Iruegas
 
Mejor proyecto big data
Mejor proyecto big dataMejor proyecto big data
Mejor proyecto big data
zylk net
 
PNE 178301. Ciudades inteligentes. Datos abiertos (Open Data)
PNE 178301. Ciudades inteligentes. Datos abiertos (Open Data)PNE 178301. Ciudades inteligentes. Datos abiertos (Open Data)
PNE 178301. Ciudades inteligentes. Datos abiertos (Open Data)
LocaliData
 
Datos Abiertos del Ayuntamiento de Málaga y como usar su API
Datos Abiertos del Ayuntamiento de Málaga y como usar su APIDatos Abiertos del Ayuntamiento de Málaga y como usar su API
Datos Abiertos del Ayuntamiento de Málaga y como usar su API
David Bueno Vallejo
 

Similar a Periodismo de datos y Linked Data: El poder de los datos enlazados para generar historias (20)

100^ safe in Dubai%)( UAE))((☎️^+971[563[407[584[** *)) Abortion Pills for Sa...
100^ safe in Dubai%)( UAE))((☎️^+971[563[407[584[** *)) Abortion Pills for Sa...100^ safe in Dubai%)( UAE))((☎️^+971[563[407[584[** *)) Abortion Pills for Sa...
100^ safe in Dubai%)( UAE))((☎️^+971[563[407[584[** *)) Abortion Pills for Sa...
 
200# safe in Dubai@]( UAE]]((☎️#+971(563(407(584(** *]] Abortion Pills for Sa...
200# safe in Dubai@]( UAE]]((☎️#+971(563(407(584(** *]] Abortion Pills for Sa...200# safe in Dubai@]( UAE]]((☎️#+971(563(407(584(** *]] Abortion Pills for Sa...
200# safe in Dubai@]( UAE]]((☎️#+971(563(407(584(** *]] Abortion Pills for Sa...
 
Generación de datos estadísticos enlazados del Instituto Aragonés de Estadística
Generación de datos estadísticos enlazados del Instituto Aragonés de EstadísticaGeneración de datos estadísticos enlazados del Instituto Aragonés de Estadística
Generación de datos estadísticos enlazados del Instituto Aragonés de Estadística
 
Datos abiertos: Reutilización de información en el sector público
Datos abiertos: Reutilización de información en el sector públicoDatos abiertos: Reutilización de información en el sector público
Datos abiertos: Reutilización de información en el sector público
 
Taller Gratuito de Datos Abiertos Ciudadanos con los datos de Málaga
Taller Gratuito de Datos Abiertos Ciudadanos con los datos de MálagaTaller Gratuito de Datos Abiertos Ciudadanos con los datos de Málaga
Taller Gratuito de Datos Abiertos Ciudadanos con los datos de Málaga
 
Desarrollo práctico de aplicaciones Linked Data: metodología y herramientas
Desarrollo práctico de aplicaciones Linked Data: metodología y herramientasDesarrollo práctico de aplicaciones Linked Data: metodología y herramientas
Desarrollo práctico de aplicaciones Linked Data: metodología y herramientas
 
Introducción a arquitecturas y herramientas de Big Data.pdf
Introducción a arquitecturas y herramientas de Big Data.pdfIntroducción a arquitecturas y herramientas de Big Data.pdf
Introducción a arquitecturas y herramientas de Big Data.pdf
 
Anatomía de un proyecto de Big Data
Anatomía de un proyecto de Big DataAnatomía de un proyecto de Big Data
Anatomía de un proyecto de Big Data
 
Difusión Estadística en Cantabria
Difusión Estadística en CantabriaDifusión Estadística en Cantabria
Difusión Estadística en Cantabria
 
2016 ULL Cabildo KEEDIO - BigData
2016 ULL Cabildo KEEDIO - BigData2016 ULL Cabildo KEEDIO - BigData
2016 ULL Cabildo KEEDIO - BigData
 
ASR_Tema_4.pdf
ASR_Tema_4.pdfASR_Tema_4.pdf
ASR_Tema_4.pdf
 
Datos Abiertos para Hackaton UMA - IBM Viewnext
Datos Abiertos para Hackaton UMA - IBM ViewnextDatos Abiertos para Hackaton UMA - IBM Viewnext
Datos Abiertos para Hackaton UMA - IBM Viewnext
 
BIME HackDay EXTRAYENDO LOS DATOS EN LAS ADMINISTRACIONES PÚBLICAS
BIME HackDay  EXTRAYENDO LOS DATOS EN LAS ADMINISTRACIONES PÚBLICASBIME HackDay  EXTRAYENDO LOS DATOS EN LAS ADMINISTRACIONES PÚBLICAS
BIME HackDay EXTRAYENDO LOS DATOS EN LAS ADMINISTRACIONES PÚBLICAS
 
PaaS la plataforma como servicio IoT-M2M, ANTONIO SÁNCHEZ, CARRIOTS/WAIRBUT
PaaS la plataforma como servicio IoT-M2M, ANTONIO SÁNCHEZ, CARRIOTS/WAIRBUTPaaS la plataforma como servicio IoT-M2M, ANTONIO SÁNCHEZ, CARRIOTS/WAIRBUT
PaaS la plataforma como servicio IoT-M2M, ANTONIO SÁNCHEZ, CARRIOTS/WAIRBUT
 
La difusión estadística y la apertura de datos gubernamentales
La difusión estadística y la apertura de datos gubernamentalesLa difusión estadística y la apertura de datos gubernamentales
La difusión estadística y la apertura de datos gubernamentales
 
Datos abiertos en el Ayuntamiento de Lorca
Datos abiertos en el Ayuntamiento de LorcaDatos abiertos en el Ayuntamiento de Lorca
Datos abiertos en el Ayuntamiento de Lorca
 
Revelando los secretos de twitter, Festival de Software Libre 2014
Revelando los secretos de twitter, Festival de Software Libre 2014Revelando los secretos de twitter, Festival de Software Libre 2014
Revelando los secretos de twitter, Festival de Software Libre 2014
 
Mejor proyecto big data
Mejor proyecto big dataMejor proyecto big data
Mejor proyecto big data
 
PNE 178301. Ciudades inteligentes. Datos abiertos (Open Data)
PNE 178301. Ciudades inteligentes. Datos abiertos (Open Data)PNE 178301. Ciudades inteligentes. Datos abiertos (Open Data)
PNE 178301. Ciudades inteligentes. Datos abiertos (Open Data)
 
Datos Abiertos del Ayuntamiento de Málaga y como usar su API
Datos Abiertos del Ayuntamiento de Málaga y como usar su APIDatos Abiertos del Ayuntamiento de Málaga y como usar su API
Datos Abiertos del Ayuntamiento de Málaga y como usar su API
 

Más de Oscar Corcho

Organisational Interoperability in Practice at Universidad Politécnica de Madrid
Organisational Interoperability in Practice at Universidad Politécnica de MadridOrganisational Interoperability in Practice at Universidad Politécnica de Madrid
Organisational Interoperability in Practice at Universidad Politécnica de Madrid
Oscar Corcho
 
Introducción a los Datos Abiertos - Open Data Day 2020
Introducción a los Datos Abiertos - Open Data Day 2020Introducción a los Datos Abiertos - Open Data Day 2020
Introducción a los Datos Abiertos - Open Data Day 2020
Oscar Corcho
 
Open Data (and Software, and other Research Artefacts) - A proper management
Open Data (and Software, and other Research Artefacts) -A proper managementOpen Data (and Software, and other Research Artefacts) -A proper management
Open Data (and Software, and other Research Artefacts) - A proper management
Oscar Corcho
 
Adiós a los ficheros, hola a los grafos de conocimientos estadísticos
Adiós a los ficheros, hola a los grafos de conocimientos estadísticosAdiós a los ficheros, hola a los grafos de conocimientos estadísticos
Adiós a los ficheros, hola a los grafos de conocimientos estadísticos
Oscar Corcho
 
Ontology Engineering at Scale for Open City Data Sharing
Ontology Engineering at Scale for Open City Data SharingOntology Engineering at Scale for Open City Data Sharing
Ontology Engineering at Scale for Open City Data Sharing
Oscar Corcho
 
Situación de las iniciativas de Open Data internacionales (y algunas recomen...
Situación de las iniciativas de Open Data internacionales (y algunas recomen...Situación de las iniciativas de Open Data internacionales (y algunas recomen...
Situación de las iniciativas de Open Data internacionales (y algunas recomen...
Oscar Corcho
 
STARS4ALL - Contaminación Lumínica
STARS4ALL - Contaminación LumínicaSTARS4ALL - Contaminación Lumínica
STARS4ALL - Contaminación Lumínica
Oscar Corcho
 
Towards Reproducible Science: a few building blocks from my personal experience
Towards Reproducible Science: a few building blocks from my personal experienceTowards Reproducible Science: a few building blocks from my personal experience
Towards Reproducible Science: a few building blocks from my personal experience
Oscar Corcho
 
Publishing Linked Statistical Data: Aragón, a case study
Publishing Linked Statistical Data: Aragón, a case studyPublishing Linked Statistical Data: Aragón, a case study
Publishing Linked Statistical Data: Aragón, a case study
Oscar Corcho
 
An initial analysis of topic-based similarity among scientific documents base...
An initial analysis of topic-based similarity among scientific documents base...An initial analysis of topic-based similarity among scientific documents base...
An initial analysis of topic-based similarity among scientific documents base...
Oscar Corcho
 
Linked Statistical Data 101
Linked Statistical Data 101Linked Statistical Data 101
Linked Statistical Data 101
Oscar Corcho
 
Aplicando los principios de Linked Data en AEMET
Aplicando los principios de Linked Data en AEMETAplicando los principios de Linked Data en AEMET
Aplicando los principios de Linked Data en AEMET
Oscar Corcho
 
Ojo Al Data 100 - Call for sharing session at IODC 2016
Ojo Al Data 100 - Call for sharing session at IODC 2016Ojo Al Data 100 - Call for sharing session at IODC 2016
Ojo Al Data 100 - Call for sharing session at IODC 2016
Oscar Corcho
 
Educando sobre datos abiertos: desde el colegio a la universidad
Educando sobre datos abiertos: desde el colegio a la universidadEducando sobre datos abiertos: desde el colegio a la universidad
Educando sobre datos abiertos: desde el colegio a la universidad
Oscar Corcho
 
STARS4ALL general presentation at ALAN2016
STARS4ALL general presentation at ALAN2016STARS4ALL general presentation at ALAN2016
STARS4ALL general presentation at ALAN2016
Oscar Corcho
 
Presentación de la red de excelencia de Open Data y Smart Cities
Presentación de la red de excelencia de Open Data y Smart CitiesPresentación de la red de excelencia de Open Data y Smart Cities
Presentación de la red de excelencia de Open Data y Smart Cities
Oscar Corcho
 
Why do they call it Linked Data when they want to say...?
Why do they call it Linked Data when they want to say...?Why do they call it Linked Data when they want to say...?
Why do they call it Linked Data when they want to say...?
Oscar Corcho
 
Linked Statistical Data: does it actually pay off?
Linked Statistical Data: does it actually pay off?Linked Statistical Data: does it actually pay off?
Linked Statistical Data: does it actually pay off?
Oscar Corcho
 
Slow-cooked data and APIs in the world of Big Data: the view from a city per...
Slow-cooked data and APIs in the world of Big Data: the view from a city per...Slow-cooked data and APIs in the world of Big Data: the view from a city per...
Slow-cooked data and APIs in the world of Big Data: the view from a city per...
Oscar Corcho
 
Research Objects for improved sharing and reproducibility
Research Objects for improved sharing and reproducibilityResearch Objects for improved sharing and reproducibility
Research Objects for improved sharing and reproducibility
Oscar Corcho
 

Más de Oscar Corcho (20)

Organisational Interoperability in Practice at Universidad Politécnica de Madrid
Organisational Interoperability in Practice at Universidad Politécnica de MadridOrganisational Interoperability in Practice at Universidad Politécnica de Madrid
Organisational Interoperability in Practice at Universidad Politécnica de Madrid
 
Introducción a los Datos Abiertos - Open Data Day 2020
Introducción a los Datos Abiertos - Open Data Day 2020Introducción a los Datos Abiertos - Open Data Day 2020
Introducción a los Datos Abiertos - Open Data Day 2020
 
Open Data (and Software, and other Research Artefacts) - A proper management
Open Data (and Software, and other Research Artefacts) -A proper managementOpen Data (and Software, and other Research Artefacts) -A proper management
Open Data (and Software, and other Research Artefacts) - A proper management
 
Adiós a los ficheros, hola a los grafos de conocimientos estadísticos
Adiós a los ficheros, hola a los grafos de conocimientos estadísticosAdiós a los ficheros, hola a los grafos de conocimientos estadísticos
Adiós a los ficheros, hola a los grafos de conocimientos estadísticos
 
Ontology Engineering at Scale for Open City Data Sharing
Ontology Engineering at Scale for Open City Data SharingOntology Engineering at Scale for Open City Data Sharing
Ontology Engineering at Scale for Open City Data Sharing
 
Situación de las iniciativas de Open Data internacionales (y algunas recomen...
Situación de las iniciativas de Open Data internacionales (y algunas recomen...Situación de las iniciativas de Open Data internacionales (y algunas recomen...
Situación de las iniciativas de Open Data internacionales (y algunas recomen...
 
STARS4ALL - Contaminación Lumínica
STARS4ALL - Contaminación LumínicaSTARS4ALL - Contaminación Lumínica
STARS4ALL - Contaminación Lumínica
 
Towards Reproducible Science: a few building blocks from my personal experience
Towards Reproducible Science: a few building blocks from my personal experienceTowards Reproducible Science: a few building blocks from my personal experience
Towards Reproducible Science: a few building blocks from my personal experience
 
Publishing Linked Statistical Data: Aragón, a case study
Publishing Linked Statistical Data: Aragón, a case studyPublishing Linked Statistical Data: Aragón, a case study
Publishing Linked Statistical Data: Aragón, a case study
 
An initial analysis of topic-based similarity among scientific documents base...
An initial analysis of topic-based similarity among scientific documents base...An initial analysis of topic-based similarity among scientific documents base...
An initial analysis of topic-based similarity among scientific documents base...
 
Linked Statistical Data 101
Linked Statistical Data 101Linked Statistical Data 101
Linked Statistical Data 101
 
Aplicando los principios de Linked Data en AEMET
Aplicando los principios de Linked Data en AEMETAplicando los principios de Linked Data en AEMET
Aplicando los principios de Linked Data en AEMET
 
Ojo Al Data 100 - Call for sharing session at IODC 2016
Ojo Al Data 100 - Call for sharing session at IODC 2016Ojo Al Data 100 - Call for sharing session at IODC 2016
Ojo Al Data 100 - Call for sharing session at IODC 2016
 
Educando sobre datos abiertos: desde el colegio a la universidad
Educando sobre datos abiertos: desde el colegio a la universidadEducando sobre datos abiertos: desde el colegio a la universidad
Educando sobre datos abiertos: desde el colegio a la universidad
 
STARS4ALL general presentation at ALAN2016
STARS4ALL general presentation at ALAN2016STARS4ALL general presentation at ALAN2016
STARS4ALL general presentation at ALAN2016
 
Presentación de la red de excelencia de Open Data y Smart Cities
Presentación de la red de excelencia de Open Data y Smart CitiesPresentación de la red de excelencia de Open Data y Smart Cities
Presentación de la red de excelencia de Open Data y Smart Cities
 
Why do they call it Linked Data when they want to say...?
Why do they call it Linked Data when they want to say...?Why do they call it Linked Data when they want to say...?
Why do they call it Linked Data when they want to say...?
 
Linked Statistical Data: does it actually pay off?
Linked Statistical Data: does it actually pay off?Linked Statistical Data: does it actually pay off?
Linked Statistical Data: does it actually pay off?
 
Slow-cooked data and APIs in the world of Big Data: the view from a city per...
Slow-cooked data and APIs in the world of Big Data: the view from a city per...Slow-cooked data and APIs in the world of Big Data: the view from a city per...
Slow-cooked data and APIs in the world of Big Data: the view from a city per...
 
Research Objects for improved sharing and reproducibility
Research Objects for improved sharing and reproducibilityResearch Objects for improved sharing and reproducibility
Research Objects for improved sharing and reproducibility
 

Periodismo de datos y Linked Data: El poder de los datos enlazados para generar historias

  • 1. Periodismo de datos y Linked Data “El poder de los datos enlazados para generar historias” UCM / #6eiiic, Madrid, 25/09/2013 Oscar Corcho ocorcho@fi.upm.es, ocorcho@localidata.com @ocorcho
  • 2. Y MEJOR algo revueltos Todos juntos… Speaker: Date: 25/09/13
  • 3. Veamos un ejemplo… • ¿Existe correlación entre el número de locutorios que hay en un barrio y la población ecuatoriana o chilena empadronada en él? • ¿Qué datos necesito? • Locutorios y su localización • Idealmente procedente de un portal de datos abiertos • Datos del padrón por barrios • Procedente del portal de datos estadísticos de Madrid Speaker: ?
  • 4. Disclaimer… 4<<Texto libre: proyecto, speaker, etc.>> Vamos a explorar tecnologías que en algunos casos son aún poco usables
  • 5. Paso 1. Descargar los datos que vamos a usar (I) • Por ejemplo, datos de población del Instituto de Estadística de Madrid 5<<Texto libre: proyecto, speaker, etc.>>
  • 6. Paso 1. Descargar los datos que vamos a usar (II) • Y también nos encontramos con una base de datos de locales comerciales, que contiene locutorios • O usamos Google Places, Open Street Map, 4square, etc. • Que proporcionan APIs de datos 6<<Texto libre: proyecto, speaker, etc.>>
  • 7. Paso 2. Nos fijamos en los datos y en cómo conectarlos 7<<Texto libre: proyecto, speaker, etc.>> • ¿Cómo los conectamos? • 079601001 • Madrid, Distrito 1, Sección 1 • http://datos.localidata.com/recurso/Provincia/Madrid/Municip
  • 8. Paso 3. Y creamos una red de datos enlazados • Linked Data • Utilizar la Web como una base de datos global • Movernos de una Web de documentos a una Web de datos • URIs, HTTP, RDF, enlaces y REST 8<<Texto libre: proyecto, speaker, etc.>> Base de datos del INE Base de datos del INE Base de datos de locales comerciales Base de datos de locales comerciales
  • 9. Ejemplo: Integración de datos 9 Catas tro Catas tro BD AEMET BD AEMET BD DBpedia BD DBpedia BD IGN BD IGN C/ Alcalá, 54 1446403VK4714E0001AZ 971m2 refCatastral superficie 28014 codPostal 1910 añoConstrucción C/ Alcalá, 54 Madrid Madrid city sameAs Madrid 20º Temperatura C/ Alcalá, 54 Cafetería Simpatía vcard:adr 11012723 NúmeroPortal L-20 Código Local Ayto Madrid Ayto Madrid
  • 10. Ejemplo: Integración de datos 10Asunción Gómez Pérez
  • 11. Algunos ejemplos de uso de Linked Data en medios • http://rtve.linkeddata.es • http://webenemasuno.linkeddata.es/ 11<<Texto libre: proyecto, speaker, etc.>>
  • 12. Paso 3. Y creamos una red de datos enlazados • Usando vocabularios estandarizados • Así nuestros datos pueden ser reutilizados por otros más fácilmente • Ejemplos • GeoSPARQL • DataCube • División administrativa de España (red.es) • Y haciendo nuestros datos enlazados disponibles como APIs 12<<Texto libre: proyecto, speaker, etc.>>
  • 13. Paso 4. Y a explotar los datos… (I) • Realizando consultas • Dime cuántos locutorios hay en Madrid (aquí) PREFIX localidata: <http://datos.localidata.com/def/City#> PREFIX rdfs: <http://www.w3.org/2000/01/rdf-schema#> SELECT (COUNT(DISTINCT ?item) AS ?numLocutorios) { ?item a localidata:LocalComercial . ?item localidata:clasificacionEconomica ?cE . ?cE localidata:epigrafeActividad ?epi . {?epi localidata:codigo "610002"} UNION {?epi localidata:codigo "477808"}. } 13<<Texto libre: proyecto, speaker, etc.>>
  • 14. Paso 4. Y a explotar los datos… (I) • Realizando consultas • Dime cuántos locutorios hay en Usera (aquí) PREFIX localidata: <http://datos.localidata.com/def/City#> SELECT COUNT (DISTINCT ?item) AS ? numLocutoriosUsera { ?item a localidata:LocalComercial . ?item localidata:clasificacionEconomica ?cE . ?cE localidata:epigrafeActividad ?epi . {?epi localidata:codigo "610002"} UNION {?epi localidata:codigo "477808"}. ?item localidata:enDivisionTerritorial ?seccion . ?seccion localidata:distrito <http://datos.localidata.com/recurso/Provincia/Madrid/Muni cipio/madrid/Distrito/12> . } 14<<Texto libre: proyecto, speaker, etc.>>
  • 15. Paso 4. Y a explotar los datos… (I) • Realizando consultas • ¿En qué barrios viven más ecuatorianos entre 20 y 59 años? (aquí) PREFIX localidata: <http://datos.localidata.com/def/City#> PREFIX rdfs: <http://www.w3.org/2000/01/rdf-schema#> PREFIX qb: <http://purl.org/linked-data/cube#> PREFIX localidata: <http://datos.localidata.com/def/City#> PREFIX rdfs: <http://www.w3.org/2000/01/rdf-schema#> PREFIX qb: <http://purl.org/linked-data/cube#> PREFIX cityStats-dimension: <http://datos.localidata.com/def/CityStats/dimension#> PREFIX sdmx-dimension: <http://purl.org/linked-data/sdmx/2009/dimension#> PREFIX cityStats-code: <http://datos.localidata.com/def/CityStats/code#> PREFIX cityStats: <http://datos.localidata.com/def/CityStats/stats#> SELECT DISTINCT ?barrio (sum(?numHabitantesEC2065Seccion) as ? numHabitantesEC2065Barrio) WHERE { ?seccion localidata:barrio ?bar . ?bar rdfs:label ?barrio . { 15<<Texto libre: proyecto, speaker, etc.>>
  • 16. Paso 4. Y a explotar los datos… (II) • Realizando gráficos con R 16<<Texto libre: proyecto, speaker, etc.>>
  • 17. Paso 4. Y a explotar los datos… (III) • Obteniendo correlaciones entre personas de Ecuador empadronadas y locutorios por barrios de Madrid q <- "PREFIX localidata: <http://datos.localidata.com/def/City#> PREFIX qb: http://purl.org/linked-data/cube# … SELECT DISTINCT ?distrito ?barrio …“ dLocutoriosEC <- SPARQL(url=endpointLocalidata, query=q, ns=prefix, extra=options) resLocutoriosEC <- dLocutoriosEC$results loc_EC_frame <- data.frame(locutorios=resLocutoriosEC$numLocutorios, ecuatorianosAdultos=resLocutoriosEC$numHabitantesEC2065, chilenosAdultos=resLocutoriosEC$numHabitantesCL2065) row.names(loc_EC_frame) <- resLocutoriosEC$barrio cor <- cor(loc_EC_frame, method='pearson’) 17<<Texto libre: proyecto, speaker, etc.>>
  • 18. Paso 4. Y a explotar los datos… (IV) • Y visualizando los datos para nuestros lectores en la Web, en un iPad… 18<<Texto libre: proyecto, speaker, etc.>>
  • 19. ¿Alguna historia más? • Publicaremos en breve algunas en http://www.localidata.com/ • Si alguno de vosotros está interesado en utilizar nuestros datos para generar historias, hablad con nosotros 19<<Texto libre: proyecto, speaker, etc.>>
  • 20. Periodismo de datos y Linked Data “El poder de los datos enlazados para generar historias” UCM / #6eiiic, Madrid, 25/09/2013 Oscar Corcho ocorcho@fi.upm.es, ocorcho@localidata.com @ocorcho

Notas del editor

  1. http://localhost:8890/sparql?default-graph-uri=&amp;query=PREFIX+localidata%3A+%3Chttp%3A%2F%2Fdatos.localidata.com%2Fdef%2FCity%23%3E%0D%0APREFIX+rdfs%3A+%3Chttp%3A%2F%2Fwww.w3.org%2F2000%2F01%2Frdf-schema%23%3E%0D%0APREFIX+qb%3A+%3Chttp%3A%2F%2Fpurl.org%2Flinked-data%2Fcube%23%3E%0D%0APREFIX+localidata%3A+%3Chttp%3A%2F%2Fdatos.localidata.com%2Fdef%2FCity%23%3E%0D%0APREFIX+rdfs%3A+%3Chttp%3A%2F%2Fwww.w3.org%2F2000%2F01%2Frdf-schema%23%3E%0D%0APREFIX+qb%3A+%3Chttp%3A%2F%2Fpurl.org%2Flinked-data%2Fcube%23%3E%0D%0APREFIX+cityStats-dimension%3A+%3Chttp%3A%2F%2Fdatos.localidata.com%2Fdef%2FCityStats%2Fdimension%23%3E%0D%0APREFIX+sdmx-dimension%3A+%3Chttp%3A%2F%2Fpurl.org%2Flinked-data%2Fsdmx%2F2009%2Fdimension%23%3E+%0D%0APREFIX+cityStats-code%3A+%3Chttp%3A%2F%2Fdatos.localidata.com%2Fdef%2FCityStats%2Fcode%23%3E%0D%0APREFIX+cityStats%3A+%3Chttp%3A%2F%2Fdatos.localidata.com%2Fdef%2FCityStats%2Fstats%23%3E%0D%0A%0D%0ASELECT+DISTINCT+%3Fbarrio+%28sum%28%3FnumHabitantesEC2065Seccion%29+as+%3FnumHabitantesEC2065Barrio%29%0D%0AWHERE%0D%0A{+%0D%0A++%3Fseccion+localidata%3Abarrio+%3Fbar+.++%3Fbar+rdfs%3Alabel+%3Fbarrio+.%0D%0A++{%0D%0A++SELECT+DISTINCT+%3Fseccion+%28sum%28xsd%3Adouble%28%3Fnum%29%29+as+%3FnumHabitantesEC2065Seccion%29%0D%0A++WHERE+{%0D%0A+++++++%3Fobs+a+qb%3AObservation+.%0D%0A+++++++%3Fobs+qb%3AdataSet+%3Chttp%3A%2F%2Fdatos.localidata.com%2Frecurso%2FCityStats%2FProvincia%2FMadrid%2FPoblacion%2F2012%2F12%3E.%0D%0A+++++++%3Fobs+cityStats-dimension%3ArefSeccionCensal+%3Fseccion+.%0D%0A+++++++%3Fobs+cityStats-dimension%3ArefPaisNacionalidad+%3Chttp%3A%2F%2Feurostat.linked-statistics.org%2Fdic%2Fgeo%23EC%3E+.%0D%0A+++++++%3Fobs+cityStats%3AnumeroHabitantes+%3Fnum+.%0D%0A+++++++{{%3Fobs+sdmx-dimension%3Aage+%3Chttp%3A%2F%2Feurostat.linked-statistics.org%2Fdic%2Fage%23Y20-24%3E+}+UNION%0D%0A+++++++{%3Fobs+sdmx-dimension%3Aage+%3Chttp%3A%2F%2Feurostat.linked-statistics.org%2Fdic%2Fage%23Y25-29%3E+}+UNION%0D%0A+++++++{%3Fobs+sdmx-dimension%3Aage+%3Chttp%3A%2F%2Feurostat.linked-statistics.org%2Fdic%2Fage%23Y30-34%3E+}+UNION%0D%0A+++++++{%3Fobs+sdmx-dimension%3Aage+%3Chttp%3A%2F%2Feurostat.linked-statistics.org%2Fdic%2Fage%23Y35-39%3E+}+UNION%0D%0A+++++++{%3Fobs+sdmx-dimension%3Aage+%3Chttp%3A%2F%2Feurostat.linked-statistics.org%2Fdic%2Fage%23Y40-44%3E+}+UNION%0D%0A+++++++{%3Fobs+sdmx-dimension%3Aage+%3Chttp%3A%2F%2Feurostat.linked-statistics.org%2Fdic%2Fage%23Y45-49%3E+}+UNION%0D%0A+++++++{%3Fobs+sdmx-dimension%3Aage+%3Chttp%3A%2F%2Feurostat.linked-statistics.org%2Fdic%2Fage%23Y50-54%3E+}+UNION%0D%0A+++++++{%3Fobs+sdmx-dimension%3Aage+%3Chttp%3A%2F%2Feurostat.linked-statistics.org%2Fdic%2Fage%23Y55-59%3E+}}+.++%0D%0A+++++++}+GROUP+BY+%3Fseccion+%0D%0A+++++}%0D%0A}+GROUP+BY+%3Fbarrio+ORDER+BY+DESC%28%3FnumHabitantesEC2065Barrio%29%0D%0A%0D%0A+&amp;debug=on&amp;timeout=&amp;format=text%2Fhtml&amp;save=display&amp;fname=
  2. q &lt;- paste(sparql_prefix, &quot;SELECT DISTINCT ?s ?type ?lat ?long WHERE { ?s a localidata:LocalComercial . ?s a ?type . ?s localidata:enDivisionTerritorial &lt;http://datos.localidata.com/recurso/Provincia/Madrid/Municipio/madrid/Distrito/01/Seccion/117&gt;. ?s geo:geometry ?g . ?g geo:lat ?lat . ?g geo:long ?long }&quot;) d &lt;- SPARQL(url=endpointLocalidata, query=q, ns=prefix, extra=options) res &lt;- d$results local_lat_lon_table &lt;- table(res$s,res$type,res$lat,res$long) # A very nice map... qmap(&apos;Madrid, Spain&apos;, zoom=16, maptype = &apos;watercolor&apos;, source = &apos;stamen&apos;) + geom_point(aes(x=long, y=lat, colour=type), data=res) + scale_color_manual(values = rainbow(10))