El documento presenta la métrica MELODA para medir el grado de reusabilidad de los conjuntos de datos abiertos. MELODA evalúa cuatro dimensiones (estándares técnicos, acceso, legal y modelo de datos) con varios niveles en cada dimensión. Los niveles están ponderados y la puntuación final de MELODA indica el grado de reusabilidad del conjunto de datos. El documento también analiza factores que afectan la reutilización como la licencia, acceso, geolocalización y tiempo real.
1. YOUR LOGO
¿Por que publicamos la información?
MELODA una métrica de la reutilización
Alberto Abella
@aabella
2. XVII JORNADA DE GESTIÓN DE LA INFORMACIÓNXVII JORNADA DE GESTIÓN DE LA INFORMACIÓN
Madrid. Datos.madrid.es
198 descargas
desde 15-4-2014
1.07 al día
http://bit.ly/volunari
osmadrid
198 descargas
desde 15-4-2014
1.07 al día
http://bit.ly/volunari
osmadrid
3. XVII JORNADA DE GESTIÓN DE LA INFORMACIÓNXVII JORNADA DE GESTIÓN DE LA INFORMACIÓN
Madrid. Datos.madrid.es
14 apps oficiales
utilizando los datos
de datos.madrid.es
14 apps oficiales
utilizando los datos
de datos.madrid.es
4. XVII JORNADA DE GESTIÓN DE LA INFORMACIÓNXVII JORNADA DE GESTIÓN DE LA INFORMACIÓN
España. Datos.gob.es
2 descargas
desde 15-4-2011
(posiblemente)
http://datos.gob.es/
catalogo/anejo-
fotografico-de-
tarazona-moncayo-
c12album
2 descargas
desde 15-4-2011
(posiblemente)
http://datos.gob.es/
catalogo/anejo-
fotografico-de-
tarazona-moncayo-
c12album
5. XVII JORNADA DE GESTIÓN DE LA INFORMACIÓNXVII JORNADA DE GESTIÓN DE LA INFORMACIÓN
Hay 1 (encontrada)
Es oficial
1000 descargas
Hay 1 (encontrada)
Es oficial
1000 descargas
BNE. Apps
6. XVII JORNADA DE GESTIÓN DE LA INFORMACIÓNXVII JORNADA DE GESTIÓN DE LA INFORMACIÓN
Copyright BNE 2015Copyright BNE 2015
BNE. Licencia catalogo datos
7. XVII JORNADA DE GESTIÓN DE LA INFORMACIÓN
Barcelona:
●
100.000 to 500.000 downloads
●
Basada en scraping de la web
●
Multiplicó por 5 durante tiempo a su competidor oficial
Barcelona:
●
100.000 to 500.000 downloads
●
Basada en scraping de la web
●
Multiplicó por 5 durante tiempo a su competidor oficial
Barcelona. Eduard Ereza
8. XVII JORNADA DE GESTIÓN DE LA INFORMACIÓNXVII JORNADA DE GESTIÓN DE LA INFORMACIÓN
Helsinki. Apps usando open data
Helsinki
621.000
habitantes
136 apps
Helsinki
621.000
habitantes
136 apps
9. 9
XVII JORNADA DE GESTIÓN DE LA INFORMACIÓN
¿Realmente queremos
que se usen?
10. XVII JORNADA DE GESTIÓN DE LA INFORMACIÓN
1 OGOV Active Passive
2 Goals Service’s improvement
Having lots of people in
well designed sites
3 Participants
Representative citizens’
sample
Those willing to
participate
4 Info. Release Actual demand and use
Authorities’ interests and
availability
5 Timeliness ASAP Once reviewed
6 Applications Ecosystem of developers Own development
7 Participation Commitment to answer Just open
8 Training In place No (just principles)
Ogov pasivo vs activo
Source: Abella, Ortiz-de-Urbina and De Pablos (2015)
SI NO
11. XVII JORNADA DE GESTIÓN DE LA INFORMACIÓN
De centralizado a colaborativo
Todos los desarrollos
son propios
No hay alternativas
para grupos de
usuarios
Conexión limitada en
caso existir
Centralizado
●
Los recursos se
comparten con los
usuarios
●
Propiedad central
cesión derechos uso
Ecosistema
reutilizadores
Promoción
Feedback
Compartido
●
Red de nodos
conectados por
plataformas /
protocolos comunes
Comparten datos u
otros recursos
digitales
Propiedad datos
distribuida
Colaborativo
Control Ecosistema Impacto
MODELOS COLABORACIÓN
Eficiencia recursos propios
12. XVII JORNADA DE GESTIÓN DE LA INFORMACIÓN
Ecosistemas digitales
Smart City Ecosystem Society
External
digital assets
SC Digital
assets
SC Data demand
Fixed data
Services
delivered
Services demand
Added value
processes
Source: Abella, Ortiz-de-Urbina and De Pablos (2015)
Data
source
13. XVII JORNADA DE GESTIÓN DE LA INFORMACIÓN
Citizen Experience
SERVICE
experience
Innovation
Save
Time
Trust
Stage impact on
attribute
Channel impact on
attribute
TOUCHPOINTS
Office Call Center … ATM
Discover Brand
Use of services
Discover Brand
…. … … … …
Finishing
LIFECYCLE
PHASE
Driver 1
(x %)
Driver 3
(z %)
Driver 2
(y %)
Driver 4
(t %)
Driver 5
(a %)
Driver 6
(b %)
Attribute
Driver For every attribute of experience
14. XVII JORNADA DE GESTIÓN DE LA INFORMACIÓN
Source http://www.ncbi.nlm.nih.gov/pubmed/15794461
Impacto de la publicación datos
Los Angeles county
Publicación calificación
sanitaria restaurantes
13.1 descenso
ingresos
hospitalarios
Los Angeles county
Publicación calificación
sanitaria restaurantes
13.1 descenso
ingresos
hospitalarios
15. XVII JORNADA DE GESTIÓN DE LA INFORMACIÓN
Tiene solución
….
Pero no sabemos cual es
16. XVII JORNADA DE GESTIÓN DE LA INFORMACIÓN
No sabemos cual es
….
Pero tenemos algunas pistas
17. XVII JORNADA DE GESTIÓN DE LA INFORMACIÓN
Impacto de la publicación datos
Reusability
degree
Reuse
value
Economic and social
value
Open data
Products/services
Distribution and/or
commercialization
Products / services
development
Open data
Smart cities datasets
Inbound open
innovation
Apps development
Outbound open
innovation
Apps Social and
market value
Stage 1 Stage 2 Stage 3
Source: Abella, Ortiz-de-Urbina and De Pablos (2015)
18. XVII JORNADA DE GESTIÓN DE LA INFORMACIÓN
Factores afectan a la
reutilización
19. XVII JORNADA DE GESTIÓN DE LA INFORMACIÓN
Factores reutilización datos. Legal
Legal
- Licencia de reutilización
- Uso comercial
- Compatibilidad entre licencias
Con la condición
- No desnaturalización
- Actualización
Legal
- Licencia de reutilización
- Uso comercial
- Compatibilidad entre licencias
Con la condición
- No desnaturalización
- Actualización
20. XVII JORNADA DE GESTIÓN DE LA INFORMACIÓN
Cambios en licencias de datos
Copyright and restrictive licensing Commercial & only attribution
0%
10%
20%
30%
40%
50%
60%
70%
80%
90%
100%
84%
16%
12%
88%
2011
2013
Fuente: Abella (2013)
21. XVII JORNADA DE GESTIÓN DE LA INFORMACIÓN
Factores reutilización datos. Acceso
Acceso
• Registro oficial
• Acceso a todos los datos
• API
• Query / SPARQL
Acceso
• Registro oficial
• Acceso a todos los datos
• API
• Query / SPARQL
«Vandalproof» de Originally first uploaded by Bottesini
of the English Wikipedia, converted to PNG by 98E of
the English Wikipedia, and then edited to look better by
Rappingwonders2. - Originally converted to PNG from
Image:Vandalprooflock.jpg, edited to look better by
User:Rappingwonders2.. Disponible bajo la licencia CC
BY-SA 3.0 vía Wikimedia Commons -
http://commons.wikimedia.org/wiki/File:Vandalproof.png
#/media/File:Vandalproof.png
22. XVII JORNADA DE GESTIÓN DE LA INFORMACIÓN
Factores reutilización datos. Acceso
-15% -10% -5% 0% 5% 10% 15% 20%
2
2.2
2.4
2.6
2.8
3
3.2
3.4
3.6
3.8
4LOCAL
Linear (LOCAL)
NATIONAL
Linear (NATIONAL)
REGIONAL
Linear (REGIONAL)
Increment use 12-11
Accessdimension
Legal
Legal
Legal
Transport
Transport
Transport (L)
Meteo
Meteo
Meteo (R)
Geograhic
Geograhic
Geograhic
Social
Social
Social
Other
Other
Other
Business
Business
Business
Muestra (2013)
• 204 fuentes (España)
• 7 categorías datos
•Ambito nacional, regional
y local
•MELODA 2.5
Muestra (2013)
• 204 fuentes (España)
• 7 categorías datos
•Ambito nacional, regional
y local
•MELODA 2.5
23. XVII JORNADA DE GESTIÓN DE LA INFORMACIÓN
Factores reutilización. Estándares
técnicos
Estándares técnicos
• No influyen tanto
• Pueden incluir los metadatos
• Pueden condicionar la herramienta
uso
•Estándares geográficos (INSPIRE)
Estándares técnicos
• No influyen tanto
• Pueden incluir los metadatos
• Pueden condicionar la herramienta
uso
•Estándares geográficos (INSPIRE)
"Master lock" by Dhscommtech at English
Wikipedia. Licensed under CC BY-SA 3.0 via
Wikimedia Commons -
https://commons.wikimedia.org/wiki/File:Master_l
ock.JPG#/media/File:Master_lock.JPG
24. XVII JORNADA DE GESTIÓN DE LA INFORMACIÓN
Factores reutilización. Modelo de datos
Modelo de datos
- Documentado
- Publicado
- Compartido
- Normalizado
- Utilizado
Posiblemente el de mayor
impacto
No nos valen las 5 estrellas
Modelo de datos
- Documentado
- Publicado
- Compartido
- Normalizado
- Utilizado
Posiblemente el de mayor
impacto
No nos valen las 5 estrellas
CC Attribution IvanWalsh.com
25. XVII JORNADA DE GESTIÓN DE LA INFORMACIÓN
Factores reutilización.
Geolocalización
Geolocalización
- Añade valor
- En los datasets más utilizados
Geolocalización
- Añade valor
- En los datasets más utilizados
"World Heat Engine" by NASA / Goddard - Image
n.0300805 "The World Revs its Heat
Engine"http://mix.msfc.nasa.gov/abstracts.php?
p=2622http://nasaimages.org/luna/servlet/detail
/nasaNAS~9~9~58656~162500http://www.flickr
.com/photos/nasacommons/5053572594/.
Licensed under Public Domain via Wikimedia
Commons -
https://commons.wikimedia.org/wiki/File:World_H
eat_Engine.jpg#/media/File:World_Heat_Engine.j
26. XVII JORNADA DE GESTIÓN DE LA INFORMACIÓN
Factores reutilización. Tiempo real
Tiempo real
De acuerdo al proceso que los
genera
Conexión en directo a los datos
Mayoritariamente presente en
los datos más reutilizados
Tiempo real
De acuerdo al proceso que los
genera
Conexión en directo a los datos
Mayoritariamente presente en
los datos más reutilizados
27. XVII JORNADA DE GESTIÓN DE LA INFORMACIÓN
¿Como medimos la
reusabilidad?
28. XVII JORNADA DE GESTIÓN DE LA INFORMACIÓN
Metrica reutilización
MELODA
4 Dimensiones de
análisis
Varios niveles en cada
dimensión
Cada nivel está ponderado
MELODA
4 Dimensiones de
análisis
Varios niveles en cada
dimensión
Cada nivel está ponderado
MELODA: Tabla de dimensiones y niveles
Dimensiones
Niveles
29. XVII JORNADA DE GESTIÓN DE LA INFORMACIÓN
Metrica reutilización
MELODA
4 Dimensiones análisis
Varios niveles en cada
dimensión
Cada nivel está
ponderado
MELODA
4 Dimensiones análisis
Varios niveles en cada
dimensión
Cada nivel está
ponderado
MELODA: Ponderación de niveles
Dimensiones
Niveles
30. XVII JORNADA DE GESTIÓN DE LA INFORMACIÓN
Metrica reutilización
MELODA
MEtric for reLeasing Open
DAta
- Cuantificar la reusabilidad de
fuentes de información
- Relacionarla con su
reutilización
- Relacionarla con el valor
creado
- Accesible en meloda.org
MELODA
MEtric for reLeasing Open
DAta
- Cuantificar la reusabilidad de
fuentes de información
- Relacionarla con su
reutilización
- Relacionarla con el valor
creado
- Accesible en meloda.org
Proceso evaluación
Estándar técnico
Legal
Acceso
Juego datos
Meloda 3.10
M3.10
Ponderación
Ponderación
Pondera
Criterios
Nivel
Nivel
Nivel
Paso 1.
Evaluación
Paso 2.
Ponderación
Paso 3.
Obtención
valor
Valor
Métrica
MELODA
Modelo de datos
Nivel
Ponderación
Ponderación
Cualificación
Reusabilidad
Paso 4.
Calificación
reusabilidad
31. XVII JORNADA DE GESTIÓN DE LA INFORMACIÓN
Metrica reutilización. Ejemplo
MELODA
La Biblioteca A publica un conjunto de datos como linked data pero con un modelo
de datos propio, con licencia de uso comercial, y con un mecanismo por el cual se
puede utilizar un recurso SPARQL para interrogar el conjunto de datos. Los niveles
que tiene en cada dimensión son los siguientes:
Dimensión estándares técnicos: Nivel 3 (RDF con metadatos) → 100%
Dimensión acceso: Nivel 5 (Interrogable vía SPARQL) → 100%
Dimensión legal: Nivel 4 (comercial) → 90%
Dimensión Modelo de datos: Nivel 2 (modelo de datos ad hoc) → 30%
MELODA
La Biblioteca A publica un conjunto de datos como linked data pero con un modelo
de datos propio, con licencia de uso comercial, y con un mecanismo por el cual se
puede utilizar un recurso SPARQL para interrogar el conjunto de datos. Los niveles
que tiene en cada dimensión son los siguientes:
Dimensión estándares técnicos: Nivel 3 (RDF con metadatos) → 100%
Dimensión acceso: Nivel 5 (Interrogable vía SPARQL) → 100%
Dimensión legal: Nivel 4 (comercial) → 90%
Dimensión Modelo de datos: Nivel 2 (modelo de datos ad hoc) → 30%
√√100 ·100 ·90 ·30 =72.08
32. XVII JORNADA DE GESTIÓN DE LA INFORMACIÓNXVII JORNADA DE GESTIÓN DE LA INFORMACIÓN
Informe reusabilidad
33. XVII JORNADA DE GESTIÓN DE LA INFORMACIÓN
Alberto Abella
Activismo: Open Knowledge Foundation
Spain
Academia: Universidad Rey Juan Carlos
Sociedad información : AMETIC
Sector Privado: Brain Trust
Activismo: Open Knowledge Foundation
Spain
Academia: Universidad Rey Juan Carlos
Sociedad información : AMETIC
Sector Privado: Brain Trust
Contacto: @aabella
aabella@braintrust-cs.com
alberto.abella@urjc.es