Crear un recurso multimedia. Maricela_Ponce_DomingoM1S3AI6-1.pptx
Curso Integración Web Semántica Estadísticas
1. Curso Integración
Web Semántica
Estadísticas
25 Octubre 2011
Jose María Álvarez Rodríguez
WESO-Universidad de Oviedo
E-mail: josem.alvarez@weso.es
WWW: http://josemalvarez.es
3. Receta
• Elegir el dataset a RDFizar
• Analizar los datos a convertir
• Buscar cómo modelar estos datos
• Reutilizar vocabularios + Nuevas
definiciones
• Enriquecer
• Con qué datasets tengo/debo/quiero
enlazar y qué operación
• Servicios de acceso a esos datasets
• Herramientas de generación
• Validen los datos generados
• Datos estáticos o dinámicos
• Provenance…
• Descripción del dataset generado
4. Mi Receta
• Noménclator 2010 de Asturias
• Formato MSExcel, Códigos, Descripciones
textuales, jerarquía de entidades y datos
estadísticos
• SKOS, Dublin Core, SCOVO, Cube+SDMX,
Organizations Ontology, FOAF, NUTS, etc.
• DBPedia-SPARQL-Reconciliar
• Google Maps API-REST WS-Buscar
• Google Refine+ RDF extension
• Valida RDF de salida
• Datos estáticos
• Provenance, licencia…
• Descripción del dataset generado
5.
6. Estadísticas con
The RDF Data Cube vocabulary
http://publishing-statistical-
data.googlecode.com/svn/trunk/specs/src/main/html/cube.html
7. Definiciones The RDF Data Cube
vocabulary
• Dataset estadístico: colección de observaciones,
definida por un conjunto de dimensiones: tiempo,
superficie, población + metadatos
• Cubo: conjunto de dimensiones+atributos+medidas
• Dimensión: identifica observaciones
• Medida: fenómeno observado
• Atributo: cualifica y sirve para interpretar las
observaciones
• Slices: cada subconjunto de observaciones en un
dataset
8. Esqueleto de una entidad de población
d s
Yh/ZM^
W Eh^
E
E
d
^
d
,
D
d s
s W
s E W
9. Dimensiones
Noménclator 2010
• Región: cada una de las entidades de
población
• Superficie
• Altitud
• Distancia
• Período: constante 2010
• Género: Hombre o Mujer
• Tipo de Vivienda: Principales y No
Principales
10. Medidas
Noménclator 2010
• Superficie: Km2
• Altitud: metros
• Distancia: metros
• Género: nº de personas
• Tipo de Vivienda: nº de viviendas
11. Slices
Noménclator 2010
• Región + Intervalo 2010+
• Superficie
• Altitud
• Distancia
• Género
• Hombres
• Mujeres
• Tipo de Vivienda
• …
20. “Número de personas de
género masculino en
Llanuces en el año 2010”
3 dimensiones
1 unidad de medida
21. Descripción de un Slice
(Subconjunto del Dataset)
nomen-stats: sliceByRegionSex a qb:SliceKey;
rdfs:label “Slice por cada región@es;
rdfs:comment “Año fijo, región y sexo
cambian@es;
qb:componentProperty
nomen-stats:refPeriod; //El que queda fijo
.
22. Descripción de un Slice
(Estructura)
nomen-stats: spopulation a
qb:DataStructureDefinition;
qb:component
[qb:dimension nomen-stats:refPeriod; ],
[qb:dimension nomen-stats:refArea; ],
[qb:dimension sdmx-dimension:sex; ],
[qb:measure nomen-stats:population; ];
qb:sliceKey nomen-stats: sliceByRegionSex .
23. Descripción de un Slice
(Definición)
nomen-stats:region/sex a qb:Slice;
qb:sliceStructure
nomen-stats: sliceByRegionSex;
nomen-stats:refPeriod
http://reference.data.gov.uk/id/gregorian-
interval/2010-01-01T00:00:00/P1Y ;
qb:observation
nomen-obs:region/sex/m/53/08/02, …
.
25. “Altitud en metros de
Llanuces en el año 2010”
3 dimensiones,
…bueno la altitud puede cambiar en cierto intervalo
¿2M años?
1 unidad de medida
26. Descripción de un Slice
(Subconjunto del Dataset)
nomen-stats: sliceByRegion a qb:SliceKey;
rdfs:label “Slice por cada región@es;
rdfs:comment “Año y datos físicos fijos, la
región cambia@es;
qb:componentProperty nomen-stats:refPeriod;
qb:componentProperty
nomen-stats:physicalData;
.
27. Descripción de un Slice
(Estructura)
nomen-stats: saltitude a
qb:DataStructureDefinition; qb:component
[qb:dimension nomen-stats:refPeriod; ],
[qb:dimension nomen-stats:refArea; ],
[qb:dimension nomen-stats:physicalData; ],
[qb:measure nomen-stats:altitude; ] ;
qb:sliceKey nomen-stats: sliceByRegion .
28. Descripción de un Slice
(Definición)
nomen-stats:region/physicaldata a qb:Slice;
qb:sliceStructure
nomen-stats: sliceByRegion;
nomen-stats:refPeriod
http://reference.data.gov.uk/id/gregorian-
interval/2010-01-01T00:00:00/P1Y ;
nomen-stats:physicalData
http://dbpedia.org/resource/Altitude;
qb:observation
nomen-obs:region/physicaldata/altitude/53/08/02, …
.
30. Guardar el proyecto
con los “datos
limpios”
+
Crear un nuevo
proyecto sólo para
estadísticas
31. Volvemos a Google
Refine…
Crear un nuevo RDF con 3
nodos raíz (hombres, mujeres
y altitud)…mapear,
producir…publicar!
Ver fichero: recursos/rdf/nomenclator-stats-
definitions.ttl
33. Curso Integración Web
Semántica
…Consumo, Introducción
OWL+Ejemplo,
Debate+Conclusiones…
Jose María Alvarez Rodríguez
WESO-Universidad de Oviedo
E-mail: josem.alvarez@weso.es
WWW: http://josemalvarez.es