2. Alberto González Yanes
Jefe de Servicio de Estadísticas Económicas
jgonyanp@gobiernodecanarias.org
@algoya_dat
Marco de desarrollo
SISTEMA DE DATOS
INTEGRADOS DE
CANARIAS (iDatos)
JECAS 2018
3. SISTEMA DE DATOS INTEGRADOS DE CANARIAS
ESQUEMA GENERAL DE LA PRESENTACIÓN
1. Marco normativo
2. Organización y gestión del sistema
3. Producción de directorios y estadísticas multifuentes
5. SISTEMA DE DATOS INTEGRADOS DE CANARIAS
1. Ley 1/1991 de Estadística de la Comunidad Autónoma de Canarias
- Artículo 32 Peticiones a las Administraciones
- Artículo 34 Acceso a ficheros de datos
- Artículo 36 Recepción, envío y depósito de información estadística
2. Plan Estadístico de Canarias 2018-2022
- Directriz 4.1. Uso de fuentes administrativas y fuentes Big Data públicas o privadas
- Directriz 4.2. Integración de fuentes de datos, estadísticas multifuentes y sistema de datos
integrados
6. SISTEMA DE DATOS INTEGRADOS DE CANARIAS
1. Principios de calidad
- Singularidad y pertinencia
- Contenido
- Eficiencia
2. Objetivos
- Debe permitir la fusión de ficheros administrativos
- Debe permitir su integración con información geográfica
- Debe facilitar la elaboración de estadísticas multifuentes
- Incluyendo fuentes Big Data
7. SISTEMA DE DATOS INTEGRADOS DE CANARIAS
Comité Técnico
1. Definir y desarrollar, técnica y normativamente, el Sistema de Datos Integrados.
2. Elaborar e implementar un marco de calidad de fuentes administrativas para fines estadísticos.
3. Inventariar fuentes de información administrativa para uso estadístico. Apoyar en el desarrollo de un gestor de inventario de fuentes de información
administrativa para fines estadísticos, integrado en la Infraestructura de Datos y Metadatos Estadísticos de Canarias (eDatos) y definición de los
procedimientos asociados.
4. Elaborar e implementar un marco de trabajo en geoestadística.
5. Incorporar estrategias, procedimientos y tecnologías de georreferenciación, deduplicación y enlazamiento de ficheros en un entorno integrado de datos
estadísticos de origen administrativo.
6. Definir estrategias, normas, procedimientos y buenas prácticas de uso de ficheros administrativos para fines geoestadísticos.
7. Incorporar procedimientos y tecnologías de control de la confidencialidad y el secreto estadístico.
8. SISTEMA DE DATOS INTEGRADOS DE CANARIAS
Hitos
1. Integración de microdatos
2. Georreferenciación de microdatos
3. Geocodificación de macrodatos
4. Anonimizar microdatos, macrodatos y cartografías
9. Organización y gestión del sistema
SISTEMA DE DATOS
INTEGRADOS DE
CANARIAS (iDatos)
JECAS 2018
10. SISTEMA DE DATOS INTEGRADOS DE CANARIAS
Marcos de desarrollo
1. Marco de gestión de datos
- Modelo organizacional
- Política de normalización
2. Marco de integración de fuentes
- Modelo general de enlazamiento
- Estrategias particulares de enlazamiento
3. Marco de estadística espacial
- Infraestructura de información geográfica
- Infraestructura de georreferenciación y
geocodificación
11. SISTEMA DE DATOS INTEGRADOS DE CANARIAS
Datos
Modelo organizacional por tipología y naturaleza
(esquemas-tipo)
Metadatos
Soporte de normalización semántica
Procedimientos
Soporte de procesos y procesamiento
12. SISTEMA DE DATOS INTEGRADOS DE CANARIAS
Cartografía
Raw Cartography (RC)
Support Cartography (IGS)
Geographic Information Reference (IGR)
Public Cartography (PC)
13. SISTEMA DE DATOS INTEGRADOS DE CANARIAS
Microdatos
Raw Data (RD)
Master Data (ID)
Statistical Data (SD)
Scientific Data (CD)
Public Data (PD)
14. SISTEMA DE DATOS INTEGRADOS DE CANARIAS
Macrodatos
MacroDataSet (MDS)
DataSetCube (DSC)
IndicatorsCube (DSI)
15. SISTEMA DE DATOS INTEGRADOS DE CANARIAS
Microdatos
Datos (DAT)
Georreferencias (GEO)
Datos longitudinales (LON)
Metadatos
Diseño de registro (DSD)
Registro de datos (REG)
Extensiones de códigos (CLE)
16. SISTEMA DE DATOS INTEGRADOS DE CANARIAS
Relaciones
Relaciones entre unidades de información (URD)
Tablas de almacenamiento de las relaciones, internas o externas, de las
observaciones de una tabla de microdatos con otros microdatos.
17. SISTEMA DE DATOS INTEGRADOS DE CANARIAS
Relaciones (URD)
Identificadores de enlazamiento
uuid_a
stid_a
uuid_b
stid_b
Descripción de la relación
rel_type
rel_description
Descripción del enlazamiento
link_type
link_description
link_quality
linl_quality_rank
18. SISTEMA DE DATOS INTEGRADOS DE CANARIAS
Georreferencias (GEO)
Literales de dirección del portal
tvia
cvia
nvia
numer
codmun
nommun
direccion
Georreferencias
geom
longitud
latitud
Relación con las tablas maestras de portales
uuid_id
stid_id
19. SISTEMA DE DATOS INTEGRADOS DE CANARIAS
Georreferenciación
Fuentes administrativas
Fuentes Big Data
Geocodificación
Método de abajo-arriba
Polígonos suburbanos
20. SISTEMA DE DATOS INTEGRADOS DE CANARIAS
Georreferenciación
Fuentes administrativas
Fuentes Big Data
Geocodificación
Método de abajo-arriba
Polígonos suburbanos
21. SISTEMA DE DATOS INTEGRADOS DE CANARIAS
Georreferenciación
Fuentes administrativas
Fuentes Big Data
Geocodificación
Método de abajo-arriba
Polígonos suburbanos
22. SISTEMA DE DATOS INTEGRADOS DE CANARIAS
Anonimización
Cartografías
Microdatos
Macrodatos
23. SISTEMA DE DATOS INTEGRADOS DE CANARIAS
Organización y gestión del sistema
1. Flexibilidad: Las cargas de microdatos se realizan sin la necesidad de disponer previamente de los enlazamientos.
2. Simplificación: Los procedimientos de enlazamiento y almacenamiento de relaciones se realizan cuando se
necesiten, sin tener la necesidad de definirlos a priori.
3. Independencia: Los procesos de generación y carga de datos de relaciones son independientes de la
normalización y generación de los ficheros DAT.
4. Seguridad: Disponer las tablas DAT separadas pero vinculadas permite gestionar con mayor facilidad los permisos
de accesos a esos datos mediante: (a) Gestionando los accesos a las tablas URD (b) Gestionando los acceso a
otras tablas DAT, GEO o LON.
24. Producción de directorios y estadística multifuente
SISTEMA DE DATOS
INTEGRADOS DE
CANARIAS (iDatos)
JECAS 2018
25. SISTEMA DE DATOS INTEGRADOS DE CANARIAS
Directorios Códigos Descripción
Lugares C00047A Directorio de Calles y Direcciones
C00113A Directorio de Puntos de Interés Turístico (PIT)
Edificios, viviendas y
locales
(DEV)
C00111A Directorio de Edificios, Viviendas y Locales
C00111B Directorio de Viviendas Turísticas (VITUR)
Población y hogares
(DPH)
C00063A Directorio de Población y Hogares
Empresas y
establecimientos
(DUE)
C00021A Directorio de Unidades Económicas (DUE)
C00021B Directorio de Alojamientos Turísticos Colectivos (ALOJATUR)
C00021C Directorio de Establecimientos de Alimentación y Bebidas
(ALIMERCA)
C00021D Directorio Especializado de Unidades Económicas de la
Industria
C00021E Directorio Especializado de Unidades Económicas de la
Energía
C00021F Directorio Especializado de Unidades Económicas del Sector
Comercial
C00021G Directorio Especializado de Unidades Económicas del Sector
Primario
DIRECTORIOS MAESTROS
- Direcciones
- Población
- Empresas
- Viviendas
26. SISTEMA DE DATOS INTEGRADOS DE CANARIAS
MODELO GENERAL E INTEGRADO
- Directorio: Colección de registros conceptualmente
relacionados
- Registro: Colección de ficheros relacionados con una
de unidad de análisis
- Capas: Colección de ficheros de un registro según
funcionalidad de integración
- Variables nucleares: Variables clave de un registro
- Variables normalizadas: Variables que no siendo
claves se quieren normalizar en iDatos
- Variables de entidades relacionadas: Identificadores
que vinculan unidades de un registro con las de otro
registro
27. SISTEMA DE DATOS INTEGRADOS DE CANARIAS
EJEMPLOS DE REGISTROS EN UN DIRECTORIO
Directorio Descripción Registro
C00063A Directorio de Población y Hogares Registro de población
C00063A Directorio de Población y Hogares Registro de hogares
C00047A Directorio de Calles y Direcciones Registro de portales
C00111A Directorio de Edificios, Viviendas y Locales Registro de viviendas
C00021A Directorio de Unidades Económicas (DUE) Registro de empresas
C00021A Directorio de Unidades Económicas (DUE) Registro de establecimientos
28. SISTEMA DE DATOS INTEGRADOS DE CANARIAS
EJEMPLO DE CAPAS DE UN REGISTRO
Tablas Descripción
IDL_POBLACION Tabla de vinculación de una persona a lo largo de
diferentes realizaciones (t) del registro
IDT_POBLACION Tabla de identificación única de una persona en la
realización del registro en un momento (t)
IDF_POBLACION Tabla de alimentación del registro a partir de la
localización de personas en diferentes microdatos en
crudo (RD)
29. SISTEMA DE DATOS INTEGRADOS DE CANARIAS
EJEMPLO DE
INTEGRACIÓN ENTRE
ESQUEMAS-TIPO
Microdatos en esquema Raw Data
GEO_PMH 20170101
Microdatos en esquema Master Data
IDT_NOMEPORTALES 20170101
Variables de entidades relacionadas:
Identificadores que vinculan unidades de un
registro con las de otro registro
30. SISTEMA DE DATOS INTEGRADOS DE CANARIAS
1. Genérico: Aplicable a cualquier registro
2. Escalabilidad vertical: Escalabilidad en capas, obteniendo valor desde un principio
3. Escalabilidad horizontal: Escalabilidad en la vinculación de registros
4. Flexibilidad: Los métodos de enlazamiento, la variables nucleares y las variables
normalizadas pueden cambiar entre diferentes realizaciones del registro.
Características del modelo de construcción de directorios
31. SISTEMA DE DATOS INTEGRADOS DE CANARIAS
ESTADÍSTICAS MULTIFUENTES
1. Estadística de Población Activa
Registrada (EPA-Reg)
2. Estadística de Inserción Laboral
32. SISTEMA DE DATOS INTEGRADOS DE CANARIAS
ESTADÍSTICAS MULTIFUENTES
1. Estadística de Población Activa
Registrada (EPA-Reg)
2. Estadística de Inserción Laboral
Demandantes de empleo en Santa Cruz de Tenerife
según barrios (Marzo 2017)
33. SISTEMA DE DATOS INTEGRADOS DE CANARIAS
ROL DE FUENTES BIG DATA
Apoyo en la creación de Directorios
1. Apoyo en la georreferenciación
2. Proyecto de apoyo en la creación de
Directorio de Unidades Económicas