SlideShare una empresa de Scribd logo
1 de 31
Descargar para leer sin conexión
CASOS DE USO DE FUENTES
BIG DATA EN LAS
ESTADÍSTICAS ECONÓMICAS
DE CANARIAS
XIX JORNADAS ESTADÍSTICAS DE LAS COMUNIDADES AUTONOMAS (JECAS 2016)
Alberto González Yanes
Domingo Lorenzo Díaz
Carlos Sierra Fumero
CASOS DE USO DE FUENTES
BIG DATA EN LAS
ESTADÍSTICAS ECONÓMICAS
DE CANARIAS
XIX JORNADAS ESTADÍSTICAS DE LAS COMUNIDADES AUTONOMAS (JECAS 2016)
Madrid, 22 y 23 de septiembre de 2016
Fuentes Big Data en la
estadística pública
“Big Data son las fuentes de datos que generalmente
pueden ser descritas como de alto volumen, velocidad y
variedad, que requieren formas rentables e innovadoras
de procesamiento con el fin de mejorar los análisis y de
apoyar las tomas de decisiones”
Conference of European Statisticians. “What Does ‘Big Data’ Mean for Official
Statistics?” UNECE, March 10, 2013.
Fuentes Big Data en la estadística pública
FUENTES BIG DATA EN LAS ESTADÍSTICAS ECONÓMICAS DE CANARIAS
Fuentes Big Data en la estadística pública
●
La propiedad sobre las fuentes de datos generalmente
no es pública, con los problemas derivados para el
acceso, uso y mantenimiento de las fuentes.
●
La fuentes de datos generalmente son muestras no
probabilísticas que no están pensadas para fines
estadísticos, con los problemas derivados de
conceptualización y sesgos.
FUENTES BIG DATA EN LAS ESTADÍSTICAS ECONÓMICAS DE CANARIAS
Fuentes Big Data en la estadística pública
Cooperación público-privada
Klein, Thilo, Johannes Jütting, and Nicholas Robin. “Public-Private
Partnerships for Statistics: Lessons Learned, Future Steps.” OECD
Development Co-operation Working Papers, February 29, 2016.
Marco de calidad
UNECE Big Data Quality Task Team. “A Suggested Big Data Quality
Framework.” UNECE, December 2014.
FUENTES BIG DATA EN LAS ESTADÍSTICAS ECONÓMICAS DE CANARIAS
FUENTES BIG DATA EN LAS ESTADÍSTICAS ECONÓMICAS DE CANARIAS
●
Sensorización de alojamientos turísticos
●
Datos de centrales de compra de pasajes
●
Datos de unidades económicas en fuente abiertas
●
Datos de precios en supermercados
Casos de uso en estudio dentro del ISTAC
FUENTES BIG DATA EN LAS ESTADÍSTICAS ECONÓMICAS DE CANARIAS
Sensorización alojamientos
FUENTES BIG DATA EN LAS ESTADÍSTICAS ECONÓMICAS DE CANARIAS
Objetivo
FUENTES BIG DATA EN LAS ESTADÍSTICAS ECONÓMICAS DE CANARIAS
Arquitectura
FUENTES BIG DATA EN LAS ESTADÍSTICAS ECONÓMICAS DE CANARIAS
FUENTES BIG DATA EN LAS ESTADÍSTICAS ECONÓMICAS DE CANARIAS
Datos de compra de pasajes
FUENTES BIG DATA EN LAS ESTADÍSTICAS ECONÓMICAS DE CANARIAS
Estadística de Movilidad Aérea de Canarias. Estudiar la movilidad aérea de los
residentes en Canarias en sus conexiones tanto interinsulares como con el resto
de España; permitiendo estudiar la evolución de los precios de compra de los
viajes según anticipación a la fechas de vuelo y las conectividades realizadas por
los residentes.
Estadística de Movilidad Marítima de Canarias. Estudiar la movilidad marítima
de los residentes en Canarias en sus conexiones interinsulares; permitiendo
estudiar la evolución de los precios de compra de los viajes según anticipación a
la fechas de travesía y las conectividades realizadas por los residentes.
Estadística de Movimientos Turísticos en Fronteras de Canarias (FRONTUR-
Canarias). Fuente auxiliar para la estimación de entra de turistas y para la
proyección a corto plazo de entra de turistas.
Objetivo
FUENTES BIG DATA EN LAS ESTADÍSTICAS ECONÓMICAS DE CANARIAS
Datos de interés
Ficheros de microdatos basados en los PNR (Passenger Name Record)
que contiene información relevante del transporte de cada viajero
aéreo. El Passenger Name Record (PNR), (español Registro de Nombre
de Pasajero), es el nombre comúnmente utilizado para designar la
información relativo a reservas hechas en sistemas de reservas (CRS).
Clave de viaje - Residente (Sí / No) - Fecha de nacimiento – Sexo - Municipio de compra (con
codificación INE) - Fecha de compra - Código de vuelo - Identificador de aerolínea - Aeropuerto de
origen - Aeropuerto de destino - Fecha del vuelo - Compra ida y vuelta (Sí / No) - Clave de viaje
asociado (si compra ida y vuelta) - Precio de compra - Descuento de residente – Tasas - Código de
vuelo n - Identificador de aerolínea n - Aeropuerto de origen n - Aeropuerto de destino n - Fecha de
vuelo n - Precio de compra n - Descuento de residente n - Tasas n - Clave de viaje en grupo n
45% de PNR de vuelos regulares
FUENTES BIG DATA EN LAS ESTADÍSTICAS ECONÓMICAS DE CANARIAS
Directorios de establecimientos
Fuentes externas
FUENTES BIG DATA EN LAS ESTADÍSTICAS ECONÓMICAS DE CANARIAS
GRID para la recogida de datos
FUENTES BIG DATA EN LAS ESTADÍSTICAS ECONÓMICAS DE CANARIAS
Proceso ETL
FUENTES BIG DATA EN LAS ESTADÍSTICAS ECONÓMICAS DE CANARIAS
Ejemplo de proceso de extracción
1) LLamada “Listado”
• aprox 40.000 ficheros
• aprox 400 Mb
• 21 campos
• máximo nº registros devuelve: 60
2) Llamada “Detalle”
• aprox 100.000 ficheros
• aprox 500 Mb
• 51 campos
3) Llamada “Fotos del sitio”
aprox 550.000 referencias
aprox 128 Mb
1 campo
FUENTES BIG DATA EN LAS ESTADÍSTICAS ECONÓMICAS DE CANARIAS
Reconciliación de fuentes
Nombre
Identificador
Rating
Clasificación
Latitud/Longitud
Región/Área (según fuente)
Localidad
Código postal
Dirección
Imágenes
Comentarios principales
Celda
Publicador
URL del publicador
Nombre
Identificador
Rating
Clasificación
Latitud/Longitud
Región/Área (según fuente)
Localidad
Código postal
Dirección
Imágenes
Comentarios principales
Celda
Publicador
URL del publicador
FUENTES BIG DATA EN LAS ESTADÍSTICAS ECONÓMICAS DE CANARIAS
Mapeo a tecnología semántica que utiliza vocabularios y clasificaciones
estandares, que además de ofrecer los datos se dan los metadatos de cada
definición bajo unas reglas públicas y publicadas.
En concreto se han utilizado los siguientes vocabularios:
xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"
xmlns:geo="http://www.w3.org/2003/01/geo/wgs84_pos#"
xmlns:locn="http://www.w3.org/ns/locn#"
xmlns:schema="http://schema.org/"
xmlns:rdfs="http://www.w3.org/2000/01/rdf-schema#"
xmlns:os="http://a9.com/-/spec/opensearch/1.1/"
xmlns:dcterms="http://purl.org/dc/terms/"
xmlns:dc="http://purl.org/dc/elements/1.1/"
xmlns:owl="http://www.w3.org/2002/07/owl#"
xmlns:locationOnt="http://data.linkedevents.org/def/location#"
xmlns:xhv="http://www.w3.org/1999/xhtml/vocab#"
xmlns:gPlacesKOS="http://data.linkedevents.org/kos/googleplaces/"
xmlns:api="http://purl.org/linked-data/api/vocab#"
xmlns:xsd="http://www.w3.org/2001/XMLSchema#">
Reconciliación de fuentes. Aplicación semántica
FUENTES BIG DATA EN LAS ESTADÍSTICAS ECONÓMICAS DE CANARIAS
FUENTES BIG DATA EN LAS ESTADÍSTICAS ECONÓMICAS DE CANARIAS
FUENTES BIG DATA EN LAS ESTADÍSTICAS ECONÓMICAS DE CANARIAS
PVP on-line en supermercados
FUENTES BIG DATA EN LAS ESTADÍSTICAS ECONÓMICAS DE CANARIAS
Objetivo PPA: Comparar niveles de precios entre territorios
· Canarias vs Resto de España
· Listado de productos utilizado por Eurostat para el cálculo de las PPA.
- Sólo datos de alimentación y bebidas
- Ponderaciones facilitadas por el INE
Metodología Eurostat-OCDE
http://ec.europa.eu/eurostat/web/purchasing-power-parities/methodology
Cálculo PPAij
Objetivo
FUENTES BIG DATA EN LAS ESTADÍSTICAS ECONÓMICAS DE CANARIAS
Fuente de datos
FUENTES BIG DATA EN LAS ESTADÍSTICAS ECONÓMICAS DE CANARIAS
PERIODO
CADENA
SUPERMERCADOS
CODIGO
POSTAL
PRODUCTO PRECIO
Formato resumido: Productos, precios, grupos de códigos postales
PRODUCTOS
PERIODO
ID_PRODUCTO
NOMBRE_PRODUCTO
MARCA
CUANTIFICADOR
UNIDAD_DE_MEDIDA
(Otras variables de
identificación del
producto)
PRECIOS
PERIODO
ID_PRODUCTO
ID_GRUPO_CODIGOS_PO
STALES
PRECIO
(Otras variables)
CODIGOS_POSTALES
PERIODO
ID_GRUPO_CODIGOS_PO
STALES
CODIGO_POSTAL
CADENA_SUPERMERCAD
OS
Formato de los datos
FUENTES BIG DATA EN LAS ESTADÍSTICAS ECONÓMICAS DE CANARIAS
Dimensión de los ficheros
PRODUCTOS: 123.000 registros, 27,6 Mb CODIGOS POSTALES: 13.500 registros, 530 Kb
PRECIOS
FUENTES BIG DATA EN LAS ESTADÍSTICAS ECONÓMICAS DE CANARIAS
Calidad de los datos
Comparativas con precios recogidos off-line y análisis de la
variabilidad de precios
Problemas de fuente
●
Selección de artículos Soysuper y relación con el listado de productos PPA: Búsqueda
casi manual entre los literales
●
Problemas iniciales en la exportación de la información
●
Códigos coherentes a lo largo del tiempo
●
Problemas de integridad referencial
●
Errores en tipos de datos: “Pack de 3 latas de 80 gr.” en campo numérico
●
Líneas en blanco. Registros incompletos
●
Existencia de registros con precios iguales a 0
FUENTES BIG DATA EN LAS ESTADÍSTICAS ECONÓMICAS DE CANARIAS
Calidad de los datos
Dificultad para encontrar productos relacionados con
carne fresca
Influencia muy elevada de un solo artículo en una posición elemental
completa (Posición elemental = Conjunto de productos)
No considerar carne fresca
FUENTES BIG DATA EN LAS ESTADÍSTICAS ECONÓMICAS DE CANARIAS
Resultados
PPA Canarias - Resto de España
(resultado provisional 2014)
109,56
Gracias
por su atención
Síguenos en Twitter: @istac_es
Slideshare: http://www.slideshare.net/ISTAC

Más contenido relacionado

La actualidad más candente

[Jecas2018] estadisticas suburbanas de poblacion y su relacion con la actividad
[Jecas2018] estadisticas suburbanas de poblacion y su relacion con la actividad[Jecas2018] estadisticas suburbanas de poblacion y su relacion con la actividad
[Jecas2018] estadisticas suburbanas de poblacion y su relacion con la actividadInstituto Canario de Estadística (ISTAC)
 
Aplicación Smart City Open Data Analytics (spanish)
Aplicación Smart City Open Data Analytics (spanish)Aplicación Smart City Open Data Analytics (spanish)
Aplicación Smart City Open Data Analytics (spanish)Stratebi
 
Aplicación Estadisticas y Observatorios Analytics
Aplicación Estadisticas y Observatorios AnalyticsAplicación Estadisticas y Observatorios Analytics
Aplicación Estadisticas y Observatorios AnalyticsStratebi
 
Matriz Origen-destino para el transporte de cargas. Argentina
Matriz Origen-destino para el transporte de cargas. ArgentinaMatriz Origen-destino para el transporte de cargas. Argentina
Matriz Origen-destino para el transporte de cargas. ArgentinaAndrei León
 
Aplicación Servicios Sociales Analytics
Aplicación Servicios Sociales AnalyticsAplicación Servicios Sociales Analytics
Aplicación Servicios Sociales AnalyticsStratebi
 
Aspectos prácticos de opendata (Jornadas SICARM), Jose M Subero
Aspectos prácticos de opendata (Jornadas SICARM), Jose M SuberoAspectos prácticos de opendata (Jornadas SICARM), Jose M Subero
Aspectos prácticos de opendata (Jornadas SICARM), Jose M SuberoAragón Open Data
 
Aplicación Medio Ambiente Analytics (spanish)
Aplicación Medio Ambiente Analytics (spanish)Aplicación Medio Ambiente Analytics (spanish)
Aplicación Medio Ambiente Analytics (spanish)Stratebi
 
Guia metodologia del site survey sgdis
Guia metodologia del site survey  sgdisGuia metodologia del site survey  sgdis
Guia metodologia del site survey sgdisAland Bravo Vecorena
 
Aplicación Universidades Analytics (spanish)
Aplicación Universidades Analytics (spanish)Aplicación Universidades Analytics (spanish)
Aplicación Universidades Analytics (spanish)Stratebi
 
Aplicación Gestion Agua y Residuos Analytics (spanish)
Aplicación Gestion Agua y Residuos Analytics (spanish)Aplicación Gestion Agua y Residuos Analytics (spanish)
Aplicación Gestion Agua y Residuos Analytics (spanish)Stratebi
 
PRESENTACIÓN CORPORATIVA ODEC
PRESENTACIÓN CORPORATIVA ODECPRESENTACIÓN CORPORATIVA ODEC
PRESENTACIÓN CORPORATIVA ODECFernando Llopis
 
Recursos estadisticos para la investigacion historica
Recursos estadisticos para la investigacion historicaRecursos estadisticos para la investigacion historica
Recursos estadisticos para la investigacion historicaFrancisco Pesante
 
Aplicación Hospitales Analytics (spanish)
Aplicación Hospitales Analytics (spanish)Aplicación Hospitales Analytics (spanish)
Aplicación Hospitales Analytics (spanish)Stratebi
 
Ciudad Intelegente
Ciudad IntelegenteCiudad Intelegente
Ciudad Intelegenteguestd6a6d9a
 
Gerencia De Ciudad Y Atlas Comercial
Gerencia De Ciudad Y  Atlas ComercialGerencia De Ciudad Y  Atlas Comercial
Gerencia De Ciudad Y Atlas Comercialguest24758f
 

La actualidad más candente (19)

[Jecas2018] estadisticas suburbanas de poblacion y su relacion con la actividad
[Jecas2018] estadisticas suburbanas de poblacion y su relacion con la actividad[Jecas2018] estadisticas suburbanas de poblacion y su relacion con la actividad
[Jecas2018] estadisticas suburbanas de poblacion y su relacion con la actividad
 
Aplicación Smart City Open Data Analytics (spanish)
Aplicación Smart City Open Data Analytics (spanish)Aplicación Smart City Open Data Analytics (spanish)
Aplicación Smart City Open Data Analytics (spanish)
 
Estrategia de Producción de Estadísticas de Turismo
Estrategia de Producción de Estadísticas de TurismoEstrategia de Producción de Estadísticas de Turismo
Estrategia de Producción de Estadísticas de Turismo
 
Aplicación Estadisticas y Observatorios Analytics
Aplicación Estadisticas y Observatorios AnalyticsAplicación Estadisticas y Observatorios Analytics
Aplicación Estadisticas y Observatorios Analytics
 
Matriz Origen-destino para el transporte de cargas. Argentina
Matriz Origen-destino para el transporte de cargas. ArgentinaMatriz Origen-destino para el transporte de cargas. Argentina
Matriz Origen-destino para el transporte de cargas. Argentina
 
Aplicación Servicios Sociales Analytics
Aplicación Servicios Sociales AnalyticsAplicación Servicios Sociales Analytics
Aplicación Servicios Sociales Analytics
 
Aspectos prácticos de opendata (Jornadas SICARM), Jose M Subero
Aspectos prácticos de opendata (Jornadas SICARM), Jose M SuberoAspectos prácticos de opendata (Jornadas SICARM), Jose M Subero
Aspectos prácticos de opendata (Jornadas SICARM), Jose M Subero
 
Aplicación Medio Ambiente Analytics (spanish)
Aplicación Medio Ambiente Analytics (spanish)Aplicación Medio Ambiente Analytics (spanish)
Aplicación Medio Ambiente Analytics (spanish)
 
Guia metodologia del site survey sgdis
Guia metodologia del site survey  sgdisGuia metodologia del site survey  sgdis
Guia metodologia del site survey sgdis
 
Aplicación Universidades Analytics (spanish)
Aplicación Universidades Analytics (spanish)Aplicación Universidades Analytics (spanish)
Aplicación Universidades Analytics (spanish)
 
Aplicación Gestion Agua y Residuos Analytics (spanish)
Aplicación Gestion Agua y Residuos Analytics (spanish)Aplicación Gestion Agua y Residuos Analytics (spanish)
Aplicación Gestion Agua y Residuos Analytics (spanish)
 
PRESENTACIÓN CORPORATIVA ODEC
PRESENTACIÓN CORPORATIVA ODECPRESENTACIÓN CORPORATIVA ODEC
PRESENTACIÓN CORPORATIVA ODEC
 
Suig
SuigSuig
Suig
 
Recursos estadisticos para la investigacion historica
Recursos estadisticos para la investigacion historicaRecursos estadisticos para la investigacion historica
Recursos estadisticos para la investigacion historica
 
[Revista] SISTEMA ESTADÍSTICO NACIONAL
[Revista] SISTEMA ESTADÍSTICO NACIONAL[Revista] SISTEMA ESTADÍSTICO NACIONAL
[Revista] SISTEMA ESTADÍSTICO NACIONAL
 
Aplicación Hospitales Analytics (spanish)
Aplicación Hospitales Analytics (spanish)Aplicación Hospitales Analytics (spanish)
Aplicación Hospitales Analytics (spanish)
 
Mapas de Fortaleza de Marca por Comunidades Autónomas 2018
Mapas de Fortaleza de Marca por Comunidades Autónomas 2018Mapas de Fortaleza de Marca por Comunidades Autónomas 2018
Mapas de Fortaleza de Marca por Comunidades Autónomas 2018
 
Ciudad Intelegente
Ciudad IntelegenteCiudad Intelegente
Ciudad Intelegente
 
Gerencia De Ciudad Y Atlas Comercial
Gerencia De Ciudad Y  Atlas ComercialGerencia De Ciudad Y  Atlas Comercial
Gerencia De Ciudad Y Atlas Comercial
 

Destacado (6)

Smart Bilbao: Los datos al servicio de la ciudad (Big Data, Open Data, etc.)
Smart Bilbao: Los datos al servicio de la ciudad (Big Data, Open Data, etc.)Smart Bilbao: Los datos al servicio de la ciudad (Big Data, Open Data, etc.)
Smart Bilbao: Los datos al servicio de la ciudad (Big Data, Open Data, etc.)
 
Casos de puesta en valor de de la tecnología de Big Data con NoSQL orientada ...
Casos de puesta en valor de de la tecnología de Big Data con NoSQL orientada ...Casos de puesta en valor de de la tecnología de Big Data con NoSQL orientada ...
Casos de puesta en valor de de la tecnología de Big Data con NoSQL orientada ...
 
On-the-fly ETL con EFK: ElasticSearch, Flume, Kibana
On-the-fly ETL con EFK: ElasticSearch, Flume, KibanaOn-the-fly ETL con EFK: ElasticSearch, Flume, Kibana
On-the-fly ETL con EFK: ElasticSearch, Flume, Kibana
 
Big Data, casos, tecnologias y aplicaciones reales
Big Data, casos, tecnologias y aplicaciones realesBig Data, casos, tecnologias y aplicaciones reales
Big Data, casos, tecnologias y aplicaciones reales
 
Competidores y productos de mercado de ETL
Competidores y productos de mercado de ETLCompetidores y productos de mercado de ETL
Competidores y productos de mercado de ETL
 
Moving Beyond Lambda Architectures with Apache Kudu
Moving Beyond Lambda Architectures with Apache KuduMoving Beyond Lambda Architectures with Apache Kudu
Moving Beyond Lambda Architectures with Apache Kudu
 

Similar a Casos de uso de fuentes big data en las estadísticas económicas de Canarias

Herramientas investigacion mercado
Herramientas investigacion mercadoHerramientas investigacion mercado
Herramientas investigacion mercadoBrox Technology
 
Aplicación Puertos y Aeropuertos Analytics (spanish)
Aplicación Puertos y Aeropuertos Analytics (spanish)Aplicación Puertos y Aeropuertos Analytics (spanish)
Aplicación Puertos y Aeropuertos Analytics (spanish)Stratebi
 
Datos sociodemográficos y de mercado por grid 100m
Datos sociodemográficos y de mercado por grid 100mDatos sociodemográficos y de mercado por grid 100m
Datos sociodemográficos y de mercado por grid 100mGuillermo Córdoba
 
Fuentes de informacion comercial Ecuador - PROECUADOR
Fuentes de informacion comercial Ecuador - PROECUADORFuentes de informacion comercial Ecuador - PROECUADOR
Fuentes de informacion comercial Ecuador - PROECUADORJho Vac Roman
 
Open data y reutilización de la información pública: dos caras de la misma mo...
Open data y reutilización de la información pública: dos caras de la misma mo...Open data y reutilización de la información pública: dos caras de la misma mo...
Open data y reutilización de la información pública: dos caras de la misma mo...Antonio Galindo Galindo
 
Catálogo de plataformas de datos inteligentes
Catálogo de plataformas de datos inteligentesCatálogo de plataformas de datos inteligentes
Catálogo de plataformas de datos inteligentesPlay&go experience
 
Joan Miro - eCommerce Day Argentina 2018
Joan Miro - eCommerce Day Argentina 2018Joan Miro - eCommerce Day Argentina 2018
Joan Miro - eCommerce Day Argentina 2018eCommerce Institute
 
Presentación Joan Miró | NetQuest - eCommerce Day Buenos Aires 2017
Presentación Joan Miró | NetQuest - eCommerce Day Buenos Aires 2017Presentación Joan Miró | NetQuest - eCommerce Day Buenos Aires 2017
Presentación Joan Miró | NetQuest - eCommerce Day Buenos Aires 2017eCommerce Institute
 
Presentación Servicios Estadísticos de Canarias
Presentación Servicios Estadísticos de CanariasPresentación Servicios Estadísticos de Canarias
Presentación Servicios Estadísticos de Canariasservicios_estadisticos
 
Webinar conozca las herramientas para encontrar nuevas oportunidades de expor...
Webinar conozca las herramientas para encontrar nuevas oportunidades de expor...Webinar conozca las herramientas para encontrar nuevas oportunidades de expor...
Webinar conozca las herramientas para encontrar nuevas oportunidades de expor...ProColombia
 
Christian Oros - eCommerce Day Santiago 2019
Christian Oros - eCommerce Day Santiago 2019Christian Oros - eCommerce Day Santiago 2019
Christian Oros - eCommerce Day Santiago 2019eCommerce Institute
 
El Comercio Electrónico y las oportunidades que ofrece ante la Crisis
El Comercio Electrónico y las oportunidades que ofrece ante la CrisisEl Comercio Electrónico y las oportunidades que ofrece ante la Crisis
El Comercio Electrónico y las oportunidades que ofrece ante la CrisisMarcos Pueyrredon
 
Smart City Maps for Smart Citizens - GICI-EptisaTI_Feb2015
Smart City Maps for Smart Citizens - GICI-EptisaTI_Feb2015Smart City Maps for Smart Citizens - GICI-EptisaTI_Feb2015
Smart City Maps for Smart Citizens - GICI-EptisaTI_Feb2015Aurora López García
 
OPORTUNIDADES DEL COMERCIO ELECTRÓNICO PARA LAS PyMES
OPORTUNIDADES DEL COMERCIO ELECTRÓNICO PARA LAS PyMESOPORTUNIDADES DEL COMERCIO ELECTRÓNICO PARA LAS PyMES
OPORTUNIDADES DEL COMERCIO ELECTRÓNICO PARA LAS PyMESMarcos Pueyrredon
 
PRESENTACION UNIVERSIDADES 2014 DAVID PÉREZ - OJD
PRESENTACION UNIVERSIDADES 2014 DAVID PÉREZ - OJDPRESENTACION UNIVERSIDADES 2014 DAVID PÉREZ - OJD
PRESENTACION UNIVERSIDADES 2014 DAVID PÉREZ - OJDpemosaro
 

Similar a Casos de uso de fuentes big data en las estadísticas económicas de Canarias (20)

Herramientas investigacion mercado
Herramientas investigacion mercadoHerramientas investigacion mercado
Herramientas investigacion mercado
 
Gobierno Abierto - Las Palmas de Gran Canaria
Gobierno Abierto - Las Palmas de Gran CanariaGobierno Abierto - Las Palmas de Gran Canaria
Gobierno Abierto - Las Palmas de Gran Canaria
 
Aplicación Puertos y Aeropuertos Analytics (spanish)
Aplicación Puertos y Aeropuertos Analytics (spanish)Aplicación Puertos y Aeropuertos Analytics (spanish)
Aplicación Puertos y Aeropuertos Analytics (spanish)
 
Datos sociodemográficos y de mercado por grid 100m
Datos sociodemográficos y de mercado por grid 100mDatos sociodemográficos y de mercado por grid 100m
Datos sociodemográficos y de mercado por grid 100m
 
Luis Alejandro Camargo
Luis Alejandro CamargoLuis Alejandro Camargo
Luis Alejandro Camargo
 
Fuentes de informacion comercial Ecuador - PROECUADOR
Fuentes de informacion comercial Ecuador - PROECUADORFuentes de informacion comercial Ecuador - PROECUADOR
Fuentes de informacion comercial Ecuador - PROECUADOR
 
Open data y reutilización de la información pública: dos caras de la misma mo...
Open data y reutilización de la información pública: dos caras de la misma mo...Open data y reutilización de la información pública: dos caras de la misma mo...
Open data y reutilización de la información pública: dos caras de la misma mo...
 
Catálogo de plataformas de datos inteligentes
Catálogo de plataformas de datos inteligentesCatálogo de plataformas de datos inteligentes
Catálogo de plataformas de datos inteligentes
 
Joan Miro - eCommerce Day Argentina 2018
Joan Miro - eCommerce Day Argentina 2018Joan Miro - eCommerce Day Argentina 2018
Joan Miro - eCommerce Day Argentina 2018
 
Presentación Joan Miró | NetQuest - eCommerce Day Buenos Aires 2017
Presentación Joan Miró | NetQuest - eCommerce Day Buenos Aires 2017Presentación Joan Miró | NetQuest - eCommerce Day Buenos Aires 2017
Presentación Joan Miró | NetQuest - eCommerce Day Buenos Aires 2017
 
BigData CCB.PDF
BigData CCB.PDFBigData CCB.PDF
BigData CCB.PDF
 
Presentación Servicios Estadísticos de Canarias
Presentación Servicios Estadísticos de CanariasPresentación Servicios Estadísticos de Canarias
Presentación Servicios Estadísticos de Canarias
 
Webinar conozca las herramientas para encontrar nuevas oportunidades de expor...
Webinar conozca las herramientas para encontrar nuevas oportunidades de expor...Webinar conozca las herramientas para encontrar nuevas oportunidades de expor...
Webinar conozca las herramientas para encontrar nuevas oportunidades de expor...
 
DP-actualizado 2021.pdf
DP-actualizado 2021.pdfDP-actualizado 2021.pdf
DP-actualizado 2021.pdf
 
Christian Oros - eCommerce Day Santiago 2019
Christian Oros - eCommerce Day Santiago 2019Christian Oros - eCommerce Day Santiago 2019
Christian Oros - eCommerce Day Santiago 2019
 
1. generalidades
1. generalidades1. generalidades
1. generalidades
 
El Comercio Electrónico y las oportunidades que ofrece ante la Crisis
El Comercio Electrónico y las oportunidades que ofrece ante la CrisisEl Comercio Electrónico y las oportunidades que ofrece ante la Crisis
El Comercio Electrónico y las oportunidades que ofrece ante la Crisis
 
Smart City Maps for Smart Citizens - GICI-EptisaTI_Feb2015
Smart City Maps for Smart Citizens - GICI-EptisaTI_Feb2015Smart City Maps for Smart Citizens - GICI-EptisaTI_Feb2015
Smart City Maps for Smart Citizens - GICI-EptisaTI_Feb2015
 
OPORTUNIDADES DEL COMERCIO ELECTRÓNICO PARA LAS PyMES
OPORTUNIDADES DEL COMERCIO ELECTRÓNICO PARA LAS PyMESOPORTUNIDADES DEL COMERCIO ELECTRÓNICO PARA LAS PyMES
OPORTUNIDADES DEL COMERCIO ELECTRÓNICO PARA LAS PyMES
 
PRESENTACION UNIVERSIDADES 2014 DAVID PÉREZ - OJD
PRESENTACION UNIVERSIDADES 2014 DAVID PÉREZ - OJDPRESENTACION UNIVERSIDADES 2014 DAVID PÉREZ - OJD
PRESENTACION UNIVERSIDADES 2014 DAVID PÉREZ - OJD
 

Más de Instituto Canario de Estadística (ISTAC)

Análisis regional e insular de las predicciones de entradas de pasajeros en C...
Análisis regional e insular de las predicciones de entradas de pasajeros en C...Análisis regional e insular de las predicciones de entradas de pasajeros en C...
Análisis regional e insular de las predicciones de entradas de pasajeros en C...Instituto Canario de Estadística (ISTAC)
 
REGIONAL TOURISM INFORMATION SYSTEM (R-TIS) OF THE CANARY ISLANDS . A strateg...
REGIONAL TOURISM INFORMATION SYSTEM (R-TIS) OF THE CANARY ISLANDS. A strateg...REGIONAL TOURISM INFORMATION SYSTEM (R-TIS) OF THE CANARY ISLANDS. A strateg...
REGIONAL TOURISM INFORMATION SYSTEM (R-TIS) OF THE CANARY ISLANDS . A strateg...Instituto Canario de Estadística (ISTAC)
 
SISTEMA REGIONAL DE ESTADÍSTICAS DE TURISMO. Una aproximación estratégica
SISTEMA REGIONAL DE ESTADÍSTICAS DE TURISMO. Una aproximación estratégicaSISTEMA REGIONAL DE ESTADÍSTICAS DE TURISMO. Una aproximación estratégica
SISTEMA REGIONAL DE ESTADÍSTICAS DE TURISMO. Una aproximación estratégicaInstituto Canario de Estadística (ISTAC)
 
Estadística de Inserción Laboral basada en registros administrativos, una apr...
Estadística de Inserción Laboral basada en registros administrativos, una apr...Estadística de Inserción Laboral basada en registros administrativos, una apr...
Estadística de Inserción Laboral basada en registros administrativos, una apr...Instituto Canario de Estadística (ISTAC)
 
Definición conceptual de microdestinos turísticos y  elaboración  de estadíst...
Definición conceptual de microdestinos turísticos y  elaboración  de estadíst...Definición conceptual de microdestinos turísticos y  elaboración  de estadíst...
Definición conceptual de microdestinos turísticos y  elaboración  de estadíst...Instituto Canario de Estadística (ISTAC)
 

Más de Instituto Canario de Estadística (ISTAC) (20)

Sistema de Datos Integrados (iDatos) - capacidades analíticas
Sistema de Datos Integrados (iDatos) - capacidades analíticasSistema de Datos Integrados (iDatos) - capacidades analíticas
Sistema de Datos Integrados (iDatos) - capacidades analíticas
 
Turismo Canarias 2018. Islas
Turismo Canarias 2018. IslasTurismo Canarias 2018. Islas
Turismo Canarias 2018. Islas
 
Crecimiento vegetativo
Crecimiento vegetativoCrecimiento vegetativo
Crecimiento vegetativo
 
Indicadores para politicas publicas
Indicadores para politicas publicasIndicadores para politicas publicas
Indicadores para politicas publicas
 
Presentacion chatbot istac
Presentacion chatbot istacPresentacion chatbot istac
Presentacion chatbot istac
 
[Jecas2018] entorno de computo estadistico en e datos
[Jecas2018] entorno de computo estadistico en e datos[Jecas2018] entorno de computo estadistico en e datos
[Jecas2018] entorno de computo estadistico en e datos
 
[Jecas2018] marco de desarrollo del sistema de datos integrados de canarias
[Jecas2018] marco de desarrollo del sistema de datos integrados de canarias[Jecas2018] marco de desarrollo del sistema de datos integrados de canarias
[Jecas2018] marco de desarrollo del sistema de datos integrados de canarias
 
[Jecas2018] marco de estadistica espacial de canarias
[Jecas2018] marco de estadistica espacial de canarias[Jecas2018] marco de estadistica espacial de canarias
[Jecas2018] marco de estadistica espacial de canarias
 
Matrimonios. 2015
Matrimonios. 2015Matrimonios. 2015
Matrimonios. 2015
 
Nombres más comunes entre recién nacidos. 2016
Nombres más comunes entre recién nacidos. 2016Nombres más comunes entre recién nacidos. 2016
Nombres más comunes entre recién nacidos. 2016
 
201807 gobcan jordanas datos abiertos
201807  gobcan   jordanas datos abiertos 201807  gobcan   jordanas datos abiertos
201807 gobcan jordanas datos abiertos
 
Análisis regional e insular de las predicciones de entradas de pasajeros en C...
Análisis regional e insular de las predicciones de entradas de pasajeros en C...Análisis regional e insular de las predicciones de entradas de pasajeros en C...
Análisis regional e insular de las predicciones de entradas de pasajeros en C...
 
REGIONAL TOURISM INFORMATION SYSTEM (R-TIS) OF THE CANARY ISLANDS . A strateg...
REGIONAL TOURISM INFORMATION SYSTEM (R-TIS) OF THE CANARY ISLANDS. A strateg...REGIONAL TOURISM INFORMATION SYSTEM (R-TIS) OF THE CANARY ISLANDS. A strateg...
REGIONAL TOURISM INFORMATION SYSTEM (R-TIS) OF THE CANARY ISLANDS . A strateg...
 
SISTEMA REGIONAL DE ESTADÍSTICAS DE TURISMO. Una aproximación estratégica
SISTEMA REGIONAL DE ESTADÍSTICAS DE TURISMO. Una aproximación estratégicaSISTEMA REGIONAL DE ESTADÍSTICAS DE TURISMO. Una aproximación estratégica
SISTEMA REGIONAL DE ESTADÍSTICAS DE TURISMO. Una aproximación estratégica
 
Entidades y núcleos turísticos. estadísticas asociadas
Entidades y núcleos turísticos. estadísticas asociadasEntidades y núcleos turísticos. estadísticas asociadas
Entidades y núcleos turísticos. estadísticas asociadas
 
Cuantificación económica del sector marítimo
Cuantificación económica del sector marítimoCuantificación económica del sector marítimo
Cuantificación económica del sector marítimo
 
Record linkage methods applied to population data deduplication
Record linkage methods applied to population data deduplicationRecord linkage methods applied to population data deduplication
Record linkage methods applied to population data deduplication
 
Estadística de Inserción Laboral basada en registros administrativos, una apr...
Estadística de Inserción Laboral basada en registros administrativos, una apr...Estadística de Inserción Laboral basada en registros administrativos, una apr...
Estadística de Inserción Laboral basada en registros administrativos, una apr...
 
Definición conceptual de microdestinos turísticos y  elaboración  de estadíst...
Definición conceptual de microdestinos turísticos y  elaboración  de estadíst...Definición conceptual de microdestinos turísticos y  elaboración  de estadíst...
Definición conceptual de microdestinos turísticos y  elaboración  de estadíst...
 
Guía de uso API de acceso a ISTAC.base
Guía de uso API de acceso a ISTAC.baseGuía de uso API de acceso a ISTAC.base
Guía de uso API de acceso a ISTAC.base
 

Último

Plan de Desarrollo y Ordenamiento Territorial de Imbabura.pptx
Plan de Desarrollo y Ordenamiento Territorial de Imbabura.pptxPlan de Desarrollo y Ordenamiento Territorial de Imbabura.pptx
Plan de Desarrollo y Ordenamiento Territorial de Imbabura.pptxAndresUrieta2
 
HISTORIA DE PIURA PERIODO INCAICO VVVVVVVVV
HISTORIA DE PIURA PERIODO INCAICO VVVVVVVVVHISTORIA DE PIURA PERIODO INCAICO VVVVVVVVV
HISTORIA DE PIURA PERIODO INCAICO VVVVVVVVVFlorMezones
 
UNIDAD II - CURSO DE DERECHO ADMINISTRATIVO (Parte I) (1).pdf
UNIDAD II - CURSO DE DERECHO ADMINISTRATIVO (Parte I) (1).pdfUNIDAD II - CURSO DE DERECHO ADMINISTRATIVO (Parte I) (1).pdf
UNIDAD II - CURSO DE DERECHO ADMINISTRATIVO (Parte I) (1).pdfELIAMARYTOVARFLOREZD
 
Boletin 1077 - Tramitación - Ley Integral Contra La Violencia Hacia Las Mujeres
Boletin 1077 - Tramitación - Ley Integral Contra La Violencia Hacia Las MujeresBoletin 1077 - Tramitación - Ley Integral Contra La Violencia Hacia Las Mujeres
Boletin 1077 - Tramitación - Ley Integral Contra La Violencia Hacia Las MujeresBaker Publishing Company
 
PLAN DE MEJORA DE BIOSEGURIDAD EN HOSPITALES.pptx
PLAN DE MEJORA DE BIOSEGURIDAD EN  HOSPITALES.pptxPLAN DE MEJORA DE BIOSEGURIDAD EN  HOSPITALES.pptx
PLAN DE MEJORA DE BIOSEGURIDAD EN HOSPITALES.pptxLuzIreneBancesGuevar
 
UNIDAD DIDÁCTICA MAYO TERCER GRADO (2).docx
UNIDAD DIDÁCTICA MAYO TERCER GRADO (2).docxUNIDAD DIDÁCTICA MAYO TERCER GRADO (2).docx
UNIDAD DIDÁCTICA MAYO TERCER GRADO (2).docxanaalmeyda1998
 
POLÍTICA CRIMINAL - SEGURIDAD CIUDADANA Y TECNOLOGÍA.pptx
POLÍTICA CRIMINAL - SEGURIDAD CIUDADANA Y TECNOLOGÍA.pptxPOLÍTICA CRIMINAL - SEGURIDAD CIUDADANA Y TECNOLOGÍA.pptx
POLÍTICA CRIMINAL - SEGURIDAD CIUDADANA Y TECNOLOGÍA.pptxBeyker Chamorro
 
UNIDAD 3.1, 3.2 y 3.3 3.5 FUNCIÓN PÚBLICA 2.pptx
UNIDAD 3.1, 3.2 y 3.3 3.5 FUNCIÓN PÚBLICA 2.pptxUNIDAD 3.1, 3.2 y 3.3 3.5 FUNCIÓN PÚBLICA 2.pptx
UNIDAD 3.1, 3.2 y 3.3 3.5 FUNCIÓN PÚBLICA 2.pptxMERCEDESCHABLE
 
Clase 4 Análisis PESTEL.PDF Material de calidad
Clase 4 Análisis PESTEL.PDF Material de calidadClase 4 Análisis PESTEL.PDF Material de calidad
Clase 4 Análisis PESTEL.PDF Material de calidadssuserfa578f
 
Día Mundial de la Seguridad y Salud en el Trabajo 2024, 28 de abril - Cambio ...
Día Mundial de la Seguridad y Salud en el Trabajo 2024, 28 de abril - Cambio ...Día Mundial de la Seguridad y Salud en el Trabajo 2024, 28 de abril - Cambio ...
Día Mundial de la Seguridad y Salud en el Trabajo 2024, 28 de abril - Cambio ...Christina Parmionova
 
La paz total, en la presidencia de gustavo Petro.pdf
La paz total, en la presidencia de gustavo Petro.pdfLa paz total, en la presidencia de gustavo Petro.pdf
La paz total, en la presidencia de gustavo Petro.pdfyehinicortes
 
Programa electoral de Vox para las elecciones catalanas
Programa electoral de Vox para las elecciones catalanasPrograma electoral de Vox para las elecciones catalanas
Programa electoral de Vox para las elecciones catalanasluarodalegre97
 
manejo de encaste en ovinos pdti indap PLC
manejo de encaste en ovinos pdti indap PLCmanejo de encaste en ovinos pdti indap PLC
manejo de encaste en ovinos pdti indap PLCMarceloAlvarez76065
 
Revista Ejército nº 989 mar-abr 2024.pdf
Revista Ejército nº 989 mar-abr 2024.pdfRevista Ejército nº 989 mar-abr 2024.pdf
Revista Ejército nº 989 mar-abr 2024.pdfEjército de Tierra
 
#DigitalTierra nº 99 Al máximo nivel en Irak
#DigitalTierra nº 99 Al máximo nivel en Irak#DigitalTierra nº 99 Al máximo nivel en Irak
#DigitalTierra nº 99 Al máximo nivel en IrakEjército de Tierra
 
Presupuesto asignado a fracking 2018-2024.pdf
Presupuesto asignado a fracking 2018-2024.pdfPresupuesto asignado a fracking 2018-2024.pdf
Presupuesto asignado a fracking 2018-2024.pdfSUSMAI
 

Último (16)

Plan de Desarrollo y Ordenamiento Territorial de Imbabura.pptx
Plan de Desarrollo y Ordenamiento Territorial de Imbabura.pptxPlan de Desarrollo y Ordenamiento Territorial de Imbabura.pptx
Plan de Desarrollo y Ordenamiento Territorial de Imbabura.pptx
 
HISTORIA DE PIURA PERIODO INCAICO VVVVVVVVV
HISTORIA DE PIURA PERIODO INCAICO VVVVVVVVVHISTORIA DE PIURA PERIODO INCAICO VVVVVVVVV
HISTORIA DE PIURA PERIODO INCAICO VVVVVVVVV
 
UNIDAD II - CURSO DE DERECHO ADMINISTRATIVO (Parte I) (1).pdf
UNIDAD II - CURSO DE DERECHO ADMINISTRATIVO (Parte I) (1).pdfUNIDAD II - CURSO DE DERECHO ADMINISTRATIVO (Parte I) (1).pdf
UNIDAD II - CURSO DE DERECHO ADMINISTRATIVO (Parte I) (1).pdf
 
Boletin 1077 - Tramitación - Ley Integral Contra La Violencia Hacia Las Mujeres
Boletin 1077 - Tramitación - Ley Integral Contra La Violencia Hacia Las MujeresBoletin 1077 - Tramitación - Ley Integral Contra La Violencia Hacia Las Mujeres
Boletin 1077 - Tramitación - Ley Integral Contra La Violencia Hacia Las Mujeres
 
PLAN DE MEJORA DE BIOSEGURIDAD EN HOSPITALES.pptx
PLAN DE MEJORA DE BIOSEGURIDAD EN  HOSPITALES.pptxPLAN DE MEJORA DE BIOSEGURIDAD EN  HOSPITALES.pptx
PLAN DE MEJORA DE BIOSEGURIDAD EN HOSPITALES.pptx
 
UNIDAD DIDÁCTICA MAYO TERCER GRADO (2).docx
UNIDAD DIDÁCTICA MAYO TERCER GRADO (2).docxUNIDAD DIDÁCTICA MAYO TERCER GRADO (2).docx
UNIDAD DIDÁCTICA MAYO TERCER GRADO (2).docx
 
POLÍTICA CRIMINAL - SEGURIDAD CIUDADANA Y TECNOLOGÍA.pptx
POLÍTICA CRIMINAL - SEGURIDAD CIUDADANA Y TECNOLOGÍA.pptxPOLÍTICA CRIMINAL - SEGURIDAD CIUDADANA Y TECNOLOGÍA.pptx
POLÍTICA CRIMINAL - SEGURIDAD CIUDADANA Y TECNOLOGÍA.pptx
 
UNIDAD 3.1, 3.2 y 3.3 3.5 FUNCIÓN PÚBLICA 2.pptx
UNIDAD 3.1, 3.2 y 3.3 3.5 FUNCIÓN PÚBLICA 2.pptxUNIDAD 3.1, 3.2 y 3.3 3.5 FUNCIÓN PÚBLICA 2.pptx
UNIDAD 3.1, 3.2 y 3.3 3.5 FUNCIÓN PÚBLICA 2.pptx
 
Clase 4 Análisis PESTEL.PDF Material de calidad
Clase 4 Análisis PESTEL.PDF Material de calidadClase 4 Análisis PESTEL.PDF Material de calidad
Clase 4 Análisis PESTEL.PDF Material de calidad
 
Día Mundial de la Seguridad y Salud en el Trabajo 2024, 28 de abril - Cambio ...
Día Mundial de la Seguridad y Salud en el Trabajo 2024, 28 de abril - Cambio ...Día Mundial de la Seguridad y Salud en el Trabajo 2024, 28 de abril - Cambio ...
Día Mundial de la Seguridad y Salud en el Trabajo 2024, 28 de abril - Cambio ...
 
La paz total, en la presidencia de gustavo Petro.pdf
La paz total, en la presidencia de gustavo Petro.pdfLa paz total, en la presidencia de gustavo Petro.pdf
La paz total, en la presidencia de gustavo Petro.pdf
 
Programa electoral de Vox para las elecciones catalanas
Programa electoral de Vox para las elecciones catalanasPrograma electoral de Vox para las elecciones catalanas
Programa electoral de Vox para las elecciones catalanas
 
manejo de encaste en ovinos pdti indap PLC
manejo de encaste en ovinos pdti indap PLCmanejo de encaste en ovinos pdti indap PLC
manejo de encaste en ovinos pdti indap PLC
 
Revista Ejército nº 989 mar-abr 2024.pdf
Revista Ejército nº 989 mar-abr 2024.pdfRevista Ejército nº 989 mar-abr 2024.pdf
Revista Ejército nº 989 mar-abr 2024.pdf
 
#DigitalTierra nº 99 Al máximo nivel en Irak
#DigitalTierra nº 99 Al máximo nivel en Irak#DigitalTierra nº 99 Al máximo nivel en Irak
#DigitalTierra nº 99 Al máximo nivel en Irak
 
Presupuesto asignado a fracking 2018-2024.pdf
Presupuesto asignado a fracking 2018-2024.pdfPresupuesto asignado a fracking 2018-2024.pdf
Presupuesto asignado a fracking 2018-2024.pdf
 

Casos de uso de fuentes big data en las estadísticas económicas de Canarias

  • 1. CASOS DE USO DE FUENTES BIG DATA EN LAS ESTADÍSTICAS ECONÓMICAS DE CANARIAS XIX JORNADAS ESTADÍSTICAS DE LAS COMUNIDADES AUTONOMAS (JECAS 2016)
  • 2. Alberto González Yanes Domingo Lorenzo Díaz Carlos Sierra Fumero CASOS DE USO DE FUENTES BIG DATA EN LAS ESTADÍSTICAS ECONÓMICAS DE CANARIAS XIX JORNADAS ESTADÍSTICAS DE LAS COMUNIDADES AUTONOMAS (JECAS 2016) Madrid, 22 y 23 de septiembre de 2016
  • 3. Fuentes Big Data en la estadística pública
  • 4. “Big Data son las fuentes de datos que generalmente pueden ser descritas como de alto volumen, velocidad y variedad, que requieren formas rentables e innovadoras de procesamiento con el fin de mejorar los análisis y de apoyar las tomas de decisiones” Conference of European Statisticians. “What Does ‘Big Data’ Mean for Official Statistics?” UNECE, March 10, 2013. Fuentes Big Data en la estadística pública FUENTES BIG DATA EN LAS ESTADÍSTICAS ECONÓMICAS DE CANARIAS
  • 5. Fuentes Big Data en la estadística pública ● La propiedad sobre las fuentes de datos generalmente no es pública, con los problemas derivados para el acceso, uso y mantenimiento de las fuentes. ● La fuentes de datos generalmente son muestras no probabilísticas que no están pensadas para fines estadísticos, con los problemas derivados de conceptualización y sesgos. FUENTES BIG DATA EN LAS ESTADÍSTICAS ECONÓMICAS DE CANARIAS
  • 6. Fuentes Big Data en la estadística pública Cooperación público-privada Klein, Thilo, Johannes Jütting, and Nicholas Robin. “Public-Private Partnerships for Statistics: Lessons Learned, Future Steps.” OECD Development Co-operation Working Papers, February 29, 2016. Marco de calidad UNECE Big Data Quality Task Team. “A Suggested Big Data Quality Framework.” UNECE, December 2014. FUENTES BIG DATA EN LAS ESTADÍSTICAS ECONÓMICAS DE CANARIAS
  • 7. FUENTES BIG DATA EN LAS ESTADÍSTICAS ECONÓMICAS DE CANARIAS
  • 8. ● Sensorización de alojamientos turísticos ● Datos de centrales de compra de pasajes ● Datos de unidades económicas en fuente abiertas ● Datos de precios en supermercados Casos de uso en estudio dentro del ISTAC FUENTES BIG DATA EN LAS ESTADÍSTICAS ECONÓMICAS DE CANARIAS
  • 9. Sensorización alojamientos FUENTES BIG DATA EN LAS ESTADÍSTICAS ECONÓMICAS DE CANARIAS
  • 10. Objetivo FUENTES BIG DATA EN LAS ESTADÍSTICAS ECONÓMICAS DE CANARIAS
  • 11. Arquitectura FUENTES BIG DATA EN LAS ESTADÍSTICAS ECONÓMICAS DE CANARIAS
  • 12. FUENTES BIG DATA EN LAS ESTADÍSTICAS ECONÓMICAS DE CANARIAS Datos de compra de pasajes
  • 13. FUENTES BIG DATA EN LAS ESTADÍSTICAS ECONÓMICAS DE CANARIAS Estadística de Movilidad Aérea de Canarias. Estudiar la movilidad aérea de los residentes en Canarias en sus conexiones tanto interinsulares como con el resto de España; permitiendo estudiar la evolución de los precios de compra de los viajes según anticipación a la fechas de vuelo y las conectividades realizadas por los residentes. Estadística de Movilidad Marítima de Canarias. Estudiar la movilidad marítima de los residentes en Canarias en sus conexiones interinsulares; permitiendo estudiar la evolución de los precios de compra de los viajes según anticipación a la fechas de travesía y las conectividades realizadas por los residentes. Estadística de Movimientos Turísticos en Fronteras de Canarias (FRONTUR- Canarias). Fuente auxiliar para la estimación de entra de turistas y para la proyección a corto plazo de entra de turistas. Objetivo
  • 14. FUENTES BIG DATA EN LAS ESTADÍSTICAS ECONÓMICAS DE CANARIAS Datos de interés Ficheros de microdatos basados en los PNR (Passenger Name Record) que contiene información relevante del transporte de cada viajero aéreo. El Passenger Name Record (PNR), (español Registro de Nombre de Pasajero), es el nombre comúnmente utilizado para designar la información relativo a reservas hechas en sistemas de reservas (CRS). Clave de viaje - Residente (Sí / No) - Fecha de nacimiento – Sexo - Municipio de compra (con codificación INE) - Fecha de compra - Código de vuelo - Identificador de aerolínea - Aeropuerto de origen - Aeropuerto de destino - Fecha del vuelo - Compra ida y vuelta (Sí / No) - Clave de viaje asociado (si compra ida y vuelta) - Precio de compra - Descuento de residente – Tasas - Código de vuelo n - Identificador de aerolínea n - Aeropuerto de origen n - Aeropuerto de destino n - Fecha de vuelo n - Precio de compra n - Descuento de residente n - Tasas n - Clave de viaje en grupo n 45% de PNR de vuelos regulares
  • 15. FUENTES BIG DATA EN LAS ESTADÍSTICAS ECONÓMICAS DE CANARIAS Directorios de establecimientos
  • 16. Fuentes externas FUENTES BIG DATA EN LAS ESTADÍSTICAS ECONÓMICAS DE CANARIAS
  • 17. GRID para la recogida de datos FUENTES BIG DATA EN LAS ESTADÍSTICAS ECONÓMICAS DE CANARIAS
  • 18. Proceso ETL FUENTES BIG DATA EN LAS ESTADÍSTICAS ECONÓMICAS DE CANARIAS
  • 19. Ejemplo de proceso de extracción 1) LLamada “Listado” • aprox 40.000 ficheros • aprox 400 Mb • 21 campos • máximo nº registros devuelve: 60 2) Llamada “Detalle” • aprox 100.000 ficheros • aprox 500 Mb • 51 campos 3) Llamada “Fotos del sitio” aprox 550.000 referencias aprox 128 Mb 1 campo FUENTES BIG DATA EN LAS ESTADÍSTICAS ECONÓMICAS DE CANARIAS
  • 20. Reconciliación de fuentes Nombre Identificador Rating Clasificación Latitud/Longitud Región/Área (según fuente) Localidad Código postal Dirección Imágenes Comentarios principales Celda Publicador URL del publicador Nombre Identificador Rating Clasificación Latitud/Longitud Región/Área (según fuente) Localidad Código postal Dirección Imágenes Comentarios principales Celda Publicador URL del publicador FUENTES BIG DATA EN LAS ESTADÍSTICAS ECONÓMICAS DE CANARIAS
  • 21. Mapeo a tecnología semántica que utiliza vocabularios y clasificaciones estandares, que además de ofrecer los datos se dan los metadatos de cada definición bajo unas reglas públicas y publicadas. En concreto se han utilizado los siguientes vocabularios: xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#" xmlns:geo="http://www.w3.org/2003/01/geo/wgs84_pos#" xmlns:locn="http://www.w3.org/ns/locn#" xmlns:schema="http://schema.org/" xmlns:rdfs="http://www.w3.org/2000/01/rdf-schema#" xmlns:os="http://a9.com/-/spec/opensearch/1.1/" xmlns:dcterms="http://purl.org/dc/terms/" xmlns:dc="http://purl.org/dc/elements/1.1/" xmlns:owl="http://www.w3.org/2002/07/owl#" xmlns:locationOnt="http://data.linkedevents.org/def/location#" xmlns:xhv="http://www.w3.org/1999/xhtml/vocab#" xmlns:gPlacesKOS="http://data.linkedevents.org/kos/googleplaces/" xmlns:api="http://purl.org/linked-data/api/vocab#" xmlns:xsd="http://www.w3.org/2001/XMLSchema#"> Reconciliación de fuentes. Aplicación semántica FUENTES BIG DATA EN LAS ESTADÍSTICAS ECONÓMICAS DE CANARIAS
  • 22. FUENTES BIG DATA EN LAS ESTADÍSTICAS ECONÓMICAS DE CANARIAS
  • 23. FUENTES BIG DATA EN LAS ESTADÍSTICAS ECONÓMICAS DE CANARIAS PVP on-line en supermercados
  • 24. FUENTES BIG DATA EN LAS ESTADÍSTICAS ECONÓMICAS DE CANARIAS Objetivo PPA: Comparar niveles de precios entre territorios · Canarias vs Resto de España · Listado de productos utilizado por Eurostat para el cálculo de las PPA. - Sólo datos de alimentación y bebidas - Ponderaciones facilitadas por el INE Metodología Eurostat-OCDE http://ec.europa.eu/eurostat/web/purchasing-power-parities/methodology Cálculo PPAij Objetivo
  • 25. FUENTES BIG DATA EN LAS ESTADÍSTICAS ECONÓMICAS DE CANARIAS Fuente de datos
  • 26. FUENTES BIG DATA EN LAS ESTADÍSTICAS ECONÓMICAS DE CANARIAS PERIODO CADENA SUPERMERCADOS CODIGO POSTAL PRODUCTO PRECIO Formato resumido: Productos, precios, grupos de códigos postales PRODUCTOS PERIODO ID_PRODUCTO NOMBRE_PRODUCTO MARCA CUANTIFICADOR UNIDAD_DE_MEDIDA (Otras variables de identificación del producto) PRECIOS PERIODO ID_PRODUCTO ID_GRUPO_CODIGOS_PO STALES PRECIO (Otras variables) CODIGOS_POSTALES PERIODO ID_GRUPO_CODIGOS_PO STALES CODIGO_POSTAL CADENA_SUPERMERCAD OS Formato de los datos
  • 27. FUENTES BIG DATA EN LAS ESTADÍSTICAS ECONÓMICAS DE CANARIAS Dimensión de los ficheros PRODUCTOS: 123.000 registros, 27,6 Mb CODIGOS POSTALES: 13.500 registros, 530 Kb PRECIOS
  • 28. FUENTES BIG DATA EN LAS ESTADÍSTICAS ECONÓMICAS DE CANARIAS Calidad de los datos Comparativas con precios recogidos off-line y análisis de la variabilidad de precios Problemas de fuente ● Selección de artículos Soysuper y relación con el listado de productos PPA: Búsqueda casi manual entre los literales ● Problemas iniciales en la exportación de la información ● Códigos coherentes a lo largo del tiempo ● Problemas de integridad referencial ● Errores en tipos de datos: “Pack de 3 latas de 80 gr.” en campo numérico ● Líneas en blanco. Registros incompletos ● Existencia de registros con precios iguales a 0
  • 29. FUENTES BIG DATA EN LAS ESTADÍSTICAS ECONÓMICAS DE CANARIAS Calidad de los datos Dificultad para encontrar productos relacionados con carne fresca Influencia muy elevada de un solo artículo en una posición elemental completa (Posición elemental = Conjunto de productos) No considerar carne fresca
  • 30. FUENTES BIG DATA EN LAS ESTADÍSTICAS ECONÓMICAS DE CANARIAS Resultados PPA Canarias - Resto de España (resultado provisional 2014) 109,56
  • 31. Gracias por su atención Síguenos en Twitter: @istac_es Slideshare: http://www.slideshare.net/ISTAC