Diapositivas que preparé para el XVII Congreso de TIG de la AGE (2016) que tuvo lugar en Málaga. Trata de la creación de una plataforma tecnológica para generar Small Data para el aula. El primer caso que he trabajado es el de las pirámides de población.
1. Introducción Caso de estudio Avances
Small Data para Educación
Más de un millón de pirámides de población de España
Benito M. Zaragozí
XVII Congreso Nacional de TIG - Málaga 29, 30 Junio y 1 Julio
2016
Small Data para Educación Benito M. Zaragozí
2. Introducción Caso de estudio Avances
Big Data vs Small Data
• Gil Press (Forbes), 12 Big Data Definitions: What’s Yours?
• Dough Laney (META), 3D Data Management: Controlling
Data Volume, Velocity, and Variety
Cuadro 1: Comparación rápida de Small Data y Big Data
3 Vs (o más) Small Data Big Data
Volumen Un humano puede con ello (<10 GB) Un humano no puede con ello (> 1 TB)
Velocidad Flujo constante (periodicidad) Enormes oleadas por milisegundo
Variedad Formatos esperados (estructurados) Formatos desconocidos (multiestructurados)
Veracidad Conocimiento previo de los patrones Incertidumbre sobre datos y formatos
Valor Suele ser conocido Creencia de que a más datos más valor
Tecnologías Un servidor, SQL, Excel, manual Cluster, Hadoop, NoSQL, Python, R, Machine-Learning
Léxico Database, Data Warehouse, Data Mart Data Lake
Small Data para Educación Benito M. Zaragozí
3. Introducción Caso de estudio Avances
Visualizaciones
Figura 1: Rafa Höhr, Un reto periodístico: la visualización de resultados
electorales
Small Data para Educación Benito M. Zaragozí
4. Introducción Caso de estudio Avances
Visualizaciones
Figura 2: Rafa Höhr, Un reto periodístico: la visualización de resultados
electorales
Small Data para Educación Benito M. Zaragozí
5. Introducción Caso de estudio Avances
Aprendizaje basado en visualizaciones
Ventajas según @Day2012 y @Shaffer2011 :
• Los estudiantes suelen ser más comprometidos en su
aprendizaje activo.
• El uso de datos locales en las lecciones facilita que los
estudiantes participen más activamente en el aprendizaje.
E inconvenientes :
• El mayor impedimento para la adopción de estas técnicas es el
tiempo necesario para encontrar, aprender, instalar, desarrollar
e integrar buenas visualizaciones en un curso.
Small Data para Educación Benito M. Zaragozí
6. Introducción Caso de estudio Avances
Pirámides de población
• Son visualizaciones con un gran poder explicativo.
• Se pueden integrar en el aula con un mínimo esfuerzo.
• Existen implementaciones en todo tipo de plataformas, librerías,
etc [1], [2], [3]
• Muestran datos disponibles habitualmente en censos y
padrones (Small Data).
Small Data para Educación Benito M. Zaragozí
7. Introducción Caso de estudio Avances
Pirámides de Chichinabo.org
Figura 3: chichinabo.org | Chichinabo.org en GitHub
Small Data para Educación Benito M. Zaragozí
8. Introducción Caso de estudio Avances
Spatial Data Warehouse
Figura 4: Esquema simplificado de la plataforma
Small Data para Educación Benito M. Zaragozí
9. Introducción Caso de estudio Avances
¿Más o menos un millón. . . ?
Figura 5: Datos de población por edad y sexo disponibles en INE
Small Data para Educación Benito M. Zaragozí
10. Introducción Caso de estudio Avances
Reproducibilidad científica
Figura 6: Encuesta de Nature sobre reproducibilidad científica
Small Data para Educación Benito M. Zaragozí
11. Introducción Caso de estudio Avances
Reproducibilidad científica
Figura 7: Roger D. Peng, Reproducible Research: Concepts and Ideas
p.10 on Coursera
Small Data para Educación Benito M. Zaragozí
12. Introducción Caso de estudio Avances
Pirámides de chichinabo ayer (Dic. 2015). . .
Figura 8: Despliegue con algo de configuración manual
Small Data para Educación Benito M. Zaragozí
13. Introducción Caso de estudio Avances
Pirámides de chichinabo hoy. . .
Figura 9: Despliegue casi automático
Small Data para Educación Benito M. Zaragozí
14. Introducción Caso de estudio Avances
Despliegue de la plataforma
Figura 10: Asciinema del compose up -d
Small Data para Educación Benito M. Zaragozí
15. Introducción Caso de estudio Avances
Orquestación de software
Figura 11: Sam Alba, Deploy and manage any cluster manager with
Docker Swarm
Small Data para Educación Benito M. Zaragozí
16. Introducción Caso de estudio Avances
References
• Day, T. 2012. “Undergraduate Teaching and Learning in
Physical Geography.” Progress in Physical Geography 36 (3):
305–32. doi:10.1177/0309133312442521.
• Shaffer, Clifford a, Monika Akbar, Alexander Joel D. Alon,
Michael Stewart, and Stephen H. Edwards. 2011. “Getting
Algorithm Visualizations into the Classroom.” Proceedings of
the 42nd ACM Technical Symposium on Computer Science
Education - SIGCSE ’11, 129.
doi:10.1145/1953163.1953204.
Small Data para Educación Benito M. Zaragozí