Presentación utilizada por Esteban Moro, Profesor Titular de Universidad, Miembro del GSIC y del Instituto de Ciencias Matemáticas CSIC-UAM-UCM-UC3M, para la Conferencia #itdUPM2015
Plan Refuerzo Escolar 2024 para estudiantes con necesidades de Aprendizaje en...
Nowcasting sociedades nuevas formas organización
1. Esteban Moro
Profesor Titular de Universidad, Miembro del GSIC y del Instituto
de Ciencias Matemáticas CSIC-UAM-UCM-UC3M
Nowcasting, sociedades para nuevas formas de organización
4. @estebanmoro
> Big Data, Better answers
Mejorar problemas que ya tenían respuesta
Gran escala, tiempo real (nowcasting/forecasting)
> Big data, Big new questions
Responder a problemas que no tenían respuesta
> Implicaciones/Problemas
7. @estebanmoro
Nowcasting/forecasting de desempleo
¿Qué comportamientos en las redes sociales reflejan el desempleo de una zona?
http://portal.uc3m.es/portal/page/portal/actualidad_cientifica/noticias/conversacion_politica_en_twitter
Torrijos, 26% paro
Sobrarbe, 7% paro
0 4 8 12 16 20
2%
Fracciónde
tweets
4%
6%
8%
Hora
8. @estebanmoro
Nowcasting/forecasting de desempleo
¿Qué comportamientos en las redes sociales reflejan el desempleo de una zona?
http://portal.uc3m.es/portal/page/portal/actualidad_cientifica/noticias/conversacion_politica_en_twitter
% Unemployment (real)
%Unemployment(predicted)
0 10 20 30 40 50
Penetración
Disparidad social
Actividad por la
mañana
Número de
“misspellers”
Menciones a la
“empleo”
% weight in the model
9. @estebanmoro
Nowcasting de enfermedades/síntomas
Correlación entre opiniones en redes sociales y comportamientos relacionados con la salud
gripe
Alergia
dolor de cabeza
Semanas desde Enero 2012
Incidencia(en100k
usuarios)
fiebre
dolor de cabeza
gripe
Incidencia
alta
media
baja
10. @estebanmoro
Nowcasting el daño económico de un desastre
Podemos predecir el impacto económico de un desastre natural? Cuantía de los
Seguros?
Huracán Sandy, 29 de Octubre de 2012
Impacto económico ~10/20 mil millones de dólares
Dataset: 52.55 Million messages, 14Million users
Yury Kryvasheyeu, Manuel Cebrián, EM, et al 2015
http://arxiv.org/abs/1504.06827
11. @estebanmoro
Nowcasting el daño económico de un desastre
Podemos predecir el impacto económico de un desastre natural? Cuantía de los
Seguros?
Huracán Sandy, 29 de Octubre de 2012
Impacto económico ~10/20 mil millones de dólares
Dataset: 52.55 Million messages, 14Million users
Yury Kryvasheyeu, Manuel Cebrián, EM, et al 2015
http://arxiv.org/abs/1504.06827
12. @estebanmoro
Nowcasting el daño económico de un desastre
Podemos predecir el impacto económico de un desastre natural? Cuantía de los
Seguros?
Huracán Sandy, 29 de Octubre de 2012
Impacto económico ~10/20 mil millones de dólares
Dataset: 52.55 Million messages, 14Million users
Yury Kryvasheyeu, Manuel Cebrián, EM, et al 2015
http://arxiv.org/abs/1504.06827
13. @estebanmoro
Detección de opinión política
Estudio de usuarios de twitter que siguen a partidos políticos. Mayo 2015.
Elecciones andaluzas (85000 cuentas)
http://portal.uc3m.es/portal/page/portal/actualidad_cientifica/noticias/conversacion_politica_en_twitter
14. @estebanmoro
Detección de opinión política
Estudio de usuarios de twitter que siguen a partidos políticos. Marzo 2015.
Elecciones andaluzas
http://portal.uc3m.es/portal/page/portal/actualidad_cientifica/noticias/conversacion_politica_en_twitter
16. @estebanmoro
Nowcasting economía surmergida
Detectamos más o menos paro que oficialmente se declara? (por provincias)
Error = ModeloParo(Actividad) - Paro declarado
(Tweets geolocalizados)
Dataset: 19.6 Million geolocalize
A. Llorente, EM, et al, 2015
http://arxiv.org/abs/1411.3140
30%
20%
10%
0%
-10%
-20%
-30%
Error
% Economía Sumergida
15 20 25 30 35
El modelo predice
menos paro que el
oficial en las provincias
con mayor economía
sumergida
18. @estebanmoro
Límites a la movilización social
Si la información viaja tan rápido en las redes sociales, ¿las podemos utilizar para
movilizar a la sociedad en situaciones criticas?
Solo 8 horas, pero muy arriesgado A. Rutherford, EM et al, PNAS 2013
20. @estebanmoro
Implicaciones/problemas
• Sociedades/gobiernos basadas en datos
• Transparencia: el proceso de
toma de datos no depende
de personas
• Responsabilidad: decisiones
basadas en datos/algoritmos
• Política con A/B Testing
• http://www.wired.com/2012/04/ff_abtesting/all/1
• http://www.fastcompany.com/3042630/first-us-chief-data-scientist-dj-patilscientist-dj-patil
21. @estebanmoro
Implicaciones/problemas
• Privacidad ~ 1 / Valor
• Trazabilidad
¿Quién/dónde/como utiliza
nuestros datos?
• Valor: Los datos son de
empresas, pero ¿y el valor de
los mismos?
• Medida: ¿cuánta privacidad
perdemos al ser usados
nuestros datos? ¿cuanto valen
nuestros datos?
22. @estebanmoro
Implicaciones/problemas
• N ≠ ALL
• Algunos sectores sociales pueden
no estar incluidos
• Introduce sesgos a los más
jóvenes, más ricos, etc.
• Necesitamos métodos de las
ciencias sociales (segmentación)