Big Data ha estado en desarrollo durante al menos 20 años, pero solo recientemente se ha vuelto popular. El documento describe la historia y definiciones de Big Data, así como ejemplos de su uso en las industrias minorista y agrícola. Finalmente, señala que aunque la tecnología está disponible, los recursos humanos con habilidades de análisis de datos son fundamentales para extraer valor de grandes volúmenes y variedades de datos.
6. Big Data: Definiciones
•
Gartner: Big data is high-volume, high-velocity and high-variety information assets that demand cost- effective, innovative forms of information processing for enhanced insight and decision making.
•
Grandes volúmenes de información, típicamente heterogéneos y complejos que deben ser procesados para extraer valor.
12. Big Data: 1990 - 2013
2012
2006
2004
2001
1997
En 2011–2012 se rompe la tendencia exponencial con la que venía creciendo el número de publicaciones. Big Data se hace popular.
14. ¿Big Data está creciendo?
El crecimiento de Big Data es similar a otras áreas cercanas.
15. ¿Big Data está creciendo?
Recién en 2011-2012 Big Data comienza a crecer por encima de otras áreas cercanas.
16. Reflexiones…
•
Big Data es el resultado de:
–
(al menos) 20 años de desarrollo tecnológico
–
muchísimos años de investigación y desarrollo en: estadística, pattern recognition, data mining, machine learning, etc.
•
(-) Big Data es un nombre “marketinero” para cosas conocidas por la academia y la industria.
•
(+) Lo nuevo de Big Data: combinación de grandes volúmenes de datos heterogéneos para extraer valor.
17. Reflexione: (3V + 1V)
•
VOLUMEN no es todo…
•
VELOCIDAD acorde al negocio…
•
VARIEDAD sobre todas las cosas…
•
VALOR el objetivo…
24. Retail
•
Negocio con tradición de uso de los datos para extraer valor.
•
¿Volumen?
•
¿Velocidad?
•
¿Variedad?
OK
OK
¿?
25. Retail: Variedad
•
Redes Sociales (estados de ánimo, otros eventos,…)
•
Dispositivos
•
Clima
•
Conteo de personas (video)
•
Reconocimiento de género y edad a partir de imágenes (video)
•
Seguimiento a partir de cámaras (video)
•
Identificación de “hot spots”
•
Marketing de proximidad (¿beacons?)
•
etc.
DATOS NO ESTRUCTURADOS
28. Agricultura: Datos
+ Imágenes Satelitales (series históricas)
+ Clima (series históricas)
+ Suelos
+ Datos de Cultivos
+ Recorridas a Campo Georeferenciadas
+ Monitores de Rendimiento (cosecha: rendimiento, humedad, elevación, temperatura,…)
+ etc.
Variedad – Volumen – Velocidad
29. Ambientaciones
•
Identificación automática de heterogeneidad ambiental
•
Imágenes Satélite 1985-2012
•
Modelo de Elevación
•
Carta de Suelos
•
Monitores Rendimiento (futuro)
30. Ambientaciones: Proceso
Adquisición
•Imágenes Satélite
•Monitores Rend.
Pre-procesamiento
•Selección Imágenes
•Extracción de bandas de interés
Integración
•Agregación
•Representación de información
Análisis
•Identificación de ambientes
Interpretación
•Evaluación Agronómica
31. Agricultura
Estimación de Rendimiento: Identificación automática de puntos de muestreo.
Procesamiento Monitores Rendimiento
32. Resumen Final
•
Volumen no lo es todo… depende de la aplicación
•
Velocidad también depende de la aplicación
•
Variedad es el mayor desafío (novedad)
•
Tecnología disponible
•
RRHH factor clave (análisis de datos)