El documento resume las tendencias del mercado de Big Data a nivel global y en Latinoamérica, destacando que se espera que el mercado global crezca de $15 mil millones en 2019 a $68 mil millones en 2025, mientras que el mercado latinoamericano crecerá de $3 mil millones en 2017 a $8 mil millones en 2023. También presenta ejemplos del uso de Big Data para mejorar la toma de decisiones operativas en tiempo real, prevenir fraude, conocer mejor a los clientes y posicionar productos en marketplaces.
3. Market
Global1:
15 mil millones de dólares (2019) ⇒ 68 mil millones de dólares (e. 2025)2
CAGR 29%
Competitivo, a pesar de COVID, especialmente en el sector salud.
LATAM3:
3 mill millones de dólares (2017) ⇒ 8 mill millones de dólares (e. 2023)
CAGR 19%
Estimación pre-COVID
Ventas: Brasil (47%), México (27%), Colombia (8%), Chile (7%), Argentina (6%).
1 https://www.frost.com/news/press-releases/global-big-data-analytics-market-to-grow-4-5-times-by-2025-powered-by-data-security-requirements/
2 https://www.frost.com/news/press-releases/big-data-analytics-among-top-three-deployment-priorities-for-enterprises-says-frost-sullivan/
3 https://www.frost.com/news/press-releases/brazil-and-mexico-stand-front-runners-latin-american-big-data-market-says-frost-sullivan/
5. Definiciones
Volúmen / Velocidad / Variedad
90% de todos los datos fueron generados en los últimos 2
años (Forbes, 2018).
Por minuto (2017):
- Google: 3.6 M de búsquedas
- Wikipedia: 600 ediciones
- Spotify: 13 nuevas canciones
- Instagram: 47 K fotos
- Twitter: 450 K tweets
- Youtube: +4 M de videos
- LinkedIn: +120 nuevos perfiles
https://web-assets.domo.com/blog/wp-content/uploads/2017/07/17_domo_data-never-
sleeps-5-01.png
7. Ops decision - Live dashboard
Challenge:
Sugerir acciones en tiempo real para
solucionar problemas operativos
(inventario de productos digitales, fallas
en pago y fulfillment, etc.).
Datos:
Múltiples fuentes: AWS RDS, API
suppliers -payment & fulfillment-,
crawlers.
Múltiples tipos: estructurada, JSON
8. Fraud Prevention
Challenge:
Optimizar el fraud engine para disminuir el costo del
fraude e incrementar el conversion rate (vs previous
algorithm).
Datos:
Múltiples fuentes: AWS RDS, txt logs (M rows per day),
GCP DB.
Múltiples tipos: estructurada, JSON
Solución:
Incrementar el número de fuentes analizadas y eficientar
el pipeline de datos para alimentar un modelo de
clasificación que analiza los intentos transaccionales en
tiempo real.
Resultados:
Disminución marginal del fraud rate pero incremento en
la conversión, es decir, ahora se permiten más intentos
pero es más certera la identificación de transacciones
fraudulentas.
9. KYC
Challenge:
Conocer mejor a los clientes (más allá de edad y sexo)
para hacer estrategias personalizadas comerciales y de
marketing y predecir su comportamiento.
Datos:
Múltiples fuentes: AWS RDS, txt logs (M rows per day),
GCP DB, API de suppliers (marketing), GA, Social Media.
Múltiples tipos: estructurada, JSON
Solución:
Creación de un pipeline que extrae datos de diversas
fuentes y se sumariza en una tabla maestra con
información de usuarios (scores, cohorts, app behaviour,
txnal behaviour, NSE, etc. También, tablas “tipo Netflix”,
para predicción.
Resultados:
Campañas de marketing y comunicación focalizadas.
Incremento en transacciones por cross-selling y
retención.
10. Buy Box
Challenge:
Posicionar mejor los productos vendidos en los
marketplaces / “ganar la buy box”.
Datos:
Múltiples fuentes: ERP, AWS RDS, marketplace API,
crawlers.
Múltiples tipos: estructurada, JSON
Solución:
Script (como parte de un proceso más grande) que
analiza las publicaciones propias y de la competencia
para ofrecer vías de acción inmediatas (precios,
inventario, opciones de envío y reviews).
Resultados:
En prueba.
11. La Big Data de
hoy es la small
data de mañana.
https://www.linkedin.com/in/miguel-alejandro-s%C3%A1nchez-acosta-2ab66591/
alex@qiseth.com