Potenciando la data con AI para hacer predicciones
1. Andrés Soler - The Venture City Madrid
Septiembre 25, 2018
Potenciando la data con AI
para hacer predicciones
2. The world’s most valuable resource
is no longer oil, but data
The Economist
3. 01. DATA & NEGOCIOS
¿Por qué todo negocio es
ahora un negocio de data?
4. El impresionante crecimiento de la Data
Cada dos días creamos tanta data como la que creamos
desde el inicio de los tiempos hasta 2003.
Hacia 2020, la cantidad de información digital disponible habrá
crecido de 5 zetabytes a 50 zetabytes
Parte de la explosión de la data se debe a IoT: dispositivos
que recolectan y transmiten data a través de Internet.
Hoy: 13B de dispositivos → 2020: 70B
2018 2020
5 ZB
50 ZB
información digital
2 días hoy
data creada en
el año 2003
data creada hasta
=
70B
de dispositivos de dispositivos
13B
5. La magnitud exponencial de la
data generada por todas las
industrias
La velocidad de generación de la data
y su correspondiente procesamiento
La diversidad de data estructurada y
no estructurada de múltiples fuentes
El volumen, velocidad y variedad de la
data genera dudas sobre su
capacidad de su procesamiento y su
validación
Las 4 “V” del Big Data
Volumen Velocidad
Variedad Veracidad
6. Big Data
ESTRUCTURADA - 20% del total
● Bases de Datos, Hojas de calculo (filas y columnas)
● Manejada usando Structured Query Language (SQL)
● Ej: Ventas, Clientes, transacciones
● Pro: Barata de usar + Fácil de almacenar y analizar
● Quién, Qué, Dónde, Cómo
NO ESTRUCTURADA O SEMI - 80% del total
● E-mails, Social Media posts, fotos, videos, audios
● Pro: Facilita entender el por qué
● Pro: Provee Insights valiosos
● Con: Almacenamiento y análisis complejos
DATA INTERNA - 1st Party Data
● Toda la info que un negocio tiene o puede recolectar
● Data propietaria del negocio
● Pro: barata y sin costos de acceso
● Pro: “Customizada” al negocio o industria
● Con: mantenimiento y seguridad (PII)
DATA EXTERNA - Pública o Privada
● Universo de data que existe fuera de la compaña
● Propiedad del gobierno o de terceros (Amazon)
● Censos, Social Media, Google Trends
● Pro: Capacidad de acceder a ella y minarla
● Con: No es propietaria y a veces debe pagarse
Tipos de Data
7. El valor de los datos es creado por las “refinerías” que
agregan, analizan, comparan, filtran y distribuyen
nuevos productos y servicios de datos.
Refinerías de datos
8. Mejora en toma de decisiones
Usos Clave
Mejora en operaciones
Monetización
¿Cómo la data está revolucionando los negocios?
9. 1.000.000 PizzasPizza & Data
DOMINO’S INFORMATION MANAGEMENT FRAMEWORK
Mobile App Text Message Twitter Facebook Voice Assistant Smartwatch
In-vehicle
Comms System
Smart TV
en 70 paises
Ventas / día
10. 1
2
3
QUIZ # 1
Ingresar desde el móvil a:
kahoot.it
Digitar el GAME PIN que se
mostrará en esta pantalla e
ingresar luego un NICKNAME
Responder rápidamente
Step by Step
14. 03 DATA & MARKETING
● Data Hierarchies
● Data Platforms
● Data Activations
15. ALTO
ALTO
BAJO
BAJO
Data Hierarchies
1st Party Data
● Determinística & Exclusiva
● Alto valor & Alta fiabilidad
● Baja escala
2nd Party Data
● Semi Determinística &
potencialmente Exclusiva
● Alto valor & Alta fiabilidad
● Consentimiento posible
● Mediana escala
3rd Party Data
● Probabilística & No Exclusiva
● Bajo valor & Baja fiabilidad
● Consentimiento poco posible
● Gran escala
16. Data Hierarchies, Consent & GDPR
1st Party Data
Claro camino al consentimiento
2nd Party Data
Consentimiento posible
3rd Party Data
Consentimiento poco probable
● GDPR reenfoca a las marcas hacia relaciones con
clientes 1:1 y a obtener consentimiento de los
usuarios
● 1st party data representará una mayor porción de
toda la data utilizable desde Mayo 2018
● Relaciones 2nd party serán más importantes pero más difíciles de
ejecutar debido a complejidades de consentimiento.
● Alianzas entre marcas establecidas tienen mejor oportunidad de
pedir a clientes permiso para compartir su data a cambio de
descuentos (eg Ticketmaster+Spotify)
● Disponibilidad será significantemente afectada eliminando su
beneficio principal: escala
● Marcas cambiarán foco hacia ser dueñas de la relación con cliente
y de la data asociada
17. Concentrarse en controlar la data de marketing
PROBLEMA
SOLUCION
1st Party Data y su importancia estratégica
Data Ownership!
20. 1
2
3
CDP
A diferencia de los data lakes, data
warehouses y la mayoría de CRMs,
(controlados por TI) es marketing el
interesado y propietario de la CDP
A diferencia de los DMP web, las CDP
capturan y almacenan identificadores
personales y los datos persisten a lo
largo del tiempo
A diferencia de las marketing clouds que
agrupan gestión y ejecución de datos, las
CDP se especializan en unificar datos y
entregarlos a otros sistemas para su
ejecución.
vs DMP
22. ACCESIBILIDAD A LA DATA
Perfiles
persistentes con
una única vista del
cliente
Customer Data Platform CDP
23. ACCESIBILIDAD A LA DATA
Perfiles
persistentes con
una única vista del
cliente
Control sobre la
recolección,
segmentación y
activación sin
requerir recursos de
IT
Customer Data Platform CDP
24. ACCESIBILIDAD A LA DATA
Integración con cualquier fuente de datos
externa y plataformas de activación
Perfiles
persistentes con
una única vista del
cliente
Control sobre la
recolección,
segmentación y
activación sin
requerir recursos de
IT
Customer Data Platform CDP
26. 1st Party Data - Digital Assets
(Pixel, SDK)
1st Party Data - Systems
(CRM, ERP, CVS, ...)
Customer Data Platform
(CDP)
Basic Data Sources
3rd Party Data - Online
(DMP / Data Providers)
27. Data Activations
Publicidad
Digital Predictiva
DSP, AdWords, FB
Personalización
Predictiva
Web, Mobile
Email
Marketing
Predictivo
Mailchimp, other
Call Center
Outbound
Predictivo
Mobile
SMS / Push
Predictivos
CDP Prediction Engine
Smart Data Activations
1st Party Data
- Digital Assets
(Pixel, SDK)
1st Party Data
- Systems
(CRM, ERP, CVS, ...)
3rd Party Data
(DMP / Data Providers)
28. Data Activations
Publicidad
Digital
DSP, AdWords, FB
Personalización
Web, Mobile
Email
Marketing
Mailchimp, other
Call Center
Outbound
Mobile
SMS / Push
CDP Prediction Engine
Smart Data Activations
1st Party Data
- Digital Assets
(Pixel, SDK)
1st Party Data
- Systems
(CRM, ERP, CVS, ...)
3rd Party Data
(DMP / Data providers)
29. 1
2
3
QUIZ # 2
Ingresar desde el móvil a:
kahoot.it
Digitar el GAME PIN que se
mostrará en esta pantalla e
ingresar luego un NICKNAME
Responder rápidamente
Step by Step
31. AI consiste en clasificar y predecir más
rápido, con más variables y en mayor
volumen que los humanos sin AI
Gartner
¿Que es Artificial Intelligence?
32. Cognitive Computing
Cognitive Science
(Estudia cerebro humano)
Computer Science Cognitive Computing
+ =
Buscar permitir a un ordenador simular el pensamiento
humano y copiar el funcionamiento del cerebro
33. AI, Machine Learning y Deep Learning
Machine Learning
Frameworks
Deep Learning
Frameworks
AI Frameworks
Cognitive
Architectures
34. Capacidad de los ordenadores de aprender sin
programación previa mediante algoritmos que reconocen
patrones y hacen deducciones lógicas de valor.
Machine Learning
35. Deep Learning
ANN: Artificial Neural Networks
Algoritmos: modelados de la misma
forma como el cerebro procesa data
“Deep”: redes de nodos en cientos
de capas
DNN: Deep Neural Networks
INPUT
OUTPUT
HIDDEN
36. 1
2
3
QUIZ # 3
Ingresar desde el móvil a:
kahoot.it
Digitar el GAME PIN que se
mostrará en esta pantalla e
ingresar luego un NICKNAME
Responder rápidamente
Step by Step
39. DATA + AI: ¿Por qué ahora?
Capacidad de los
ordenadoress por aprender
con mínima programación
Abundante data & bajos
costos de almacenamiento
Mayor capacidad de
procesamiento (CPUs, GPUs)
Avances en la tecnología
Deep Learning
41. EPICA es una plataforma de Predicciones como Servicio que
captura, rastrea y analiza todo tipo de data de fuentes online
y offline para predecir todo tipo de resultados y
comportamientos
42. EPICA está construida con algoritmos de machine learning que le permiten
predecir:
Ventas Audiencias
Resultados
Deportivos
Demanda
Intereses
Desempeño
Publicitario
43. Modelos Predictivos
Motor de Recomendaciones
para predicciones automáticas
(filtering) sobre los intereses del usuario
Modelos de Clasificación
para detección de género
y compradores potenciales
Modelos Generalizados
para factorizar matrices
Redes Neuronales
para matching de anónimos
Word2Vec
para vectorizar contenido
de las páginas web
ARIMA Forecast ETS
para predecir valores futuros
basados en valores existentes
44. Data Activations
Publicidad
Digital
Predictiva
DSP, AdWords, FB
Personalización
Predictiva
Web, Mobile
Email
Marketing
Predictivo
Mailchimp, other
Call Center
Outbound
Predictivo
Mobile
SMS / Push
Predictivos
CDP Prediction Engine
Tech Overview
1st Party Data
- Digital Assets
(Pixel, SDK)
1st Party Data
- Systems
(CRM, ERP, CVS, ...)
3rd 2nd
Party Data Party Data
(Data providers) (Data Partners)
45. 1
2
3
QUIZ # 4
Ingresar desde el móvil a:
kahoot.it
Digitar el GAME PIN que se
mostrará en esta pantalla e
ingresar luego un NICKNAME
Responder rápidamente
Step by Step