Customer Analytics
Presenta:
Pablo Maldonado
Introducción
En esta plática
INTEGRACIÓN Y
TRANSFORMACIÓN
ANALYTICS VISUALIZATIONANÁLISIS VISUALIZACIÓN
Técnicas para entender mejor a nuestros
clients y tomar decisiones clave para mejorar
nuestro negocio, usando ciencia de datos
Quién soy?
• Doctor en Matemáticas Aplicadas (Universidad París VI)
• Consultor Independiente
• Machine Learning / Deep Learning / Reinforcement Learning
• Customer Analytics, Fraude / Anti-lavado de dinero, Procesamiento de texto
• Startups y organizaciones globales
• Profesor Universitario
• Universidad Tecnológica de la República Checa, Praga CZ
• Centro de Investigación Económica y Estudios de Posgrado, Praga
Segmentación de mercado
Qué es segmentación de mercado?
• Segmentación de mercado es el
proceso de organizar nuestro
mercado en grupos con características
semejantes
Podemos clasificar a nuestros clientes
de acuerdo a distintos criterios:
- Historial de compras
- Categorías de interés
- Productos en común
Qué es k-medias?
• K-means es un algoritmo de
segmentación (clustering)
• Clustering es el proceso de organizar
datos que comparten características
semejantes
Cómo funciona?
1. Se escogen k puntos de nuestro conjunto de datos al
azar.
2. Para cada punto, se calcula la semejanza con cada
uno de estos k puntos, y asociamos cada punto con
el más cercano entre ellos. Estos son los clusters.
3. Para cada cluster, se toma el promedio de los puntos
que lo componen como nuevo centroide y se repite
el algoritmo hasta que la suma de cuadrados en el
cluster deje de decrecer.
Ejemplo
Cuántos clusters se necesitan?
Hay muchos métodos para
determinar esto. El método del
codo funciona como sigue:
- Corremos k-medias para
diferentes valores de k
- Guardamos la suma de
cuadrados intra-cluster
- Creamos una gráfica como la
de la izquierda y buscamos el
punto de inflexión (el codo).
Pasos – Segmentación de mercado
1. Crear resumen RFM
2. Discretización
3. Clustering
4. Explicar los resultados
Resumen básico de los clientes:
- Recency el número de días
desde la última compra.
- Frequency el número de
compras.
- Monetary total de dinero
gastado.
Este paso es importante para
- Poner las cantidades a escala
- Hacer segmentación que tenga sentido“
- Hay una diferencia enorme entre
gastar 0 o 10 pesos, pero no tanto
entre gastar 1000 y 1010.
Paso 0: Cargar los datos
Paso 1: Resumen RFM
Paso 2: Discretización
Los valores de cada segmento se
obtienen
- Visualmente
- Usando quantiles
Paso 3: Clustering
Paso 3: Clustering
Paso 4: Interpretar los resultados
Paso 5: Como leer las leyendas
- LHH: Segmento diamante, mejores clientes.
- HHH: Bellas durmientes.
- HHL: No gastan mucho, pero si el objetivo es
incrementar la presencia en el mercado, vale la
pena reactivar.
- HLH: Vale la pena reactivar si el objetivo es
incrementar ventas.
- HLL: Probablemente perdidos.
Churn y CLV
Motivación
• A qué clientes
debemos dirigirnos?
• Cómo dirigirnos a
ellos y por qué
canales?
Adquisición
• Quiénes son
nuestros clientes en
riesgo?
• Por qué se van?
Retención
• Qué clientes tienen
potencial para
ofrecerles nuevos
productos o
servicios?
Desarrollo
Customer Lifetime Value
Qué es Customer Lifetime Value?
Customer Lifetime Value (CLV) es el valor
presente esperado de todas las
transacciones futuras de un cliente
mientras este siga activo
La suma de CLVs de los clientes presentes
y futuros se llama Customer Equity (CE).
Customer Equity es
crucial para empresas
orientadas a servicios, ya
que la mayor parte de
sus ingresos viene de
relaciones a largo
plazo con sus clientes
Estimando Customer Equity
En su “Q2 2014 Earnings Conference Call” el
CFO de Amazon dijo que “[a]ctive customer
accounts exceeded 250 million,” considerando
como activos los clientes que hicieron una
compra en los doce meses previos.
En base a los números presentados por
Vodafone Group Plc’s al final de marzo 2014,
vemos que Vodafone UK tenía 11.7 million
“tarifa mensual” de clientes los doce meses
previos.
Pregunta: Qué empresa tiene mejor idea de su customer equity?
Modelos probabilísticos
La idea es descubrir propiedades
latentes de los clientes para
inferir comportamientos futuros
Hipótesis del modelo
A cada momento de decisión, cada cliente tira una
moneda y decide si
❖Comprar/no comprar
❖Morir/vivir
Cada quién tiene dos monedas únicas.
Todos los modelos que
mostraremos se basan
en la misma idea.
Discreto contra continuo
Eshops
Workflow
Transacciones
RFM
Workflow (2)
RFM
Calibración Validación
Calcular el
monto
promedio
de la
transacción
CLV
Calibrar un modelo Pareto /
NBD model usando Recency
y Frequency solamente
Suponemos que el gasto en
cada transacción sigue una
distribución normal
Patrones
probabilísticos de
compra
Implementaciones
• Excel! (Bruce Hardie)
http://www.brucehardie.com/notes/004/
• BTYD (R package)
https://cran.r-project.org/web/packages/BTYD/index.html
• BTYD Plus
https://github.com/mplatzer/BTYDplus
• Lifetimes (Python)
https://github.com/CamDavidsonPilon/lifetimes
BTYD
BTYD (cont.)
Realidad vs Validación
Realidad vs Validación
Cómo se usa esto en práctica?
Customer Analytics
High-Level Overview
Segmento valioso
Reactivación
necesaria
Qué pasó?
Customer Analytics
Identificar clientes en riesgo
Set churn threshold
of interest
High-value customer
with high churn risk!
Resumen de cada cliente
Intereses principales
Filtro interactivo
Casos más avanzados
Segmentación de mercado - Telco
• 80% del tráfico en la red de la empresa de
telecomunicaciones promedio en Europa genera
20% del ingreso, en parte por el incremento en el
uso de datos.
• Necesidad creciente en el sector de utilizar los
datos de los clientes para mejorar procesos
internos y monetizarlos externamente.
Segmentación – Patrones de navegación
Modelos
Funciona?
• CTR en caída constante (de 44% to 0.2%, 49% son bots)
• 70% incremento en CTR
• 4x ventas
• Nuevas fuentes de ingreso (reventa de datos agregados)
Pablo Maldonado
@pablito_prague
www.linkedin.com/in/jpmaldo
info@pablomaldonado.org
www.pablomaldonado.org

Customer Analytics

  • 1.
  • 2.
  • 3.
    En esta plática INTEGRACIÓNY TRANSFORMACIÓN ANALYTICS VISUALIZATIONANÁLISIS VISUALIZACIÓN Técnicas para entender mejor a nuestros clients y tomar decisiones clave para mejorar nuestro negocio, usando ciencia de datos
  • 4.
    Quién soy? • Doctoren Matemáticas Aplicadas (Universidad París VI) • Consultor Independiente • Machine Learning / Deep Learning / Reinforcement Learning • Customer Analytics, Fraude / Anti-lavado de dinero, Procesamiento de texto • Startups y organizaciones globales • Profesor Universitario • Universidad Tecnológica de la República Checa, Praga CZ • Centro de Investigación Económica y Estudios de Posgrado, Praga
  • 5.
  • 6.
    Qué es segmentaciónde mercado? • Segmentación de mercado es el proceso de organizar nuestro mercado en grupos con características semejantes Podemos clasificar a nuestros clientes de acuerdo a distintos criterios: - Historial de compras - Categorías de interés - Productos en común
  • 7.
    Qué es k-medias? •K-means es un algoritmo de segmentación (clustering) • Clustering es el proceso de organizar datos que comparten características semejantes
  • 8.
    Cómo funciona? 1. Seescogen k puntos de nuestro conjunto de datos al azar. 2. Para cada punto, se calcula la semejanza con cada uno de estos k puntos, y asociamos cada punto con el más cercano entre ellos. Estos son los clusters. 3. Para cada cluster, se toma el promedio de los puntos que lo componen como nuevo centroide y se repite el algoritmo hasta que la suma de cuadrados en el cluster deje de decrecer.
  • 9.
  • 10.
    Cuántos clusters senecesitan? Hay muchos métodos para determinar esto. El método del codo funciona como sigue: - Corremos k-medias para diferentes valores de k - Guardamos la suma de cuadrados intra-cluster - Creamos una gráfica como la de la izquierda y buscamos el punto de inflexión (el codo).
  • 11.
    Pasos – Segmentaciónde mercado 1. Crear resumen RFM 2. Discretización 3. Clustering 4. Explicar los resultados Resumen básico de los clientes: - Recency el número de días desde la última compra. - Frequency el número de compras. - Monetary total de dinero gastado. Este paso es importante para - Poner las cantidades a escala - Hacer segmentación que tenga sentido“ - Hay una diferencia enorme entre gastar 0 o 10 pesos, pero no tanto entre gastar 1000 y 1010.
  • 12.
    Paso 0: Cargarlos datos
  • 13.
  • 14.
    Paso 2: Discretización Losvalores de cada segmento se obtienen - Visualmente - Usando quantiles
  • 15.
  • 16.
  • 17.
    Paso 4: Interpretarlos resultados
  • 18.
    Paso 5: Comoleer las leyendas - LHH: Segmento diamante, mejores clientes. - HHH: Bellas durmientes. - HHL: No gastan mucho, pero si el objetivo es incrementar la presencia en el mercado, vale la pena reactivar. - HLH: Vale la pena reactivar si el objetivo es incrementar ventas. - HLL: Probablemente perdidos.
  • 19.
  • 20.
    Motivación • A quéclientes debemos dirigirnos? • Cómo dirigirnos a ellos y por qué canales? Adquisición • Quiénes son nuestros clientes en riesgo? • Por qué se van? Retención • Qué clientes tienen potencial para ofrecerles nuevos productos o servicios? Desarrollo Customer Lifetime Value
  • 21.
    Qué es CustomerLifetime Value? Customer Lifetime Value (CLV) es el valor presente esperado de todas las transacciones futuras de un cliente mientras este siga activo La suma de CLVs de los clientes presentes y futuros se llama Customer Equity (CE). Customer Equity es crucial para empresas orientadas a servicios, ya que la mayor parte de sus ingresos viene de relaciones a largo plazo con sus clientes
  • 22.
    Estimando Customer Equity Ensu “Q2 2014 Earnings Conference Call” el CFO de Amazon dijo que “[a]ctive customer accounts exceeded 250 million,” considerando como activos los clientes que hicieron una compra en los doce meses previos. En base a los números presentados por Vodafone Group Plc’s al final de marzo 2014, vemos que Vodafone UK tenía 11.7 million “tarifa mensual” de clientes los doce meses previos. Pregunta: Qué empresa tiene mejor idea de su customer equity?
  • 23.
    Modelos probabilísticos La ideaes descubrir propiedades latentes de los clientes para inferir comportamientos futuros
  • 24.
    Hipótesis del modelo Acada momento de decisión, cada cliente tira una moneda y decide si ❖Comprar/no comprar ❖Morir/vivir Cada quién tiene dos monedas únicas. Todos los modelos que mostraremos se basan en la misma idea.
  • 25.
  • 26.
  • 27.
    Workflow (2) RFM Calibración Validación Calcularel monto promedio de la transacción CLV Calibrar un modelo Pareto / NBD model usando Recency y Frequency solamente Suponemos que el gasto en cada transacción sigue una distribución normal Patrones probabilísticos de compra
  • 28.
    Implementaciones • Excel! (BruceHardie) http://www.brucehardie.com/notes/004/ • BTYD (R package) https://cran.r-project.org/web/packages/BTYD/index.html • BTYD Plus https://github.com/mplatzer/BTYDplus • Lifetimes (Python) https://github.com/CamDavidsonPilon/lifetimes
  • 29.
  • 30.
  • 31.
  • 32.
  • 33.
    Cómo se usaesto en práctica?
  • 34.
    Customer Analytics High-Level Overview Segmentovalioso Reactivación necesaria Qué pasó?
  • 35.
    Customer Analytics Identificar clientesen riesgo Set churn threshold of interest High-value customer with high churn risk!
  • 36.
    Resumen de cadacliente Intereses principales Filtro interactivo
  • 37.
  • 38.
    Segmentación de mercado- Telco • 80% del tráfico en la red de la empresa de telecomunicaciones promedio en Europa genera 20% del ingreso, en parte por el incremento en el uso de datos. • Necesidad creciente en el sector de utilizar los datos de los clientes para mejorar procesos internos y monetizarlos externamente.
  • 39.
  • 40.
  • 41.
    Funciona? • CTR encaída constante (de 44% to 0.2%, 49% son bots) • 70% incremento en CTR • 4x ventas • Nuevas fuentes de ingreso (reventa de datos agregados)
  • 42.