Existen varios métodos que pueden ser usados para generar perfiles de clientes, tales como ANOVA, POSANOVA, arboles de decisión, categorización de variables; igualmente hay varias variables que son de interés a los investigadores y líderes, variables como el churn, los accidentes, eventos de compras y la calidad de los pagos de los deudores entre otras. La metodología final que se debe usar para cada pronóstico depende de cada situación particular, teniendo en cuenta la información con la que se cuenta, el tiempo y los recursos disponibles. Este trabajo explica un caso exitoso del uso de métodos de segmentación y pronostico aplicados al pronóstico de churn, explicando en el proceso el porqué de cada uno de los factores que se tuvieron en cuenta al diseñar la metodología. El uso de la nueva metodología mejoró la precisión del pronóstico, permitiendo un pronóstico diario de alta precisión, que al mismo tiempo del desarrollo fue automatizado y puesto en producción con muy buenos resultados.
Mejorando el poder predictivo de los métodos de pronóstico de CHURN a través de la segmentación de los clientes
1. MEJORANDO EL PODER
PREDICTIVO DE LOS MÉTODOS
DE PRONÓSTICO A TRAVÉS DE
LA SEGMENTACIÓN DE LOS
CLIENTES.
Darwin Amézquita, Master en Economía
Analytics
2. SOBRE MI
Pregrado y maestría en Economía en la Universidad de
Los Andes.
Trabajo desde hace 2 años como jefe de Cobranzas para
Decision Analytics. Directv, Gerencia de Decision
Analytics.
Trabajé 3 años como Director de Modelos en la gerencia
de Portafolio. Colpatria-Scotia Bank, Gerencia de Modelos.
Autor y Co-autor de 5 Papers presentados en el SAS
Global Forum/Conferencia de Analytics de SAS.
13. OPORTUNIDAD
¿Qué? • Mejorar el Pronóstico de Churn
• Tener un seguimiento diario
¿Por qué? • Ineficiencias
• Decisiones
¿Cómo? • Usando Anaytics
• Segmentación de Clientes
Resultado
• Proceso diario
• Mejora en la precisión
• Mejora en el churn
15. Mora
Cargue a
Gestión
DX RX
Vencimiento
Factura
Día 15 de
Mora
Vencimiento
2da Factura
Día 50 de
Mora
Inicio
Pronóstico
Tasas de efectividad
PRONÓSTICO - ANTERIOR
Churn Neto
Inicio
Pronóstico
Clientes DX Churn Neto
16. METODOLOGÍA
• Para usar la metodología de ANOVA/POST ANOVA
es necesario categorizar todas las variables
• Bining Interactivo (SAS Miner) Gini Impurity
Transformación
de variables
• Se seleccionan las variables que según la ANOVA
tengan categorías con medias estadísticamente
diferentes.
Selección de
variables
• A través de la POSANOVA
• Se definen cuales son los perfiles de clientes que
tienen medias estadísticamente diferencias
Generación de
perfiles
• Si tu objetivo es pronosticar, debes buscar el mejor
modelo que sirva para tal fin. Se hizo Backtesting
usando 3 meses hacía adelante, con base en eso se
escogía la mejor metodología y se hacían ajustes.
Backtesting
17. METODOLOGÍA
• Para usar la metodología de ANOVA/POST ANOVA
es necesario categorizar todas las variables
• Bining Interactivo (SAS Miner) Gini Impurity
Transformación
de variables
• Se seleccionan las variables que según la ANOVA
tengan categorías con medias estadísticamente
diferentes.
Selección de
variables
• A través de la POSANOVA
• Se definen cuales son los perfiles de clientes que
tienen medias estadísticamente diferencias
Generación de
perfiles
• Si tu objetivo es pronosticar, debes buscar el mejor
modelo que sirva para tal fin. Se hizo Backtesting
usando 3 meses hacía adelante, con base en eso se
escogía la mejor metodología y se hacían ajustes.
Backtesting
19. METODOLOGÍA
• Para usar la metodología de ANOVA/POST ANOVA
es necesario categorizar todas las variables
• Bining Interactivo (SAS Miner) Gini Impurity
Transformación
de variables
• Se seleccionan las variables que según la ANOVA
tengan categorías con medias estadísticamente
diferentes.
Selección de
variables
• A través de la POSANOVA
• Se definen cuales son los perfiles de clientes que
tienen medias estadísticamente diferencias
Generación de
perfiles
• Si tu objetivo es pronosticar, debes buscar el mejor
modelo que sirva para tal fin. Se hizo Backtesting
usando 3 meses hacía adelante, con base en eso se
escogía la mejor metodología y se hacían ajustes.
Backtesting
20. METODOLOGÍA
• Para usar la metodología de ANOVA/POST ANOVA
es necesario categorizar todas las variables
• Bining Interactivo (SAS Miner) Gini Impurity
Transformación
de variables
• Se seleccionan las variables que según la ANOVA
tengan categorías con medias estadísticamente
diferentes.
Selección de
variables
• A través de la POSANOVA
• Se definen cuales son los perfiles de clientes que
tienen medias estadísticamente diferencias
Generación de
perfiles
• Si tu objetivo es pronosticar, debes buscar el mejor
modelo que sirva para tal fin. Se hizo Backtesting
usando 3 meses hacía adelante, con base en eso se
escogía la mejor metodología y se hacían ajustes.
Backtesting
21. METODOLOGÍA
• Para usar la metodología de ANOVA/POST ANOVA
es necesario categorizar todas las variables
• Bining Interactivo (SAS Miner) Gini Impurity
Transformación
de variables
• Se seleccionan las variables que según la ANOVA
tengan categorías con medias estadísticamente
diferentes.
Selección de
variables
• A través de la POSANOVA
• Se definen cuales son los perfiles de clientes que
tienen medias estadísticamente diferencias
Generación de
perfiles
• Si tu objetivo es pronosticar, debes buscar el mejor
modelo que sirva para tal fin. Se hizo Backtesting
usando 3 meses hacía adelante, con base en eso se
escogía la mejor metodología y se hacían ajustes.
Backtesting
Source DF Mean Square F Value Pr > F
GRP_dias_para_dx 3 138.548.699 16.85 <.0001
GRP_nivel_de_riesgo_ 3 0,63452907 7.72 <.0001
GRP_ANTIGUEDAD_2 3 0,29126066 3.54 0.0141
perfil 2 0,48325008 5.88 0.0029
GRP_Producto 5 0,03007973 0.37 0.8722
MOP_ACTUAL 3 0,01519597 0.18 0.9068
GRP_dias_para*perfil 6 0,24270575 2.95 0.0072
GRP_dias_*GRP_Produc 15 0,06638425 0.81 0.6705
GRP_nivel_de_*perfil 6 0,16194953 1.97 0.0669
GRP_nivel*MOP_ACTUAL 9 0,1167049 1.42 0.1743
GRP_ANTIG*MOP_ACTUAL 9 0,1654189 2.01 0.0347
22. METODOLOGÍA
• Para usar la metodología de ANOVA/POST ANOVA
es necesario categorizar todas las variables
• Bining Interactivo (SAS Miner) Gini Impurity
Transformación
de variables
• Se seleccionan las variables que según la ANOVA
tengan categorías con medias estadísticamente
diferentes.
Selección de
variables
• A través de la POSANOVA
• Se definen cuales son los perfiles de clientes que
tienen medias estadísticamente diferencias
Generación de
perfiles
• Si tu objetivo es pronosticar, debes buscar el mejor
modelo que sirva para tal fin. Se hizo Backtesting
usando 3 meses hacía adelante, con base en eso se
escogía la mejor metodología y se hacían ajustes.
Backtesting
23. METODOLOGÍA
• Para usar la metodología de ANOVA/POST ANOVA
es necesario categorizar todas las variables
• Bining Interactivo (SAS Miner) Gini Impurity
Transformación
de variables
• Se seleccionan las variables que según la ANOVA
tengan categorías con medias estadísticamente
diferentes.
Selección de
variables
• A través de la POSANOVA
• Se definen cuales son los perfiles de clientes que
tienen medias estadísticamente diferencias
Generación de
perfiles
• Si el objetivo es pronosticar, debes buscar el mejor
modelo que sirva para tal fin. Se hizo Backtesting
usando 3 meses hacía adelante, con base en eso se
escogía la mejor metodología y se hacían ajustes.
Backtesting
24. ANOVA - ANTIDESCONEXION
Variables escogidas para la antidescionexión:
Pendiente de la mora
Antigüedad
Nivel de Riesgo
Días para la DX
Producto + Método de pago.
25. ANOVA - RECONEXIÓN
Variables escogidas para la Reconexión:
Pendiente de la mora
Antigüedad
Nivel de Riesgo
Día de la RX * Días desde la DX
Tecnología.
33. CONCLUSIONES
Hay ganancias significativas en el poder predictivo
de los pronósticos de churn.
Cada evento a pronóstico requiere un nuevo
proceso de categorización de variables, selección
de variables y selección de perfiles.
En el caso presentado anteriormente las tasas de
Desconexión y Reconexión son evidentemente
distintos entre perfiles.
El método de selección de perfiles con la ANOVA y
POST-ANOVA es un método eficiente para fines
prácticos de mejorar la predicción del modelo de
pronóstico.
This paper is about the optimization of a collection campaign
The collection campaign is the process design to recover money from delinquent clients.
WHY? because we found that the process as it was, was inefficient spending too much time, labor and money.
We decided to optimize the process using SAS solution like Data integration, Information MAP, Customer Intelligence and web report studio, as well as ANALITYC.
The goal was to create an automated and smarter process that would help us to improve collection and decrease churn.
To understand this presentation is important to now what a churner is:
Churners are the clients that fail to pay their bills and are disconnected from the company.