SlideShare una empresa de Scribd logo
1 de 35
MEJORANDO EL PODER
PREDICTIVO DE LOS MÉTODOS
DE PRONÓSTICO A TRAVÉS DE
LA SEGMENTACIÓN DE LOS
CLIENTES.
Darwin Amézquita, Master en Economía
Analytics
SOBRE MI
 Pregrado y maestría en Economía en la Universidad de
Los Andes.
 Trabajo desde hace 2 años como jefe de Cobranzas para
Decision Analytics. Directv, Gerencia de Decision
Analytics.
 Trabajé 3 años como Director de Modelos en la gerencia
de Portafolio. Colpatria-Scotia Bank, Gerencia de Modelos.
 Autor y Co-autor de 5 Papers presentados en el SAS
Global Forum/Conferencia de Analytics de SAS.
INTRODUCCIÓN
 Antecedentes
 Oportunidad de Negocio
 Desarrollo
 Segmentación de Clientes
 Selección de Variable
 Back Testing
 Resultados
 Conclusiones
INTRODUCCIÓN
 Antecedentes
 Oportunidad de Negocio
 Desarrollo
 Selección de Variable
 Segmentación de Clientes
 Back Testing
 Resultados
 Conclusiones
INTRODUCCIÓN
 Antecedentes
 Oportunidad de Negocio
 Desarrollo
 Selección de Variable
 Segmentación de Clientes
 Back Testing
 Resultados
 Conclusiones
INTRODUCCIÓN
 Antecedentes
 Oportunidad de Negocio
 Desarrollo
 Selección de Variable
 Segmentación de Clientes
 Back Testing
 Resultados
 Conclusiones
INTRODUCCIÓN
 Antecedentes
 Oportunidad de Negocio
 Desarrollo
 Selección de Variable
 Segmentación de Clientes
 Back Testing
 Resultados
 Conclusiones
INTRODUCCIÓN
 Antecedentes
 Oportunidad de Negocio
 Desarrollo
 Selección de Variable
 Segmentación de Clientes
 Back Testing
 Resultados
 Conclusiones
INTRODUCCIÓN
 Antecedentes
 Oportunidad de Negocio
 Desarrollo
 Selección de Variable
 Segmentación de Clientes
 Back Testing
 Resultados
 Conclusiones
Hacer predicciones es muy difícil,
especialmente cuando se trata del
futuro…
(Niels Bohr)
Premio Novel de física en 1922.
Mora
Cargue a
Gestión
DX RX
Vencimiento
Factura
Día 15 de
Mora
Vencimiento
2da Factura
Día 50 de
Mora
Inicio
Pronóstico
Tasas de efectividad
PRONÓSTICO - ANTERIOR
Churn Neto
INTRODUCCIÓN
 Antecedentes
 Oportunidad de Negocio
 Desarrollo
 Selección de Variable
 Segmentación de Clientes
 Back Testing
 Resultados
 Conclusiones
OPORTUNIDAD
¿Qué? • Mejorar el Pronóstico de Churn
• Tener un seguimiento diario
¿Por qué? • Ineficiencias
• Decisiones
¿Cómo? • Usando Anaytics
• Segmentación de Clientes
Resultado
• Proceso diario
• Mejora en la precisión
• Mejora en el churn
INTRODUCCIÓN
 Antecedentes
 Oportunidad de Negocio
 Desarrollo
 Segmentación de Clientes
 Selección de Variable
 Back Testing
 Resultados
 Conclusiones
Mora
Cargue a
Gestión
DX RX
Vencimiento
Factura
Día 15 de
Mora
Vencimiento
2da Factura
Día 50 de
Mora
Inicio
Pronóstico
Tasas de efectividad
PRONÓSTICO - ANTERIOR
Churn Neto
Inicio
Pronóstico
Clientes DX Churn Neto
METODOLOGÍA
• Para usar la metodología de ANOVA/POST ANOVA
es necesario categorizar todas las variables
• Bining Interactivo (SAS Miner) Gini Impurity
Transformación
de variables
• Se seleccionan las variables que según la ANOVA
tengan categorías con medias estadísticamente
diferentes.
Selección de
variables
• A través de la POSANOVA
• Se definen cuales son los perfiles de clientes que
tienen medias estadísticamente diferencias
Generación de
perfiles
• Si tu objetivo es pronosticar, debes buscar el mejor
modelo que sirva para tal fin. Se hizo Backtesting
usando 3 meses hacía adelante, con base en eso se
escogía la mejor metodología y se hacían ajustes.
Backtesting
METODOLOGÍA
• Para usar la metodología de ANOVA/POST ANOVA
es necesario categorizar todas las variables
• Bining Interactivo (SAS Miner) Gini Impurity
Transformación
de variables
• Se seleccionan las variables que según la ANOVA
tengan categorías con medias estadísticamente
diferentes.
Selección de
variables
• A través de la POSANOVA
• Se definen cuales son los perfiles de clientes que
tienen medias estadísticamente diferencias
Generación de
perfiles
• Si tu objetivo es pronosticar, debes buscar el mejor
modelo que sirva para tal fin. Se hizo Backtesting
usando 3 meses hacía adelante, con base en eso se
escogía la mejor metodología y se hacían ajustes.
Backtesting
CATEGORIZACIÓN
METODOLOGÍA
• Para usar la metodología de ANOVA/POST ANOVA
es necesario categorizar todas las variables
• Bining Interactivo (SAS Miner) Gini Impurity
Transformación
de variables
• Se seleccionan las variables que según la ANOVA
tengan categorías con medias estadísticamente
diferentes.
Selección de
variables
• A través de la POSANOVA
• Se definen cuales son los perfiles de clientes que
tienen medias estadísticamente diferencias
Generación de
perfiles
• Si tu objetivo es pronosticar, debes buscar el mejor
modelo que sirva para tal fin. Se hizo Backtesting
usando 3 meses hacía adelante, con base en eso se
escogía la mejor metodología y se hacían ajustes.
Backtesting
METODOLOGÍA
• Para usar la metodología de ANOVA/POST ANOVA
es necesario categorizar todas las variables
• Bining Interactivo (SAS Miner) Gini Impurity
Transformación
de variables
• Se seleccionan las variables que según la ANOVA
tengan categorías con medias estadísticamente
diferentes.
Selección de
variables
• A través de la POSANOVA
• Se definen cuales son los perfiles de clientes que
tienen medias estadísticamente diferencias
Generación de
perfiles
• Si tu objetivo es pronosticar, debes buscar el mejor
modelo que sirva para tal fin. Se hizo Backtesting
usando 3 meses hacía adelante, con base en eso se
escogía la mejor metodología y se hacían ajustes.
Backtesting
METODOLOGÍA
• Para usar la metodología de ANOVA/POST ANOVA
es necesario categorizar todas las variables
• Bining Interactivo (SAS Miner) Gini Impurity
Transformación
de variables
• Se seleccionan las variables que según la ANOVA
tengan categorías con medias estadísticamente
diferentes.
Selección de
variables
• A través de la POSANOVA
• Se definen cuales son los perfiles de clientes que
tienen medias estadísticamente diferencias
Generación de
perfiles
• Si tu objetivo es pronosticar, debes buscar el mejor
modelo que sirva para tal fin. Se hizo Backtesting
usando 3 meses hacía adelante, con base en eso se
escogía la mejor metodología y se hacían ajustes.
Backtesting
Source DF Mean Square F Value Pr > F
GRP_dias_para_dx 3 138.548.699 16.85 <.0001
GRP_nivel_de_riesgo_ 3 0,63452907 7.72 <.0001
GRP_ANTIGUEDAD_2 3 0,29126066 3.54 0.0141
perfil 2 0,48325008 5.88 0.0029
GRP_Producto 5 0,03007973 0.37 0.8722
MOP_ACTUAL 3 0,01519597 0.18 0.9068
GRP_dias_para*perfil 6 0,24270575 2.95 0.0072
GRP_dias_*GRP_Produc 15 0,06638425 0.81 0.6705
GRP_nivel_de_*perfil 6 0,16194953 1.97 0.0669
GRP_nivel*MOP_ACTUAL 9 0,1167049 1.42 0.1743
GRP_ANTIG*MOP_ACTUAL 9 0,1654189 2.01 0.0347
METODOLOGÍA
• Para usar la metodología de ANOVA/POST ANOVA
es necesario categorizar todas las variables
• Bining Interactivo (SAS Miner) Gini Impurity
Transformación
de variables
• Se seleccionan las variables que según la ANOVA
tengan categorías con medias estadísticamente
diferentes.
Selección de
variables
• A través de la POSANOVA
• Se definen cuales son los perfiles de clientes que
tienen medias estadísticamente diferencias
Generación de
perfiles
• Si tu objetivo es pronosticar, debes buscar el mejor
modelo que sirva para tal fin. Se hizo Backtesting
usando 3 meses hacía adelante, con base en eso se
escogía la mejor metodología y se hacían ajustes.
Backtesting
METODOLOGÍA
• Para usar la metodología de ANOVA/POST ANOVA
es necesario categorizar todas las variables
• Bining Interactivo (SAS Miner) Gini Impurity
Transformación
de variables
• Se seleccionan las variables que según la ANOVA
tengan categorías con medias estadísticamente
diferentes.
Selección de
variables
• A través de la POSANOVA
• Se definen cuales son los perfiles de clientes que
tienen medias estadísticamente diferencias
Generación de
perfiles
• Si el objetivo es pronosticar, debes buscar el mejor
modelo que sirva para tal fin. Se hizo Backtesting
usando 3 meses hacía adelante, con base en eso se
escogía la mejor metodología y se hacían ajustes.
Backtesting
ANOVA - ANTIDESCONEXION
 Variables escogidas para la antidescionexión:
 Pendiente de la mora
 Antigüedad
 Nivel de Riesgo
 Días para la DX
 Producto + Método de pago.
ANOVA - RECONEXIÓN
 Variables escogidas para la Reconexión:
 Pendiente de la mora
 Antigüedad
 Nivel de Riesgo
 Día de la RX * Días desde la DX
 Tecnología.
INTRODUCCIÓN
 Antecedentes
 Oportunidad de Negocio
 Desarrollo
 Selección de Variable
 Segmentación de Clientes
 Back Testing
 Resultados
 Conclusiones
GANANCIAS EN LAS TASAS DE DX
0%
10%
20%
30%
40%
50%
60%
70%
80%
90%
100%
1_1_1_1_2
1_2_1_1_1
1_2_1_1_2
2_1_1_1_2
1_2_2_1_2
5_2_2_1_1
3_2_1_1_2
3_2_2_2_1
3_2_2_1_2
2_2_2_2_2
4_2_2_1_2
1_1_2_1_2
2_1_1_2_1
4_2_1_2_2
5_1_1_1_2
2_1_2_1_2
5_2_1_1_2
3_1_1_2_2
5_1_2_1_1
4_1_1_2_1
1_1_1_2_1
4_1_1_1_2
4_1_1_1_1
5_1_1_1_1
1_1_2_2_2
2_1_2_1_1
5_2_2_2_1
Tasas de DX por perfil
Tasa DX por Perfil
Promedio
GANANCIAS EN LAS TASAS DE RX
0.0%
5.0%
10.0%
15.0%
20.0%
25.0%
30.0%
35.0%
40.0%
1 2 3 4 5 6 7 8
Tasa de Reconexión por día
Perfil 1
Perfil 2
Perfil 3
Perfil 4
Perfil 5
Perfil 6
Perfil 7
Total
71.9% 71.2%
78.0%
68.8%
81.0%
100.0%
21.4%
88.8%
Perfil 1 Perfil 2 Perfil 3 Perfil 4 Perfil 5 Perfil 6 Perfil 7 Total
Tasa de Reconexión
Diferencias significativas
en las tasas de eventos
PRONÓSTICO ANTERIOR
-2000
-1500
-1000
-500
0
500
1000
1500
2000
2500
3000
-1000
0
1000
2000
3000
4000
5000
6000
01
03
05
07
09
11
13
15
17
19
21
23
25
27
29
31
DX Forecast
DX Real
RX Pronóstico
RX Real
Churners netos pronóstico
Chruners netos real
PRONÓSTICO ACTUAL
-1500
-1000
-500
0
500
1000
1500
2000
2500
3000
-1000
0
1000
2000
3000
4000
5000
6000
01
03
05
07
09
11
13
15
17
19
21
23
25
27
29
DX Forecast
DX Real
RX Pronóstico
RX Real
Churners netos pronóstico
Chruners netos real
GANANCIAS EN LAS TASAS DE DX
0%
10%
20%
30%
40%
50%
60%
70%
80%
90%
100%
1_1_1_1_2
1_2_1_1_1
1_2_1_1_2
2_1_1_1_2
1_2_2_1_2
5_2_2_1_1
3_2_1_1_2
3_2_2_2_1
3_2_2_1_2
2_2_2_2_2
4_2_2_1_2
1_1_2_1_2
2_1_1_2_1
4_2_1_2_2
5_1_1_1_2
2_1_2_1_2
5_2_1_1_2
3_1_1_2_2
5_1_2_1_1
4_1_1_2_1
1_1_1_2_1
4_1_1_1_2
4_1_1_1_1
5_1_1_1_1
1_1_2_2_2
2_1_2_1_1
5_2_2_2_1
Tasas de DX por perfil
Tasa DX por Perfil
Promedio
Perfil
Perfil-Tasa
¿Acciones?
GANANCIA
16.9%
19.4%
43.2%
16.3%
45.3%
30.5%
2.9%
10.6%
14.6%
9.0%
16.4%
4.8%
11.2%
16.6%
13.0%
4.5%
14.2%
Apr-14
May-14
Jun-14
Jul-14
Aug-14
Sep-14
Oct-14
Nov-14
Dec-14
Jan-15
Feb-15
Mar-15
Apr-15
May-15
Jun-15
Jul-15
Aug-15
Desviación absoluta del Forecast
CONCLUSIONES
 Hay ganancias significativas en el poder predictivo
de los pronósticos de churn.
 Cada evento a pronóstico requiere un nuevo
proceso de categorización de variables, selección
de variables y selección de perfiles.
 En el caso presentado anteriormente las tasas de
Desconexión y Reconexión son evidentemente
distintos entre perfiles.
 El método de selección de perfiles con la ANOVA y
POST-ANOVA es un método eficiente para fines
prácticos de mejorar la predicción del modelo de
pronóstico.
¿PREGUNTAS?
CONTACTO
 Darwin Alberto Amezquita
 Business Partner Churn Involuntario
 Decision Analytics|DIRECTV Colombia Ltda
 Cel. (+57) 321 496 9356
 Tel. 6516000 Ext. 1673
 Email: alberto24d@gmail.com
 www.directv.com.co

Más contenido relacionado

Más de Big Data Colombia

Deep learning: el renacimiento de las redes neuronales
Deep learning: el renacimiento de las redes neuronalesDeep learning: el renacimiento de las redes neuronales
Deep learning: el renacimiento de las redes neuronales
Big Data Colombia
 

Más de Big Data Colombia (19)

Machine learning applied in health
Machine learning applied in healthMachine learning applied in health
Machine learning applied in health
 
Whose Balance Sheet is this? Neural Networks for Banks’ Pattern Recognition
Whose Balance Sheet is this? Neural Networks for Banks’ Pattern RecognitionWhose Balance Sheet is this? Neural Networks for Banks’ Pattern Recognition
Whose Balance Sheet is this? Neural Networks for Banks’ Pattern Recognition
 
Analysis of your own Facebook friends’ data structure through graphs
Analysis of your own Facebook friends’ data structure through graphsAnalysis of your own Facebook friends’ data structure through graphs
Analysis of your own Facebook friends’ data structure through graphs
 
Lo datos cuentan su historia
Lo datos cuentan su historiaLo datos cuentan su historia
Lo datos cuentan su historia
 
Entornos Naturalmente Inteligentes
Entornos Naturalmente InteligentesEntornos Naturalmente Inteligentes
Entornos Naturalmente Inteligentes
 
Modelamiento predictivo y medicina
Modelamiento predictivo y medicinaModelamiento predictivo y medicina
Modelamiento predictivo y medicina
 
Ayudando a los Viajeros usando 500 millones de Reseñas Hoteleras al Mes
Ayudando a los Viajeros usando 500 millones de Reseñas Hoteleras al MesAyudando a los Viajeros usando 500 millones de Reseñas Hoteleras al Mes
Ayudando a los Viajeros usando 500 millones de Reseñas Hoteleras al Mes
 
Deep learning: el renacimiento de las redes neuronales
Deep learning: el renacimiento de las redes neuronalesDeep learning: el renacimiento de las redes neuronales
Deep learning: el renacimiento de las redes neuronales
 
IPython & Jupyter
IPython & JupyterIPython & Jupyter
IPython & Jupyter
 
Cloud computing: Trends and Challenges
Cloud computing: Trends and ChallengesCloud computing: Trends and Challenges
Cloud computing: Trends and Challenges
 
Kaggle: Coupon Purchase Prediction
Kaggle: Coupon Purchase PredictionKaggle: Coupon Purchase Prediction
Kaggle: Coupon Purchase Prediction
 
Machine learning y Kaggle
Machine learning y KaggleMachine learning y Kaggle
Machine learning y Kaggle
 
Fraud Analytics
Fraud AnalyticsFraud Analytics
Fraud Analytics
 
Data crunching con Spark
Data crunching con SparkData crunching con Spark
Data crunching con Spark
 
Introducción al Datawarehousing
Introducción al DatawarehousingIntroducción al Datawarehousing
Introducción al Datawarehousing
 
Análisis Explotatorio de Datos: Dejad que la data hable.
Análisis Explotatorio de Datos: Dejad que la data hable.Análisis Explotatorio de Datos: Dejad que la data hable.
Análisis Explotatorio de Datos: Dejad que la data hable.
 
Big Data para mortales
Big Data para mortalesBig Data para mortales
Big Data para mortales
 
Salud, dinero, amor y big data
Salud, dinero, amor y big dataSalud, dinero, amor y big data
Salud, dinero, amor y big data
 
Business Analytics: ¡La culpa es del BIG data!
Business Analytics: ¡La culpa es del BIG data!Business Analytics: ¡La culpa es del BIG data!
Business Analytics: ¡La culpa es del BIG data!
 

Último

metodo SOAP utilizado para evaluar el estado de un paciente
metodo SOAP utilizado para evaluar el estado de un pacientemetodo SOAP utilizado para evaluar el estado de un paciente
metodo SOAP utilizado para evaluar el estado de un paciente
MedicinaInternaresid1
 
PLAN ANUAL DE PROYECTO 2020. para mejorar
PLAN ANUAL DE PROYECTO 2020. para mejorarPLAN ANUAL DE PROYECTO 2020. para mejorar
PLAN ANUAL DE PROYECTO 2020. para mejorar
CelesteRolon2
 
REPORTE DE HOMICIDIO DOLOSO IRAPUATO ABRIL 2024
REPORTE DE HOMICIDIO DOLOSO IRAPUATO ABRIL 2024REPORTE DE HOMICIDIO DOLOSO IRAPUATO ABRIL 2024
REPORTE DE HOMICIDIO DOLOSO IRAPUATO ABRIL 2024
IrapuatoCmovamos
 
INFORME FINAL ESTADISTICA DESCRIPTIVA E INFERENCIAL
INFORME FINAL ESTADISTICA DESCRIPTIVA E INFERENCIALINFORME FINAL ESTADISTICA DESCRIPTIVA E INFERENCIAL
INFORME FINAL ESTADISTICA DESCRIPTIVA E INFERENCIAL
MANUELVILELA7
 
Conversacion.pptx en guarani boliviano latino
Conversacion.pptx en guarani boliviano latinoConversacion.pptx en guarani boliviano latino
Conversacion.pptx en guarani boliviano latino
BESTTech1
 

Último (20)

Análisis del Modo y Efecto de Fallas AMEF.ppt
Análisis del Modo y Efecto de Fallas AMEF.pptAnálisis del Modo y Efecto de Fallas AMEF.ppt
Análisis del Modo y Efecto de Fallas AMEF.ppt
 
P.P ANÁLISIS DE UN TEXTO BÍBLICO. TEMA 10.pptx
P.P ANÁLISIS DE UN TEXTO BÍBLICO. TEMA 10.pptxP.P ANÁLISIS DE UN TEXTO BÍBLICO. TEMA 10.pptx
P.P ANÁLISIS DE UN TEXTO BÍBLICO. TEMA 10.pptx
 
Perú en el ranking mundial, segun datos mineria
Perú en el ranking mundial, segun datos mineriaPerú en el ranking mundial, segun datos mineria
Perú en el ranking mundial, segun datos mineria
 
CUADRO COMPARATIVO DE ARCHIVOS Y CARPETAS.pptx
CUADRO COMPARATIVO DE ARCHIVOS Y CARPETAS.pptxCUADRO COMPARATIVO DE ARCHIVOS Y CARPETAS.pptx
CUADRO COMPARATIVO DE ARCHIVOS Y CARPETAS.pptx
 
El Manierismo. El Manierismo
El Manierismo.              El ManierismoEl Manierismo.              El Manierismo
El Manierismo. El Manierismo
 
Sistema Nacional de Vigilancia en Salud Pública SIVIGILA
Sistema Nacional de Vigilancia en Salud Pública SIVIGILASistema Nacional de Vigilancia en Salud Pública SIVIGILA
Sistema Nacional de Vigilancia en Salud Pública SIVIGILA
 
Alfredo Gabriel Rodriguez Yajure Tarea#1
Alfredo Gabriel Rodriguez Yajure Tarea#1Alfredo Gabriel Rodriguez Yajure Tarea#1
Alfredo Gabriel Rodriguez Yajure Tarea#1
 
Los idiomas más hablados en el mundo (2024).pdf
Los idiomas más hablados en el mundo  (2024).pdfLos idiomas más hablados en el mundo  (2024).pdf
Los idiomas más hablados en el mundo (2024).pdf
 
COMUNICADO PARA TODO TIPO DE REUNIONES .
COMUNICADO PARA TODO TIPO DE REUNIONES .COMUNICADO PARA TODO TIPO DE REUNIONES .
COMUNICADO PARA TODO TIPO DE REUNIONES .
 
procedimiento paran la planificación en los centros educativos tipo v(multig...
procedimiento  paran la planificación en los centros educativos tipo v(multig...procedimiento  paran la planificación en los centros educativos tipo v(multig...
procedimiento paran la planificación en los centros educativos tipo v(multig...
 
diseño de una linea de produccion de jabon liquido.pptx
diseño de una linea de produccion de jabon liquido.pptxdiseño de una linea de produccion de jabon liquido.pptx
diseño de una linea de produccion de jabon liquido.pptx
 
metodo SOAP utilizado para evaluar el estado de un paciente
metodo SOAP utilizado para evaluar el estado de un pacientemetodo SOAP utilizado para evaluar el estado de un paciente
metodo SOAP utilizado para evaluar el estado de un paciente
 
PLAN ANUAL DE PROYECTO 2020. para mejorar
PLAN ANUAL DE PROYECTO 2020. para mejorarPLAN ANUAL DE PROYECTO 2020. para mejorar
PLAN ANUAL DE PROYECTO 2020. para mejorar
 
Adultos Mayores más de 60 años como de la población total (2024).pdf
Adultos Mayores más de 60 años como  de la población total (2024).pdfAdultos Mayores más de 60 años como  de la población total (2024).pdf
Adultos Mayores más de 60 años como de la población total (2024).pdf
 
decreto 2090 de 2003.pdf actividades de alto riesgo en Colombia
decreto 2090 de 2003.pdf actividades de alto riesgo en Colombiadecreto 2090 de 2003.pdf actividades de alto riesgo en Colombia
decreto 2090 de 2003.pdf actividades de alto riesgo en Colombia
 
Las marcas automotrices con más ventas de vehículos (2024).pdf
Las marcas automotrices con más ventas de vehículos (2024).pdfLas marcas automotrices con más ventas de vehículos (2024).pdf
Las marcas automotrices con más ventas de vehículos (2024).pdf
 
REPORTE DE HOMICIDIO DOLOSO IRAPUATO ABRIL 2024
REPORTE DE HOMICIDIO DOLOSO IRAPUATO ABRIL 2024REPORTE DE HOMICIDIO DOLOSO IRAPUATO ABRIL 2024
REPORTE DE HOMICIDIO DOLOSO IRAPUATO ABRIL 2024
 
INFORME FINAL ESTADISTICA DESCRIPTIVA E INFERENCIAL
INFORME FINAL ESTADISTICA DESCRIPTIVA E INFERENCIALINFORME FINAL ESTADISTICA DESCRIPTIVA E INFERENCIAL
INFORME FINAL ESTADISTICA DESCRIPTIVA E INFERENCIAL
 
Las familias más ricas de África en el año (2024).pdf
Las familias más ricas de África en el año (2024).pdfLas familias más ricas de África en el año (2024).pdf
Las familias más ricas de África en el año (2024).pdf
 
Conversacion.pptx en guarani boliviano latino
Conversacion.pptx en guarani boliviano latinoConversacion.pptx en guarani boliviano latino
Conversacion.pptx en guarani boliviano latino
 

Mejorando el poder predictivo de los métodos de pronóstico de CHURN a través de la segmentación de los clientes

  • 1. MEJORANDO EL PODER PREDICTIVO DE LOS MÉTODOS DE PRONÓSTICO A TRAVÉS DE LA SEGMENTACIÓN DE LOS CLIENTES. Darwin Amézquita, Master en Economía Analytics
  • 2. SOBRE MI  Pregrado y maestría en Economía en la Universidad de Los Andes.  Trabajo desde hace 2 años como jefe de Cobranzas para Decision Analytics. Directv, Gerencia de Decision Analytics.  Trabajé 3 años como Director de Modelos en la gerencia de Portafolio. Colpatria-Scotia Bank, Gerencia de Modelos.  Autor y Co-autor de 5 Papers presentados en el SAS Global Forum/Conferencia de Analytics de SAS.
  • 3. INTRODUCCIÓN  Antecedentes  Oportunidad de Negocio  Desarrollo  Segmentación de Clientes  Selección de Variable  Back Testing  Resultados  Conclusiones
  • 4. INTRODUCCIÓN  Antecedentes  Oportunidad de Negocio  Desarrollo  Selección de Variable  Segmentación de Clientes  Back Testing  Resultados  Conclusiones
  • 5. INTRODUCCIÓN  Antecedentes  Oportunidad de Negocio  Desarrollo  Selección de Variable  Segmentación de Clientes  Back Testing  Resultados  Conclusiones
  • 6. INTRODUCCIÓN  Antecedentes  Oportunidad de Negocio  Desarrollo  Selección de Variable  Segmentación de Clientes  Back Testing  Resultados  Conclusiones
  • 7. INTRODUCCIÓN  Antecedentes  Oportunidad de Negocio  Desarrollo  Selección de Variable  Segmentación de Clientes  Back Testing  Resultados  Conclusiones
  • 8. INTRODUCCIÓN  Antecedentes  Oportunidad de Negocio  Desarrollo  Selección de Variable  Segmentación de Clientes  Back Testing  Resultados  Conclusiones
  • 9. INTRODUCCIÓN  Antecedentes  Oportunidad de Negocio  Desarrollo  Selección de Variable  Segmentación de Clientes  Back Testing  Resultados  Conclusiones
  • 10. Hacer predicciones es muy difícil, especialmente cuando se trata del futuro… (Niels Bohr) Premio Novel de física en 1922.
  • 11. Mora Cargue a Gestión DX RX Vencimiento Factura Día 15 de Mora Vencimiento 2da Factura Día 50 de Mora Inicio Pronóstico Tasas de efectividad PRONÓSTICO - ANTERIOR Churn Neto
  • 12. INTRODUCCIÓN  Antecedentes  Oportunidad de Negocio  Desarrollo  Selección de Variable  Segmentación de Clientes  Back Testing  Resultados  Conclusiones
  • 13. OPORTUNIDAD ¿Qué? • Mejorar el Pronóstico de Churn • Tener un seguimiento diario ¿Por qué? • Ineficiencias • Decisiones ¿Cómo? • Usando Anaytics • Segmentación de Clientes Resultado • Proceso diario • Mejora en la precisión • Mejora en el churn
  • 14. INTRODUCCIÓN  Antecedentes  Oportunidad de Negocio  Desarrollo  Segmentación de Clientes  Selección de Variable  Back Testing  Resultados  Conclusiones
  • 15. Mora Cargue a Gestión DX RX Vencimiento Factura Día 15 de Mora Vencimiento 2da Factura Día 50 de Mora Inicio Pronóstico Tasas de efectividad PRONÓSTICO - ANTERIOR Churn Neto Inicio Pronóstico Clientes DX Churn Neto
  • 16. METODOLOGÍA • Para usar la metodología de ANOVA/POST ANOVA es necesario categorizar todas las variables • Bining Interactivo (SAS Miner) Gini Impurity Transformación de variables • Se seleccionan las variables que según la ANOVA tengan categorías con medias estadísticamente diferentes. Selección de variables • A través de la POSANOVA • Se definen cuales son los perfiles de clientes que tienen medias estadísticamente diferencias Generación de perfiles • Si tu objetivo es pronosticar, debes buscar el mejor modelo que sirva para tal fin. Se hizo Backtesting usando 3 meses hacía adelante, con base en eso se escogía la mejor metodología y se hacían ajustes. Backtesting
  • 17. METODOLOGÍA • Para usar la metodología de ANOVA/POST ANOVA es necesario categorizar todas las variables • Bining Interactivo (SAS Miner) Gini Impurity Transformación de variables • Se seleccionan las variables que según la ANOVA tengan categorías con medias estadísticamente diferentes. Selección de variables • A través de la POSANOVA • Se definen cuales son los perfiles de clientes que tienen medias estadísticamente diferencias Generación de perfiles • Si tu objetivo es pronosticar, debes buscar el mejor modelo que sirva para tal fin. Se hizo Backtesting usando 3 meses hacía adelante, con base en eso se escogía la mejor metodología y se hacían ajustes. Backtesting
  • 19. METODOLOGÍA • Para usar la metodología de ANOVA/POST ANOVA es necesario categorizar todas las variables • Bining Interactivo (SAS Miner) Gini Impurity Transformación de variables • Se seleccionan las variables que según la ANOVA tengan categorías con medias estadísticamente diferentes. Selección de variables • A través de la POSANOVA • Se definen cuales son los perfiles de clientes que tienen medias estadísticamente diferencias Generación de perfiles • Si tu objetivo es pronosticar, debes buscar el mejor modelo que sirva para tal fin. Se hizo Backtesting usando 3 meses hacía adelante, con base en eso se escogía la mejor metodología y se hacían ajustes. Backtesting
  • 20. METODOLOGÍA • Para usar la metodología de ANOVA/POST ANOVA es necesario categorizar todas las variables • Bining Interactivo (SAS Miner) Gini Impurity Transformación de variables • Se seleccionan las variables que según la ANOVA tengan categorías con medias estadísticamente diferentes. Selección de variables • A través de la POSANOVA • Se definen cuales son los perfiles de clientes que tienen medias estadísticamente diferencias Generación de perfiles • Si tu objetivo es pronosticar, debes buscar el mejor modelo que sirva para tal fin. Se hizo Backtesting usando 3 meses hacía adelante, con base en eso se escogía la mejor metodología y se hacían ajustes. Backtesting
  • 21. METODOLOGÍA • Para usar la metodología de ANOVA/POST ANOVA es necesario categorizar todas las variables • Bining Interactivo (SAS Miner) Gini Impurity Transformación de variables • Se seleccionan las variables que según la ANOVA tengan categorías con medias estadísticamente diferentes. Selección de variables • A través de la POSANOVA • Se definen cuales son los perfiles de clientes que tienen medias estadísticamente diferencias Generación de perfiles • Si tu objetivo es pronosticar, debes buscar el mejor modelo que sirva para tal fin. Se hizo Backtesting usando 3 meses hacía adelante, con base en eso se escogía la mejor metodología y se hacían ajustes. Backtesting Source DF Mean Square F Value Pr > F GRP_dias_para_dx 3 138.548.699 16.85 <.0001 GRP_nivel_de_riesgo_ 3 0,63452907 7.72 <.0001 GRP_ANTIGUEDAD_2 3 0,29126066 3.54 0.0141 perfil 2 0,48325008 5.88 0.0029 GRP_Producto 5 0,03007973 0.37 0.8722 MOP_ACTUAL 3 0,01519597 0.18 0.9068 GRP_dias_para*perfil 6 0,24270575 2.95 0.0072 GRP_dias_*GRP_Produc 15 0,06638425 0.81 0.6705 GRP_nivel_de_*perfil 6 0,16194953 1.97 0.0669 GRP_nivel*MOP_ACTUAL 9 0,1167049 1.42 0.1743 GRP_ANTIG*MOP_ACTUAL 9 0,1654189 2.01 0.0347
  • 22. METODOLOGÍA • Para usar la metodología de ANOVA/POST ANOVA es necesario categorizar todas las variables • Bining Interactivo (SAS Miner) Gini Impurity Transformación de variables • Se seleccionan las variables que según la ANOVA tengan categorías con medias estadísticamente diferentes. Selección de variables • A través de la POSANOVA • Se definen cuales son los perfiles de clientes que tienen medias estadísticamente diferencias Generación de perfiles • Si tu objetivo es pronosticar, debes buscar el mejor modelo que sirva para tal fin. Se hizo Backtesting usando 3 meses hacía adelante, con base en eso se escogía la mejor metodología y se hacían ajustes. Backtesting
  • 23. METODOLOGÍA • Para usar la metodología de ANOVA/POST ANOVA es necesario categorizar todas las variables • Bining Interactivo (SAS Miner) Gini Impurity Transformación de variables • Se seleccionan las variables que según la ANOVA tengan categorías con medias estadísticamente diferentes. Selección de variables • A través de la POSANOVA • Se definen cuales son los perfiles de clientes que tienen medias estadísticamente diferencias Generación de perfiles • Si el objetivo es pronosticar, debes buscar el mejor modelo que sirva para tal fin. Se hizo Backtesting usando 3 meses hacía adelante, con base en eso se escogía la mejor metodología y se hacían ajustes. Backtesting
  • 24. ANOVA - ANTIDESCONEXION  Variables escogidas para la antidescionexión:  Pendiente de la mora  Antigüedad  Nivel de Riesgo  Días para la DX  Producto + Método de pago.
  • 25. ANOVA - RECONEXIÓN  Variables escogidas para la Reconexión:  Pendiente de la mora  Antigüedad  Nivel de Riesgo  Día de la RX * Días desde la DX  Tecnología.
  • 26. INTRODUCCIÓN  Antecedentes  Oportunidad de Negocio  Desarrollo  Selección de Variable  Segmentación de Clientes  Back Testing  Resultados  Conclusiones
  • 27. GANANCIAS EN LAS TASAS DE DX 0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100% 1_1_1_1_2 1_2_1_1_1 1_2_1_1_2 2_1_1_1_2 1_2_2_1_2 5_2_2_1_1 3_2_1_1_2 3_2_2_2_1 3_2_2_1_2 2_2_2_2_2 4_2_2_1_2 1_1_2_1_2 2_1_1_2_1 4_2_1_2_2 5_1_1_1_2 2_1_2_1_2 5_2_1_1_2 3_1_1_2_2 5_1_2_1_1 4_1_1_2_1 1_1_1_2_1 4_1_1_1_2 4_1_1_1_1 5_1_1_1_1 1_1_2_2_2 2_1_2_1_1 5_2_2_2_1 Tasas de DX por perfil Tasa DX por Perfil Promedio
  • 28. GANANCIAS EN LAS TASAS DE RX 0.0% 5.0% 10.0% 15.0% 20.0% 25.0% 30.0% 35.0% 40.0% 1 2 3 4 5 6 7 8 Tasa de Reconexión por día Perfil 1 Perfil 2 Perfil 3 Perfil 4 Perfil 5 Perfil 6 Perfil 7 Total 71.9% 71.2% 78.0% 68.8% 81.0% 100.0% 21.4% 88.8% Perfil 1 Perfil 2 Perfil 3 Perfil 4 Perfil 5 Perfil 6 Perfil 7 Total Tasa de Reconexión Diferencias significativas en las tasas de eventos
  • 31. GANANCIAS EN LAS TASAS DE DX 0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100% 1_1_1_1_2 1_2_1_1_1 1_2_1_1_2 2_1_1_1_2 1_2_2_1_2 5_2_2_1_1 3_2_1_1_2 3_2_2_2_1 3_2_2_1_2 2_2_2_2_2 4_2_2_1_2 1_1_2_1_2 2_1_1_2_1 4_2_1_2_2 5_1_1_1_2 2_1_2_1_2 5_2_1_1_2 3_1_1_2_2 5_1_2_1_1 4_1_1_2_1 1_1_1_2_1 4_1_1_1_2 4_1_1_1_1 5_1_1_1_1 1_1_2_2_2 2_1_2_1_1 5_2_2_2_1 Tasas de DX por perfil Tasa DX por Perfil Promedio Perfil Perfil-Tasa ¿Acciones?
  • 33. CONCLUSIONES  Hay ganancias significativas en el poder predictivo de los pronósticos de churn.  Cada evento a pronóstico requiere un nuevo proceso de categorización de variables, selección de variables y selección de perfiles.  En el caso presentado anteriormente las tasas de Desconexión y Reconexión son evidentemente distintos entre perfiles.  El método de selección de perfiles con la ANOVA y POST-ANOVA es un método eficiente para fines prácticos de mejorar la predicción del modelo de pronóstico.
  • 35. CONTACTO  Darwin Alberto Amezquita  Business Partner Churn Involuntario  Decision Analytics|DIRECTV Colombia Ltda  Cel. (+57) 321 496 9356  Tel. 6516000 Ext. 1673  Email: alberto24d@gmail.com  www.directv.com.co

Notas del editor

  1. This paper is about the optimization of a collection campaign The collection campaign is the process design to recover money from delinquent clients. WHY? because we found that the process as it was, was inefficient spending too much time, labor and money. We decided to optimize the process using SAS solution like Data integration, Information MAP, Customer Intelligence and web report studio, as well as ANALITYC. The goal was to create an automated and smarter process that would help us to improve collection and decrease churn. To understand this presentation is important to now what a churner is: Churners are the clients that fail to pay their bills and are disconnected from the company.