1. Data Mining:
Aplicaciones en el
sector seguros
Jorge Rodríguez M.
942150982 / RPM: #0025095
jrodriguez@strategicsperu.com
2. Agenda
Resumen
Cambios en las tecnologías de información
Aplicaciones Data Mining en el sector seguros
Aumentar el valor del cliente
Ciclo completo del Customer Intelligence
Vista única del cliente
Modelado predictivo: Definición/Funcionamiento
Ventanas de predicción
Scoring: Esquema/Funcionalidad
Comparación de campañas
Metodología de proyectos Data Mining
Anexos
3. Resumen
Data Mining Es el proceso de seleccionar, explorar y dar forma a grandes cantidades de datos para
descubrir patrones antes desconocidos. En el sector seguros, la minería de datos puede ser un
apoyo fundamental para obtener ventajas competitivas.
Aplicaciones Analizaremos como gracias a la minería de datos, las aseguradoras pueden explotar
íntegramente los datos acerca de los patrones de compra y comportamiento de sus clientes,
en el sector consiguiendo de este modo, entender mejor las motivaciones de los mismos y ayudando con
ello a la reducción del fraude.
seguros
También veremos como las soluciones de minería de datos pueden ayudar a las compañías de
seguros a reducir costos, aumentar beneficios, y conservar y atraer nuevos clientes. Se
detallará también como se puede utilizar la previsión del comportamiento futuro del cliente
como base en el desarrollo de nuevos productos.
Metodología La metodología CRISP (CRoss-Industry Standard Process for Data Mining) es un proceso
jerárquico formado por varias tareas que ofrece a las organizaciones la estructura necesaria
CRISP-DM para obtener mejores y más rápidos resultados en la minería de datos.
Esta metodología, es un modelo genérico adaptable a las necesidades de una empresa o
sector particular.
4. Cambios en las tecnologías de información
Avances en hardware,
software y redes
Innovaciones
tecnológicas como el
Data Mining y el Data
Warehouse
Globalización de los
mercados
Reducción de los costos
de almacenamiento,
acceso y procesamiento
de datos
Las GUI proporcionan
modelos más complejos
e información más
detallada
Generación de modelos
Es tiempo de análisis…
de alta precisión en
mucho menos tiempo
“El que no aplique nuevos remedios debe esperar nuevos
males, porque el tiempo es el máximo innovador.”
Sir Francis Bacon
5. Aplicaciones Data Mining en el sector seguros
Cálculo de primas Captación de nuevos Fidelización de clientes Desarrollo de nuevas
clientes líneas de productos
Creación de informes Detección de siniestros Administración de Estimación de las
de riesgo geográfico fraudulentos campañas sofisticadas provisiones para
siniestros pendientes
7. Ciclo completo de Customer Intelligence
Gestión de Automatización de
Análisis del Cliente
Datos Campañas/Optimización
Vista
Modelado de Administración Contactos
integrada del Segmentación
comportamiento de Campañas Inteligentes
cliente
Enterprise Intelligence Platform
8. Vista única del cliente
Segmentación y Perfilado
Repositorio de clientes Adquisición / Retención
Reactivación
Rentabilidad / Potencial de Clientes
X-Sell / Up-Sell
9. Modelado Predictivo
DEFINICION
Intenta encontrar las reglas que permitan predecir el valor de una
variable objetivo en función de los valores de las variables de entrada.
Variables de Entrada
Objetivo
• Propensión a compra
• Propensión a la fuga
• Propensión a la mora
• Probabilidad de recupero
Casos: • Probabilidad de fraude
• Datos de clientes • Probabilidad de lavado de
• Datos de pacientes dinero
• Datos de usuarios • Probabilidad de default
• Datos de máquinas • Scoring de riesgo crediticio
• Etcétera • Scoring de riesgo médico
• Scoring de riesgo de vida
• Probabilidad de falla
10. ¿Cómo funciona un modelo predictivo?
Datos personales y demográficos
Productos / Servicios contratados
Tipo de cobertura
Historial de siniestros
Historial de pago
Historial de interacciones (Reclamos, Consultas)
Segmento del cliente
Canal de preferencia
Etc.
¿Compró?
¿Pagó?
¿Fugó?
¿Cambió de cobertura?
Clientes
11. Ventanas de predicción
Predicción
Datos Históricos Ventana de Evento
Ventana Operativa
• Recopilación de los datos
• Anticipación del evento
• Acciones de marketing
12. Deducción de la regla de scoring
Hizo llamadas
Id de Cliente Nombre y Apellido Sexo Edad Antigüedad en meses Código Postal ARPU Plan … Fue Churner?
internacionales?
12341 Jorge Rodríguez M 32 48 0001 75 Plan A NO NO
54674 Jeniffer Garamendi F 25 12 0019 52 Plan B SI NO
98789 Dany León M 30 36 0012 115 Plan A SI SI
Probabilidad de Score de
Id de Cliente Id de Cliente
Churn Potencialidad Churn
12341 ??? Data Mining 12341 0.91
54674 ??? 54674 0.74
98789 ??? 98789 0.13
% de Clientes Churners # Clientes
Si Antigüedad > 10 y Llamadas Internacionales = ‘SI’ 13% 74,500
Si Edad <= 27 y Sexo = ‘M’ y Código Postal in (0019, 0012) 91% 29,150
Si …
13. Funcionalidad de la regla de scoring
PREDICCION REALIDAD
Alta
Probabilidad
Probabilidad
de Evento
Baja
Probabilidad
16. Metodología de proyectos Data Mining
Conocimiento
del negocio
Conocimiento de
la información
Preparación
de los datos
Modelamiento
Evaluación
Despliegue
17. “El requisito del éxito es la prontitud en las decisiones”
Sir Francis Bacon
19. Evolución del análisis de datos
Pregunta de Tecnología que lo Característica
Hito Histórico Proveedores
Negocio posibilita principal
Computadoras, cintas,
Data Collection "¿Cuál fue la utilidad
discos, DBMS
neta en los últimos IBM, CDC Datos históricos
(1960s) jerárquicos (IMS) y en
cinco años?"
red
Bases de datos
Data Access "¿Cuántas transacciones relacionales (RDBMS), Oracle, Sybase,
Datos dinámicos a nivel
se realizaron en el canal Lenguaje de consulta Informix, IBM,
(1980s) de registro (histórico)
POS en marzo pasado?" estructurado (SQL), Microsoft
ODBC
“¿Cuántas
Data Warehousing transacciones se Procesamiento analítico
Business Objects, SPSS, Datos dinámicos en
& Decision realizaron en el en línea (OLAP), bases
Comshare, Cognos, múltiples niveles o
canal POS en marzo de datos
Support (1990s) Microstrategy, NCR jerarquías (histórico)
pasado? Drill down multidimensionales
para el canal HBK".
“¿Qué productos
Algoritmos avanzados,
Data Mining pueden ser ofrecidos SPSS / Clementine, Datos de prospección
computadoras
(2000’s) a un cliente como Lockheed, IBM, SGI, SAS (análisis de mercado, de
multiprocesador, bases
“siguiente compra” Miner, NCR, Oracle riesgos, …)
de datos masivas
¿Por qué?"
20. Pirámide de inteligencia de negocios
Aumento potencial para el
Making Relaciones con el usuario final
soporte a las decisiones de Decisión
negocio Decisions
Data Presentation
Visualization Analista de Negocios
Techniques
Data Mining
Information Discovery
Analista de datos Análisis
Data Exploration
Statistical Analysis, Querying and Reporting
Data Warehouses/ Datamarts
Organización
OLAP, MDA
DBA
Data Sources
Adquisición
Paper, Files, Information Providers, Data Base Systems, OLTP