Este documento presenta el trabajo final de maestría de Diego Oppenheim sobre modelos de detección de churn bancario con R. El objetivo es desarrollar un modelo para predecir clientes que se darán de baja en los próximos dos meses y definir acciones de retención. Se utilizaron técnicas de preprocesamiento, selección de variables, y modelos como Random Forest y Boosting. El programa de retención se enfocó en clientes de alto valor con alta probabilidad de churn, logrando reducir la tasa anual de churn del 12% y una
La inteligencia de negocios (BI) implica el análisis de datos de una organización para apoyar la toma de decisiones. BI incluye herramientas para el acceso a información, análisis de datos y presentación de informes. La minería de datos es una técnica de BI que se utiliza para encontrar patrones y relaciones ocultas en grandes conjuntos de datos que pueden usarse para predecir resultados.
3ª Sesión Técnica del Ciclo de Conferencias sobre BI, celebrada el 12 de junio. Fue conducida por Julio Iglesias, Director del Departamento de Business Intelligence en IFR Group, experto especializado en proyectos de este tipo, y profesor asociado de nuestra Escuela Universitaria
¿Qué significa realmente la minería de datos? ,¿Cómo se engloba en un proyecto de BI?, ¿Puede mi empresa con los datos que genera hacer proyectos de este tipo? Y ¿Dónde está el límite para abordar proyectos de este tipo?
Bancos, hospitales, empresas de retail y páginas web son algunos de los sectores que utilizan esta tecnología. A lo largo de la sesión se analizó qué significa y qué implica la minería de datos: concepto y definición, casos, algoritmos de utilización… y de forma práctica se vieron un par de proyectos de ejemplo de las posibilidades que ofrece esta tecnología tan aplicada en la actualidad. Los asistentes tuvieron la oportunidad de ver de primera mano cómo las empresas utilizan los datos y la estadística para crear ofertas personalizadas.
¿Qué es un modelo predictivo y para qué vale?Scoremind
Los modelos predictivos permiten estimar cual es el comportamiento esperado del cliente utilizando los datos de uso de los servicios.
Para el desarrollo de los modelos se utilizan técnicas analíticas (data mining).
Este documento presenta una introducción a varios modelos de minería de datos, incluyendo reglas de asociación, clustering, árboles de decisión, series temporales, redes neuronales y naive bayes. Explica brevemente cada modelo y sus usos típicos, como análisis de cestas de compra, segmentación de mercados, detección de anomalías y clasificación. También incluye ejemplos de aplicaciones prácticas de los modelos de minería de datos en una empresa de venta de bicicletas.
La Minería de Datos y herramientas de análisisMundo Contact
El documento habla sobre el CRM analítico y la minería de datos. El CRM analítico usa un modelo único de datos de clientes y herramientas tecnológicas para conocer mejor a los clientes. La minería de datos usa técnicas para encontrar patrones en grandes bases de datos que expliquen el comportamiento de los datos. Algunas técnicas son la asociación, clasificación, conglomerados y pronósticos.
La minería de datos consiste en extraer información implícita de grandes conjuntos de datos. Se utilizan técnicas de inteligencia artificial y estadística para descubrir patrones en los datos que pueden predecir resultados o segmentar grupos. La minería de datos se aplica en diversos campos como negocios, fraude y comportamiento en internet para obtener conocimientos útiles.
El documento proporciona una introducción al concepto de muestreo. Explica que el muestreo se utiliza por razones de economía, rapidez, flexibilidad y para obtener mejores procesos de medición. Señala que el muestreo es un proceso técnico que requiere seguir reglas como la representatividad y el tamaño de muestra adecuado para obtener una muestra de calidad. También describe diferentes técnicas de muestreo como el muestreo probabilístico, el muestreo estratificado y el muestreo por conglomerados
Entérese de las actividades a llevar a cabo para obtener un modelo de minería de datos a partir de un caso del dominio público. En la sesión se describe y trabaja el caso "Insurance". Por medio de herramientas de modelado de Md se obtienen modelos de clasificación y se lleva a cabo el post proceso en Excel para obtener la conclusión comercial del modelo.
Se describen actividades posteriores para la extrapolación de los resultados de la muestra a una campaña con un mayor número de clientes potenciales.
El asistente a la sesión virtual se enterará de:
a) Qué es la minería de datos y porqué las técnicas son importantes en este momento de "Big Data".
b) Qué son los modelos de clasificación.
c) Cómo aplicarlos a un caso de campaña con costo de promoción y utilidad al hacer "hit".
La inteligencia de negocios (BI) implica el análisis de datos de una organización para apoyar la toma de decisiones. BI incluye herramientas para el acceso a información, análisis de datos y presentación de informes. La minería de datos es una técnica de BI que se utiliza para encontrar patrones y relaciones ocultas en grandes conjuntos de datos que pueden usarse para predecir resultados.
3ª Sesión Técnica del Ciclo de Conferencias sobre BI, celebrada el 12 de junio. Fue conducida por Julio Iglesias, Director del Departamento de Business Intelligence en IFR Group, experto especializado en proyectos de este tipo, y profesor asociado de nuestra Escuela Universitaria
¿Qué significa realmente la minería de datos? ,¿Cómo se engloba en un proyecto de BI?, ¿Puede mi empresa con los datos que genera hacer proyectos de este tipo? Y ¿Dónde está el límite para abordar proyectos de este tipo?
Bancos, hospitales, empresas de retail y páginas web son algunos de los sectores que utilizan esta tecnología. A lo largo de la sesión se analizó qué significa y qué implica la minería de datos: concepto y definición, casos, algoritmos de utilización… y de forma práctica se vieron un par de proyectos de ejemplo de las posibilidades que ofrece esta tecnología tan aplicada en la actualidad. Los asistentes tuvieron la oportunidad de ver de primera mano cómo las empresas utilizan los datos y la estadística para crear ofertas personalizadas.
¿Qué es un modelo predictivo y para qué vale?Scoremind
Los modelos predictivos permiten estimar cual es el comportamiento esperado del cliente utilizando los datos de uso de los servicios.
Para el desarrollo de los modelos se utilizan técnicas analíticas (data mining).
Este documento presenta una introducción a varios modelos de minería de datos, incluyendo reglas de asociación, clustering, árboles de decisión, series temporales, redes neuronales y naive bayes. Explica brevemente cada modelo y sus usos típicos, como análisis de cestas de compra, segmentación de mercados, detección de anomalías y clasificación. También incluye ejemplos de aplicaciones prácticas de los modelos de minería de datos en una empresa de venta de bicicletas.
La Minería de Datos y herramientas de análisisMundo Contact
El documento habla sobre el CRM analítico y la minería de datos. El CRM analítico usa un modelo único de datos de clientes y herramientas tecnológicas para conocer mejor a los clientes. La minería de datos usa técnicas para encontrar patrones en grandes bases de datos que expliquen el comportamiento de los datos. Algunas técnicas son la asociación, clasificación, conglomerados y pronósticos.
La minería de datos consiste en extraer información implícita de grandes conjuntos de datos. Se utilizan técnicas de inteligencia artificial y estadística para descubrir patrones en los datos que pueden predecir resultados o segmentar grupos. La minería de datos se aplica en diversos campos como negocios, fraude y comportamiento en internet para obtener conocimientos útiles.
El documento proporciona una introducción al concepto de muestreo. Explica que el muestreo se utiliza por razones de economía, rapidez, flexibilidad y para obtener mejores procesos de medición. Señala que el muestreo es un proceso técnico que requiere seguir reglas como la representatividad y el tamaño de muestra adecuado para obtener una muestra de calidad. También describe diferentes técnicas de muestreo como el muestreo probabilístico, el muestreo estratificado y el muestreo por conglomerados
Entérese de las actividades a llevar a cabo para obtener un modelo de minería de datos a partir de un caso del dominio público. En la sesión se describe y trabaja el caso "Insurance". Por medio de herramientas de modelado de Md se obtienen modelos de clasificación y se lleva a cabo el post proceso en Excel para obtener la conclusión comercial del modelo.
Se describen actividades posteriores para la extrapolación de los resultados de la muestra a una campaña con un mayor número de clientes potenciales.
El asistente a la sesión virtual se enterará de:
a) Qué es la minería de datos y porqué las técnicas son importantes en este momento de "Big Data".
b) Qué son los modelos de clasificación.
c) Cómo aplicarlos a un caso de campaña con costo de promoción y utilidad al hacer "hit".
1) El documento describe diferentes técnicas y métodos para realizar pronósticos de demanda, incluyendo métodos cualitativos, análisis de series de tiempo, y relaciones causales.
2) Se explican métodos cuantitativos como promedios simples, promedios móviles, suavización exponencial y regresión simple.
3) También se discute el monitoreo y control de pronósticos, incluyendo la medición del error de pronóstico.
Este documento describe cómo las empresas pueden mejorar su comprensión de los clientes mediante el análisis de grandes cantidades de datos internos y externos sobre los clientes. Esto permite segmentar mejor a los clientes, predecir su comportamiento y recomendar productos personalizados para aumentar las ventas y la retención de clientes.
Este documento presenta diferentes métodos de pronóstico para predecir los requerimientos de la cadena de suministros, incluyendo métodos cualitativos, de proyección histórica y causales. También describe técnicas como el nivelado exponencial, la descomposición de series de tiempo y el análisis de regresión múltiple. Finalmente, discute problemas comunes como el arranque, la demanda irregular y el pronóstico regional.
Presentación que el MBA. Jorge Pérez Colín realizó en el evento Big Data Analytics: Inteligencia para competir en aguas turbulentas el 7 de mayo de 2014 en el German Centre.
Planeación de Ventas y Operaciones / Sales & Operations Planning (S&OP)Israel Villarello
Sales & Operations Planning (S&OP) basic concepts, tips and experiences regarding its implementation in chemical company.
Planeación de Ventas y Operaciones (PVO) - conceptos básicos, recomendaciones y experiencias vividas durante su implementación en una compañía trasnacional de recubrimientos.
Este documento presenta los conceptos fundamentales del diseño de la cadena de suministro desde una perspectiva sistémica. Explica que una cadena de suministro es un sistema complejo formado por empresas interrelacionadas con el objetivo común de satisfacer al cliente final. También describe los principales procesos como la gestión de la demanda, cumplimiento de pedidos y aprovisionamiento, así como facilitadores clave como los sistemas de información y las relaciones de colaboración. El documento concluye que el enfoque sistémico permite ver a las partes de una cadena
"Herramientas Avanzadas de Gestión de la Cadena de Suministro"
Ponente: Guillermo Giménez. Auren consultores
Actividad en abierto
Proyecto: Logística Murcia
Lugar: INFO Murcia
Fecha: 20 de mayo 2015
Presentación de José Miguel Miralles (@mirallesjm) en la reunión de Usuarios de R de Almería del 31 de marzo de 2016.
Presente en la estrategia de cualquier Empresa, las tasas de abandono se disparan en todos los sectores y compañías. Telecomunicaciones, con tasas de abandono superiores al 25% , el Sector Financiero con ratios entre el 5% y el 20%, Distribución y Gran Consumo manejan cifras entre el 3% y el 10% de clientes fugados.
BrokerTrade Aplicación para la recomendación de compra de Acciones en tiempo ...Albert Obiols
El objetivo de este proyecto es realizar una aplicación piloto para poner al alcance del pequeño inversor técnicas de Machine Learning para que pueda identificar cuáles son los mejores momentos para comprar acciones del IBEX 35.
Concretamente realizaremos predicciones de compra a 20 sesiones bursátiles con el objetivo de ganar un 10%, de no cumplirse la predicción al 20abo día, asumiremos la ganancia/perdida que devenga de vender al precio de cierre de ese día.
The objective of this project is to develop a pilot application to make available to the small investor, Machine Learning techniques to be able to identify what are the best times to buy shares of IBEX 35 (Top 35 Spanish stock market shares).
Specifically we will make predictions of purchase with the goal of winning 10% in the 20 next coming sessions, if it does not happened our strategy is to sell that 20th day and assume the gain/loss accruing at the closing price of that day.
Presentación inteligencia analítica para AseguradorasQuanam
Este documento lista una serie de temas y capacidades analíticas clave para las aseguradoras, incluyendo precisión de precios, estimación de reservas, detección y prevención de fraude, pronóstico de pérdidas, análisis de clientes, segmentación, valor en el ciclo de vida, retención y fidelización, entre otros. También describe una metodología para segmentar a los clientes según su valor potencial y las posibles estrategias a aplicar, y resalta la importancia de los datos y el análisis en la
Optimización de procesos basada en datosMarlon Dumas
Ponencia en BPM Day Lima 2021.
En esta charla, hablaremos de métodos y aplicaciones emergentes en el ámbito de la optimización de procesos basada en datos. Hablaremos de avances en el área de la minería de procesos, de métodos de construcción de gemelos digitales de procesos y de métodos de monitoreo predictivo. Mostraremos por medio de ejemplos y casos de estudio, cómo estos métodos permiten guiar las iniciativas de transformación digital y de mejora continua de procesos, En particular, ilustraremos el uso de estos métodos para: (1) analizar el rendimiento de los procesos de negocio de manera a identificar fricciones y oportunidades de automatización; (2) predecir el impacto de cambios, y en particular, predecir el impacto de una iniciativa de automatización; (3) realizar predicciones sobre el rendimiento del proceso y ajustar la ejecución del proceso de manera a prevenir incumplimientos del SLA, quejas de clientes, y otros eventos indeseables.
El documento presenta los principios de la Teoría de Restricciones (TOC) para mejorar el desempeño de una organización. Explica que se debe identificar la restricción o cuello de botella en cada área (mercado, operaciones, distribución, etc.) y enfocarse en elevar esa restricción para mejorar el desempeño general del sistema. También habla de la importancia de establecer métricas integrales que alineen todos los procesos de la cadena de valor hacia el objetivo común.
ENAEDM23 - Rocío González Martínez. Data Science MarketingEnaeBusiness
Este documento discute el uso de ciencia de datos en el marketing, incluyendo la segmentación de clientes, el cálculo del valor del cliente a lo largo del tiempo (CLTV), y la gestión de la pérdida de clientes. Explica que la combinación de conocimientos de negocio, tecnología y análisis crea una ventaja competitiva. También describe retos como estrechar la relación con los clientes y comunicarse de manera relevante.
El documento describe los desafíos y enfoques estratégicos para la toma de decisiones en las organizaciones. Explica que la planificación, visibilidad, eficiencia y retroalimentación son retos clave de las operaciones integradas. También presenta tres niveles de procesos de toma de decisiones - estratégico, de alineamiento y de eficiencia operacional - que ocurren en diferentes frecuencias. Además, introduce conceptos como el mapa estratégico y la conversión de datos en información para el análisis.
1. El documento describe el método Seis Sigma, el cual busca eliminar defectos en los procesos de negocio enfocándose en las necesidades de los clientes. 2. La metodología Seis Sigma se basa en una mejora continua sistemática y cuantitativa de los procesos orientada a mejorar la calidad. 3. El objetivo de Seis Sigma es lograr procesos con una calidad de seis sigmas, es decir, procesos que generen como máximo 3.4 defectos por millón de oportunidades.
Webinar impulse su negocio con prediccion analíticaNexolution
Mientras la competencia global continua reduciendo los márgenes de utilidad, las organizaciones están buscando maneras de aumentar sus ingresos y reducir los gastos. Al mismo tiempo, las empresas están siendo inundadas con datos de cada acción, operación y puntos de contacto con clientes actuales o potenciales.
Mientras que este incremento exponencial de información presenta retos para muchas organizaciones, las empresas inteligentes convierten sus datos en conocimiento al realizar análisis estadísticos, pronósticos y encontrar agrupaciones o relaciones entre datos que a simple vista no se ven.
El análisis predictivo es una mezcla de herramientas y técnicas que permiten a las organizaciones identificar patrones en los datos que pueden utilizarse para realizar predicciones de resultados futuros. En este webinar usted aprenderá acerca de:
• Aplicaciones del análisis predictivo en diferentes áreas del negocio e industrias
• Diferentes técnicas y métodos de análisis predictivo
• Análisis de textos y redes sociales
Entre otros temas importantes para el negocio como: market basket analysis, retención de clientes, análisis de mercado, scoring de créditos.
Detalles de las soluciones de Nexolution: informacion@nexolution.com
Retos y oportunidades de la Analítica avanzada y Big Data en la industriaIbermática.digital
Este documento discute los retos y oportunidades de la analítica avanzada y el Big Data en la industria. Presenta cómo estas tecnologías pueden usarse para mejorar la eficiencia operativa, predecir fallas, optimizar inventarios y más. También ofrece recomendaciones para comenzar proyectos de Big Data como seleccionar un caso simple inicial y asegurar la calidad y relevancia de los datos.
Este documento compara varios métodos para medir el rendimiento de una cadena de suministro, incluyendo el método six-sigma, métodos integrados, blockchain y el modelo SCOR. Explica que cada método define métricas clave como costos, calidad, flexibilidad y tiempos de entrega para evaluar el estado actual y futuro deseado de la cadena de suministro.
Cómo aplicar el análisis predictivo en la empresaNexolution
El análisis predictivo permite a su organización estimar escenarios posibles que permitan planificar y llevar a cabo estrategias que mejoren la toma de decisiones.
La mayoría de las corporaciones logra convertir sus datos en información para realizar un análisis estadístico de lo que ha sucedido, pero muy pocas de éstas logran usar la información para pronosticar o predecir, para encontrar agrupaciones o relaciones entre datos que permitan transformar dicha información en conocimiento.
Con el análisis predictivo es posible modelar grandes volúmenes de datos que lleven al descubrimiento de patrones de información desconocida acerca de lo que sucede dentro del negocio que ayudará a crear e implementar estrategias que permitan a la empresa ser más competitivos al mejorar la calidad de sus productos y servicios.
En ésta presentación usted conocerá en qué áreas de negocio es posible implementar el análisis predictivo como por ejemplo:
• Qué valor tiene el análisis predictivo para las áreas de negocio
• Mantenimiento predictivo de los activos de la empresa
• Antes de diseñar una campaña de marketing ¿Cómo analizar el comportamiento de nuestro clientes?
• ¿Cómo pronosticar la demanda de tus clientes? Evitando así el sobre inventario en el almacén y la optimización en el servicio al cliente
• Conocer qué opinan los clientes
Presentador: José Mondragon
Información de las soluciones de Business Analytics: informacion@nexolution.com
1) El documento describe diferentes técnicas y métodos para realizar pronósticos de demanda, incluyendo métodos cualitativos, análisis de series de tiempo, y relaciones causales.
2) Se explican métodos cuantitativos como promedios simples, promedios móviles, suavización exponencial y regresión simple.
3) También se discute el monitoreo y control de pronósticos, incluyendo la medición del error de pronóstico.
Este documento describe cómo las empresas pueden mejorar su comprensión de los clientes mediante el análisis de grandes cantidades de datos internos y externos sobre los clientes. Esto permite segmentar mejor a los clientes, predecir su comportamiento y recomendar productos personalizados para aumentar las ventas y la retención de clientes.
Este documento presenta diferentes métodos de pronóstico para predecir los requerimientos de la cadena de suministros, incluyendo métodos cualitativos, de proyección histórica y causales. También describe técnicas como el nivelado exponencial, la descomposición de series de tiempo y el análisis de regresión múltiple. Finalmente, discute problemas comunes como el arranque, la demanda irregular y el pronóstico regional.
Presentación que el MBA. Jorge Pérez Colín realizó en el evento Big Data Analytics: Inteligencia para competir en aguas turbulentas el 7 de mayo de 2014 en el German Centre.
Planeación de Ventas y Operaciones / Sales & Operations Planning (S&OP)Israel Villarello
Sales & Operations Planning (S&OP) basic concepts, tips and experiences regarding its implementation in chemical company.
Planeación de Ventas y Operaciones (PVO) - conceptos básicos, recomendaciones y experiencias vividas durante su implementación en una compañía trasnacional de recubrimientos.
Este documento presenta los conceptos fundamentales del diseño de la cadena de suministro desde una perspectiva sistémica. Explica que una cadena de suministro es un sistema complejo formado por empresas interrelacionadas con el objetivo común de satisfacer al cliente final. También describe los principales procesos como la gestión de la demanda, cumplimiento de pedidos y aprovisionamiento, así como facilitadores clave como los sistemas de información y las relaciones de colaboración. El documento concluye que el enfoque sistémico permite ver a las partes de una cadena
"Herramientas Avanzadas de Gestión de la Cadena de Suministro"
Ponente: Guillermo Giménez. Auren consultores
Actividad en abierto
Proyecto: Logística Murcia
Lugar: INFO Murcia
Fecha: 20 de mayo 2015
Presentación de José Miguel Miralles (@mirallesjm) en la reunión de Usuarios de R de Almería del 31 de marzo de 2016.
Presente en la estrategia de cualquier Empresa, las tasas de abandono se disparan en todos los sectores y compañías. Telecomunicaciones, con tasas de abandono superiores al 25% , el Sector Financiero con ratios entre el 5% y el 20%, Distribución y Gran Consumo manejan cifras entre el 3% y el 10% de clientes fugados.
BrokerTrade Aplicación para la recomendación de compra de Acciones en tiempo ...Albert Obiols
El objetivo de este proyecto es realizar una aplicación piloto para poner al alcance del pequeño inversor técnicas de Machine Learning para que pueda identificar cuáles son los mejores momentos para comprar acciones del IBEX 35.
Concretamente realizaremos predicciones de compra a 20 sesiones bursátiles con el objetivo de ganar un 10%, de no cumplirse la predicción al 20abo día, asumiremos la ganancia/perdida que devenga de vender al precio de cierre de ese día.
The objective of this project is to develop a pilot application to make available to the small investor, Machine Learning techniques to be able to identify what are the best times to buy shares of IBEX 35 (Top 35 Spanish stock market shares).
Specifically we will make predictions of purchase with the goal of winning 10% in the 20 next coming sessions, if it does not happened our strategy is to sell that 20th day and assume the gain/loss accruing at the closing price of that day.
Presentación inteligencia analítica para AseguradorasQuanam
Este documento lista una serie de temas y capacidades analíticas clave para las aseguradoras, incluyendo precisión de precios, estimación de reservas, detección y prevención de fraude, pronóstico de pérdidas, análisis de clientes, segmentación, valor en el ciclo de vida, retención y fidelización, entre otros. También describe una metodología para segmentar a los clientes según su valor potencial y las posibles estrategias a aplicar, y resalta la importancia de los datos y el análisis en la
Optimización de procesos basada en datosMarlon Dumas
Ponencia en BPM Day Lima 2021.
En esta charla, hablaremos de métodos y aplicaciones emergentes en el ámbito de la optimización de procesos basada en datos. Hablaremos de avances en el área de la minería de procesos, de métodos de construcción de gemelos digitales de procesos y de métodos de monitoreo predictivo. Mostraremos por medio de ejemplos y casos de estudio, cómo estos métodos permiten guiar las iniciativas de transformación digital y de mejora continua de procesos, En particular, ilustraremos el uso de estos métodos para: (1) analizar el rendimiento de los procesos de negocio de manera a identificar fricciones y oportunidades de automatización; (2) predecir el impacto de cambios, y en particular, predecir el impacto de una iniciativa de automatización; (3) realizar predicciones sobre el rendimiento del proceso y ajustar la ejecución del proceso de manera a prevenir incumplimientos del SLA, quejas de clientes, y otros eventos indeseables.
El documento presenta los principios de la Teoría de Restricciones (TOC) para mejorar el desempeño de una organización. Explica que se debe identificar la restricción o cuello de botella en cada área (mercado, operaciones, distribución, etc.) y enfocarse en elevar esa restricción para mejorar el desempeño general del sistema. También habla de la importancia de establecer métricas integrales que alineen todos los procesos de la cadena de valor hacia el objetivo común.
ENAEDM23 - Rocío González Martínez. Data Science MarketingEnaeBusiness
Este documento discute el uso de ciencia de datos en el marketing, incluyendo la segmentación de clientes, el cálculo del valor del cliente a lo largo del tiempo (CLTV), y la gestión de la pérdida de clientes. Explica que la combinación de conocimientos de negocio, tecnología y análisis crea una ventaja competitiva. También describe retos como estrechar la relación con los clientes y comunicarse de manera relevante.
El documento describe los desafíos y enfoques estratégicos para la toma de decisiones en las organizaciones. Explica que la planificación, visibilidad, eficiencia y retroalimentación son retos clave de las operaciones integradas. También presenta tres niveles de procesos de toma de decisiones - estratégico, de alineamiento y de eficiencia operacional - que ocurren en diferentes frecuencias. Además, introduce conceptos como el mapa estratégico y la conversión de datos en información para el análisis.
1. El documento describe el método Seis Sigma, el cual busca eliminar defectos en los procesos de negocio enfocándose en las necesidades de los clientes. 2. La metodología Seis Sigma se basa en una mejora continua sistemática y cuantitativa de los procesos orientada a mejorar la calidad. 3. El objetivo de Seis Sigma es lograr procesos con una calidad de seis sigmas, es decir, procesos que generen como máximo 3.4 defectos por millón de oportunidades.
Webinar impulse su negocio con prediccion analíticaNexolution
Mientras la competencia global continua reduciendo los márgenes de utilidad, las organizaciones están buscando maneras de aumentar sus ingresos y reducir los gastos. Al mismo tiempo, las empresas están siendo inundadas con datos de cada acción, operación y puntos de contacto con clientes actuales o potenciales.
Mientras que este incremento exponencial de información presenta retos para muchas organizaciones, las empresas inteligentes convierten sus datos en conocimiento al realizar análisis estadísticos, pronósticos y encontrar agrupaciones o relaciones entre datos que a simple vista no se ven.
El análisis predictivo es una mezcla de herramientas y técnicas que permiten a las organizaciones identificar patrones en los datos que pueden utilizarse para realizar predicciones de resultados futuros. En este webinar usted aprenderá acerca de:
• Aplicaciones del análisis predictivo en diferentes áreas del negocio e industrias
• Diferentes técnicas y métodos de análisis predictivo
• Análisis de textos y redes sociales
Entre otros temas importantes para el negocio como: market basket analysis, retención de clientes, análisis de mercado, scoring de créditos.
Detalles de las soluciones de Nexolution: informacion@nexolution.com
Retos y oportunidades de la Analítica avanzada y Big Data en la industriaIbermática.digital
Este documento discute los retos y oportunidades de la analítica avanzada y el Big Data en la industria. Presenta cómo estas tecnologías pueden usarse para mejorar la eficiencia operativa, predecir fallas, optimizar inventarios y más. También ofrece recomendaciones para comenzar proyectos de Big Data como seleccionar un caso simple inicial y asegurar la calidad y relevancia de los datos.
Este documento compara varios métodos para medir el rendimiento de una cadena de suministro, incluyendo el método six-sigma, métodos integrados, blockchain y el modelo SCOR. Explica que cada método define métricas clave como costos, calidad, flexibilidad y tiempos de entrega para evaluar el estado actual y futuro deseado de la cadena de suministro.
Cómo aplicar el análisis predictivo en la empresaNexolution
El análisis predictivo permite a su organización estimar escenarios posibles que permitan planificar y llevar a cabo estrategias que mejoren la toma de decisiones.
La mayoría de las corporaciones logra convertir sus datos en información para realizar un análisis estadístico de lo que ha sucedido, pero muy pocas de éstas logran usar la información para pronosticar o predecir, para encontrar agrupaciones o relaciones entre datos que permitan transformar dicha información en conocimiento.
Con el análisis predictivo es posible modelar grandes volúmenes de datos que lleven al descubrimiento de patrones de información desconocida acerca de lo que sucede dentro del negocio que ayudará a crear e implementar estrategias que permitan a la empresa ser más competitivos al mejorar la calidad de sus productos y servicios.
En ésta presentación usted conocerá en qué áreas de negocio es posible implementar el análisis predictivo como por ejemplo:
• Qué valor tiene el análisis predictivo para las áreas de negocio
• Mantenimiento predictivo de los activos de la empresa
• Antes de diseñar una campaña de marketing ¿Cómo analizar el comportamiento de nuestro clientes?
• ¿Cómo pronosticar la demanda de tus clientes? Evitando así el sobre inventario en el almacén y la optimización en el servicio al cliente
• Conocer qué opinan los clientes
Presentador: José Mondragon
Información de las soluciones de Business Analytics: informacion@nexolution.com
Similar a Modelos de-attrition-bancarios-diego-oppenheim (20)
TIA portal Bloques PLC Siemens______.pdfArmandoSarco
Bloques con Tia Portal, El sistema de automatización proporciona distintos tipos de bloques donde se guardarán tanto el programa como los datos
correspondientes. Dependiendo de la exigencia del proceso el programa estará estructurado en diferentes bloques.
ESPERAMOS QUE ESTA INFOGRAFÍA SEA UNA HERRAMIENTA ÚTIL Y EDUCATIVA QUE INSPIRE A MÁS PERSONAS A ADENTRARSE EN EL APASIONANTE CAMPO DE LA INGENIERÍA CIVIŁ. ¡ACOMPAÑANOS EN ESTE VIAJE DE APRENDIZAJE Y DESCUBRIMIENTO
Klohn Crippen Berger es una consultoría
especializada que presta servicios al
sector minero en estudios geotécnicos,
geoquímicos, hidrotécnicos y de
asesoramiento ambiental, reconocida por
su trayectoria, calidad y ética profesional.
1. Modelos de Churn Bancarios con R
Trabajo Final de la Maestría en Data Mining
Presentado por
Diego Ariel Oppenheim
Director
Martin Volpacchio
Fecha: 31/7/2017
2. Objetivos del trabajo final
• Entender la situación actual de fuga de clientes del Banco
• Entender cuáles son las variables que mejor explican el fenómeno
• Desarrollar un modelo de Data Mining que permita predecir los clientes que se
darán de baja dentro de los próximos dos meses
• Entender los motivos de bajas de clientes y definir acciones comerciales de
retención
• Cuantificar el impacto de un programa de retención
3. Esquema General
Fuentes de Información
Identificación de las principales variables que
definen/caracterizan a los clientes que se fugarán
Clientes con mayor valor real
y potencial para el Banco
Medidas de retención
apropiadas para los
clientes en riesgo de fuga
Estrategia post retención para aumentar la fidelización.
Cuantificar el incentivo, costos y ganancia
esperada de un programa de retención
4. Introducción al concepto de Attrition
• Término utilizado para describir la pérdida del cliente
Tipos de Fuga
Total
Parcial
Cancela todos los acuerdos
Cancela algunos productos y para el resto utiliza
la competencia
Inactividad por un largo periodo de tiempoEscondida
Motivos de fuga
• Precio
• Producto
• Servicio - Insatisfacción
• Mercado
• Organización
• Ofertas Competencia
Por qué retenerlos?
• Más rentable retener a un cliente valioso que captar uno nuevo
• Clientes a largo plazo tienden a consumir más
• Clientes a Largo Plazo resultan menos sensibles a actividades publicitarias de la competencia
• Nuevos clientes potencialmente riesgosos
5. ImplementaciónValidaciónIntegración Pre-Procesamiento
Etapas del Trabajo - Concepto del KDD (Knowledge Discovery in Databases)
• Fuentes de información
• Análisis de datos
• IT
• Data Wharehouse
• Integración
• Multiplataforma
• Formatos diferentes
• Frecuencia de extracción
• Valores ausentes
• Imputación de
valores
• Outliers
• Duplicados, registros
incoherentes
• Nuevas Variables
• Transformación de
variable
• Feature Engineering
• Descubrimiento
• Patrones, secuencias
• Modelos de clasificación,
predicción
• Confiabilidad
• Usabilidad
• Escalabilidad
• Robustez
• Estacionalidad de
los datos
• Evaluación técnica
y comecial
• Métricas de rendimiento
• Accuracy
• Recall
• AUC
• LIFT
• Curva Roc
• Matriz de confusión
• Acción sobre el
cliente (Evento)
• Comunicación
• Presentación de
resultados
• Medición
• Plan de retención
• Servicio post venta
PROCESSCONSULTING
Data Mining
6. Imputación de valores faltantes - Nulos
• Descarte de registros
• Imputación de datos faltantes
en base a árboles de decisión
• Conserva la distribución inicial
de la variable
Pre Procesamiento de la base de datos
7. Balanceo de la muestra
• Problema de clases
desbalanceadas
• Escasez de una de las clases
(un conjunto de datos
resulta significativo)
• Bajo % de fuga de la
población de estudio
Se aplicó la técnica del
sub-muestreo aleatorio que
elimina al azar instancias de la
clase mayoritaria
Pre Procesamiento de la base de datos
Foco en clientes Premium - Alta participación en las ganancias
8. Creación de nuevas variables - Feature Engineering
Pre Procesamiento de la base de datos
Derivadas de variables existente
• Discretización de la variable
cuadrante (valor del cliente)
• Discretizacion del mejor producto
• Discretizacion de la zona de
residencia
• Discretizacion del estado civil
Variables Flag (0-1)
• Tenencia de tarjeta de crédito
(últimos 3 y 6 meses)
• Tenencia de tarjeta de débito
(últimos 3 y 6 meses)
• Cobro de sueldo hace 3 meses
Variables Ratio
• Variación de MBB (ingreso que deja al Banco)
• Variación en la cantidad de productos
bancarios
• Variación de la cantidad de artículos
consumidos
• Variación del monto en consumo
• Variación del monto total de las inversiones
• Variación del saldo en cuenta corriente
• Variación de la cantidad de extracciones por
Home Banking
Variaciones a 3 y 6 meses
9. Selección de variables
• Definir las variables más influyentes para los modelos
• Independencia entre variables, baja correlación con entre si y alta correlación con la
variable target (fuga del cliente)
Pre Procesamiento de la base de datos
Ingreso Promedio y Suma del Ingreso
tienen alta correlación positiva
Se excluyeron las variables con un coeficiente de correlación mayor o igual a 0.8
Se excluye la que menor correlación
tiene con la variable target
Lapso de compra y Attrition tienen alta
correlación negativa
Se mantiene la variable
11. Regla 4Regla 3Regla 2
Pregunta
2
Árbol de decisión
Regla 1
Pregunta
2
Pregunta
1
• Robusto a Outliers
• Aplicable a cualquier tipo de dato
• Sencilla interpretación
• Reutilizable
Overfitting
Poda para prevenir el sobreajuste del modelo
Mayor simplicidad – mayor generalización
Técnica de “ganancia de información”
Divide y vencerás
Técnica de clasificación
no paramétrica
Nodos terminales
Objetivo – Máxima pureza
12. Modelos: Bagging
• Muestreo selectivo – Aumento de la performance
• Creación de diferentes modelos usando muestras aleatorias con reemplazo y luego
combina y ensambla los resultados mejorando la predicción
Modelos: Boosting
• Cada nuevo clasificador presta mayor atención a los datos clasificados erróneamente por
los clasificadores anteriores
• Combinación de resultados para obtener un clasificador con mayor poder de predicción
Modelos: Random Forest
• Cada árbol contiene una muestra aleatoria de observaciones y es construido con
variables seleccionadas de forma aleatoria
13. Métricas de Rendimiento
• Matriz de Confusión, muestra los resultados de los modelos de clasificación binaria
AUC - Área bajo la curva ROC - LIFT
• Comparación entre las predicciones correctas e incorrectas
del clasificador
• LIFT: Indica la cantidad de veces que mejora la predicción del
modelo con respecto al azar
14. Principales variables seleccionadas con los modelos
Comportamientos diferenciados para cada uno de
los grupos de clientes seleccionados (Clusters)
Variables:
• Cantidad de compras (transacciones) en los últimos 3 meses
• Saldo en cuenta de los últimos 3 meses.
• Variación de la suma de MBB (Ingreso que deja el cliente al
Banco)
• Cantidad de extracciones en cajeros
• Tenencia (en número) de productos bancarios
• Cantidad de compras en los últimos 3 meses
15. Evaluación de los modelos
Clases altamente desbalanceadas para ambos clusters para la variable Target (Attrition)
LIFT - Primeros 20.000 clientes
11.23
Más probable a abandonar el Banco a un cliente
seleccionado al azar
Validación de los modelos con datos a Abril 2016
AUC
96%-97%
Modelos Random
Forest y Boosting
Accuracy
95%-99%
TN, True Negative(Especificidad)
90% (para el Cluster 0 el modelo encontró a 3715 de
los 3879 clientes fugados)
Falsos Positivos
60%-77%
El modelo Boosting
clasificó correctamente al
23%-42% de los clientes
que predijo como Churners
VALIDACIÓN CON DATA FUTURA (1 AÑO)
16. Programa de Retención
*Aquellos clientes impactados
por el programa fueron los de
mayor valor comercial para el
Banco
*Mayor probabilidad de fuga
*Mayor LIFT
*Se busca reducir la tasa de los
Falsos Positivos (clientes que
permanecen en el Banco
habiendo recibido un incentivo)
+ LIFT + Rentabilidad + Éxito del programa
17. Resultado e Implementación del Programa de Retención
SUPUESTOS CONSIDERADOS:
1. Distribución constante del CLV
2. Tasa de éxito del 20%
3. Ganancia media de 2MM USD (en 3 meses)
ÉXITO DEL PLAN DE RETENCION ANTE:
• Clientes con gran valor para el Banco
• Alto riesgo de fuga para los próximos meses
• Correcta comunicación, canal e incentivo
con el cliente
• Revisión y mantenimiento de los modelos
predictivos
18. Conclusiones
• Se trata de un problema del desbalanceo de clases (existe una clase predominante y
una minoritaria, fuga de clientes). Relación 99.5% a 0.5%
• Balanceo de casos mediante sub-muestreo, eliminación de registros de clase
dominante.
• Problema de la sub especificación del modelo: No contar con todas las variables
para poder explicar el fenómeno (existencia de limitaciones y supuestos)
• Ranking de clientes en base a la probabilidad de fuga
• Acciones comerciales de retención, necesidad de bajar el CHURN del 12% anual
• Cambios rápidos en las condiciones económicas del país
• Oportunidad de mejora (+ retención - adquisición)
19. Conclusiones
• Aquellos clientes que cobraban en el Banco hace 6 meses y que
redujeron la cantidad de productos en un 30% y redujeron en mas de
un 20% la cantidad de artículos comprados, tienen el triple de
probabilidad de abandonar el Banco (X3)
• Dentro del grupo de clientes que no acreditaba sueldo en el Banco,
aquellos que disminuyeron el saldo en vista en un 25%, no consumieron
en mas de 2 meses y disminuyeron en un 30% la cantidad de
movimientos voluntarios totales, tienen el quíntuple de probabilidad de
fuga (X5).
20. Trabajo Futuro
• Inclusión de nuevas variables
• Revisión de los algoritmos utilizados
• Optimización de parámetros de los modelos
• Implementación de nuevos algoritmos. Ejemplo, gradient boosting (XGBOOST)
• Ensembles de modelos para explorar diferentes hipótesis sobre los datos
• Predicción de fuga mes a mes (Función de Hazard)
• Afinar supuestos de Customer Life Time Value
A diferencia del algoritmo Boosting aplicado en el trabajo, el XGBOOST construye arboles de
manera secuencial añadiendo a cada iteración el árbol que mejor compensa los errores de
los arboles previos. Esto se realiza árbol a árbol.