Seminarios de Analítica Predictiva con Rapid Miner
1. Limitless Power of Information (LPI)
AddKw S.r.L.
SEMINARIOS DE ANALÍTICA PREDICTIVA CON RAPID MINER
Presentación
LPI ofrece un conjunto de seminarios prácticos en la modalidad virtual, donde se desarrollan técnicas del
análisis predictivo aplicado a la solución de problemas particulares de las empresas, tales como: la planificación
de la demanda, el establecimiento de precios y promociones, el análisis de la cesta de mercado y la
segmentación de clientes, por otro lado se desarrolla un webinar para la clasificación de grafos y etiquetado de
nodos y finalmente un webinar para el análisis de textos para la extracción de información no estructurada.
Metodología de Trabajo
Todos los problemas son abordados de la siguiente manera:
• Planteamiento conceptual del tema.
• Formulación del problema.
• Enfoques de solución al problema planteado y herramientas.
• Análisis de posibles casos especiales.
• Procedimiento de solución paso a paso.
• Desarrollo de la solución.
• Análisis del rendimiento (eficacia) de la solución.
Seminarios dispopnibles:
Código Denominación Fechas
WB011 Aplicación de Modelos para el Pronóstico de Series de Tiempo. 22 febrero
WB013 Aplicación del Modelos para la Gestión del Precio y la Promoción 24 febrero
WB015 Aplicaciones de Análisis de Redes Sociales, clasificación de grafos 26 febrero
WB017 Aplicaciones de análisis de la cesta de mercado – modelo de asociación 29 febrero
WB019 Aplicaciones de Agrupamiento y Segmentación de Clientes 2 de marzo
WB021 Aplicaciones de Textmining – Extracción de Información 4 de marzo
2. Limitless Power of Information (LPI)
AddKw S.r.L.
SEMINARIOS DE ANALÍTICA PREDICTIVA CON RAPID MINER
Seminario 1: Aplicación de Modelos para el Pronóstico de Series de Tiempo.
Sumilla
Una serie de tiempo es un conjunto de mediciones de cierto fenómeno registradas secuencialmente en el
tiempo. Los modelos de series de tiempo tienen por objetivo analizar la tendencia y la estacionalidad de
estas series. Los modelos de pronóstico de series de tiempo, pretende identificar el patrón de comportamiento
de la serie para luego intentar calcular los siguientes valores de la serie (horizonte de pronóstico).
El seminario se orienta a desarrollar dos tipos de modelos para el pronóstico de series de tiempo:
• Modelo ARIMA. Conformado por un modelo auto-regresivo, un promedio móvil para series univariadas y
multivariadas, que utiliza variaciones y regresiones de los datos para encontrar el patrón de
comportamiento de los datos.
• Modelo Neuronal. Aplica la red neuronal de retro propagación para ventanas de tiempo fijas, este modelo
es útil cuando no se obtiene rendimientos aceptables aplicando otros modelos.
Objetivos del Seminario
Al finalizar el seminario los alumnos estarán en capacidad de:
• Identificar problemas donde son aplicables las series de tiempo.
• Aplicar técnicas de limpieza y preparación de las series de tiempo, previos a la aplicación de las técnicas de
pronóstico (valores null, valores extremos, suavizado.
• Aplicar las técnicas de análisis de la estacionalidad de la serie de tiempo – cálculo del coeficiente de
autocorrelación.
• Aplicar técnicas para transformar la serie no estacionaria a estacionaria.
• Estimación de parámetros del modelo.
• Cálculo del pronóstico de la serie de tiempo.
• Al finalizar el taller el participante debe lograr construir un modelo paso a paso, de tal forma que sea
aplicable a diferentes fuentes de datos.
Contenido
• Introducción a las series de tiempo
• Preparación de datos
• Análisis de la estacionalidad de los datos
• Transformación de técnicas no estacionarias.
• Estimación de parámetros del modelo (regresión múltiple)
• Construcción del modelo neuronal
Duración
• 8 horas
Herramienta
Rapid Miner's Time Series plugin
Ejercicio de aplicación
• Pronóstico de la demanda de efectivo en cajeros electrónicos.
3. Limitless Power of Information (LPI)
AddKw S.r.L.
SEMINARIOS DE ANALÍTICA PREDICTIVA CON RAPID MINER
Dirigido a
• Especialistas en planificación y presupuesto.
• Especialistas en programación de servicios.
• Analistas de ventas.
• Especialistas en marketing.
Pre-requisitos
• Conocimientos básicos de estadística descriptiva..
• Conocimientos básicos de métodos de regresión.
• Conocimiento básico del Rapidminer.
4. Limitless Power of Information (LPI)
AddKw S.r.L.
SEMINARIOS DE ANALÍTICA PREDICTIVA CON RAPID MINER
Seminario 2: Aplicación del Modelos para la Gestión del Precio y la
Promoción
Sumilla
El modelo de Precio y Promoción, es la aplicación de herramientas analíticas para predecir el comportamiento
del consumidor, medido como su intención de compra ante diferentes escenarios de precios. El modelo busca
optimizar la disponibilidad y precio de los producto que ofrece una empresa para maximizar sus ingresos.
Se trata de aprovechar los datos generados en campañas anteriores donde se aplicaron descuentos eventuales
(promocionales) a los productos para medir el impacto de estas variaciones en la demanda.
Se pretende comprender la percepción del valor del producto para los clientes, alineándola con precisión a los
precios de los productos, la colocación y disponibilidad para cada segmento de clientes.
La construcción del modelo implica el desarrollo de cuatro etapas:
Objetivos del Seminario
Al finalizar el seminario los alumnos estarán en capacidad de:
• Planificar la recolección de datos de campañas promocionales anteriores, buscando la estandarización de
datos por sector.
• Seleccionar los atributos de interés que ingresaran al dataset.
• Preparar el dataset para el proceso de segmentación.
• Segmentar los datos recolectados, cada segmente corresponde a un grupo de clientes con
comportamiento similar.
• Preparar un modelo de pronóstico de la demanda por cada segmento identificado.
• Preparar un modelo de elasticidad-precio para predecir la demanda en función al precio.
• Diseñar un modelo de optimización para maximizar los ingresos en función del pronóstico de la demanda y
de la función de demanda, la variable a calcular es el precio.
Contenido
• Recolección de datos.
• Construcción del dataset
• Segmentación de datos
• Preparación del modelo de pronóstico de la demanda.
• Preparación del modelo de elasticidad-precio.
• Formulación del modelo de optimización no-lineal
• Optimización del modelo.
5. Limitless Power of Information (LPI)
AddKw S.r.L.
SEMINARIOS DE ANALÍTICA PREDICTIVA CON RAPID MINER
Duración
• 8 horas
Herramienta
• Rapidminer
Ejercicio de aplicación
• Data de 5 hoteles.
Dirigido a
• Especialistas en planificación y presupuesto.
• Analistas de comerciales.
• Supervisores comerciales.
• Analistas de precios.
• Especialistas en marketing
Pre-requisitos
• Conocimientos básicos de estadística descriptiva..
• Conocimientos básicos de métodos de regresión.
• Conocimientos básicos de técnicas de optimización
• Conocimiento básico del Rapidminer.
6. Limitless Power of Information (LPI)
AddKw S.r.L.
SEMINARIOS DE ANALÍTICA PREDICTIVA CON RAPID MINER
Seminario 3: Aplicaciones de Análisis de Redes Sociales, clasificación de
grafos
Sumilla
El análisis de redes sociales es un instrumento indispensable para comprender la complejidad del mundo
actual, dado por las relaciones que se forman entre los seres humanos.
Las redes sociales (personales o virtuales) se forman por el principio de la homofilia es decir que todos los que
tienen características comunes tienden a juntarse en grupos, por lo que se puede estudiar el comportamiento
de todo el grupo estudiando el comportamiento de una parte de ella.
El análisis de redes sociales se centra en la medición, representación y análisis de los vínculos o lazos que se
establecen entre las personas, instituciones o cualquier otro tipo de entidades.
Objetivos del Seminario
Al finalizar el seminario los alumnos estarán en capacidad de:
• Conocer formatos de representación de grafos (GDF, GML, etc.)
• Identificar métricas que se pueden extraer desde grafos (centralidad, densidad, etc.).
• Descargar su propio grafo social desde facebook.
• Usar herramientas para la visualización de grafos.
• Extraer métricas desde grafos para elaborar el dataset.
• Identificar la relación que existe entre las métricas de los grafos.
• Construir modelos de agrupamiento de grafos (grafos similares).
• Construir modelos de clasificación de grafos.
• Identificar patrones de relaciones sociales artificiales.
• Etiquetado de grafos.
Contenido
• Conceptos básicos del análisis de grafos
• Teoría de grafos y métricas en grafos.
• Formatos y herramientas para la gestión de grafos.
• Extracción de métricas
• Agrupamiento de grafos
• Clasificación de grafos.
Duración
• 8 horas
Herramienta
• Python
Ejercicio de aplicación
• Grafos sociales de facebook.
Dirigido a
• Profesionales interesados en el uso de herramientas de redes sociales y sus aplicaciones en: seguridad,
marketing, salud, gobierno, etc.
7. Limitless Power of Information (LPI)
AddKw S.r.L.
SEMINARIOS DE ANALÍTICA PREDICTIVA CON RAPID MINER
Pre-requisitos
• Conocimientos básicos de programación.
• Conocimientos básicos de python.
• Estar familiarizado con conceptos básicos de teoría de grafos
8. Limitless Power of Information (LPI)
AddKw S.r.L.
SEMINARIOS DE ANALÍTICA PREDICTIVA CON RAPID MINER
Seminario 4: Aplicaciones de Análisis de la Cesta de Mercado
Sumilla
La cesta de mercado es la resultante de combinar diferentes productos en diversas cantidades, los clientes
compran diferentes cestas de mercado, dependientes de sus preferencias
El análisis de la cesta de mercado utiliza diferentes técnicas para analizar las relaciones entre productos
comprados y de esta forma identificar el patrón de compra de los clientes.
El análisis de la cesta de mercado se puede desarrollar:
• Por afinidad, para encontrar relaciones entre eventos que ocurren conjuntamente o en simultaneo
• Por clúster, para encontrar relaciones entre categorías de eventos, por ejemplo compras de
electrodomésticos con compra de artículos para el dormitorio.
El análisis de la cesta de mercado se realiza sin interesar la cantidad o el precio de los productos, se analiza
solo la ocurrencia eventos.
El análisis de la cesta de mercado se aplica al: diseño de los espacios de compra, diseño de campañas de
marketing, sistemas de recomendación automática (cross-selling), etc.
Objetivos del taller
Al final del taller los alumnos estarán en capacidad de:
• Diseñar estructuras de datos para recolectar información de eventos.
• Aplicar técnicas de segmentación de clientes.
• Aplicar técnicas de agrupamiento por categorías de productos.
• Generar itemsets por segmentos y por categorías.
• Generar k-itemset, con soporte mínimo.
• Generar reglas con rangos de confianza.
• Visualizar las reglas generadas.
• Evaluar las reglas generadas
Contenido
• Modelos de asociación y algoritmo a-priori.
• Diseño de la estructura de datos para el registro de eventos.
• Diseño del agrupamiento por categorías.
• Segmentación de los datos.
• Generación del itemset.
• Generación de k-itemset con soporte mínimo.
• Generación de reglas con confianza mínima.
• Visualización de las reglas generadas.
• Evaluación de reglas de asociación.
Duración
• 8 horas
Herramienta
• Rapidminer
Ejercicio de aplicación
• Ventas Retail.
• Ventas de bicicletas
9. Limitless Power of Information (LPI)
AddKw S.r.L.
SEMINARIOS DE ANALÍTICA PREDICTIVA CON RAPID MINER
Dirigido a
• Analistas de marketing.
• Supervisores de ventas.
• Supervisores de campañas
• Analistas de Estrategias de ventas
Pre-requisitos
• Conocimientos básicos rapidminer
10. Limitless Power of Information (LPI)
AddKw S.r.L.
SEMINARIOS DE ANALÍTICA PREDICTIVA CON RAPID MINER
Seminario 5: Aplicaciones de Agrupamiento y Segmentación de Clientes
Sumilla
La segmentación de clientes es un conjunto técnicas diseñadas con la finalidad de encontrar grupos con
patrones de comportamiento similares dentro del grupo (pero diferentes entre los grupos). Se asume que los
miembros de un segmento tienen características homogéneas. El patrón de comportamiento puede estar
relacionado a sus características intrínsecas o a su capacidad de respuesta ante campañas de marketing.
La identificación de estos grupos es fundamental para el diseño de campañas de marketing, la aplicación de
estrategias de precio y promoción, entre otras tareas de marketing. Permite ajustar la estrategia de marketing
en función de las necesidades y preferencias de cada grupo de clientes.
Con el fin de encontrar estos grupos se aplican múltiples técnicas:
• A posteriori. Análisis tipológico
• A priori. Análisis discriminante y detección automática de iteraciones.
Objetivos del taller
Al finalizar el taller los estudiantes estarán en capacidad de:
• Gestionar el ciclo del proyecto de segmentación.
• Entender y aplicar las diferentes técnicas de segmentación.
• Preparar los datos antes del proceso de segmentación.
• Perfilar y validar segmentos.
• Evaluar los segmentos.
• Calcular la probabilidad de afiliación al segmento.
• Usar los resultados de la segmentación para construir modelos de clasificación.
Contenido
• Segmentación de clientes.
• Tipos de segmentación.
• El clico de vida del proyecto de segmentación.
• Preparación de datos antes de la segmentación.
• Técnicas de segmentación.
• Probabilidad de afiliación al segmento.
• Evaluación de segmentos.
• Modelos de clasificación.
Duración
• 8 horas
Herramienta
• Rapidminer
Ejercicio de aplicación
• Ventas Retail.
• Ventas Hoteles
11. Limitless Power of Information (LPI)
AddKw S.r.L.
SEMINARIOS DE ANALÍTICA PREDICTIVA CON RAPID MINER
Dirigido a
• Analistas de mercado.
• Analistas de marketing.
• Personas que desean aprender a segmentar a sus clientes en base a sus actitudes, preferencias o
transacciones, para desarrollar campañas de marketing.
• Personas interesadas en analizar la evolución de los segmentos identificados.
Pre-requisitos
• Conocimientos básicos rapidminer
12. Limitless Power of Information (LPI)
AddKw S.r.L.
SEMINARIOS DE ANALÍTICA PREDICTIVA CON RAPID MINER
Seminario 6: Aplicaciones de Textmining – Extracción de Información
Sumilla
La minería de textos es el proceso para descubrir conocimiento almacenado en documentos (datos no
estructurados), el conocimiento se representa mediante tendencias, promedios, desviaciones, dependencias,
grupos, etc. La minería de textos es la extensión de los métodos de la minería de datos. La minería de textos
comprende actividades como: Clasificación de documentos para la asignación automática a clases
pre-definidas. Agrupamiento de documentos para la identificación de documentos similares. Recuperación de
información, similar a un buscador. Extracción de la información incluida en esos textos (hechos), Extracción de
asociaciones entre los hechos extraídos y Etiquetado de palabras con el fin de identificar los componentes de
una oración.
Objetivos
Al final del taller los alumnos estarán en capacidad de:
• Conocer los fundamentos de minería de textos.
• Estructurar corpus de documentos con fines de análisis.
• Usar técnicas para la preparación de documentos.
• Aplicar técnicas de agrupamiento, clasificación y extracción de asociaciones en documentos.
• Aplicar técnicas para la extracción de información.
• Aplicar técnicas para el etiquetado de documentos.
• Aplicar técnicas para la reducción de la dimensionalidad.
Contenido.
• Introducción a la minería de textos.
• Técnicas para la preparación de documentos.
• Modelos de agrupamiento de documentos.
• Modelos de clasificación de documentos.
• Modelos de extracción de asociaciones entre documentos.
• Expresiones regulares.
• Extracción de información.
• Etiquetado de documentos.
• Reducción de la dimensionalidad.
Duración
• 8 horas
Herramienta
• Rapidminer
Ejercicios de aplicación
• Análisis sentimental.
• Estructuración de base de datos mediante la extracción de información desde un corpus de documentos.
13. Limitless Power of Information (LPI)
AddKw S.r.L.
SEMINARIOS DE ANALÍTICA PREDICTIVA CON RAPID MINER
Dirigido a
• Analistas de datos.
• Analistas de marketing en la web.
• Investigadores de mercado que desean analizar encuestas abiertas.
• Profesionales en estadística interesados en analizar el contenido de textos no estructurados (formularios,
encuestas, etc.).
Pre-requisitos
• Conocimientos básicos rapidminer
• Conocimientos básicos de clasificación, agrupamiento y asociación