SlideShare una empresa de Scribd logo
1 de 60
Descargar para leer sin conexión
Big Data Analytics: Automatización de
Modelos Predictivos
José Angel Alvarez
© 2007. MAySA
Big Data Analytics
• Responder preguntas "más grandes" (con mayor cantidad
y variedad de datos)…
• más detalladas…
• más rápidamente (en tiempo real, en muchos casos).
• Detección de fraude en transacciones en línea
• Marketing uno-a-uno en tiempo real
• Gestión de inventarios y distribuciones en grandes
cadenas
• Optimización de precios en tiendas departamentales
• Internet de las cosas
Se necesitan millones de modelos!
© 2007. MAySA
La única solución: automatización
Big Data AnalyticsAnalytics
tradicional
© 2007. MAySA
Práctica actual (Analytics tradicional)
© 2007. MAySA
Objetivos
• Analizar las características de la automatización en herramientas de
modelamiento
• Proponer estrategias útiles en la práctica actual del analista para
acelerar los procesos de desarrollo de modelos
© 2007. MAySA
Tecnologías de Big Data Analytics involucradas
Automatización del modelamiento
Tecnologías de adquisición e integración de datos, de procesamiento en
línea e identificación de eventos, almacenamiento en diversos tipos de
arquitecturas (especialmente no relacionales), tecnologías de data
governance, tecnologías de estandarización de interfases (REST y
otras), tecnologías de exploración y visualización de datos, tecnologías
de orquestación de los diversos componentes en una plataforma
integrada de Analytics, tecnologías de procesamiento en memoria,
tecnologías de procesamiento distribuido y paralelo, etc.
© 2007. MAySA
Tecnologías de…
7
• Forecasting de alta
performance
• SAS Forecast Server
• Mineria de datos
• SAS BIS
• SAS Model Manager
• SAS RPM
• SAS Factory Miner
• Optimización de precios
• SAS Revenue
Optimization
© 2007. MAySA
Forecasting de alta performance
– Pronósticos confiables de muchas series que deben actualizarse
frecuente y regularmente
– No hay suficientes recursos para pronósticos tradicionales
© 2007. MAySA
Forecasting “por excepción”
Series de tiempo
80% pueden pronosticarse automáticamente.
10% requieren un esfuerzo extra
10% no pueden pronosticarse precisamente.
El analista debe concentrarse en las series…
• problemáticas
• de alto valor
© 2007. MAySA
Herramientas de automatización
• Preparación automática de las series
• Repositorio de modelos
• Repositorio de eventos
• Selección automática de modelos apropiados
• Detección y modelamiento automático de outliers
• Forecasting jerárquico y reconciliación
• Resúmenes estadísticos del conjunto de modelos
• Exploración y modificación eficaz de series y modelos individuales
10
© 2007. MAySA
Repositorio de modelos de forecasting
© 2007. MAySA
Repositorio de eventos y variables
independientes
© 2007. MAySA
Jerarquías: agregación y reconciliación
16
8 4
20
10
32
0
+3 +1 0 0
+4
10
• Volatilidad
• Series cortas
© 2007. MAySA
Serie con y sin reconciliación
© 2007. MAySA
Tareas del analista
• Configuración inicial del proyecto
• Verificar los resultados generales del modelamiento
• Identificar las series de mayor interés o valor que no han alcanzado el
nivel de precisión apropiado
• Intervenir manualmente sobre estas series
15
© 2007. MAySA
Configuración inicial de un proyecto
© 2007. MAySA
Resumen estadístico global de los resultados
© 2007. MAySA
Distribución de MAPEs de los modelos del
proyecto
© 2007. MAySA
Resumen de los tipos de modelos usados
© 2007. MAySA
Exploración de una serie individual
© 2007. MAySA
Automatización en forecasting
• Se basa en ajustar por fuerza bruta un conjunto de modelos a cada
serie (incluidas algunas transformaciones) y seleccionar el mejor
modelo en base a una métrica.
• Las tareas esenciales del analista son la configuración inicial del
proyecto (qué diagnósticos, qué transformaciones, qué modelos, qué
métrica, etc.) , la detección de aquellos modelos sobre los que vale la
pena que intervenga manualmente y su modificación
• La configuración inicial del proyecto es muy importante para acotar la
búsqueda de modelos por fuerza bruta.
21
© 2007. MAySA
Automatización de modelos de minería de datos
• SAS BIS
• SAS Model Manager
• SAS RPM
• SAS Factory Miner
© 2007. MAySA
Soluciones Empaquetadas para industrias
verticales
• DW , Data marts especializados y scripts de carga
• Plantillas de modelamiento
• Portal de administración
© 2007. MAySA
Modelo "táctico" de cross-sell y up-sell de BIS
Quién comprará un producto particular.
© 2007. MAySA
Soluciones Empaquetadas para industrias
verticales
• La arquitectura de datos, un data warehouse diseñado según las
mejores prácticas en un sector industrial y data marts para
aplicaciones específicas, permite a una empresa acelerar
considerablemente las etapas de diseño de estas estructuras y carga
de datos, al menos en la teoría.
• En la práctica, la aceleración en el desarrollo de un proyecto o
"sistema" de minería de datos es un poco más dificultosa de lo que
plantean estas soluciones en la teoría.
• Un déficit frecuente en las empresas usuarias de Analytics: el insumo
principal de proyectos son los datos, pero la adquisición de los
mismos, su análisis y mantenimiento (como datos), su
estandarización, su propia "semántica", etc. suele manejarse de un
modo inorgánico, desarticulado, etc., algo que tiene un impacto
importante sobre la eficiencia de uno de sus principales
consumidores: las tareas de Analytics.
25
© 2007. MAySA
Integración del Analytics
Analista
Gerencia
Ops IT
Integradores
de datos
Comerciales
Governance
STAKEHOLDERS
Servicio al
cliente
Retail
Logística
Promociones
OPERACIONES TARGET
Clientes
Accionistas
Proveedores
Empleados
© 2007. MAySA
SAS Model Manager
• Herramienta de automatización de la gestión de modelos.
• Definir y gerenciar un workflow para automatizar parcialmente las
distintas etapas del ciclo de vida de un modelo y hacerlas más
eficaces
• Posee herramientas que permiten detectar cambios significativos en la
distribución de las variables que integran un modelo y generar alertas,
detectar cambios en la distribución de las predicciones de un modelo
(lo que habitualmente se llama estabilidad) y el deterioro en las
métricas de evaluación del mismo (lift, error cuadrático medio, K-S,
etc.).
• También puede realizar ajustes automáticos de los parámetros de un
modelo cuando este se ha desajustado, reemplazar un modelo por
otro competidor que en algún momento consigue mejor performance,
y la automatización de la puesta en producción de los modelos.
27
© 2007. MAySA
Interfase SAS Model Manager
© 2007. MAySA
Interfase SAS Model Manager
29
© 2007. MAySA
SAS Model Manager
30
Un modelo no es un objeto
aislado y separable de otros
diversos objetos.
© 2007. MAySA
SAS Rapid Predictive Modeler (RPM)
31
© 2007. MAySA
SAS Rapid Predictive Modeler (RPM)
© 2007. MAySA
SAS Rapid Predictive Modeler (RPM)
33
© 2007. MAySA
SAS Rapid Predictive Modeler (RPM
34
© 2007. MAySA
SAS Rapid Predictive Modeler (RPM)
35
© 2007. MAySA
SAS Rapid Predictive Modeler (RPM)
• La automatización consiste en aplicar técnicas básicas de
transformación, imputación y selección de variables, además de las
técnicas de modelamiento más comunes.
• En casi todos los casos se utilizan las configuraciones default de los
nodos.
• Al igual que en el Model Manager, la automatización se basa en
proyectos con una cantidad relativamente baja de modelos.
• La intervención del analista solamente ocurre en la configuración
inicial que es bastante básica y genérica, sin la posibilidad de hacer
algún ajuste en base a conocimiento de dominio.
• Lo sorprendente de estas plantillas genéricas es que usualmente esta
configuración muy elemental basta para generar modelos iniciales
bastante buenos que luego, si es necesario, pueden perfeccionarse.
36
© 2007. MAySA
SAS Factory Miner
© 2007. MAySA
SAS Factory Miner
• Modelamiento en paralelo de múltiples segmentos de una población
(subyace a esta característica la idea de la microsegmentación).
• Se ajustan automáticamente los modelos seleccionados (entre los que
pueden incluirse árboles de decisiones, regresión, redes neuronales,
modelos lineales generalizados, redes bayesianas, máquinas de
soporte vectorial y algún otro) y se selecciona en cada caso el modelo
campeón según alguna métrica elegida.
• Las herramientas de navegación facilitan la exploración de cualquier
modelo de cualquier segmento, se generan los gráficos usuales de
comparación y se calculan las métricas de evaluación habituales.
• La herramienta se basa en una arquitectura de alta performance que
le permite ajustar rápidamente modelos "pesados" como Random
Forest, máquinas de soporte vectorial y otros.
38
© 2007. MAySA
SAS Factory Miner
39
Visualización de los resultados de los modelos ajustados a un segmento de datos
© 2007. MAySA
SAS Factory Miner
40
Análisis de los resultados generales a través de segmentos y targets para un
proyecto y monitoreo de performance
© 2007. MAySA
Automatización en Minería de datos
• La estrategia de automatización es la prueba por fuerza bruta de
algunos pocos modelos, transformaciones, etc. Son los que tienen, en
la práctica, una frecuencia de utilización muy alta.
• En minería de datos no es "popular" la utilización de una estrategia de
predicción por excepción, pero esto no es incompatible en absoluto
con el diseño de las herramientas existentes
• Una cuestión que parece estar ausente en las aplicaciones
mencionadas, es la utilización del concepto de jerarquía de modelos.
• Recién en el SAS Factory Miner aparece la noción de modelamiento
simultáneo sobre distintos conjuntos de datos (segmentos) en un
mismo proyecto.
41
© 2007. MAySA
Automatización en Minería de datos
• El nivel de automatización y su alcance no permiten todavía a cubrir
las necesidades del Big Data Analytics, si bien el SAS Factory Miner
parece un buen primer paso
• La adquisición y preparación de datos tienen un bajo nivel de
automatización. La preparación de datos se basa en la prueba de
transformaciones básicas en versiones default.
• La administración de modelos tampoco tiene la escala necesaria. Se
necesita una gestión más "inteligente" y extensiva para reducir la
intervención manual
42
© 2007. MAySA
Automatización en Minería de datos
• El rol del analista es similar:
– Configuración inicial de un proyecto
– Exploración general de los resultados
– Intervención manual en modelos de alto valor que no hayan
alcanzado el estándar deseado
43
© 2007. MAySA
SAS® Revenue Optimization Suite
44
© 2007. MAySA
• Modelo de demanda
Estimacio-
nes Elasticidad,
efectos cruzados,
Promos
Pronóstico
de base
Total
Demanda
 Optimización
User inputs
Reglas,
objetivos, etc.
Total
Demanda
Precio/ofer-
ta óptima
Optimización de precios
© 2007. MAySA
SAS® Revenue Optimization Suite
• Estas soluciones implementan lo que SAS denomina "modelamiento
prescriptivo", el uso de modelos de demanda predefinidos, plantillas,
que permiten acelerar y automatizar su implementación y finalmente la
optimización.
• Las plantillas predefinidas son siete según el tipo de producto:
productos estacionales y otros con ciclos de vida cortos, productos
básicos no estacionales, etc.
• Cada plantilla posee un número de "especificaciones" que es
necesario calibrar según valores apropiados para el conjunto de
productos/puntos de venta del sector económico y la empresa a la que
se aplican.
46
© 2007. MAySA
Modelo de demanda típico
Los componentes se combinan para producir un pronóstico total para cada
item/punto de venta
EstacionalidadTendencia Feriados
Promociones Ciclo de vidaEfectos del precio
Predicción total
© 2007. MAySA
Modelo de demanda típico
Los componentes se combinan para producir un pronóstico total para cada
item/punto de venta
EstacionalidadTendencia Feriados
Promociones Ciclo de vidaEfectos del precio
Sales Fcst = Level Trend * Cyclical seasonality * Holiday effect *
Product life cycle effect *
Price effect *
Promo support 1 effect * ... * Promo support n effect *
Inventory effect
© 2007. MAySA
Jerarquía de productos y jerarquía de lugares
49
Agregar información para obtener modelos y
predicciones más estables y confiables debido
a los problemas de volatilidad y escasez de
datos en el nivel de los ítems (productos)
individuales.
© 2007. MAySA
Niveles TS, REG y FCST dentro de un grupo de
modelamiento
50
© 2007. MAySA
SAS® Revenue Optimization Suite
• La arquitectura de datos de la solución es bastante más estructurada y
definida que las soluciones anteriores, lo que se debe principalmente
a la naturaleza del problema. Esta característica facilita su
implementación en menor tiempo.
• La conformación de las jerarquías tiene un rol crucial, lo mismo que el
compartimiento vertical y horizontal de información para mejorar los
modelos.
• El modelo final para cada producto/punto de venta es el resultado de
la composición de varios modelos, incluso en distintos niveles.
• Las plantillas de modelamiento están compuestas de técnicas
estándar de forecasting de series de tiempo (utilizan las técnicas del
forecasting de alta performance) y de regresión con componentes
fijos.
• El rol del analista es fundamental en la configuración inicial de la
solución y el calibrado de los modelos predefinidos. Tanto en la
calibración como en el monitoreo posterior, el analista debe proceder
"por excepción". 51
© 2007. MAySA
Conclusiones sobre la automatización -
Similitudes
• Uso de procesos predefinidos (plantillas, proyectos, etc.) con un
conjunto pequeño de opciones de configuración que implementan
transformaciones y modelos estándar, repetitivos y muy frecuentes
• La intervención del analista se focaliza en la configuración inicial del
proceso automatizado, en la evaluación global de los resultados y en
la intervención específica sobre modelos en los que sea valioso
hacerlo (“modelamiento por excepción”).
• Compartir información a través de distintos niveles en una o diversas
jerarquías, para resolver problemas típicos de variabilidad, falta de
datos, etc.
• Combinar modelos: ya sea varios modelos que hacen predicciones
sobre el mismo suceso en una predicción de conjunto (lo que
habitualmente se denomina "ensemble learning") o modelos que
predicen distintos componentes de un suceso y luego se componen
en una predicción global, como era el caso del modelamiento de
demanda.
52
© 2007. MAySA
Conclusiones sobre la automatización -
Similitudes
• Organizar y estructurar opciones limitadas (aunque ampliables) en
base a las características generales o específicas de los fenómenos
que se deben modelar (repositorio de modelos, repositorio de eventos,
defaults de distintas técnicas, etc.)
• Organizar y estructurar los distintos componentes de un proyecto en
un conjunto fácil de identificar, almacenar, explorar y mantener.
53
© 2007. MAySA
Conclusiones sobre la automatización - Déficits
• Areas como la adquisición de datos y la administración de modelos no
han alcanzado aún una escala de automatización a la altura de las
necesidades del Big Data Analytics
• Un elemento importante en el Analytics de Big Data es la integración
de fuentes de datos de tipos diversos (campos estructurados, texto,
imágenes, etc.). Todas las automatizaciones consideradas se basan
en el uso de campos estructurados, lo que constituirá cada vez más
una limitación importante.
• Las transformaciones y modelos que se ajustan, seleccionan, etc.
automáticamente, si bien es cierto que son los más frecuentes, son
relativamente elementales. Sería deseable una mayor riqueza y
sofisticación.
54
© 2007. MAySA
Conclusiones sobre la automatización - Deficits
• La estrategia principal es la búsqueda de buenos modelos por fuerza
bruta
• No hay una selección “inteligente” más allá de la configuración inicial
del analista
• Los déficits en las tareas más abiertas de adquisición de datos, en la
transformación de los mismos y en una utilización más sofisticada de
modelos se debe a esta falta de “inteligencia”
• La estrategia de modelamiento por excepción consiste en concentrar
la tarea inteligente (la del analista) en los modelos de mayor valor.
55
© 2007. MAySA
¿Qué significa “inteligencia”?
• "Inteligencia" significa utilizar conocimiento de las técnicas de
modelamiento y de dominio sobre un fenómeno particular para poder
hacer inferencias y tomar decisiones. Algo para lo que, todavía, las
herramientas actuales necesitan del analista.
• El conocimiento debiera estar incorporado en la forma de "metadatos
analíticos".
• Estos permitirían junto con una capacidad elemental de inferencia
generar variables más relevantes en muchos modelamientos, hacer
una selección de variables en el proceso inicial de adquisición de
datos, determinar cómo y cuándo integrar información textual a
información estructurada, determinar que técnicas de modelamiento
podrían ser útiles, gestionar modelos y proyectos en función de su
importancia y relevancia para un problema dado, etc.
• Las herramientas que aportarían “inteligencia” se encuentran
disponibles desde hace mucho tiempo (Ingeniería del Conocimiento),
pero aún no han sido integradas a las herramientas de Analytics
56
© 2007. MAySA
Conclusiones sobre el trabajo del analista
• Es recomendable utilizar plantillas o procedimientos preconstruidos de
modelamiento. A estas plantillas se debe conectar la tabla con los
datos de entrada y luego analizar los resultados obtenidos.
• El tiempo mejor invertido del analista es aquel que dedica al análisis
de resultados de modelos generados rápidamente para obtener
conclusiones sobre el problema, los datos, las transformaciones y las
propias técnicas de modelamiento.
• Es decir, la mejor estrategia es una de refinamiento iterativo y
progresivo de un problema mediante modelos rápidos que puedan
mejorarse.
• Combinado con una estrategia de desarrollo mediante prototipos
rápidos que no esperan meses hasta haber reunido gran cantidad de
datos
• Aprovechar información redundante o complementaria en la forma de
jerarquías, segmentos y combinación de modelos.
• Trabajar con “paquetes” de modelamiento que reunen y conservan
toda la información y objetos relevantes. 57
© 2007. MAySA
Conclusiones sobre el entorno del analista
• La "inteligencia" que debe ser parte fundamental del desarrollo y
automatización del modelamiento no es y no debe ser exclusivamente
de la herramienta o del analista, sino de la empresa en su conjunto.
• Los analistas en una empresa debieran encontrarse en una situación
parecida a la de los sistemas automatizados: debieran poder limitarse
a hacer algunas pocas especificaciones iniciales para obtener
rápidamente un primer resultado a analizar.
• Deberían contar con herramientas como plantillas de modelamiento,
conjuntos de variables con una "semántica" estandarizada y
protocolos o herramientas que le faciliten mantener unidos los
distintos objetos involucrados en un proyecto de modelamiento,
mantener un modelo o pasarlo a producción.
58
© 2007. MAySA
Conclusiones sobre el entorno del analista
Grupo transversal de Analytics que se encargue de:
1. Definir plantillas de modelamiento con características similares a las
de las herramientas mencionadas pero ajustadas a los problemas
frecuentes de la empresa, mantenerlas y mejorarlas
progresivamente.
2. Ampliar el o los data warehouses con metadatos analíticos
estandarizados a nivel de la empresa que faciliten la conexión del
DW o los data marts con las plantillas de modelamiento y disminuyan
el trabajo de adquisición de datos por parte del analista.
3. Mantener repositorios "oficiales" de modelos, de eventos y de
transformaciones (en especial para la construcción de variables
"secundarias").
4. Implementar prácticas estandarizadas de la gestión de modelos que
aseguren que los distintos objetos vinculados a un modelo no se
dispersen o se pierdan.
59
© 2007. MAySA 60

Más contenido relacionado

La actualidad más candente

Cómo implementar una solución Big Data
Cómo implementar una solución Big DataCómo implementar una solución Big Data
Cómo implementar una solución Big DataAMETIC
 
2016 ULL Cabildo KEEDIO - Arquitecturas Big Data
2016 ULL Cabildo KEEDIO - Arquitecturas Big Data2016 ULL Cabildo KEEDIO - Arquitecturas Big Data
2016 ULL Cabildo KEEDIO - Arquitecturas Big DataKEEDIO
 
Big Data Architecture con Pentaho
Big Data Architecture con PentahoBig Data Architecture con Pentaho
Big Data Architecture con PentahoDatalytics
 
Cómo empezar a implementar proyectos Big Data en tu organización
Cómo empezar a implementar proyectos Big Data en tu organizaciónCómo empezar a implementar proyectos Big Data en tu organización
Cómo empezar a implementar proyectos Big Data en tu organizaciónBEEVA_es
 
Aplicaciones difusas manejo de grandes volúmenes de datos
Aplicaciones difusas manejo de grandes volúmenes de datosAplicaciones difusas manejo de grandes volúmenes de datos
Aplicaciones difusas manejo de grandes volúmenes de datosLuis Fernando Aguas Bucheli
 
Big Data con Sql Server 2014 y la nube
Big Data con Sql Server 2014 y la nubeBig Data con Sql Server 2014 y la nube
Big Data con Sql Server 2014 y la nubeEduardo Castro
 
Aplicaciones DIfusas: Limpieza de datos, resolución de entidades, integración...
Aplicaciones DIfusas: Limpieza de datos, resolución de entidades, integración...Aplicaciones DIfusas: Limpieza de datos, resolución de entidades, integración...
Aplicaciones DIfusas: Limpieza de datos, resolución de entidades, integración...Luis Fernando Aguas Bucheli
 
Nuevos escenarios BI con SQL Server 2014
Nuevos escenarios BI con SQL Server 2014Nuevos escenarios BI con SQL Server 2014
Nuevos escenarios BI con SQL Server 2014Ruben Pertusa Lopez
 
Presentación semana académica unam big data abril 2015
Presentación semana académica unam big data abril 2015Presentación semana académica unam big data abril 2015
Presentación semana académica unam big data abril 2015Peter Kroll
 
9 problemas en proyectos Data Analytics
9 problemas en proyectos Data Analytics9 problemas en proyectos Data Analytics
9 problemas en proyectos Data AnalyticsStratebi
 
Predictive Analytics with Pentaho Data Mining - Análisis Predictivo con Penta...
Predictive Analytics with Pentaho Data Mining - Análisis Predictivo con Penta...Predictive Analytics with Pentaho Data Mining - Análisis Predictivo con Penta...
Predictive Analytics with Pentaho Data Mining - Análisis Predictivo con Penta...Pentaho
 
2016 ULL Cabildo KEEDIO - KEEDIO DATA STACK
2016 ULL Cabildo KEEDIO - KEEDIO DATA STACK2016 ULL Cabildo KEEDIO - KEEDIO DATA STACK
2016 ULL Cabildo KEEDIO - KEEDIO DATA STACKKEEDIO
 
Desmitificando el Big Data
Desmitificando el Big DataDesmitificando el Big Data
Desmitificando el Big DataStratebi
 
Inteligencia de Negocios (BI)
Inteligencia de Negocios (BI)Inteligencia de Negocios (BI)
Inteligencia de Negocios (BI)LOGIN S.A:
 
Datawarehouse práctica 6
Datawarehouse   práctica 6Datawarehouse   práctica 6
Datawarehouse práctica 6Gustavo Araque
 
Overview sap bo girona nib efimatica
Overview sap bo girona nib efimaticaOverview sap bo girona nib efimatica
Overview sap bo girona nib efimaticaEfimatica
 

La actualidad más candente (20)

Cómo implementar una solución Big Data
Cómo implementar una solución Big DataCómo implementar una solución Big Data
Cómo implementar una solución Big Data
 
2016 ULL Cabildo KEEDIO - Arquitecturas Big Data
2016 ULL Cabildo KEEDIO - Arquitecturas Big Data2016 ULL Cabildo KEEDIO - Arquitecturas Big Data
2016 ULL Cabildo KEEDIO - Arquitecturas Big Data
 
Big Data Architecture con Pentaho
Big Data Architecture con PentahoBig Data Architecture con Pentaho
Big Data Architecture con Pentaho
 
Cómo empezar a implementar proyectos Big Data en tu organización
Cómo empezar a implementar proyectos Big Data en tu organizaciónCómo empezar a implementar proyectos Big Data en tu organización
Cómo empezar a implementar proyectos Big Data en tu organización
 
Aplicaciones difusas:Introducción a BI
Aplicaciones difusas:Introducción a  BIAplicaciones difusas:Introducción a  BI
Aplicaciones difusas:Introducción a BI
 
Aplicaciones difusas manejo de grandes volúmenes de datos
Aplicaciones difusas manejo de grandes volúmenes de datosAplicaciones difusas manejo de grandes volúmenes de datos
Aplicaciones difusas manejo de grandes volúmenes de datos
 
Big Data con Sql Server 2014 y la nube
Big Data con Sql Server 2014 y la nubeBig Data con Sql Server 2014 y la nube
Big Data con Sql Server 2014 y la nube
 
Aplicaciones DIfusas: Limpieza de datos, resolución de entidades, integración...
Aplicaciones DIfusas: Limpieza de datos, resolución de entidades, integración...Aplicaciones DIfusas: Limpieza de datos, resolución de entidades, integración...
Aplicaciones DIfusas: Limpieza de datos, resolución de entidades, integración...
 
Nuevos escenarios BI con SQL Server 2014
Nuevos escenarios BI con SQL Server 2014Nuevos escenarios BI con SQL Server 2014
Nuevos escenarios BI con SQL Server 2014
 
Presentación semana académica unam big data abril 2015
Presentación semana académica unam big data abril 2015Presentación semana académica unam big data abril 2015
Presentación semana académica unam big data abril 2015
 
9 problemas en proyectos Data Analytics
9 problemas en proyectos Data Analytics9 problemas en proyectos Data Analytics
9 problemas en proyectos Data Analytics
 
Predictive Analytics with Pentaho Data Mining - Análisis Predictivo con Penta...
Predictive Analytics with Pentaho Data Mining - Análisis Predictivo con Penta...Predictive Analytics with Pentaho Data Mining - Análisis Predictivo con Penta...
Predictive Analytics with Pentaho Data Mining - Análisis Predictivo con Penta...
 
Obtención de Datos en #BigData
Obtención de Datos en #BigDataObtención de Datos en #BigData
Obtención de Datos en #BigData
 
2016 ULL Cabildo KEEDIO - KEEDIO DATA STACK
2016 ULL Cabildo KEEDIO - KEEDIO DATA STACK2016 ULL Cabildo KEEDIO - KEEDIO DATA STACK
2016 ULL Cabildo KEEDIO - KEEDIO DATA STACK
 
Desmitificando el Big Data
Desmitificando el Big DataDesmitificando el Big Data
Desmitificando el Big Data
 
Inteligencia de Negocios (BI)
Inteligencia de Negocios (BI)Inteligencia de Negocios (BI)
Inteligencia de Negocios (BI)
 
Datawarehouse práctica 6
Datawarehouse   práctica 6Datawarehouse   práctica 6
Datawarehouse práctica 6
 
Overview sap bo girona nib efimatica
Overview sap bo girona nib efimaticaOverview sap bo girona nib efimatica
Overview sap bo girona nib efimatica
 
Big data presentación
Big data presentaciónBig data presentación
Big data presentación
 
Introduccion a mineria de datos
Introduccion a mineria de datosIntroduccion a mineria de datos
Introduccion a mineria de datos
 

Destacado

Modelos predictivos: datos, métodos, problemas y aplicaciones
Modelos predictivos: datos, métodos, problemas y aplicacionesModelos predictivos: datos, métodos, problemas y aplicaciones
Modelos predictivos: datos, métodos, problemas y aplicacionesÁngel M. Felicísimo
 
Soluciones de Big Data en el Entorno Analítico de SAS
Soluciones de Big Data en el Entorno Analítico de SASSoluciones de Big Data en el Entorno Analítico de SAS
Soluciones de Big Data en el Entorno Analítico de SASDMC Perú
 
Métodos predictivos y Descriptivos - MINERÍA DE DATOS
Métodos predictivos y Descriptivos - MINERÍA DE DATOSMétodos predictivos y Descriptivos - MINERÍA DE DATOS
Métodos predictivos y Descriptivos - MINERÍA DE DATOSlalopg
 
Nuevos Enfoques del Business Analytics: "Faster Prediction, Better Decision"
Nuevos Enfoques del Business Analytics: "Faster Prediction, Better Decision"Nuevos Enfoques del Business Analytics: "Faster Prediction, Better Decision"
Nuevos Enfoques del Business Analytics: "Faster Prediction, Better Decision"DMC Perú
 
Métodos Predictivos: Aplicación a la Detección de Fraudes en Tarjetas De Crédito
Métodos Predictivos: Aplicación a la Detección de Fraudes en Tarjetas De CréditoMétodos Predictivos: Aplicación a la Detección de Fraudes en Tarjetas De Crédito
Métodos Predictivos: Aplicación a la Detección de Fraudes en Tarjetas De CréditoDMC Perú
 
Big data y Marketing digital
Big data y Marketing digitalBig data y Marketing digital
Big data y Marketing digitalDMC Perú
 
Predictive Analysis of Health Records using MATLAB
Predictive Analysis of Health Records using MATLABPredictive Analysis of Health Records using MATLAB
Predictive Analysis of Health Records using MATLABUmang Shukla
 
La Modelización Predictiva como Herramienta de Innovación
La Modelización Predictiva como Herramienta de InnovaciónLa Modelización Predictiva como Herramienta de Innovación
La Modelización Predictiva como Herramienta de InnovaciónDMC Perú
 
Curso Modelos Predictivos - Luis Carlos Silva
Curso Modelos Predictivos - Luis Carlos SilvaCurso Modelos Predictivos - Luis Carlos Silva
Curso Modelos Predictivos - Luis Carlos Silvapyjote
 
Fundamentos de Data Mining con R
Fundamentos de Data Mining con RFundamentos de Data Mining con R
Fundamentos de Data Mining con RSoftware Guru
 
Evolución de Herramientas de BI hacia el Entorno BigData
Evolución de Herramientas de BI hacia el Entorno BigDataEvolución de Herramientas de BI hacia el Entorno BigData
Evolución de Herramientas de BI hacia el Entorno BigDataDMC Perú
 
Técnicas y Modelos de Mineria de Datos
Técnicas y Modelos de Mineria de DatosTécnicas y Modelos de Mineria de Datos
Técnicas y Modelos de Mineria de Datosiloylan
 
Presentación Nexolution
Presentación Nexolution Presentación Nexolution
Presentación Nexolution Nexolution
 
Uni fiee scm sesion 07 modelos empiricos de prediccion de propagación para ma...
Uni fiee scm sesion 07 modelos empiricos de prediccion de propagación para ma...Uni fiee scm sesion 07 modelos empiricos de prediccion de propagación para ma...
Uni fiee scm sesion 07 modelos empiricos de prediccion de propagación para ma...c09271
 
Introducción a Modelos Predictivos de Fuga de Clientes
Introducción a Modelos Predictivos de Fuga de ClientesIntroducción a Modelos Predictivos de Fuga de Clientes
Introducción a Modelos Predictivos de Fuga de ClientesHugo E. Cisternas
 
Caracteristicas de los modelos de propagacion
Caracteristicas de los modelos de propagacionCaracteristicas de los modelos de propagacion
Caracteristicas de los modelos de propagacionalfredo_tics
 
¿Qué es un modelo predictivo y para qué vale?
¿Qué es un modelo predictivo y para qué vale?¿Qué es un modelo predictivo y para qué vale?
¿Qué es un modelo predictivo y para qué vale?Scoremind
 

Destacado (20)

Modelos predictivos: datos, métodos, problemas y aplicaciones
Modelos predictivos: datos, métodos, problemas y aplicacionesModelos predictivos: datos, métodos, problemas y aplicaciones
Modelos predictivos: datos, métodos, problemas y aplicaciones
 
Soluciones de Big Data en el Entorno Analítico de SAS
Soluciones de Big Data en el Entorno Analítico de SASSoluciones de Big Data en el Entorno Analítico de SAS
Soluciones de Big Data en el Entorno Analítico de SAS
 
Métodos predictivos y Descriptivos - MINERÍA DE DATOS
Métodos predictivos y Descriptivos - MINERÍA DE DATOSMétodos predictivos y Descriptivos - MINERÍA DE DATOS
Métodos predictivos y Descriptivos - MINERÍA DE DATOS
 
Nuevos Enfoques del Business Analytics: "Faster Prediction, Better Decision"
Nuevos Enfoques del Business Analytics: "Faster Prediction, Better Decision"Nuevos Enfoques del Business Analytics: "Faster Prediction, Better Decision"
Nuevos Enfoques del Business Analytics: "Faster Prediction, Better Decision"
 
Métodos Predictivos: Aplicación a la Detección de Fraudes en Tarjetas De Crédito
Métodos Predictivos: Aplicación a la Detección de Fraudes en Tarjetas De CréditoMétodos Predictivos: Aplicación a la Detección de Fraudes en Tarjetas De Crédito
Métodos Predictivos: Aplicación a la Detección de Fraudes en Tarjetas De Crédito
 
Big data y Marketing digital
Big data y Marketing digitalBig data y Marketing digital
Big data y Marketing digital
 
Predictive analysis of Bihar election 2015
Predictive analysis of Bihar election 2015Predictive analysis of Bihar election 2015
Predictive analysis of Bihar election 2015
 
Predictive Analysis of Health Records using MATLAB
Predictive Analysis of Health Records using MATLABPredictive Analysis of Health Records using MATLAB
Predictive Analysis of Health Records using MATLAB
 
La Modelización Predictiva como Herramienta de Innovación
La Modelización Predictiva como Herramienta de InnovaciónLa Modelización Predictiva como Herramienta de Innovación
La Modelización Predictiva como Herramienta de Innovación
 
Curso Modelos Predictivos - Luis Carlos Silva
Curso Modelos Predictivos - Luis Carlos SilvaCurso Modelos Predictivos - Luis Carlos Silva
Curso Modelos Predictivos - Luis Carlos Silva
 
Fundamentos de Data Mining con R
Fundamentos de Data Mining con RFundamentos de Data Mining con R
Fundamentos de Data Mining con R
 
Evolución de Herramientas de BI hacia el Entorno BigData
Evolución de Herramientas de BI hacia el Entorno BigDataEvolución de Herramientas de BI hacia el Entorno BigData
Evolución de Herramientas de BI hacia el Entorno BigData
 
Técnicas y Modelos de Mineria de Datos
Técnicas y Modelos de Mineria de DatosTécnicas y Modelos de Mineria de Datos
Técnicas y Modelos de Mineria de Datos
 
Presentación Nexolution
Presentación Nexolution Presentación Nexolution
Presentación Nexolution
 
Uni fiee scm sesion 07 modelos empiricos de prediccion de propagación para ma...
Uni fiee scm sesion 07 modelos empiricos de prediccion de propagación para ma...Uni fiee scm sesion 07 modelos empiricos de prediccion de propagación para ma...
Uni fiee scm sesion 07 modelos empiricos de prediccion de propagación para ma...
 
Data mining
Data miningData mining
Data mining
 
Introducción a Modelos Predictivos de Fuga de Clientes
Introducción a Modelos Predictivos de Fuga de ClientesIntroducción a Modelos Predictivos de Fuga de Clientes
Introducción a Modelos Predictivos de Fuga de Clientes
 
Caracteristicas de los modelos de propagacion
Caracteristicas de los modelos de propagacionCaracteristicas de los modelos de propagacion
Caracteristicas de los modelos de propagacion
 
¿Qué es un modelo predictivo y para qué vale?
¿Qué es un modelo predictivo y para qué vale?¿Qué es un modelo predictivo y para qué vale?
¿Qué es un modelo predictivo y para qué vale?
 
Inteligencia de negocios
Inteligencia de negociosInteligencia de negocios
Inteligencia de negocios
 

Similar a Big Data Analytics: Automatización de Modelos Predictivos

Introducción al análisis predictivo con SQL Server
Introducción al análisis predictivo con SQL ServerIntroducción al análisis predictivo con SQL Server
Introducción al análisis predictivo con SQL ServerEduardo Castro
 
Minería datos con SQL Server 2012
Minería datos con SQL Server 2012Minería datos con SQL Server 2012
Minería datos con SQL Server 2012Eduardo Castro
 
Presentacion software-Predictive Analytics
Presentacion software-Predictive AnalyticsPresentacion software-Predictive Analytics
Presentacion software-Predictive AnalyticsMauricio Smith Mejia
 
Analysis Services
Analysis ServicesAnalysis Services
Analysis ServicesMartha
 
Mejores prácticas de Data Warehouse con SQL Server
Mejores prácticas de Data Warehouse con SQL ServerMejores prácticas de Data Warehouse con SQL Server
Mejores prácticas de Data Warehouse con SQL ServerSpanishPASSVC
 
INTRODUCCIÓN A LA CIENCIA DE DATOS.pptx
INTRODUCCIÓN A LA CIENCIA DE DATOS.pptxINTRODUCCIÓN A LA CIENCIA DE DATOS.pptx
INTRODUCCIÓN A LA CIENCIA DE DATOS.pptxCabezaDePinga
 
Sql server analysis services 2008
Sql server analysis services 2008Sql server analysis services 2008
Sql server analysis services 2008Will Flores Soto
 
Presentación BI - Azure_VFinal_RevOleon.pptx
Presentación BI - Azure_VFinal_RevOleon.pptxPresentación BI - Azure_VFinal_RevOleon.pptx
Presentación BI - Azure_VFinal_RevOleon.pptxPedroJesusManzanares
 
BrokerTrade Aplicación para la recomendación de compra de Acciones en tiempo ...
BrokerTrade Aplicación para la recomendación de compra de Acciones en tiempo ...BrokerTrade Aplicación para la recomendación de compra de Acciones en tiempo ...
BrokerTrade Aplicación para la recomendación de compra de Acciones en tiempo ...Albert Obiols
 
Afinando la Administración de SQL Server y Novedades de Administración 2016 -...
Afinando la Administración de SQL Server y Novedades de Administración 2016 -...Afinando la Administración de SQL Server y Novedades de Administración 2016 -...
Afinando la Administración de SQL Server y Novedades de Administración 2016 -...SolidQ
 
Mineria y modelado de datos
Mineria y modelado de datosMineria y modelado de datos
Mineria y modelado de datosSergio Salimbeni
 
Que Es Un Datawarehouse
Que Es Un DatawarehouseQue Es Un Datawarehouse
Que Es Un Datawarehouseguest10616d
 

Similar a Big Data Analytics: Automatización de Modelos Predictivos (20)

Introducción al análisis predictivo con SQL Server
Introducción al análisis predictivo con SQL ServerIntroducción al análisis predictivo con SQL Server
Introducción al análisis predictivo con SQL Server
 
Minería datos con SQL Server 2012
Minería datos con SQL Server 2012Minería datos con SQL Server 2012
Minería datos con SQL Server 2012
 
Presentacion software-Predictive Analytics
Presentacion software-Predictive AnalyticsPresentacion software-Predictive Analytics
Presentacion software-Predictive Analytics
 
Analysis services
Analysis  servicesAnalysis  services
Analysis services
 
Analysis Services
Analysis ServicesAnalysis Services
Analysis Services
 
Data mart
Data martData mart
Data mart
 
Entregable final
Entregable finalEntregable final
Entregable final
 
Mejores prácticas de Data Warehouse con SQL Server
Mejores prácticas de Data Warehouse con SQL ServerMejores prácticas de Data Warehouse con SQL Server
Mejores prácticas de Data Warehouse con SQL Server
 
INTRODUCCIÓN A LA CIENCIA DE DATOS.pptx
INTRODUCCIÓN A LA CIENCIA DE DATOS.pptxINTRODUCCIÓN A LA CIENCIA DE DATOS.pptx
INTRODUCCIÓN A LA CIENCIA DE DATOS.pptx
 
Inducción
InducciónInducción
Inducción
 
Sql server analysis services 2008
Sql server analysis services 2008Sql server analysis services 2008
Sql server analysis services 2008
 
Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
 
Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
 
Presentación BI - Azure_VFinal_RevOleon.pptx
Presentación BI - Azure_VFinal_RevOleon.pptxPresentación BI - Azure_VFinal_RevOleon.pptx
Presentación BI - Azure_VFinal_RevOleon.pptx
 
BrokerTrade Aplicación para la recomendación de compra de Acciones en tiempo ...
BrokerTrade Aplicación para la recomendación de compra de Acciones en tiempo ...BrokerTrade Aplicación para la recomendación de compra de Acciones en tiempo ...
BrokerTrade Aplicación para la recomendación de compra de Acciones en tiempo ...
 
Afinando la Administración de SQL Server y Novedades de Administración 2016 -...
Afinando la Administración de SQL Server y Novedades de Administración 2016 -...Afinando la Administración de SQL Server y Novedades de Administración 2016 -...
Afinando la Administración de SQL Server y Novedades de Administración 2016 -...
 
Bayer EIS y proceso de toma de decisiones
Bayer EIS y proceso de toma de decisionesBayer EIS y proceso de toma de decisiones
Bayer EIS y proceso de toma de decisiones
 
Mineria y modelado de datos
Mineria y modelado de datosMineria y modelado de datos
Mineria y modelado de datos
 
Que Es Un Datawarehouse
Que Es Un DatawarehouseQue Es Un Datawarehouse
Que Es Un Datawarehouse
 
S15 bi v1-1
S15 bi v1-1S15 bi v1-1
S15 bi v1-1
 

Más de DMC Perú

DMC Talk - Blockchain Stamping
DMC Talk - Blockchain StampingDMC Talk - Blockchain Stamping
DMC Talk - Blockchain StampingDMC Perú
 
DMC Talk - Presentacion Voicebots
DMC Talk - Presentacion VoicebotsDMC Talk - Presentacion Voicebots
DMC Talk - Presentacion VoicebotsDMC Perú
 
Perfiles profesionales en analytics - DMC Perú
Perfiles profesionales en analytics - DMC Perú Perfiles profesionales en analytics - DMC Perú
Perfiles profesionales en analytics - DMC Perú DMC Perú
 
Sistema recomendador - DMC 2018
Sistema recomendador - DMC 2018Sistema recomendador - DMC 2018
Sistema recomendador - DMC 2018DMC Perú
 
Democratización de ciencia de datos
Democratización de ciencia de datosDemocratización de ciencia de datos
Democratización de ciencia de datosDMC Perú
 
Relación Entre Big Data, Data Mining y Estadística
Relación Entre Big Data, Data Mining y EstadísticaRelación Entre Big Data, Data Mining y Estadística
Relación Entre Big Data, Data Mining y EstadísticaDMC Perú
 
Relación Entre Big Data, Data Mining y Estadística
Relación Entre Big Data, Data Mining y EstadísticaRelación Entre Big Data, Data Mining y Estadística
Relación Entre Big Data, Data Mining y EstadísticaDMC Perú
 
Plataformas Analíticas como Soporte en la Era del Big Data
Plataformas Analíticas como Soporte en la Era del Big DataPlataformas Analíticas como Soporte en la Era del Big Data
Plataformas Analíticas como Soporte en la Era del Big DataDMC Perú
 
BigDataSummitPeru - Big Data y Hadoop
BigDataSummitPeru - Big Data y HadoopBigDataSummitPeru - Big Data y Hadoop
BigDataSummitPeru - Big Data y HadoopDMC Perú
 
Caso netflix
Caso netflixCaso netflix
Caso netflixDMC Perú
 
Text Mining: Segmentaciónd de Usuarios de Twitter. Lima Metropolitana.
Text Mining: Segmentaciónd de Usuarios de Twitter. Lima Metropolitana.Text Mining: Segmentaciónd de Usuarios de Twitter. Lima Metropolitana.
Text Mining: Segmentaciónd de Usuarios de Twitter. Lima Metropolitana.DMC Perú
 
¿Que es el Text Mining?
¿Que es el Text Mining?¿Que es el Text Mining?
¿Que es el Text Mining?DMC Perú
 

Más de DMC Perú (13)

DMC Talk - Blockchain Stamping
DMC Talk - Blockchain StampingDMC Talk - Blockchain Stamping
DMC Talk - Blockchain Stamping
 
DMC Talk - Presentacion Voicebots
DMC Talk - Presentacion VoicebotsDMC Talk - Presentacion Voicebots
DMC Talk - Presentacion Voicebots
 
Perfiles profesionales en analytics - DMC Perú
Perfiles profesionales en analytics - DMC Perú Perfiles profesionales en analytics - DMC Perú
Perfiles profesionales en analytics - DMC Perú
 
Sistema recomendador - DMC 2018
Sistema recomendador - DMC 2018Sistema recomendador - DMC 2018
Sistema recomendador - DMC 2018
 
Democratización de ciencia de datos
Democratización de ciencia de datosDemocratización de ciencia de datos
Democratización de ciencia de datos
 
Relación Entre Big Data, Data Mining y Estadística
Relación Entre Big Data, Data Mining y EstadísticaRelación Entre Big Data, Data Mining y Estadística
Relación Entre Big Data, Data Mining y Estadística
 
Relación Entre Big Data, Data Mining y Estadística
Relación Entre Big Data, Data Mining y EstadísticaRelación Entre Big Data, Data Mining y Estadística
Relación Entre Big Data, Data Mining y Estadística
 
Plataformas Analíticas como Soporte en la Era del Big Data
Plataformas Analíticas como Soporte en la Era del Big DataPlataformas Analíticas como Soporte en la Era del Big Data
Plataformas Analíticas como Soporte en la Era del Big Data
 
BigDataSummitPeru - Big Data y Hadoop
BigDataSummitPeru - Big Data y HadoopBigDataSummitPeru - Big Data y Hadoop
BigDataSummitPeru - Big Data y Hadoop
 
Caso netflix
Caso netflixCaso netflix
Caso netflix
 
Text Mining: Segmentaciónd de Usuarios de Twitter. Lima Metropolitana.
Text Mining: Segmentaciónd de Usuarios de Twitter. Lima Metropolitana.Text Mining: Segmentaciónd de Usuarios de Twitter. Lima Metropolitana.
Text Mining: Segmentaciónd de Usuarios de Twitter. Lima Metropolitana.
 
Web Mining
Web MiningWeb Mining
Web Mining
 
¿Que es el Text Mining?
¿Que es el Text Mining?¿Que es el Text Mining?
¿Que es el Text Mining?
 

Último

Qué es un Histograma estadístico teoria y problema
Qué es un Histograma estadístico teoria y problemaQué es un Histograma estadístico teoria y problema
Qué es un Histograma estadístico teoria y problemaJoellyAlejandraRodrg
 
INTRODUCCION-A-LOS-ALGORITMOS-BASICOS.pptx
INTRODUCCION-A-LOS-ALGORITMOS-BASICOS.pptxINTRODUCCION-A-LOS-ALGORITMOS-BASICOS.pptx
INTRODUCCION-A-LOS-ALGORITMOS-BASICOS.pptxJamesHerberthBacaTel
 
COMUNICADO PARA TODO TIPO DE REUNIONES .
COMUNICADO PARA TODO TIPO DE REUNIONES .COMUNICADO PARA TODO TIPO DE REUNIONES .
COMUNICADO PARA TODO TIPO DE REUNIONES .GIANELAKAINACHALLCOJ2
 
Reservas de divisas y oro en México en sexenio de AMLO (2018-2024).pdf
Reservas de divisas y oro en México en sexenio de AMLO (2018-2024).pdfReservas de divisas y oro en México en sexenio de AMLO (2018-2024).pdf
Reservas de divisas y oro en México en sexenio de AMLO (2018-2024).pdfJC Díaz Herrera
 
Familias_más_ricas_de_AL_en_la_historia.pdf
Familias_más_ricas_de_AL_en_la_historia.pdfFamilias_más_ricas_de_AL_en_la_historia.pdf
Familias_más_ricas_de_AL_en_la_historia.pdfJC Díaz Herrera
 
llllllllllllllllllllllllllllllllllllllllllllllllllllllllll
llllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllll
llllllllllllllllllllllllllllllllllllllllllllllllllllllllllJulietaCarbajalOsis
 
Los artistas mexicanos con más ventas de discos en la historia (2024).pdf
Los artistas mexicanos con más ventas de discos en la historia (2024).pdfLos artistas mexicanos con más ventas de discos en la historia (2024).pdf
Los artistas mexicanos con más ventas de discos en la historia (2024).pdfJC Díaz Herrera
 
Las familias más ricas del sionismo en el siglo XXI.pdf
Las familias más ricas del sionismo en el siglo XXI.pdfLas familias más ricas del sionismo en el siglo XXI.pdf
Las familias más ricas del sionismo en el siglo XXI.pdfJC Díaz Herrera
 
Posiciones del IDH a nivel global en México (1982-2024).pdf
Posiciones del IDH a nivel global en México (1982-2024).pdfPosiciones del IDH a nivel global en México (1982-2024).pdf
Posiciones del IDH a nivel global en México (1982-2024).pdfJC Díaz Herrera
 
Industria musical de EUA vs Industria musical Corea del Sur (2024).pdf
Industria musical de EUA vs Industria musical Corea del Sur (2024).pdfIndustria musical de EUA vs Industria musical Corea del Sur (2024).pdf
Industria musical de EUA vs Industria musical Corea del Sur (2024).pdfJC Díaz Herrera
 
triptico-de-las-drogas en la adolescencia
triptico-de-las-drogas en la adolescenciatriptico-de-las-drogas en la adolescencia
triptico-de-las-drogas en la adolescenciaferg6120
 
Listas de Fundamentos de Programación 2024
Listas de Fundamentos de Programación 2024Listas de Fundamentos de Programación 2024
Listas de Fundamentos de Programación 2024AndrsReinosoSnchez1
 
Técnica palatina baja, anestesiología dental
Técnica palatina baja, anestesiología dentalTécnica palatina baja, anestesiología dental
Técnica palatina baja, anestesiología dentalIngrid459352
 
Gestión Logística maria palmira guti cabajal
Gestión Logística maria palmira guti cabajalGestión Logística maria palmira guti cabajal
Gestión Logística maria palmira guti cabajalMarcosAlvarezSalinas
 
Investigacion cualitativa y cuantitativa....pdf
Investigacion cualitativa y cuantitativa....pdfInvestigacion cualitativa y cuantitativa....pdf
Investigacion cualitativa y cuantitativa....pdfalexanderleonyonange
 
Las marcas automotrices con más ventas de vehículos (2024).pdf
Las marcas automotrices con más ventas de vehículos (2024).pdfLas marcas automotrices con más ventas de vehículos (2024).pdf
Las marcas automotrices con más ventas de vehículos (2024).pdfJC Díaz Herrera
 
Países por velocidad de sus misiles hipersónicos (2024).pdf
Países por velocidad de sus misiles hipersónicos  (2024).pdfPaíses por velocidad de sus misiles hipersónicos  (2024).pdf
Países por velocidad de sus misiles hipersónicos (2024).pdfJC Díaz Herrera
 
Análisis de datos en acción: Optimizando el crecimiento de Cyclistic
Análisis de datos en acción: Optimizando el crecimiento de CyclisticAnálisis de datos en acción: Optimizando el crecimiento de Cyclistic
Análisis de datos en acción: Optimizando el crecimiento de CyclisticJamithGarcia1
 
Tendencias en la Gestión del Talento Humano.pdf
Tendencias en la Gestión del Talento Humano.pdfTendencias en la Gestión del Talento Humano.pdf
Tendencias en la Gestión del Talento Humano.pdfdanaeamadot
 
CALENDARIZACIÓN ACTUALIZADA DEL 2024 alt.pdf
CALENDARIZACIÓN ACTUALIZADA DEL 2024 alt.pdfCALENDARIZACIÓN ACTUALIZADA DEL 2024 alt.pdf
CALENDARIZACIÓN ACTUALIZADA DEL 2024 alt.pdfPOULANDERSONDELGADOA2
 

Último (20)

Qué es un Histograma estadístico teoria y problema
Qué es un Histograma estadístico teoria y problemaQué es un Histograma estadístico teoria y problema
Qué es un Histograma estadístico teoria y problema
 
INTRODUCCION-A-LOS-ALGORITMOS-BASICOS.pptx
INTRODUCCION-A-LOS-ALGORITMOS-BASICOS.pptxINTRODUCCION-A-LOS-ALGORITMOS-BASICOS.pptx
INTRODUCCION-A-LOS-ALGORITMOS-BASICOS.pptx
 
COMUNICADO PARA TODO TIPO DE REUNIONES .
COMUNICADO PARA TODO TIPO DE REUNIONES .COMUNICADO PARA TODO TIPO DE REUNIONES .
COMUNICADO PARA TODO TIPO DE REUNIONES .
 
Reservas de divisas y oro en México en sexenio de AMLO (2018-2024).pdf
Reservas de divisas y oro en México en sexenio de AMLO (2018-2024).pdfReservas de divisas y oro en México en sexenio de AMLO (2018-2024).pdf
Reservas de divisas y oro en México en sexenio de AMLO (2018-2024).pdf
 
Familias_más_ricas_de_AL_en_la_historia.pdf
Familias_más_ricas_de_AL_en_la_historia.pdfFamilias_más_ricas_de_AL_en_la_historia.pdf
Familias_más_ricas_de_AL_en_la_historia.pdf
 
llllllllllllllllllllllllllllllllllllllllllllllllllllllllll
llllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllll
llllllllllllllllllllllllllllllllllllllllllllllllllllllllll
 
Los artistas mexicanos con más ventas de discos en la historia (2024).pdf
Los artistas mexicanos con más ventas de discos en la historia (2024).pdfLos artistas mexicanos con más ventas de discos en la historia (2024).pdf
Los artistas mexicanos con más ventas de discos en la historia (2024).pdf
 
Las familias más ricas del sionismo en el siglo XXI.pdf
Las familias más ricas del sionismo en el siglo XXI.pdfLas familias más ricas del sionismo en el siglo XXI.pdf
Las familias más ricas del sionismo en el siglo XXI.pdf
 
Posiciones del IDH a nivel global en México (1982-2024).pdf
Posiciones del IDH a nivel global en México (1982-2024).pdfPosiciones del IDH a nivel global en México (1982-2024).pdf
Posiciones del IDH a nivel global en México (1982-2024).pdf
 
Industria musical de EUA vs Industria musical Corea del Sur (2024).pdf
Industria musical de EUA vs Industria musical Corea del Sur (2024).pdfIndustria musical de EUA vs Industria musical Corea del Sur (2024).pdf
Industria musical de EUA vs Industria musical Corea del Sur (2024).pdf
 
triptico-de-las-drogas en la adolescencia
triptico-de-las-drogas en la adolescenciatriptico-de-las-drogas en la adolescencia
triptico-de-las-drogas en la adolescencia
 
Listas de Fundamentos de Programación 2024
Listas de Fundamentos de Programación 2024Listas de Fundamentos de Programación 2024
Listas de Fundamentos de Programación 2024
 
Técnica palatina baja, anestesiología dental
Técnica palatina baja, anestesiología dentalTécnica palatina baja, anestesiología dental
Técnica palatina baja, anestesiología dental
 
Gestión Logística maria palmira guti cabajal
Gestión Logística maria palmira guti cabajalGestión Logística maria palmira guti cabajal
Gestión Logística maria palmira guti cabajal
 
Investigacion cualitativa y cuantitativa....pdf
Investigacion cualitativa y cuantitativa....pdfInvestigacion cualitativa y cuantitativa....pdf
Investigacion cualitativa y cuantitativa....pdf
 
Las marcas automotrices con más ventas de vehículos (2024).pdf
Las marcas automotrices con más ventas de vehículos (2024).pdfLas marcas automotrices con más ventas de vehículos (2024).pdf
Las marcas automotrices con más ventas de vehículos (2024).pdf
 
Países por velocidad de sus misiles hipersónicos (2024).pdf
Países por velocidad de sus misiles hipersónicos  (2024).pdfPaíses por velocidad de sus misiles hipersónicos  (2024).pdf
Países por velocidad de sus misiles hipersónicos (2024).pdf
 
Análisis de datos en acción: Optimizando el crecimiento de Cyclistic
Análisis de datos en acción: Optimizando el crecimiento de CyclisticAnálisis de datos en acción: Optimizando el crecimiento de Cyclistic
Análisis de datos en acción: Optimizando el crecimiento de Cyclistic
 
Tendencias en la Gestión del Talento Humano.pdf
Tendencias en la Gestión del Talento Humano.pdfTendencias en la Gestión del Talento Humano.pdf
Tendencias en la Gestión del Talento Humano.pdf
 
CALENDARIZACIÓN ACTUALIZADA DEL 2024 alt.pdf
CALENDARIZACIÓN ACTUALIZADA DEL 2024 alt.pdfCALENDARIZACIÓN ACTUALIZADA DEL 2024 alt.pdf
CALENDARIZACIÓN ACTUALIZADA DEL 2024 alt.pdf
 

Big Data Analytics: Automatización de Modelos Predictivos

  • 1. Big Data Analytics: Automatización de Modelos Predictivos José Angel Alvarez
  • 2. © 2007. MAySA Big Data Analytics • Responder preguntas "más grandes" (con mayor cantidad y variedad de datos)… • más detalladas… • más rápidamente (en tiempo real, en muchos casos). • Detección de fraude en transacciones en línea • Marketing uno-a-uno en tiempo real • Gestión de inventarios y distribuciones en grandes cadenas • Optimización de precios en tiendas departamentales • Internet de las cosas Se necesitan millones de modelos!
  • 3. © 2007. MAySA La única solución: automatización Big Data AnalyticsAnalytics tradicional
  • 4. © 2007. MAySA Práctica actual (Analytics tradicional)
  • 5. © 2007. MAySA Objetivos • Analizar las características de la automatización en herramientas de modelamiento • Proponer estrategias útiles en la práctica actual del analista para acelerar los procesos de desarrollo de modelos
  • 6. © 2007. MAySA Tecnologías de Big Data Analytics involucradas Automatización del modelamiento Tecnologías de adquisición e integración de datos, de procesamiento en línea e identificación de eventos, almacenamiento en diversos tipos de arquitecturas (especialmente no relacionales), tecnologías de data governance, tecnologías de estandarización de interfases (REST y otras), tecnologías de exploración y visualización de datos, tecnologías de orquestación de los diversos componentes en una plataforma integrada de Analytics, tecnologías de procesamiento en memoria, tecnologías de procesamiento distribuido y paralelo, etc.
  • 7. © 2007. MAySA Tecnologías de… 7 • Forecasting de alta performance • SAS Forecast Server • Mineria de datos • SAS BIS • SAS Model Manager • SAS RPM • SAS Factory Miner • Optimización de precios • SAS Revenue Optimization
  • 8. © 2007. MAySA Forecasting de alta performance – Pronósticos confiables de muchas series que deben actualizarse frecuente y regularmente – No hay suficientes recursos para pronósticos tradicionales
  • 9. © 2007. MAySA Forecasting “por excepción” Series de tiempo 80% pueden pronosticarse automáticamente. 10% requieren un esfuerzo extra 10% no pueden pronosticarse precisamente. El analista debe concentrarse en las series… • problemáticas • de alto valor
  • 10. © 2007. MAySA Herramientas de automatización • Preparación automática de las series • Repositorio de modelos • Repositorio de eventos • Selección automática de modelos apropiados • Detección y modelamiento automático de outliers • Forecasting jerárquico y reconciliación • Resúmenes estadísticos del conjunto de modelos • Exploración y modificación eficaz de series y modelos individuales 10
  • 11. © 2007. MAySA Repositorio de modelos de forecasting
  • 12. © 2007. MAySA Repositorio de eventos y variables independientes
  • 13. © 2007. MAySA Jerarquías: agregación y reconciliación 16 8 4 20 10 32 0 +3 +1 0 0 +4 10 • Volatilidad • Series cortas
  • 14. © 2007. MAySA Serie con y sin reconciliación
  • 15. © 2007. MAySA Tareas del analista • Configuración inicial del proyecto • Verificar los resultados generales del modelamiento • Identificar las series de mayor interés o valor que no han alcanzado el nivel de precisión apropiado • Intervenir manualmente sobre estas series 15
  • 16. © 2007. MAySA Configuración inicial de un proyecto
  • 17. © 2007. MAySA Resumen estadístico global de los resultados
  • 18. © 2007. MAySA Distribución de MAPEs de los modelos del proyecto
  • 19. © 2007. MAySA Resumen de los tipos de modelos usados
  • 20. © 2007. MAySA Exploración de una serie individual
  • 21. © 2007. MAySA Automatización en forecasting • Se basa en ajustar por fuerza bruta un conjunto de modelos a cada serie (incluidas algunas transformaciones) y seleccionar el mejor modelo en base a una métrica. • Las tareas esenciales del analista son la configuración inicial del proyecto (qué diagnósticos, qué transformaciones, qué modelos, qué métrica, etc.) , la detección de aquellos modelos sobre los que vale la pena que intervenga manualmente y su modificación • La configuración inicial del proyecto es muy importante para acotar la búsqueda de modelos por fuerza bruta. 21
  • 22. © 2007. MAySA Automatización de modelos de minería de datos • SAS BIS • SAS Model Manager • SAS RPM • SAS Factory Miner
  • 23. © 2007. MAySA Soluciones Empaquetadas para industrias verticales • DW , Data marts especializados y scripts de carga • Plantillas de modelamiento • Portal de administración
  • 24. © 2007. MAySA Modelo "táctico" de cross-sell y up-sell de BIS Quién comprará un producto particular.
  • 25. © 2007. MAySA Soluciones Empaquetadas para industrias verticales • La arquitectura de datos, un data warehouse diseñado según las mejores prácticas en un sector industrial y data marts para aplicaciones específicas, permite a una empresa acelerar considerablemente las etapas de diseño de estas estructuras y carga de datos, al menos en la teoría. • En la práctica, la aceleración en el desarrollo de un proyecto o "sistema" de minería de datos es un poco más dificultosa de lo que plantean estas soluciones en la teoría. • Un déficit frecuente en las empresas usuarias de Analytics: el insumo principal de proyectos son los datos, pero la adquisición de los mismos, su análisis y mantenimiento (como datos), su estandarización, su propia "semántica", etc. suele manejarse de un modo inorgánico, desarticulado, etc., algo que tiene un impacto importante sobre la eficiencia de uno de sus principales consumidores: las tareas de Analytics. 25
  • 26. © 2007. MAySA Integración del Analytics Analista Gerencia Ops IT Integradores de datos Comerciales Governance STAKEHOLDERS Servicio al cliente Retail Logística Promociones OPERACIONES TARGET Clientes Accionistas Proveedores Empleados
  • 27. © 2007. MAySA SAS Model Manager • Herramienta de automatización de la gestión de modelos. • Definir y gerenciar un workflow para automatizar parcialmente las distintas etapas del ciclo de vida de un modelo y hacerlas más eficaces • Posee herramientas que permiten detectar cambios significativos en la distribución de las variables que integran un modelo y generar alertas, detectar cambios en la distribución de las predicciones de un modelo (lo que habitualmente se llama estabilidad) y el deterioro en las métricas de evaluación del mismo (lift, error cuadrático medio, K-S, etc.). • También puede realizar ajustes automáticos de los parámetros de un modelo cuando este se ha desajustado, reemplazar un modelo por otro competidor que en algún momento consigue mejor performance, y la automatización de la puesta en producción de los modelos. 27
  • 28. © 2007. MAySA Interfase SAS Model Manager
  • 29. © 2007. MAySA Interfase SAS Model Manager 29
  • 30. © 2007. MAySA SAS Model Manager 30 Un modelo no es un objeto aislado y separable de otros diversos objetos.
  • 31. © 2007. MAySA SAS Rapid Predictive Modeler (RPM) 31
  • 32. © 2007. MAySA SAS Rapid Predictive Modeler (RPM)
  • 33. © 2007. MAySA SAS Rapid Predictive Modeler (RPM) 33
  • 34. © 2007. MAySA SAS Rapid Predictive Modeler (RPM 34
  • 35. © 2007. MAySA SAS Rapid Predictive Modeler (RPM) 35
  • 36. © 2007. MAySA SAS Rapid Predictive Modeler (RPM) • La automatización consiste en aplicar técnicas básicas de transformación, imputación y selección de variables, además de las técnicas de modelamiento más comunes. • En casi todos los casos se utilizan las configuraciones default de los nodos. • Al igual que en el Model Manager, la automatización se basa en proyectos con una cantidad relativamente baja de modelos. • La intervención del analista solamente ocurre en la configuración inicial que es bastante básica y genérica, sin la posibilidad de hacer algún ajuste en base a conocimiento de dominio. • Lo sorprendente de estas plantillas genéricas es que usualmente esta configuración muy elemental basta para generar modelos iniciales bastante buenos que luego, si es necesario, pueden perfeccionarse. 36
  • 37. © 2007. MAySA SAS Factory Miner
  • 38. © 2007. MAySA SAS Factory Miner • Modelamiento en paralelo de múltiples segmentos de una población (subyace a esta característica la idea de la microsegmentación). • Se ajustan automáticamente los modelos seleccionados (entre los que pueden incluirse árboles de decisiones, regresión, redes neuronales, modelos lineales generalizados, redes bayesianas, máquinas de soporte vectorial y algún otro) y se selecciona en cada caso el modelo campeón según alguna métrica elegida. • Las herramientas de navegación facilitan la exploración de cualquier modelo de cualquier segmento, se generan los gráficos usuales de comparación y se calculan las métricas de evaluación habituales. • La herramienta se basa en una arquitectura de alta performance que le permite ajustar rápidamente modelos "pesados" como Random Forest, máquinas de soporte vectorial y otros. 38
  • 39. © 2007. MAySA SAS Factory Miner 39 Visualización de los resultados de los modelos ajustados a un segmento de datos
  • 40. © 2007. MAySA SAS Factory Miner 40 Análisis de los resultados generales a través de segmentos y targets para un proyecto y monitoreo de performance
  • 41. © 2007. MAySA Automatización en Minería de datos • La estrategia de automatización es la prueba por fuerza bruta de algunos pocos modelos, transformaciones, etc. Son los que tienen, en la práctica, una frecuencia de utilización muy alta. • En minería de datos no es "popular" la utilización de una estrategia de predicción por excepción, pero esto no es incompatible en absoluto con el diseño de las herramientas existentes • Una cuestión que parece estar ausente en las aplicaciones mencionadas, es la utilización del concepto de jerarquía de modelos. • Recién en el SAS Factory Miner aparece la noción de modelamiento simultáneo sobre distintos conjuntos de datos (segmentos) en un mismo proyecto. 41
  • 42. © 2007. MAySA Automatización en Minería de datos • El nivel de automatización y su alcance no permiten todavía a cubrir las necesidades del Big Data Analytics, si bien el SAS Factory Miner parece un buen primer paso • La adquisición y preparación de datos tienen un bajo nivel de automatización. La preparación de datos se basa en la prueba de transformaciones básicas en versiones default. • La administración de modelos tampoco tiene la escala necesaria. Se necesita una gestión más "inteligente" y extensiva para reducir la intervención manual 42
  • 43. © 2007. MAySA Automatización en Minería de datos • El rol del analista es similar: – Configuración inicial de un proyecto – Exploración general de los resultados – Intervención manual en modelos de alto valor que no hayan alcanzado el estándar deseado 43
  • 44. © 2007. MAySA SAS® Revenue Optimization Suite 44
  • 45. © 2007. MAySA • Modelo de demanda Estimacio- nes Elasticidad, efectos cruzados, Promos Pronóstico de base Total Demanda  Optimización User inputs Reglas, objetivos, etc. Total Demanda Precio/ofer- ta óptima Optimización de precios
  • 46. © 2007. MAySA SAS® Revenue Optimization Suite • Estas soluciones implementan lo que SAS denomina "modelamiento prescriptivo", el uso de modelos de demanda predefinidos, plantillas, que permiten acelerar y automatizar su implementación y finalmente la optimización. • Las plantillas predefinidas son siete según el tipo de producto: productos estacionales y otros con ciclos de vida cortos, productos básicos no estacionales, etc. • Cada plantilla posee un número de "especificaciones" que es necesario calibrar según valores apropiados para el conjunto de productos/puntos de venta del sector económico y la empresa a la que se aplican. 46
  • 47. © 2007. MAySA Modelo de demanda típico Los componentes se combinan para producir un pronóstico total para cada item/punto de venta EstacionalidadTendencia Feriados Promociones Ciclo de vidaEfectos del precio Predicción total
  • 48. © 2007. MAySA Modelo de demanda típico Los componentes se combinan para producir un pronóstico total para cada item/punto de venta EstacionalidadTendencia Feriados Promociones Ciclo de vidaEfectos del precio Sales Fcst = Level Trend * Cyclical seasonality * Holiday effect * Product life cycle effect * Price effect * Promo support 1 effect * ... * Promo support n effect * Inventory effect
  • 49. © 2007. MAySA Jerarquía de productos y jerarquía de lugares 49 Agregar información para obtener modelos y predicciones más estables y confiables debido a los problemas de volatilidad y escasez de datos en el nivel de los ítems (productos) individuales.
  • 50. © 2007. MAySA Niveles TS, REG y FCST dentro de un grupo de modelamiento 50
  • 51. © 2007. MAySA SAS® Revenue Optimization Suite • La arquitectura de datos de la solución es bastante más estructurada y definida que las soluciones anteriores, lo que se debe principalmente a la naturaleza del problema. Esta característica facilita su implementación en menor tiempo. • La conformación de las jerarquías tiene un rol crucial, lo mismo que el compartimiento vertical y horizontal de información para mejorar los modelos. • El modelo final para cada producto/punto de venta es el resultado de la composición de varios modelos, incluso en distintos niveles. • Las plantillas de modelamiento están compuestas de técnicas estándar de forecasting de series de tiempo (utilizan las técnicas del forecasting de alta performance) y de regresión con componentes fijos. • El rol del analista es fundamental en la configuración inicial de la solución y el calibrado de los modelos predefinidos. Tanto en la calibración como en el monitoreo posterior, el analista debe proceder "por excepción". 51
  • 52. © 2007. MAySA Conclusiones sobre la automatización - Similitudes • Uso de procesos predefinidos (plantillas, proyectos, etc.) con un conjunto pequeño de opciones de configuración que implementan transformaciones y modelos estándar, repetitivos y muy frecuentes • La intervención del analista se focaliza en la configuración inicial del proceso automatizado, en la evaluación global de los resultados y en la intervención específica sobre modelos en los que sea valioso hacerlo (“modelamiento por excepción”). • Compartir información a través de distintos niveles en una o diversas jerarquías, para resolver problemas típicos de variabilidad, falta de datos, etc. • Combinar modelos: ya sea varios modelos que hacen predicciones sobre el mismo suceso en una predicción de conjunto (lo que habitualmente se denomina "ensemble learning") o modelos que predicen distintos componentes de un suceso y luego se componen en una predicción global, como era el caso del modelamiento de demanda. 52
  • 53. © 2007. MAySA Conclusiones sobre la automatización - Similitudes • Organizar y estructurar opciones limitadas (aunque ampliables) en base a las características generales o específicas de los fenómenos que se deben modelar (repositorio de modelos, repositorio de eventos, defaults de distintas técnicas, etc.) • Organizar y estructurar los distintos componentes de un proyecto en un conjunto fácil de identificar, almacenar, explorar y mantener. 53
  • 54. © 2007. MAySA Conclusiones sobre la automatización - Déficits • Areas como la adquisición de datos y la administración de modelos no han alcanzado aún una escala de automatización a la altura de las necesidades del Big Data Analytics • Un elemento importante en el Analytics de Big Data es la integración de fuentes de datos de tipos diversos (campos estructurados, texto, imágenes, etc.). Todas las automatizaciones consideradas se basan en el uso de campos estructurados, lo que constituirá cada vez más una limitación importante. • Las transformaciones y modelos que se ajustan, seleccionan, etc. automáticamente, si bien es cierto que son los más frecuentes, son relativamente elementales. Sería deseable una mayor riqueza y sofisticación. 54
  • 55. © 2007. MAySA Conclusiones sobre la automatización - Deficits • La estrategia principal es la búsqueda de buenos modelos por fuerza bruta • No hay una selección “inteligente” más allá de la configuración inicial del analista • Los déficits en las tareas más abiertas de adquisición de datos, en la transformación de los mismos y en una utilización más sofisticada de modelos se debe a esta falta de “inteligencia” • La estrategia de modelamiento por excepción consiste en concentrar la tarea inteligente (la del analista) en los modelos de mayor valor. 55
  • 56. © 2007. MAySA ¿Qué significa “inteligencia”? • "Inteligencia" significa utilizar conocimiento de las técnicas de modelamiento y de dominio sobre un fenómeno particular para poder hacer inferencias y tomar decisiones. Algo para lo que, todavía, las herramientas actuales necesitan del analista. • El conocimiento debiera estar incorporado en la forma de "metadatos analíticos". • Estos permitirían junto con una capacidad elemental de inferencia generar variables más relevantes en muchos modelamientos, hacer una selección de variables en el proceso inicial de adquisición de datos, determinar cómo y cuándo integrar información textual a información estructurada, determinar que técnicas de modelamiento podrían ser útiles, gestionar modelos y proyectos en función de su importancia y relevancia para un problema dado, etc. • Las herramientas que aportarían “inteligencia” se encuentran disponibles desde hace mucho tiempo (Ingeniería del Conocimiento), pero aún no han sido integradas a las herramientas de Analytics 56
  • 57. © 2007. MAySA Conclusiones sobre el trabajo del analista • Es recomendable utilizar plantillas o procedimientos preconstruidos de modelamiento. A estas plantillas se debe conectar la tabla con los datos de entrada y luego analizar los resultados obtenidos. • El tiempo mejor invertido del analista es aquel que dedica al análisis de resultados de modelos generados rápidamente para obtener conclusiones sobre el problema, los datos, las transformaciones y las propias técnicas de modelamiento. • Es decir, la mejor estrategia es una de refinamiento iterativo y progresivo de un problema mediante modelos rápidos que puedan mejorarse. • Combinado con una estrategia de desarrollo mediante prototipos rápidos que no esperan meses hasta haber reunido gran cantidad de datos • Aprovechar información redundante o complementaria en la forma de jerarquías, segmentos y combinación de modelos. • Trabajar con “paquetes” de modelamiento que reunen y conservan toda la información y objetos relevantes. 57
  • 58. © 2007. MAySA Conclusiones sobre el entorno del analista • La "inteligencia" que debe ser parte fundamental del desarrollo y automatización del modelamiento no es y no debe ser exclusivamente de la herramienta o del analista, sino de la empresa en su conjunto. • Los analistas en una empresa debieran encontrarse en una situación parecida a la de los sistemas automatizados: debieran poder limitarse a hacer algunas pocas especificaciones iniciales para obtener rápidamente un primer resultado a analizar. • Deberían contar con herramientas como plantillas de modelamiento, conjuntos de variables con una "semántica" estandarizada y protocolos o herramientas que le faciliten mantener unidos los distintos objetos involucrados en un proyecto de modelamiento, mantener un modelo o pasarlo a producción. 58
  • 59. © 2007. MAySA Conclusiones sobre el entorno del analista Grupo transversal de Analytics que se encargue de: 1. Definir plantillas de modelamiento con características similares a las de las herramientas mencionadas pero ajustadas a los problemas frecuentes de la empresa, mantenerlas y mejorarlas progresivamente. 2. Ampliar el o los data warehouses con metadatos analíticos estandarizados a nivel de la empresa que faciliten la conexión del DW o los data marts con las plantillas de modelamiento y disminuyan el trabajo de adquisición de datos por parte del analista. 3. Mantener repositorios "oficiales" de modelos, de eventos y de transformaciones (en especial para la construcción de variables "secundarias"). 4. Implementar prácticas estandarizadas de la gestión de modelos que aseguren que los distintos objetos vinculados a un modelo no se dispersen o se pierdan. 59