Los artistas mexicanos con más ventas de discos en la historia (2024).pdf
Introducción Business Intelligence
1.
2. PRESENTACIÓN
• Diego Martín Fernández
• Ingeniero Superior en Informática (UEM)
• Dirección y Gestión Estratégica de Proyectos (IE Business School)
• Aprendizaje Estadístico y Data Mining (UNED)
• Responsable de Business Intelligence
• QDQ Media
• Grupo EULEN
• AGS Group
• Contacto:
• linkedin.com/in/dmfdez - dmfdez@gmail.com
2 ABRIL 2015
5. HISTORIA DEL BI
• El término Business Intelligence fue acuñado por Gartner Group a
finales de los 80’s.
• Sin embargo, el concepto es mucho más antiguo y sigue evolucionando
• 1970’s - MIS reporting - static/periodic reports
• 1980’s - Executive Information Systems (EIS)
• 1990’s - OLAP, dynamic, multidimensional, ad-hoc reporting
• 2010’s - Data/Text/Web Mining; Web-based Portals, Dashboards, Big Data,
Social Media, and Visual Analytics
• 2020’s - …
5 ABRIL 2015
6. ACTUALIDAD
• Compañías en mercados hipercompetitivos.
• Los clientes son más exigentes, mejor informados y demandan
productos personalizados.
• Las empresas necesitan conocer mejor al cliente para saber cual es su
fuerte y potenciarlo.
• Customer Intelligence
• Maketing Intelligence
• Social Business Intelligence
• …
6 ABRIL 2015
7. FUTURO
• Data Discovery
• Real Time Data
• Big Data
• Social Business Intelligence
• Modelado descriptivo, predictivo y prescriptivo
7 ABRIL 2015
9. DEFINICIÓN
• Business intelligence (BI) es un término genérico que incluye las
aplicaciones, la infraestructura y herramientas y las mejores prácticas
que permitan el acceso y el análisis de la información para mejorar y
optimizar las decisiones y rendimiento.
9 ABRIL 2015
10. DEL DATO AL CONOCIMIENTO
Dato Información Conocimiento
10 ABRIL 2015
11. DATO
• Hechos objetivos y discretos sobre eventos.
• Registros estructurado de operaciones.
• Muchos datos pueden hacer difícil identificar y dar sentido a los datos
que importan
• Los datos sólo describen una parte de lo que ocurre, no proporcionan
significado, juicio o interpretación.
• Gestión del Dato:
• Velocidad, coste y capacidad
• Relevancia y claridad
• El dato es la fuente de origen para la toma de decisión pero no puede
decirnos que hacer.
11 ABRIL 2015
12. INFORMACIÓN
• Convierte los datos en útiles para decidir y/o realizar una acción.
• La información es definida como datos que son dotados de un sentido y
un propósito.
• La información nos permite responder a preguntas como:
• ¿Quién?
• ¿Qué?
• ¿Cómo?
• ¿Cuándo?
• ¿Donde?
12 ABRIL 2015
14. CONOCIMIENTO
• Finalmente, el conocimiento se define habitualmente como
información que ha sido procesada, organizada y estructura de alguna
manera o que ha sido aplicada a una acción.
• En las organizaciones, a menudo se convierte implícito no sólo en
documentos o repositorios sino también en rutinas organizativas,
procesos, prácticas y normas.
• El conocimiento puede ser visto como
• Proceso: aprendizaje organizacional
• Stock: conocimiento
14 ABRIL 2015
15. ¿PARA QUE NOS SIRVE EL BI?
• Impacto de una campaña.
• Conocer a nuestros clientes
• ¿Cómo y qué compran?
• ¿Dónde suelen hacerlo?
• ¿A qué horas?
• Rendimiento de nuestro proceso de venta.
• Rendimiento de nuestro proceso de postventa.
• …
15 ABRIL 2015
16. TIPO DE PROYECTOS
• Sistema MDM (Master Data Management)
• Sistema Data Warehouse
• Procesos ETL
• Construir sistemas OLAP
• Diseñar Informes y/o cuadros de mando
• Business Analytics
• Big Data
16 ABRIL 2015
18. COMPONENTES DE UN BI
•Un sistema de Business Intelligence tiene 4
componentes principales:
• Un Data Warehouse, es un gran repositorio de datos
históricos bien organizados.
• Business Analytics, es una colección de herramientas para
manipular, explotar y analizar los datos del Data Warehouse.
• Business Performance Management permite monitorizar,
medir y analizar los KPIs definidos.
• Un Interfaz de Usuario (e.g., dashboard) , nos permite
acceder y trabajar con las herramientas de BI.
18 ABRIL 2015
20. BUSINESS INTELLIGENCE VS BIG
DATA
Business
Intelligence
Big Data
Información Conocida
Preguntas que no
puedes responder
Preguntas que
puedes responder
Información Desconocida
20 ABRIL 2015
21. BIG DATA
• Big Data es la información de gran volumen, de alta velocidad y/o de
gran variedad que exige formas rentables e innovadoras de
procesamiento de la información para mejorar la comprensión y la
toma de decisiones.
21 ABRIL 2015
22. 3 4 5 V’S DEL BIG DATA
Big
Data
Volumen
Velocida
d
Valor
Veracida
d
Variedad
22 ABRIL 2015
24. BENEFICIOS DEL BUSINESS
INTELLIGENCE
• Mejorar los procesos de gestión
• planificación, control, medición y / o cambiar lo que resulta en un
aumento de los ingresos y reducción de costos.
• Mejorar los procesos operativos
• la detección de fraudes, procesamiento de pedidos, compras .. resultando
en mayores ingresos y menores costos.
• Predecir el Futuro
24 ABRIL 2015
29. DEFINICIÓN
• Un Data Warehouse es un sistema de almacenamiento diseñado para
contener los datos extraidos en los sistemas transaccionales, de los
sistemas operativos y de fuentes externas.
• Un Data Mart contiene datos similares en el tiempo y temática, es
decir, son subconjuntos de un Data Warehouse de un área específica
del negocio para ayudarle a la toma de decisiones.
29 ABRIL 2015
30. BILL INMON
• Bill Inmon define un data warehouse en términos de las características del
repositorio de datos:
• Orientado a temas.- Los datos en la base de datos están organizados de
manera que todos los elementos de datos relativos al mismo evento u objeto
del mundo real queden unidos entre sí.
• Variante en el tiempo.- Los cambios producidos en los datos a lo largo del
tiempo quedan registrados para que los informes que se puedan generar
reflejen esas variaciones.
• No volátil.- La información no se modifica ni se elimina, una vez almacenado
un dato, éste se convierte en información de sólo lectura, y se mantiene para
futuras consultas.
• Integrado.- La base de datos contiene los datos de todos los sistemas
operacionales de la organización, y dichos datos deben ser consistentes.
30 ABRIL 2015
32. RALPH KIMBALL
• Ralph Kimball define un almacén de datos como: "una copia de las
transacciones de datos específicamente estructurada para la consulta y
el análisis”.
32 ABRIL 2015
34. INMON VS KIMBALL
• Es muy difícil de decantarse por uno por otro.
• En los proyectos de BI típicos, normalmente se empieza por el modelo
de Kimball creando Datamarts de los departamentos debido a
presupuestos ajustados, desconfianza o como punto de entrada.
• A medida que una organización crece en BI, lo mejor sería pasar a
Immon para ahorrar mantenimiento de etl, crear un repositorio único,
etc…
34 ABRIL 2015
35. MODELADO: ESQUEMA EN ESTRELLA
(OLAP)
• Se compone:
• Dimensiones
• Hechos
• OLAP (On-Line
Analytical Processing)
Ventas
Producto
Tiempo
Cliente
Tienda
35 ABRIL 2015
36. HECHOS
• ¿Qué queremos medir?
• Euros, unidades, coste, litros, kilos…
• Normalmente se almacenan datos agregados.
• Esto no es una copia de nuestros sistemas es para analizar!!
• La granuladidad de las medidas es crítica, siempre hay que pensar el
nivel más detallado que queremos analizar
36 ABRIL 2015
38. DIMENSIÓN
• ¿Qué queremos analizar?
• Tiempo, Tienda, Producto, Cliente, …
• Contienen los descriptores de los hechos
• Pueden ser jerarquías
Tiempo
Año
Mes
Día
Tienda
País
Provincia
Tienda
38 ABRIL 2015
39. EJERCICIO
• Identificar Dimensiones (Jerarquías) y Hechos
Datos Empresa/Profesional, etc Cliente Fecha Pedido Nº Factura
Vendedor Vendedor 1
Cliente 1 12/12/2015 10:10 465132
Tienda Tienda Madrid
Código artículo Artículo/Concepto/Descripción/etc. Unidades
Precio
Unidad
Descuento Descuento
total
Total
%
A001 Grupo A: Descripción producto A001 4 1.000,00 8,00% 80 3920
A002 Grupo A: Descripción producto A002 2 1.500,00 5,00% 75 2925
A003 Grupo A: Descripción producto A003 3 2.000,00 4,80% 96 5904
B001 Grupo B: Descripción producto B001 3 3.000,00 4,40% 132 8868
B002 Grupo B: Descripción producto B002 2 4.000,00 4,00% 160 7840
C001 Grupo C: Descripción producto C001 3 4.500,00 3,80% 171 13329
Total Bruto 42.786,00
I.V.A. % 21% 8.985,06
Suma
total 51.771,06 €
39 ABRIL 2015
40. KEY PERFORMANCE INDICATOR
• KPI o Indicador Clave de Desempeño
• Son medidas financieras o no financieras
• Identificar las necesidades de información y luego diseñar los indicadores
más apropiados para evaluar el desempeño
• S.M.A.R.T.
• eSpecíficos
• Medibles
• Alcanzables
• Relevantes
• Temporales
ABRIL 201540
41. TIPOS DE HECHOS
• Transacción
• Un evento que ha ocurrido en un instante de tiempo, una fila por ocurrencia
• Una compra, venta, una velocidad, temperatura
• Periodic Snapshot
• Se toma una fotografía, al final de un periodo de tiempo, multiples filas
• Balances, estados de cuenta, inventarios….
• Acumulating SnapShot
• Se va modificando el status de una fila a lo largo del tiempo. Múltiples filas.
• Suele llevar una marca de tiempo
41 ABRIL 2015
42. TIPOS DE DIMENSIONES (I)
• SCD. Slowly Changing Dimensions
• Tipo 1, se sobreescriben los valores.
• Tipo 2, se incluye una nueva línea.
• Tipo 3, se incluye una columna para conservar el valor original o anterior.
• Tipo 4, la dimensión sería tipo 1 pero se tabla una tabla con el histórico.
• Tipo 6, combinación de los tipos 1, 2 y 3.
42 ABRIL 2015
43. TIPOS DE DIMENSIONES (II)
• Esquema Copo de Nieve (Snowflake)
• Se normalizan las dimensiones para extraer los atributos redundantes a
una nueva tabla.
Tienda
País
Provincia
TiendaHecho
Tienda
Tienda
Hecho
Provincia
Provincia
País
País
43 ABRIL 2015
44. TIPOS DE DIMENSIONES (III)
• Dimensión degenerada
• Cada fila en la tabla de hechos es un “documento”
• Número de factura, de orden, etc..
• Parent – Child Dimensions
• Manejar dimensiones recursivas que tienen profundidad variable
• Dimension Role-Playing
• Una misma dimensión aparece varias veces en la misma tabla de hechos.
• Junk Dimensions
• Flags e indicadores de baja cardinalidad
• En la tabla de hechos aumentaría mucho la granularidad.
• Se combinan en una dimensión.
44 ABRIL 2015
45. OPERACIONES TÍPICAS EN OLAP
• Roll up (drill-up): resumir los datos
• Subiendo por la jerarquía o por reducción de dimensiones.
• Drill down (roll down): Inverso al roll-up
• Desde los niveles superior a los de más detalle o introducciendo unas nuevas
dimensiones.
• Slice and dice
• Seleccionar. Y proyectar.
• Pivot (rotate)
• Reorientar el cubo.
• Otras operaciones:
• drill across: involucrar más de un cubo a través de una medida en común.
• drill through: ver el detalle en las tablas.
45 ABRIL 2015
46. MODELADO: ACTIVE DATA WAREHOUSE
(OLTP)
• Active Data Warehousing es otro tipo de modelo de nuestro Data
Warehouse en este caso lo que nos basamos en la captura de las
transacciones cuando estas ocurren y las integramos en nuestro Data
Warehouse. Esto nos proporcionada las posibilidad de automatizar
tareas rutinarias y decisiones.
46 ABRIL 2015
47. DIFERENCIAS ENTRE OLTP VS OLAP
Sistemas OLTP Sistemas OLAP
Objetivo Garantizar la consistencia de los datos. Consolidar los datos ya validados y adecuados a
las necesidades para la toma de decisiones.
Orientación Orientado a la aplicación, hace cumplir
las reglas del negocio.
Orientado al sujeto, se define en base a lo que el
analista necesita ver.
Vigencia de los
datos
Los datos se usan a medida que se van
produciendo y dejan de ser importantes a
corto plazo.
Se guardan los datos actuales y los históricos para
poder realizar análisis comparativos.
Granularidad
de datos
Es dada por controles definidos por la
organización, así como por normas
legales importantes.
Estará dado por el tipo de análisis que se requiera
analizar.
Organización Es normalizado. Se basa en estructuras jerárquicas
desnormalizadas modeladas de acuerdo a como
se analizaran los datos.
ABRIL 201547
48. INTEGRACIÓN DE DATOS
• Procesos ETL (Extract, Transform & Load):
• Extraer datos de múltiples fuentes
• Transformar los datos
• Comprobamos la calidad del dato.
• Limpiamos y/o normalizamos los datos.
• Unificamos conceptos.
• Cargar los datos en un DW
48 ABRIL 2015
49. CREAR UN MODELO DE BI
ABRIL 201549
Clientes
Oferta
Contrato Actividad CampañaProductos
51. DEFINICIÓN
• Business analytics se compone de las soluciones utilizadas para
construir los modelos de análisis y simulaciones para crear escenarios,
entender las realidades y predecir los estados futuros. Business
analytics incluye la minería de datos, análisis predictivo, análisis
aplicadas y las estadísticas, y se entrega como una aplicación adecuada
para un usuario de negocios. Estas soluciones de análisis a menudo
vienen con las industrias de contenido creado previamente que se
dirige a un proceso de negocio de la industria (por ejemplo, los
reclamos, suscripción o un requisito reglamentario específico).
51 ABRIL 2015
52. MODELOS DESCRIPTIVOS VS
PREDICTIVOS
• Modelos descriptivos
• Dado un conjunto de variables sobre unos datos de una empresa,
pretendemos buscar en ellos características relevantes o segmentar los
datos en grupos
• Modelos predictivos
• Dado un conjunto de variables sobre unos datos, pretendemos aquí
predecir una variable especial que depende de alguna del conjunto de
datos inicial. El objetivo es “aprender” un modelo que nos permita
adivinar la etiqueta a partir de las relaciones encontradas en el pasado.
52 ABRIL 2015
53. ¿QUÉ ES DATA MINING?
•Data mining
• Descubrimiento de Conocimiento desde los Datos
• Extracción de patrones triviales o no triviales, desconocidos y
potencialemente útiles de una gran cantidad de datos.
•Otros nombres
• Knowledge discovery in databases (KDD), knowledge extraction,
data/pattern analysis, data archeology, data dredging, information
harvesting, business intelligence, etc.
ABRIL 201553
54. FUNCIONALIDADES I
• Descripción concepto multidimensional: Caracterización y la discriminación
• Generalizada, resumir y características de los datos de contraste
• Patrones frecuentes, asociación, correlación vs. casualidad.
• Pañal Beer [0,5%, 75%], Educación Ingresos
• La clasificación y predicción
• Construir modelos que describen y distinguir clases o conceptos para la futura
predicción
• Por ejemplo:
• clasificar a los países sobre la base de (economía), automóviles basado en
(rendimiento de la gasolina), noticias de internet (Google News), producto
(Amazon)
• Predecir el precio de las acciones, atasco de tráfico
ABRIL 201554
55. FUNCIONALIDADES II
• El análisis de agrupaciones
• Maximizar similitud del grupo y minimizando similitud entre grupos
• Ánálisis de valores atípicos (Outlier)
• Objeto de datos que no cumpla con el comportamiento general de los datos:
valores atípicos
• ¿Ruido o excepción? Útil en la detección del fraude, el análisis de eventos raros
• El análisis de tendencias y la evolución
• Tendencia y desviación: las encuestas políticas.
• Minería de secuencias: la minería de vídeo -> identificar objetos
• Análisis Periodicidad: el cambio climático
• Basado en el análisis de similaridad
ABRIL 201555
56. EJEMPO: ANÁLISIS DEL MERCADO I
• ¿De dónde sacamos los datos?
• Tarjeta de crédito, tarjetas de fidelización, cupones de descuento, queja de un
cliente llama, además de estudios publicos sociodemográficos.
• Público Objetivo
• Encuentra grupos de clientes "modelo" que comparten las mismas características:
el interés, nivel de ingresos, hábitos de consumo, etc.
• Determinar los patrones de compra de los clientes a través del tiempo
• Venta cruzada
• Buscar asociaciones entre las ventas de productos y predicen basa en dicha
asociación
ABRIL 201556
57. EJEMPO: ANÁLISIS DEL MERCADO II
• Perfil del Cliente
• ¿Qué tipo de clientes compra qué tipo de productos?
• Análisis de las necesidades del cliente
• Identificar los mejores productos para los diferentes grupos de clientes
• Predecir qué factores van a atraer nuevos clientes
• Provisión de información resumida
• Informes resumidos multidimensionales
• Resumen estadístico de información (datos de tendencia central y de variación)
ABRIL 201557
59. ÁRBOLES DE DECISIÓN I
• Son modelos estadísticos en los que interesa explicar una variable dependiente
cualitativa (en nuestro caso binaria) en función de varias variables explicativas.
• Consiste en clasificar a los individuos en grupos de comportamiento diferente
discriminando por las variables de entrada.
• Es una técnica de modelización supervisada.
• Beneficios:
• Su principal virtud es que son entendibles y explicables.
• Buena capacidad predictiva con variables categóricas.
• Alta flexibilidad
• Muy fáciles de implementar, mantener y revisar.
ABRIL 201559
61. CLÚSTER (SEGMENTACIÓN) I
• Se utiliza para la identificación automática de las agrupaciones
naturales de las cosas
• Parte de la familia de aprendizaje de máquinas
• Emplear aprendizaje no supervisado
• También conocida como la segmentación
ABRIL 201561
63. CLÚSTER (SEGMENTACIÓN) III
•Pueden ser utilizados para
• Identificar agrupaciones naturales de clientes.
• Identificar las normas para la asignación de nuevos casos a su
grupo.
• Proporcionar caracterización, definición, etiquetado de las
poblaciones.
• Disminuir el tamaño y la complejidad de los problemas.
• Identificar los valores atípicos en un dominio específico.
63 ABRIL 2015
64. SOCIAL MEDIA
• Experiencia personal y opiniones sobre cualquier cosa en revistas, foros,
blogs, twitter.
• Publicaciones en redes sociales, Facebook.
• Comentarios sobre artículos, temas, tópicos, críticas.
• Se convierte en la VOZ DEL CLIENTE:
• Nos propociona información útil del feedback del cliente.
• Está disponible y suele ser gratuita.
• Este análisis es muy parecido al que nos puede proporcionar los
investigadores de mercado pero este es a tiempo real.
64 ABRIL 2015
65. ANÁLISIS DEL SENTIMIENTO
• Sentimiento
• Un pensamiento, una vista o actitud, especialmente uno basado
principalmente en la emoción en lugar de la razón
• Análisis del Sentimiento
• Opinion Mining
• Se usan técnicas de procesamiento del lenguaje natural (NLP) y técnicas
computacionales para automatizar la extracción y clasificación de
sentimiento de texto normalmente no estructurada
65 ABRIL 2015
66. ANÁLISIS DEL SENTIMIENTO
• ¿Cómo interpretar las características para la detección de emociones?
• Bolsa de palabras (IR)
• Léxicos anotados (WordNet, SentiWordNet)
• Patrones sintácticos
• ¿Qué características usar?
• Palabras (n gramos)
• Frases / n-gramas
• Sentencias
66 ABRIL 2015
68. •Cuadros de Mando
•La necesidad de ejecutar, controlar y gestionar los procesos de una
organización genera y consume cantidades ingentes de datos, eso lleva a
la creación de sistemas de toma de decisiones con reporting, pivots,
métricas, índices,…
•No todo el mundo debe usar todos y cada uno de los elementos. Al
menos no todo el tiempo.
•Los CdM son una representación simplificada de un conjunto de
indicadores que nos dan una idea de cómo se está comportando un área
o un proceso de nuestra empresa
VISUALIZACIÓN DE DATOS
68 ABRIL 2015
69. • Existen muchos tipos de clasificación.
• ¿Cuándo se usan unos u otros?
Soportados por un modelo teórico
• BSC
• EFQM
Referentes a conceptos de la
organización
• KPI vs. KGI
•Se pueden dividir en
operacionales, tácticos y
estratégicos
CLASIFICACIÓN
69 ABRIL 2015
70. •EFQM
•Fundación europea para el control de calidad
•El uso principal del modelo es la autoevaluación , de la que se obtiene un
conjunto de puntos fuertes y otro de áreas susceptibles de mejora .
•Se construye un plan de acción
tendente a mantener resultados y
realizar las mejoras correspondientes
•La EFQM concede anualmente el
Premio Europeo a la Excelencia
EFQM
70 ABRIL 2015
72. BALANCED SCORECARD I
• La medición del rendimiento y la metodología de gestión que ayuda a
traducir las finanzas, los clientes, los procesos internos y los objetivos
de aprendizaje y crecimiento en un conjunto de iniciativas viables
• "The Balanced Scorecard: Measures That Drive Performance”
(HBR, 1992)
72 ABRIL 2015
73. BALANCED SCORECARD II
• Perspectivas:
• Financiera
• Basados en la contabilidad de la empresa.
• Ej: Rentabilidad, margen operativo, facturación, …
• Cliente
• Los KPIs dependerán del tipo de actividad de la empresa pero basados principalmente en entrevistas y
encuestas
• Ej: Grado de Satisfacción, % Reclamaciones, Interacciones, Tiempos de servicio, Calidad del servicio, …
• Procesos
• Operaciones, gestión de clientes, RSC, …
• Ej: tiempo medio, calidad, coste, captación de clientes, …
• Innovación
• Mejoras, crear valor e innovar
• Ej: time-to-market, ciclo de vida de productos, desarrollo de nuevos productos, …
ABRIL 201573
75. CDM - OPERACIONAL I
• Cuadro de mando operacional
•De respuesta rápida.
•Gráficos y tablas simples
•Capacidad de atracción de la atención ante eventos (avisan de errores o
anomalías)
•Alto nivel de detalle
•Proveen un único nivel más de profundidad, que suele enlazar con el
operacional (si no ataca a este directamente). Informes tabulares
75 ABRIL 2015
77. CDM – TÁCTICO I
•Cuadro de mando táctico
•Mas contextualizado, comparativo e histórico
•Datos consolidados que no cambian en un periodo de tiempo largo
•Visualizaciones mas complejas (perfil mas lato)
•Permiten exploración para aclarar las causas (no los detalles)
•Suelen enlazar con otros cuadros de mando y OLAP.
77 ABRIL 2015
79. CDM – ESTRATÉGICO I
•Cuadro de mando estratégico
•Se centran en indicadores de alto nivel que permitan evaluar tendencias
•No suelen contener mucha información (ranking, etc…)
•Tipos de gráficos muy simples
•Los datos se basan en snapshots
•No aportan mucha interacción
79 ABRIL 2015
81. • Medida del éxito: Que el cuadro de mando se está utilizando.
•responde a la necesidad informacional que se planteaba
•es rápido y accesible (usable)
•permite hacer inferencia de información (profundidad de análisis)
•en mayor o menos medida, es “bonito”
¿QUÉ ES IMPORTANTE?
81 ABRIL 2015
82. ERRORES A EVITAR I
• Exceder los límites de una pantalla
• Se tiene que ver todo lo que se necesite ver, de una vez, para que se
puedan producir inferencias o descubrir patrones
ABRIL 201582
83. ERRORES A EVITAR II
• Descontextualizar la información
• La cantidad que se muestra ¿con que se compara?¿es
buena o mala?
ABRIL 201583
84. ERRORES A EVITAR III
• Mostrar mucho detalle (o precisión), o mucha variedad.
• Elegir medidas no representativas (usuario)
ABRIL 201584
85. ERRORES A EVITAR IV
• Elegir la gráfica inapropiada
ABRIL 201585