1. 1
I.E.S.T.P. VÍCTOR RAÚL HAYA DE LA TORRE
Barranca, 14 de setiembre del 2022
Integrar
Informar
Analizar
2. 2
Agenda
• Introducción
• Inteligencia de Negocios
• Datawarehouse
• Técnicas de Inteligencia de Negocios:
• E.T.L.
• Motor de base de datos multidimensional.
• OLAP.
• Minería de Datos.
• Reportes.
• Demo
• Conclusiones.
6. 6
Así almacenados los datos, no facilitan la labor de
los usuarios que toman decisiones para el negocio.
Bases de datos Relacional Normalizada
7. 7
Cuando se tiene la información almacenada en
bases de datos relacionales normalizadas, para que
el usuario pueda obtener cualquier reporte es
necesario:
Además esto únicamente estará disponible para el
usuario mediante un reporte con formato
preestablecido elaborado por el Área de Sistemas.
Inconveniente de los modelos normalizados
8. 8
Diversidad de SGBDR utilizados en los
diferentes Sistemas de Información
• Las empresas por lo general cuentan con
aplicaciones que utilizan diferentes
plataformas para los servidores de base de
datos de cada una de las aplicaciones de
negocio.
9. 9
Arquitectura de Aplicaciones Empresariales
Proveedores
Clientes
Empleados
Socios
Administración de la cadena de
suministro
- Subcontratacion - Suministros
Administración de relaciones
con los clientes
- Mercadotecnia – Ventas - Servicio
Planeacion de recursos
empresariales
Procesos internos de negocio
Administración
del
conocimiento
-
Colaboración
–
Apoyo
a
decisiones
Administración
de
relaciones
con
los
socios
-
Ventas
-
Distribución
10. 10
SAP: Módulos de aplicación R/3
• Gestión Financiera (FI): Libro mayor, libros auxiliares, ledgers especiales, etc.
• Controlling (CO): Gastos generales, costes de producto, cuenta de resultados, centros de beneficio, etc.
• Tesorería (TR): Control de fondos, gestión presupuestaria, flujo de efectivo
• Sistema de proyectos (PS): Grafos, contabilidad de costes de proyecto, etc.
• Gestión de personal (HR): Gestión de personal, cálculo de la nómina, contratación de personal, etc.
• Mantenimiento (PM): Planificación de tareas, planificación de mantenimiento, etc.
• Gestión de calidad (QM): Planificación de calidad, inspección de calidad, certificado de, aviso de calidad,
etc.
• Planificación de producción (PP): Fabricación sobre pedido o para stock, fabricación en serie, Kanban, etc.
• Gestión de material (MM): Gestión de stocks, compras, verificación de facturas, etc.
• Ventas y Distribución (SD): Ventas, expedición, facturación, precios, clientes, etc.
• Workflow (WF), Soluciones sectoriales (IS): Contienen funciones que se pueden aplicar en todos los
módulos
• Activos Fijo (AF), Ingresos , depreciación y amortización de activos fijos. (Sub módulo de FI) AM
• Cuentas contractuales Cuentas para clientes masivos (telefonia, cia de electricidad, universidades,etc)
• Presupuestos (FM): Presupuestacion publica o privada.
• Viajes (TM): Manejo de viajes, reservas y gastos adicionales.
• xApp Manufacturing Integration and Intelligence(XMII): integración de manufactura e inteligencia.
• Bussines Warehouse (BW): Sistema de soporte para la toma de decisiones (Business Intelligence).
11. 11
Información, Decisiones y Administración
Específico
No programada
Resumida
Poco frecuente
Prospectiva
Externa
De amplio alcance
Predefinido
Programada
Detallada
Frecuente
Histórica
Interna
De enfoque reducido
No estructurada
Semiestructurada
Estructurada
Estructura de decisión Características de la Información
Administración
estratégica
Ejecutivos y directores
Administración táctica
Administradores de unidades
de negocios y equipos autodirigidos
Administración operativa
Directivos de operaciones y equipos autodirigidos
16. 16
Software para la Toma de Decisiones
• El software sofisticado para administrar la
inteligencia de negocios proporciona
herramientas valiosas para la toma de
decisiones.
17. 17
Sistemas de apoyo a la toma de decisiones
Definición:
• Sistemas de información basados en computadora
que proporcionan apoyo de información interactiva a
administradores y profesionales de negocios durante
el proceso de toma de decisiones, usando para
apoyar la toma de decisiones semiestructurada de
negocios los siguientes :
• Modelos analíticos
• Bases de datos especializados
• Las propias percepciones y juicios de quien toma las
decisiones.
• Un proceso de modelación interactivo basado en
computadora.
18. 18
Componentes de un Sistema de apoyo a la
toma de decisiones
Funciones de interfase de usuario
Multimedia con hipervínculos, visualización en tercera dimensión.
Funciones de administración de modelos
Modelación analítica, análisis estadístico
Funciones de administración de datos
Extracción, validación, saneamiento, integración y replicación de datos
Mercados de datos y otras bases de datos
Datos
operativos
Datos de
mercado
Datos
de ventas
Datos de
cuentas
de clientes
Software
antiguo
de legado
Navegador
Web
Otro
software
20. 20
Almacén de datos (Data Warehouse)
Definición:
• Guarda datos que se han extraído desde
diversas bases de datos operativas, externas y
otras bases de datos de una organización
21. 21
Almacén de datos y sus Mercados de datos
Distribución
Compras
Contabilidad
Reportes de
administración
Ventas
22. 22
Bloque de Fuente de Información
Metadatos para
fuentes
Fuentes externas
Sistemas internos
de oficina
Datos de herencia
Datos de
producción
Bases operacionales de datos que contienen la
información recopilada de las OLTP.
Están fuera de línea, en archivos perdidos, porque ya no
son necesarios para apoyar aplicaciones operacionales
actuales.
No están almacenados en bases de datos operacionales
(formas no electrónicas, hojas de cálculo, documentos
de procesadores de palabras, reportes anuales)
No las controla, posee ni opera la empresa. Dow Jones,
Nasdaq, estudios de mercado, articulos o revistas ( Wall
Street Journal, Fortune, Business Week)
Información de definición acerca de los datos de las
fuentes. (nombre del campo, definición del contenido,
fecha creación y origen de datos)
28. 28
Cliente Portal
Plataforma Analítica
OLTP
Data Analysis
(OLAP,
DataMining)
ERP
CR
M
OTRO
S SI SCM
DW,
DATA
MART
(ETL)
DATOS
EXTERNOS
IINTERFAZ
DEL USUARIO
Sistema de Inteligencia de Negocios
30. 30
END USER TOOLS & PERFORMANCE MANAGEMENT APPS
Excel PerformancePoint Server
BI PLATFORM
SQL Server
Reporting Services
SQL Server
Analysis Services
SQL Server DBMS
SQL Server Integration Services
SharePoint Server
DELIVERY
Reports Dashboards Excel
Workbooks
Analytic
Views Scorecards Plans
Plataforma BI en SQL Server 2008
31. 31
Business Scorecarding
(BSM)
Plataforma
BI
Portal and Collaboration
(Office “12” SharePoint Servers)
End-user Analysis
(Excel)
Data Warehousing
SQL RDBMS
Integration
SSIS
Analysis
SSAS
Reporting
SSRS
Herramientas
Usuario Final
Aplicaciones
Administración
Rendimiento
33. 33
S.S. Integration Services
• Unión de información de distintas fuentes de datos:
• Archivos de Texto
• Mainframes
• Hojas de cálculo
• Múltiples RDBMS
• Refrescar los datos en Data Warehouses y Datamarts
• Limpieza de datos
• Carga de información a las BDs OLAP
• Enviar notificaciones de error
38. 38
Analysis Services
• Key Performance Indicators
• Unified Dimensional Model
• Data Mining
• Integrado a la herramienta de
desarrollo
39. 39
Bases de Datos OLAP
• Esquema Optimizado para dar respuestas
rápidas a las consultas de los usuarios
• Son Bases de Datos con Modelos
Intuitivos
• Provee vistas Multidimensional de los
Datos
• Drill down y drill up
• Pivot de los datos en las vistas
40. 40
Base de Datos Multidimensional
• Cubos
• Dimensiones
• Medidas
42. 42
Cubos
• Tabla de Hechos
• Claves externas
• Medidas
• Dimensiones
Producto
Id
Nombre
Tamaño
…
Ciudad
Cliente
Id
Nombre
Provincia
…
Tiempo
Fecha
Año
Mes
Dia
…
Tabla de
Hechos
Producto1
Producto2
Producto 3
Producto1
Producto2
Producto 3
43. 43
Componentes de la Tabla de Hechos
Tabla
Dimensional
empledo_dim
201 ALFI Alfreds
producto_dim
25 123 Chai
Tabla VentasHecho
Medidas
Foreign Keys
empleado_key producto_key Ventas_Dolar
201 25
tiempo_key
134
Ventas_Unid
400 10,789
El grano de la tabla VentasHecho esta definida por el
más bajo nivel de detalle almacenada en cada dimensión
134 1/1/2000
tiempo_dim
46. 46
Jerarquías de los atributos
Jerarquia Geografica
Jerarquia de Mercado
Grupo Grupo
Total
Clase Clase
Producto
Total
Region Region
Distrito Distrito
Tienda
Total
Estado Estado
Ciudad Ciudad
Tienda
Dimension Producto:
Una jerarquía
Dimension Tienda:
Dos jerarquías
47. 47
Modelo Relacional vs.Modelo Multidimensional
Observe que en ambos modelos
se guardan los mismos datos pero
en estructuras de datos distintas
48. 48
Data Marts Relacionales y Cubos OLAP
Data Mart
Relacionales
Cubos OLAP
Almacen de la Data
Estructuras
Relacionales
Estructuras
N-dimensional
Contenido de la Data
Detallada y
Sumarizada
Sumarizada
Fuentes de Datos
Fuentes Relacionales y
No Relacionales
Fuentes Relacionales y
No Relacionales
Recuperación de
Datos
Rápida Muy Rápida
49. 49
Medidas
• Son valores numéricos
• Corresponde a los hechos de la Fact
Table
• Intersecta todas las Dimensiones y Todos
los niveles
• Son agregados
51. 51
Procesamiento Analítico en Línea (OLAP)
Definición:
• Permite a los administradores y analístas,
analizar y manipular en forma interactiva
grandes cantidades de datos detallados y
consolidados desde diferentes
perspectivas.
52. 52
Cambiar el Nivel de
Detalle de la Consulta
Chiclayo
Leonardo
Ortiz
Lambayeque
Juan Aurich
Vera
Desglose (Drill)
54. 54
Operaciones Analíticas
• Consolidación – agregación de datos
• Desglose – datos detallados que abarcan
datos consolidados
• Fragmentación en cortes y cubos –
habilidad de observar la base de datos
desde diferentes puntos de vista.
55. 55
OLTP y OLAP
OLTP OLAP
Objetivo Control de los proc. oper. Toma de Decisiones
Cliente Personal Operacional Gestores del Negocio
Datos Atómicos, Actualizados Consolidados,
y Dinámicos Históricos y Estables
Estructura Normalizada Dimensional
Tiempo resp. Segundos De Seg. a Minutos
Orientación Orientado a aplicaciones Orient. a Información
Acceso Alto Moderado a bajo
Actualización Continua Periódica
Aplicación Estructurada y Procesos No Estructurada y
repetitivos Procesos Analíticos
57. 57
Minería de datos para el apoyo a la toma de decisiones.
• El software de minería de datos analiza los vastos
depósitos de información de negocio histórica que
han sido preparados para su análisis en almacenes
de datos corporativos y trata de descubrir patrones,
tendencias y correlaciones ocultos en los
datos que pueden ayudar a una empresa
a mejorar en su rendimiento empresarial.
• El software de minería de datos puede realizar
análisis de regresión, árbol de decisiones, redes
neuronales, detección de grupos y de canastas de
mercado para una empresa..
60. 60
DM – Tareas y Técnicas Comunes
Nombre
PREDICTIVO DESCRIPTIVO
Clasificación Regresión Agrupamiento Reglas de
Asociación
Correlaciones/
Factorizaciones
Redes Neuronales
Árboles de decisión ID3, C4.5, C5.0
Árboles de decisión CART
Otros árboles de decisión
Redes de Kohonen
Regresión lineal y logarítmica
Regresión logística
Kmeans
Apriori
Naive Bayes
Vecinos mas próximos
Análisis factorial y de comp. ppales.
Twostep, Cobweb
Algoritmos genéticos y evolutivos
Maquinas de soporte vectorial
CN2 rules (cobertura)
Análisis discriminante multivariante
61. 61
DM – Caso Predictivo – Jugar Tenis
• En este primer ejemplo, vamos a trabajar con los datos acerca de los días
que se ha podido jugar al tenis, dependiendo de diversos aspectos
meteorológicos.
• El objetivo es poder determinar (predecir) si hoy podremos jugar al
tenis.
• Los datos de que disponemos están en el archivo:JugarTenis.txt” y son los
siguientes:
Cielo Temperatura Humedad Viento JugarTenis
Soleado Alta Alta Debil No
Soleado Alta Alta Fuerte No
Nublado Alta Alta Debil Si
Lluvioso Media Alta Debil Si
Lluvioso Baja Normal Debil Si
Lluvioso Baja Normal Fuerte No
Nublado Baja Normal Fuerte Si
Soleado Media Alta Debil No
Soleado Baja Normal Debil Si
Lluvioso Media Normal Debil Si
Soleado Media Normal Fuerte Si
Nublado Media Alta Fuerte Si
Nublado Alta Normal Debil Si
Lluvioso Media Alta Fuerte No
62. 62
DM – Caso Agrupación de Empleados
• La empresa de software para Internet “Memo Web” quiere
extraer tipologías de empleados, con el objetivo de hacer una
política de personal más fundamentada y seleccionar a qué
grupos incentivar.
• Las variables que se recogen de las fichas de los 15
empleados de la empresa son:
• Sueldo: sueldo anual en Soles.
• Casado: si está casado o no.
• Coche: si viene en coche a trabajar (o al menos si lo estaciona en la
empresa).
• Hijos: si tiene hijos.
• Alq/Prop: si vive en una casa alquilada o propia.
• Sindic.: si pertenece al sindicato revolucionario de Internet
• Bajas/Año: media del nº de bajas por año
• Antigüedad: antigüedad en la empresa
• Sexo: H: hombre, M: mujer.
63. 63
DM – Caso Agrupación de Empleados
#Ej Sueldo Casado Coche Hijos Alq/Prop Sindic. Bajas/Año Antigüedad Sexo
1 10000 Sí No 0 Alquiler No 7 15 H
2 20000 No Sí 1 Alquiler Sí 3 3 M
3 15000 Sí Sí 2 Prop Sí 5 10 H
4 30000 Sí Sí 1 Alquiler No 15 7 M
5 10000 Sí Sí 0 Prop Sí 1 6 H
6 40000 No Sí 0 Alquiler Sí 3 16 M
7 25000 No No 0 Alquiler Sí 0 8 H
8 20000 No Sí 0 Prop Sí 2 6 M
9 20000 Sí Sí 3 Prop No 7 5 H
10 30000 Sí Sí 2 Prop No 1 20 H
11 50000 No No 0 Alquiler No 2 12 M
12 8000 Sí Sí 2 Prop No 3 1 H
13 20000 No No 0 Alquiler No 27 5 M
14 10000 No Sí 0 Alquiler Sí 0 7 H
15 8000 No Sí 0 Alquiler No 3 2 H
64. 64
DM – Caso Agrupación de Empleados
• Podemos ver a qué conglomerado va a parar cada ejemplo.
• Pero además, podemos ver la distancia al centro de su
conglomerado.
• Cuanto menor es ese valor la pertenencia a su conglomerado es más fuerte. En cambio,
cuanto mayor es ese valor el empleado no está tan claramente asignado dentro de su
conglomerado.
65. 65
DM - Análisis de Canastas de Mercado (MBA)
• El propósito es determinar que productos
compran los clientes junto con otros
productos.
79. 79
Resumen
• Sistemas de información administrativa
proporcionan a los administradores reportes y
respuestas predefinidos de manera periódica,
excepcional, bajo demanda o automática para
satisfacer sus necesidades de información y
apoyar la toma de decisiones.
• El procesamiento analítico en línea analiza de
manera interactiva las relaciones complejas
entre grandes cantidades de datos
almacenados en bases de datos
multidimensionales.
80. 80
Resumen
• La minería de datos analiza las enormes
cantidades de datos históricos que se han
preparado para su análisis en almacenes de datos.
• Los sistemas de apoyo a la toma de decisiones son
sistemas de información interactivos, basados en
computadora, que utilizan software de sistemas de
apoyo a la toma de decisiones, así como una base
de modelos y bases de datos, con el fin de
proporcionar información adaptada para apoyar las
decisiones semiestructuradas y no estructuradas
de administradores individuales.