1. Datawarehouse
MTI. ADÁN JAIMES JAIMES
semT
Base de Datos para Aplicaciones
Ingeniería en Tecnologías de la Información y Comunicación
2. Conceptos Datawarehouse
• Datawarehouse: Repositorio completo de datos, donde se
almacenan datos estratégicos, tácticos y operativos, al
objeto de obtener información estratégica y táctica
• Data-Marts: Repositorio parcial de datos, donde se
almacenan datos tácticos y operativos, al objeto de
obtener información táctica
• Data-Mining: Técnicas de análisis de datos encaminadas a
obtener información oculta en un Datawarehouse
DATAWAREHOUSE 2
5. Comparación
Base de Datos Operacional Datawarehouse
Datos Operacionales
Datos del negocio para
Información
Orientado a la aplicación Orientado al sujeto
Actual Actual + histórico
Detallada Detallada + más resumida
Cambia continuamente Estable
DATAWAREHOUSE
5DATAWAREHOUSE
6. Características de un Datawarehouse
Orientado hacia la información relevante de la organización.
Se diseña para consultar eficientemente información
relativa a las actividades básicas de la organización como son
compras, ventas, mercadotecnia.
Y no para exportar procesos que se realizan en la
organización como son pedidos y facturación entre otros..
DATAWAREHOUSE
6DATAWAREHOUSE
11. Sistemas de Ayuda a Datawarehouse
EIS (Executive Information System): Herramientas para proveer de
información estratégica a los ejecutivos, mediante informes,
comparativas y cuadros de mandos multi-dimensionales.
DSS (Decission Suport System): Herramientas de ayuda a la toma de
decisiones. Incorpora reglas de decisión y análisis de datos no
predefinidos en las posibilidades de un EIS
DATAWAREHOUSE
11DATAWAREHOUSE
13. OLTP
OLTP (On-Line Transaction Processing): Define el
comportamiento habitual de un entorno operacional de
gestión:
◦ Altas/Bajas/Modificaciones/Consultas
◦ Consultas rápidas y encuestas
◦ Poco volumen de información
◦ Transacciones rápidas
◦ Gran nivel de concurrencia
DATAWAREHOUSE
13DATAWAREHOUSE
14. OLAP
OLAP: On-Line Analytical Process: Define el
comportamiento de un sistema de análisis de datos y
elaboración de información:
◦ Sólo Consulta
◦ Consultas pesadas y no predecibles
◦ Gran volumen de información histórica
◦ Operaciones lentas
DATAWAREHOUSE
14DATAWAREHOUSE
16. OLTP - OLAP
C aracterística O LTP O LA P
Tam año BD G igaBytes G iga a TeraBytes
O rigen D atos Interno Interno y Externo
A ctualización O n-Line Periodica
Periodos A ctual A ctuale H istórico
C onsultas Predecibles N ecesarias
A ctividad O peracional A nalítica
DATAWAREHOUSE
16DATAWAREHOUSE
21. Arquitectura Datawarehouse
Consistencia de consolidación
◦ Comprobar la validez de los datos en el entorno
operacional
◦ Datos que no se usan
◦ Inconsistencia entre distintas aplicaciones dentro del
sistema
◦ Datos no igualmente mantenidos
◦ Codificaciones diferentes
DATAWAREHOUSE
21DATAWAREHOUSE
22. Arquitectura Datawarehouse
• Middle-Ware
▫ Gestiona comunicaciones con el Datawarehouse
▫ Coordina la concurrencia
• Aplicaciones
▫ Sistemas de presentación
▫ Sistemas interrogativos
▫ Sistemas de simulación
▫ Sistemas funcionales
▫ Sistemas expertos
▫ DSS
DATAWAREHOUSE
22DATAWAREHOUSE
23. OLAP
El análisis de los datos se suele basar en un modelo
simplificado de estrella, o más genéricamente, de copo de
nieve (snowflake), el cual relaciona los hechos con los agentes
del negocio (dimensiones):
DATAWAREHOUSE
23
VentasGeografía
Tiempo
Clientes
Productos
DATAWAREHOUSE
25. Extract, Transform and Load (Extraer, transformar y cargar en inglés)
Ad-Hog Reporting. Personalizar una consulta en tiempo real
DATAWAREHOUSE
25DATAWAREHOUSE