Datawarehouse
MTI. ADÁN JAIMES JAIMES
semT
Base de Datos para Aplicaciones
Ingeniería en Tecnologías de la Información y Comunicación
Conceptos Datawarehouse
• Datawarehouse: Repositorio completo de datos, donde se
almacenan datos estratégicos, tácticos y operativos, al
objeto de obtener información estratégica y táctica
• Data-Marts: Repositorio parcial de datos, donde se
almacenan datos tácticos y operativos, al objeto de
obtener información táctica
• Data-Mining: Técnicas de análisis de datos encaminadas a
obtener información oculta en un Datawarehouse
DATAWAREHOUSE 2
DATAWAREHOUSE
3DATAWAREHOUSE
Datawarehouse
DATAWAREHOUSE
4DATAWAREHOUSE
Comparación
Base de Datos Operacional Datawarehouse
Datos Operacionales
Datos del negocio para
Información
Orientado a la aplicación Orientado al sujeto
Actual Actual + histórico
Detallada Detallada + más resumida
Cambia continuamente Estable
DATAWAREHOUSE
5DATAWAREHOUSE
Características de un Datawarehouse
Orientado hacia la información relevante de la organización.
 Se diseña para consultar eficientemente información
relativa a las actividades básicas de la organización como son
compras, ventas, mercadotecnia.
 Y no para exportar procesos que se realizan en la
organización como son pedidos y facturación entre otros..
DATAWAREHOUSE
6DATAWAREHOUSE
Datawarehouse
DATAWAREHOUSE
7DATAWAREHOUSE
Datawarehouse
DATAWAREHOUSE
8DATAWAREHOUSE
Datawarehouse
DATAWAREHOUSE
9DATAWAREHOUSE
DataMart
DATAWAREHOUSE
10DATAWAREHOUSE
Sistemas de Ayuda a Datawarehouse
EIS (Executive Information System): Herramientas para proveer de
información estratégica a los ejecutivos, mediante informes,
comparativas y cuadros de mandos multi-dimensionales.
DSS (Decission Suport System): Herramientas de ayuda a la toma de
decisiones. Incorpora reglas de decisión y análisis de datos no
predefinidos en las posibilidades de un EIS
DATAWAREHOUSE
11DATAWAREHOUSE
DATAWAREHOUSE
12DATAWAREHOUSE
OLTP
OLTP (On-Line Transaction Processing): Define el
comportamiento habitual de un entorno operacional de
gestión:
◦ Altas/Bajas/Modificaciones/Consultas
◦ Consultas rápidas y encuestas
◦ Poco volumen de información
◦ Transacciones rápidas
◦ Gran nivel de concurrencia
DATAWAREHOUSE
13DATAWAREHOUSE
OLAP
OLAP: On-Line Analytical Process: Define el
comportamiento de un sistema de análisis de datos y
elaboración de información:
◦ Sólo Consulta
◦ Consultas pesadas y no predecibles
◦ Gran volumen de información histórica
◦ Operaciones lentas
DATAWAREHOUSE
14DATAWAREHOUSE
DATAWAREHOUSE
15DATAWAREHOUSE
OLTP - OLAP
C aracterística O LTP O LA P
Tam año BD G igaBytes G iga a TeraBytes
O rigen D atos Interno Interno y Externo
A ctualización O n-Line Periodica
Periodos A ctual A ctuale H istórico
C onsultas Predecibles N ecesarias
A ctividad O peracional A nalítica
DATAWAREHOUSE
16DATAWAREHOUSE
DATAWAREHOUSE
17DATAWAREHOUSE
DATAWAREHOUSE
18DATAWAREHOUSE
DATAWAREHOUSE
19DATAWAREHOUSE
Arquitectura Datawarehouse
Diagrama de Flujo de Datos
DATAWAREHOUSE
20
OLAPConsolidación
Middle-
Ware
Aplicación
DATAWAREHOUSE
Arquitectura Datawarehouse
Consistencia de consolidación
◦ Comprobar la validez de los datos en el entorno
operacional
◦ Datos que no se usan
◦ Inconsistencia entre distintas aplicaciones dentro del
sistema
◦ Datos no igualmente mantenidos
◦ Codificaciones diferentes
DATAWAREHOUSE
21DATAWAREHOUSE
Arquitectura Datawarehouse
• Middle-Ware
▫ Gestiona comunicaciones con el Datawarehouse
▫ Coordina la concurrencia
• Aplicaciones
▫ Sistemas de presentación
▫ Sistemas interrogativos
▫ Sistemas de simulación
▫ Sistemas funcionales
▫ Sistemas expertos
▫ DSS
DATAWAREHOUSE
22DATAWAREHOUSE
OLAP
El análisis de los datos se suele basar en un modelo
simplificado de estrella, o más genéricamente, de copo de
nieve (snowflake), el cual relaciona los hechos con los agentes
del negocio (dimensiones):
DATAWAREHOUSE
23
VentasGeografía
Tiempo
Clientes
Productos
DATAWAREHOUSE
DATAWAREHOUSE
24DATAWAREHOUSE
Extract, Transform and Load (Extraer, transformar y cargar en inglés)
Ad-Hog Reporting. Personalizar una consulta en tiempo real
DATAWAREHOUSE
25DATAWAREHOUSE

Datawarehouse

  • 1.
    Datawarehouse MTI. ADÁN JAIMESJAIMES semT Base de Datos para Aplicaciones Ingeniería en Tecnologías de la Información y Comunicación
  • 2.
    Conceptos Datawarehouse • Datawarehouse:Repositorio completo de datos, donde se almacenan datos estratégicos, tácticos y operativos, al objeto de obtener información estratégica y táctica • Data-Marts: Repositorio parcial de datos, donde se almacenan datos tácticos y operativos, al objeto de obtener información táctica • Data-Mining: Técnicas de análisis de datos encaminadas a obtener información oculta en un Datawarehouse DATAWAREHOUSE 2
  • 3.
  • 4.
  • 5.
    Comparación Base de DatosOperacional Datawarehouse Datos Operacionales Datos del negocio para Información Orientado a la aplicación Orientado al sujeto Actual Actual + histórico Detallada Detallada + más resumida Cambia continuamente Estable DATAWAREHOUSE 5DATAWAREHOUSE
  • 6.
    Características de unDatawarehouse Orientado hacia la información relevante de la organización.  Se diseña para consultar eficientemente información relativa a las actividades básicas de la organización como son compras, ventas, mercadotecnia.  Y no para exportar procesos que se realizan en la organización como son pedidos y facturación entre otros.. DATAWAREHOUSE 6DATAWAREHOUSE
  • 7.
  • 8.
  • 9.
  • 10.
  • 11.
    Sistemas de Ayudaa Datawarehouse EIS (Executive Information System): Herramientas para proveer de información estratégica a los ejecutivos, mediante informes, comparativas y cuadros de mandos multi-dimensionales. DSS (Decission Suport System): Herramientas de ayuda a la toma de decisiones. Incorpora reglas de decisión y análisis de datos no predefinidos en las posibilidades de un EIS DATAWAREHOUSE 11DATAWAREHOUSE
  • 12.
  • 13.
    OLTP OLTP (On-Line TransactionProcessing): Define el comportamiento habitual de un entorno operacional de gestión: ◦ Altas/Bajas/Modificaciones/Consultas ◦ Consultas rápidas y encuestas ◦ Poco volumen de información ◦ Transacciones rápidas ◦ Gran nivel de concurrencia DATAWAREHOUSE 13DATAWAREHOUSE
  • 14.
    OLAP OLAP: On-Line AnalyticalProcess: Define el comportamiento de un sistema de análisis de datos y elaboración de información: ◦ Sólo Consulta ◦ Consultas pesadas y no predecibles ◦ Gran volumen de información histórica ◦ Operaciones lentas DATAWAREHOUSE 14DATAWAREHOUSE
  • 15.
  • 16.
    OLTP - OLAP Característica O LTP O LA P Tam año BD G igaBytes G iga a TeraBytes O rigen D atos Interno Interno y Externo A ctualización O n-Line Periodica Periodos A ctual A ctuale H istórico C onsultas Predecibles N ecesarias A ctividad O peracional A nalítica DATAWAREHOUSE 16DATAWAREHOUSE
  • 17.
  • 18.
  • 19.
  • 20.
    Arquitectura Datawarehouse Diagrama deFlujo de Datos DATAWAREHOUSE 20 OLAPConsolidación Middle- Ware Aplicación DATAWAREHOUSE
  • 21.
    Arquitectura Datawarehouse Consistencia deconsolidación ◦ Comprobar la validez de los datos en el entorno operacional ◦ Datos que no se usan ◦ Inconsistencia entre distintas aplicaciones dentro del sistema ◦ Datos no igualmente mantenidos ◦ Codificaciones diferentes DATAWAREHOUSE 21DATAWAREHOUSE
  • 22.
    Arquitectura Datawarehouse • Middle-Ware ▫Gestiona comunicaciones con el Datawarehouse ▫ Coordina la concurrencia • Aplicaciones ▫ Sistemas de presentación ▫ Sistemas interrogativos ▫ Sistemas de simulación ▫ Sistemas funcionales ▫ Sistemas expertos ▫ DSS DATAWAREHOUSE 22DATAWAREHOUSE
  • 23.
    OLAP El análisis delos datos se suele basar en un modelo simplificado de estrella, o más genéricamente, de copo de nieve (snowflake), el cual relaciona los hechos con los agentes del negocio (dimensiones): DATAWAREHOUSE 23 VentasGeografía Tiempo Clientes Productos DATAWAREHOUSE
  • 24.
  • 25.
    Extract, Transform andLoad (Extraer, transformar y cargar en inglés) Ad-Hog Reporting. Personalizar una consulta en tiempo real DATAWAREHOUSE 25DATAWAREHOUSE