INF 432 Sistemas para el soporte a la toma
de decisiones
TEMA 3. DATA WAREHOUSE
M.Sc. Rodolfo Arana Gonzales
Octubre 2024
Santa Cruz - Bolivia
2
Data Warehouse
Consideraciones iniciales
El dinamismo del mundo de los negocios requiere acceso rápido y
sencillo a información para la toma de decisiones
Lo usual es que las empresas tienen Sistemas Transaccionales (ST) para
aplicaciones de nivel operacional.
Los niveles gerenciales y de decisión necesitan información elaborada
para tomar decisiones cruciales, pero con frecuencia usan la experiencia
con un enfoque subjetivo.
Varios estudios de gestión de calidad han demostrado la trascendencia
de la toma de decisiones basada en cifras, datos y hechos.
3
Data Warehouse
Objetivo
Un Data Warehouse (DW) almacena información que permite tomar
decisiones racionales, proporcionando información confiable y
oportuna.
Un DW transforma los datos operacionales de los ST en información útil
para decidir, además busca:
• Relaciones nuevas entre los datos
• Predecir el comportamiento futuro bajo condiciones dadas.
Su filosofía es modelar los datos a partir de dimensiones basadas en
procesamiento analítico.
4
Data Warehouse
Como lo logra
Los datos operacionales (dispersos) son los insumos de entrada del DW.
La función de un DW respecto a la información es :
Recolectar - Unificar - Depurar
Eliminando inconsistencias y conservando solo información útil para los
objetivos empresariales.
Los datos en el ambiente DW pueden organizarse en:
• Data Warehouse corporativo
• Dividirse por área o sector, almacenándose en Data Marts (versión
reducida de un DW)
5
Data Warehouse
Aplicaciones
Las aplicaciones de usuario final que acceden al DW:
• Brindan información a diferentes niveles de agregación (detallados o
resumidos)
• Permiten filtrar consultas por distintas variables (“rebanar” y “picar” la
información).
• Utilizan herramientas como el Data Mining, IA y otras, para encontrar
relaciones ocultas entre los datos.
En consecuencia, un DW en la empresa es una ventaja competitiva en el
mundo de los negocios.
6
Datos operacionales y datos informativos
¿Datos o información?
Los procesos de registro del negocio usan datos operacionales,
(registros de las transacciones almacenados en bases de datos).
Tener acceso a los datos operacionales por limitaciones de
rendimiento y tecnología, es complicado para los usuarios.
Lo que el usuario necesita para análisis, en situaciones de
incertidumbre, son datos informativos.
Los datos informativos son una combinación de datos operacionales
con datos de fuentes externas; modificados, depurados,
transformados, consolidados y organizados.
7
Datos operacionales-OLTP
Propósito de los OLTP
Los datos operacionales de las bases de datos, manejados por
sistemas operacionales o transaccionales (OLTP On Line
Transactional Processing), se concentran en la administración y la
medición de:
Indicadores empresariales (capital e inversión),
Indicadores financieros (márgenes de utilidades, etc.)
Indicadores de ventas (identificación de clientes etc.)
8
Datos informativos-DW
Los datos informativos
Por su parte, los datos informativos que conforman un DW,
miden y administran parámetros empresariales estratégicos,
como:
Crecimiento del ingreso
Rentabilidad
Participación en el mercado
Segmentos del cliente.
9
Datos operacionales y datos informativos
Datos operacionales vs informativos
Datos Operacionales de BD
 Orientados a una aplicación
 Integración limitada
 Constantemente actualizados
 Sólo valores actuales
 Soportan operaciones diarias
Datos Informativos del DW
 Orientados a un tema
 Integrados
 No volátiles, estables
 Datos Actuales + históricos
 Detallados o resumidos
10
Data Warehouse (DW)
Concepto de Data Warehouse
Un Data Warehouse es un sistema de almacenamiento de
datos centralizado que integra y organiza información
proveniente de diversas fuentes de una empresa, diseñado
para soportar el análisis y la toma de decisiones. A diferencia
de las bases de datos operacionales, un data warehouse
almacena datos históricos y está estructurado para realizar
consultas y análisis complejos de forma rápida y eficiente,
facilitando el acceso a datos informativos relevantes para la
inteligencia empresarial
11
Data Warehouse (DW)
Dos enfoques:
Bill Inmon: los Data marts se crearán después de haber
terminado el data warehouse completo de la
organización.
Ralph Kimball: un data warehouse no es más que: “la
unión de todos los Data marts de una organización”
12
Data Mart
Data Mart
Un Data Mart es una implementación de un DW con un menor
alcance de información y un soporte limitado para procesos
analíticos.
Sirve a un sólo departamento de una organización o para el
análisis de problemas de un tema particular.
Es un subconjunto de información corporativa con formato
adicional a la medida de un usuario específico.
Será siempre menor en complejidad y alcance de los datos.
13
Características de DW
Características
Integra y asocia datos de múltiples fuentes: Combina información de
distintas bases de datos y otras fuentes.
Orientado a temas clave: Enfocado en datos relevantes para la
organización.
Conserva datos históricos: Almacena información periódica de distintos
momentos en el tiempo.
Maneja versiones de esquemas: Controla cambios en los esquemas de
datos de diversas fuentes.
Condensa y agrega datos: Simplifica y organiza la información para
hacerla comprensible.
14
Características de DW
15
Sistemas de Soporte a la decisions - DSS
Definición de un DSS
Un DSS (Sistema de Soporte a las Decisiones) es una
herramienta informática que facilita el proceso de toma de
decisiones en una organización, ya sea en planeación,
administración u operaciones. Permite seleccionar, manipular y
analizar datos, presentando resultados útiles para la toma de
decisiones. Además, proporciona acceso transparente a los
datos del Data Warehouse (DW) a través de interfaces comunes
para diversos usuarios.
"Un DSS es una ventana a datos informativos."
16
Inteligencia de Negocios - BI
Definición
La Inteligencia de Negocios (BI) es el conjunto de estrategias,
tecnologías y herramientas que transforman datos en
información útil para la toma de decisiones en una organización.
BI permite analizar el rendimiento, identificar tendencias y
mejorar la eficiencia empresarial mediante reportes,
visualizaciones y análisis de datos.
El concepto de Inteligencia entendido como:
“Aplicación de la información, habilidades, experiencias y
razonamiento para resolver un problema de negocios”
17
Inteligencia de Negocios - BI
Inteligencia de Negocios:
DW (Data Warehouse)- Es un almacén centralizado de datos integrados
de toda la organización.que almacena datos históricos y actuales para
análisis y reporting..
DSS (Decision Support System)- Es un sistema que soporte la toma de
decisiones en una organización. Utiliza datos del DW y proporciona
herramientas para la toma de decisiones informadas.
BI (Business Intelligence)- Es un conjunto de herramientas y técnicas
para analizar y visualizar datos. Utiliza datos del DW para generar
informes y análisis y ayuda a identificar tendencias y patrones en los
datos.
DW ---> DSS + BI
18
Beneficios del DATA WAREHOUSE
Beneficios del DW
1. Integración de datos de diversas fuentes
2. Facilita análisis y reporting
3. Toma de decisiones informadas
4. Mejora eficiencia y productividad en tiempo y costo
5. Flexibilidad y escalabilidad
6. Mejora calidad de datos
7. Visibilidad en un solo lugar y control sobre datos
19
Componentes de un sistema BI/DW
20
Arquitectura de un Data Warehouse
Un DW típico consta de las siguientes
capas:
1. Capa de Fuente datos (Source Layer)
• Sistemas operacionales
• Bases de datos transaccionales
• Archivos planos1
• .
2. Capa de Extracción (Extraction Layer)
• ETL (Extracción, Transformación, Carga)
• Herramientas de integración de datos
3. Capa de Almacenamiento (Storage
Layer)
• Almacén de datos centralizado
• Base de datos relacional o NoSQL
4. Capa de Acceso (Access Layer)
• Interfaces de consulta (SQL, MDX, etc.)
• Herramientas de reporting y análisis
5. Capa de Presentación (Presentation
Layer)
• Informes y dashboards
• Visualización de datos (gráficos, tablas,
etc.)
Arquitectura del DW
21
ELEMENTOS de un DSS
22
ELEMENTOS DE un DSS
1. Fuentes de datos
Sistemas de Procesamiento de Transacciones (TPS)
Sistemas de Información de Gestión (MIS)
Aplicaciones de Negocio: Como ERP y CRM.
Archivos Planos y Documentos: archivos CSV, Excel
 Datos Externos: bases de datos publicas y privadas.
Big Data y Fuentes de Datos No Estructurados: logs de internet,
datos de sensores, textos, imágenes y video.
23 2. Extracción, transformación y carga (ETL)
• Capturar y copiar los datos requeridos de uno o más sistemas
operacionales o fuentes de datos, que luego son colocados en un
archivo intermedio con un formato definido.
• Pueden presentarse errores como ser violaciones de integridad, claves
duplicadas, formatos de datos incorrectos y datos inválidos como
campos vacíos, fechas futuras e importes negativos si no correspondan
• Son subsistemas para poblar el Data Warehouse. Se pueden construir
utilizando herramientas y productos disponibles en el mercado o
programas y procesos codificados desde cero, para el crecimiento
evolutivo del DW (mapeo).
EXTRACCION TRANSFORMACION Y CARGA
24
Transformación (Transformation)
Esta fase consiste en
 leer los archivos intermedios generados por la extracción
 realizar las transformaciones necesarias
 construir los registros en el formato del Data Warehouse
 crear un archivo de salida conteniendo todos los registros nuevos a ser
cargados en el Data Warehouse.
PROCESOS DE ETL
25
Las transformaciones incluyen:
 Combinar campos múltiples de nombres y apellidos en un solo
campo.
 Fusionar campos o datos homónimos.
 Separar un campo de fecha en año, mes día.
 Cambiar la representación de los datos, como TRUE a 1, y FALSE a 0,
o códigos numéricos a alfanuméricos.
 Cambiar un dato que tiene múltiples representaciones a una sola
representación, como por ejemplo definir un formato común para
números telefónicos etc.
PROCESOS DE ETL
26
Carga (Loading)
El último paso es cargar los datos transformados en el DW. La
carga puede ser completa, donde todo el conjunto de datos se
carga en el DW, o incremental, donde solo se añaden los
cambios realizados desde la última carga. Este proceso debe ser
cuidadosamente gestionado para mantener la integridad y el
rendimiento del DW.
PROCESOS DE ETL
27
MODELADO DEL DATA WAREHOUSE
Modelado lógico de Datos: En los Data Warehouses, el modelado
dimensional (esquemas estrella o copo de nieve) es común. Se
organizan en tablas de hechos (que contienen medidas cuantitativas)
y tablas de dimensiones (que contienen datos descriptivos).
Abstracción de la Complejidad: Los datos se presentan de manera
que analistas y gerentes, puedan entenderlos y analizarlos sin
necesidad de comprender los detalles técnicos de la base de datos.
Independencia de Datos: Los usuarios acceden y utilizan los datos
sin preocuparse por cómo y dónde se almacenan físicamente. Esto
proporciona una capa de independencia que facilita la adaptabilidad
y la escalabilidad.
ELEMENTOS DE LOS DSS
28
Arquitectura de un Data Warehouse
4. Herramientas de acceso y consulta
Se incluye software y hardware para visualización, reportes, hojas de calculo, graficos y
diagramas de analisis. Estas pantallas se llaman Cuadros de Mando (Dashboard)
ELEMENTOS DE LOS DSS
29
INTELIGENCIA DE NEGOCIOS BI
Herramientas de acceso y uso
Son sistemas de software basados en técnicas para capturar datos,
analizarlos desde distintos puntos de vista y transformarlos en
información útil para el negocio.
Se llaman genéricamente Herramientas de Inteligencia de Negocio
(Business Inteligence Tools, BIT) Ver video
Consultas SQL
Herramientas MDA (Multidimensinal Analysis)
OLAP (On-Line Analitical Processing)
Data Minning
30
Modelo dimensional OLAP
Modelo dimensional OLAP (On Line Analisys Processing)
 El Procesamiento Analítico en Línea (OLAP) es una tecnología de
análisis de datos.
 Crea nueva información empresarial a partir de los datos
existentes.
 Basado en el modelo relacional (modelo R, con restricciones)
 Resume, organiza y presenta la información para soportar el
análisis.
31
Modelo dimensional OLAP
Características de OLAP:
 Presenta visión multidimensional lógica de los datos del DW,
independientemente de su almacenamiento.
 Crea resúmenes, agrupaciones y jerarquías.
 Soporta consultas interactivas y análisis de los datos.
 Permite una profundización hacia niveles más detallados o un
ascenso a niveles superiores de resumen y agrupacion.
Cubos OLAP
Son estructuras relacionales compuesta por dimensiones separadas y
heterogéneas, cuyos datos que se obtienen de varias fuentes (tablas
relacionales, archivos planos).
32
Modelo dimensional OLAP
Características:
 Ofrece opciones de modelado analítico, así como también
provee modelos estadísticos básicos.
 Responde con rapidez a las consultas, de modo que el proceso
de análisis no se interrumpe y la información no se
desactualiza.
 Recupera y exhibe datos tabulares en dos o tres dimensiones,
cuadros o gráficos, con un fácil pivoteo de los ejes.
33
OLAP OLTP
Usuario Gerente, Ejecutivo Empleado, Prof. de Sistemas
Función Soporte a las Decisiones Operación diaria
Diseño de la Base de
Datos
Orientado a una materia Orientado a una aplicación
Datos
Históricos, resumidos,
multidimensionales, integrados,
consolidados, detallados
Actuales, detallados, relacionales,
aislados
Uso
Ad-hoc, requerimientos del
momento
Repetitivo
Acceso Exploración
Lectura/Escritura,
Índices/Algoritmos de dispersión
Unidad de Trabajo Consultas complejas Transacciones simples
Cantidad registros
accedidos
Millones Decenas
Cantidad usuarios Cientos Miles
Volumen Base de
Datos
Mayor Menor
Métrica Consultas por unidad tiempo Transacciones por unid. tiempo
34
Modelo dimensional OLAP
Elementos fundamentales de OLAP:
*Áreas temas
*Indicadores
*Dimensiones
*Hechos
35
Modelo dimensional de datos
Area tema
Son temas clave de interés de una función empresarial. Por ejemplo, el
depto. de comercialización puede estar interesado en áreas tema:
Pedidos, Promociones, Mercados y Ventas.
Medidas (indicadores)
Son cuantificadores del desempeño de un ítem o una actividad del negocio.
Es usada en consultas para evaluar el desempeño de un área tema
Para el área tema “llamadas”, los indicadores serían:
duración de las llamadas y cantidad de llamadas.
En un “banco”, los indicadores pueden ser:
creditos, comisiones, cant. clientes, % particip. mercado
36
Modelo dimensional
Dimensiones
Son atributos descriptivos usados por los analistas para identificar el
contexto de las medidas con las que trabajan. Vienen expresadas en
forma de cualidades de las medidas y que no cambian en el tiempo.
En una compañía telefónica:
Tipo de Llamada, Duración, Organización Telefónica
En un banco se tendrán:
Cuentas, Clientes, Tiempo, Productos, Agencias, Regiones, etc.
Las dimensiones están compuestas por «miembros», que pueden
tener jerarquías. Por ejemplo, el mes dentro de un trimestre. (otro ej.
areas o deptos., dentro de empresa)
37
Modelo dimensional cubos OLAP
Medida:
Duración de
Llamadas.
Dimensiones:
Tiempo, Tipo
de Llamada y
Organización
Telefónica
(secciones)
38
Técnicas para navegar por distintos niveles de detalle de una jerarquía
de datos.
 Drill Down explora los hechos hacia los niveles más detallados de la
jerarquía de dimensiones.
 Roll Up explora los hechos iterativamente hacia el nivel más alto de
agregación.
Drill Down y
Roll Up
*Navegación en OLAP
39
Los datos multidimensionales pueden ser mostrados aplicando diferentes filtros a
los cubos.
Slice (Rebanar) a un subconjunto de datos de un cubo se aplica una única
restricción a una sola dimensión.
Cuando se combinan varios Slice la acción efectuada es llamada Dice (Picar).
Slice y Dice
*Navegación en OLAP
40
Reportes en el Modelo Relacional
Ventas productos farmaceuticos
(en miles de Bs.)
Enero
Agencia 1 Agencia 2 Agencia 3
Refrianex 558 553 644
Optigen 323 290 307
Amoxicilina 922 452 455
Risperidona 457 691 821
41
Agencia 1 Agencia 2 Agencia 3
Refrianex 428 523 301
Optigen 33 91 33
Amoxicilina 769 821 502
Risperidona 688 500 680
Agencia 1 Agencia 2 Agencia 3
Refrianex 501 490 490
Optigen 33 91 33
Amoxicilina 769 821 502
Risperidona 688 500 680
Reportes en el Modelo dimensional
Ventas productos farmaceuticos
(en miles de Bs.)
Abril
Marzo
Febrero
Enero
Agencia 1 Agencia 2 Agencia 3
Refrianex 244 663 533
Optigen 64 66 17
Amoxicilina 755 983 742
Risperidona 544 876 558
Agencia 1 Agencia 2 Agencia 3
Refrianex 558 553 644
Optigen 323 290 307
Amoxicilina 922 452 455
Risperidona 457 691 821
Dimensiones
Productos
Agencias
Meses
Medida
Monto de
ventas
42
Modelo dimensional: Implementacion
Tipos de implementación
El esquema multidimensional puede ser implementado por dos
tipos de esquemas o modelos relacionales:
Modelo estrella - star schema (más usado)
Modelo copo de nieve - snowflake schema
43
Modelo estrella
Elementos del modelo estrella
Tablas dimensión - Tabla de hechos
Las tablas periféricas dimensión guardan la información cualitativa de los
miembros y sus relaciones.
La tabla central de hechos almacena datos cuantitativos.
Indicadores o medidas
Son medidas candidatas los atributos numéricos de valor continuo. No todo
atributo numérico es una medida.
Están involucradas en «queries de usuario» que calculan resúmenes.
Ejemplos:
Cantidades, tamaños, montos, duración, etc.
44
Modelo estrella
Tablas de dimensión
Cada tabla dimensión tiene su clave primaria que corresponde con uno de
los atributos de la clave compuesta en la tabla de hechos.
Las tablas de dimensiones contienen información textual descriptiva, sus
atributos se usan para las restricciones en las consultas al DW.
Las dimensiones son referenciadas por las llaves de dimension. Contienen:
Entidades de dimensión
Atributos de dimensión
Jerarquías de dimensión
Niveles de agregación
45
Modelo estrella
Tabla de hechos
La tablas de hechos, además de sus campos clave, contiene uno o más
indicadores o “hechos”. Los indicadores más útiles en una tabla de hechos
son numéricos y aditivos.
Contienen:
Un identificador de hechos
Llaves de dimensión (que los enlaza con las dimensiones)
Medidas
Varios tipos de atributos (se derivan de otros datos del modelo)
46
Modelo estrella
47
Modelo copo de nieve
Modelo copo de nieve
En este modelado se normalizan algunas las dimensiones reflejando
las jerarquías en las mismas y conservando lo esencial del modelo en
estrella: las tablas de hechos.
La ventaja del modelo copo de nieve es eliminar la redundancia de
datos y por lo tanto ocupar menos espacio en disco
Cuando no es posible recopilar toda la información necesaria en un
único esquema estrella o copo ne nuieve, se puede utilizar varios
esquemas. Cada uno de estos esquemas se denomina Datamart.
48
F I N
49
A N E X O S
50
Ciclo de vida de un DW
 PLANIFICACIÓN DEL PROYECTO.
 La planificación busca identificar la definición y el alcance del proyecto de datawarehouse,
incluyendo justificaciones del negocio y evaluaciones de factibilidad. La planificación del
proyecto se focaliza sobre recursos, perfiles, tareas, duraciones y secuencialidad. El plan de
proyecto resultante identifica todas las tareas asociadas con el BDL e identifica las partes
involucradas. Esta etapa se concentra sobre la definición del proyecto (identificación del
escenario del proyecto para saber de dónde surge la necesidad del data warehouse).
 DEFINICIÓN DE LOS REQUERIMIENTOS DE NEGOCIOS
 Un factor determinante en el éxito de un proceso de Data Warehousing es la interpretación
correcta de los diferentes niveles de requerimientos expresados por los diferentes niveles de
usuarios. La técnica utilizada para relevar los requerimientos de los analistas del negocio difiere
de los enfoques tradicionales guiados por los datos [Inm92] [Gol99]. Los diseñadores de los
data warehouses deben entender los factores claves que guían al negocio para determinar
efectivamente los requerimientos y traducirlos en consideraciones de diseño apropiadas.
51
Ciclo de vida de un DW
52
•DISEÑO DE LA ARQUITECTURA TÉCNICA.
Los ambientes de data warehousing requieren la integración de numerosas tecnologías. Se debe
saber tres factores: los requerimientos del negocio, los actuales ambientes técnicos y las
directrices técnicas estratégicas futuras planificadas para de esta forma poder establecer el
diseño de la arquitectura técnica del ambiente de data warehousing .
•MODELO DIMENSIONAL.
La definición de los requerimientos del negocio determina los datos necesarios para cumplir los
requerimientos analíticos de los usuarios. Diseñar los modelos de datos para soportar estos
análisis requiere un enfoque diferente al usado en los sistemas operacionales. Básicamente se
comienza con una matriz donde se determina la dimensionalidad de cada indicador y luego se
especifican los diferentes grados de detalle (atributos) dentro de cada concepto del negocio
(dimensión), como así también la granularidad de cada indicador (variable o métrica) y las
diferentes jerarquías que dan forma al modelo dimensional del negocio (BDM) o mapa
dimensional.
53 arquitectura
54 •ESPECIFICACIÓN DE IMPLEMENTACIÓN PARA USUARIOS FINALES.
No todos los usuarios del warehouse necesitan el mismo nivel de análisis. Es por ello
que en esta etapa se identifican los diferentes roles o perfiles de usuarios para
determinar los diferentes tipos de aplicaciones necesarias en base al alcance de los
diferentes perfiles (gerencial, analista del negocio, vendedor, etc.) Kimball se concentra
sobre el proceso de creación de aplicaciones “templates”. Comienza definiendo el
concepto de la aplicación para usuario final y su rol en el acceso a la información del
negocio. Brinda un marco metodológico bastante estándard en lo que ha desarrollo de
aplicaciones (como piezas de software) se refiere.
•SELECCIÓN DEL PRODUCTO E INSTALACIÓN.
Utilizando el diseño de arquitectura técnica como marco, es necesario evaluar y
seleccionar componentes específicos de la arquitectura como ser la plataforma de
hardware, el motor de base de datos, la herramienta de ETL o el desarrollo pertinente,
herramientas de acceso, etc. Una vez evaluados y seleccionados los componentes
determinados se procede con la instalación y prueba de los mismos en un ambiente
integrado de data warehousing.
55 •DISEÑO FÍSICO.
El diseño físico de las base de datos se focaliza sobre la selección de las estructuras necesarias para
soportar el diseño lógico. Algunos de los elementos principales de este proceso son la definición de
convenciones estándares de nombres y seteos específicos del ambiente de la base de datos. La indexación y
las estrategias de particionamiento son también determinadas en esta etapa.
•DISEÑO Y DESARROLLO DE PRESENTACION DE DATOS.
Esta etapa es típicamente la más subestimada de las tareas en un proyecto de data warehouse. Las
principales subetapas de esta zona del ciclo de vida son: la extracción, la transformación y la carga (ETL
process). Se definen como procesos de extracción a aquellos requeridos para obtener los datos que
permitirán efectuar la carga del Modelo Físico acordado. Asimismo, se definen como procesos de
transformación los procesos para convertir o recodificar los datos fuente a fin poder efectuar la carga
efectiva del Modelo Físico.
•DESARROLLO DE APLICACIÓN PARA USUARIOS FINALES.
Siguiendo a la especificación de las aplicaciones para usuarios finales, el desarrollo de las aplicaciones de
los usuarios finales involucra configuraciones del metadata y construcción de reportes específicos. Una vez
que se ha cumplido con todos los pasos de la especificación y se tiene la posibilidad de trabajar con algunos
datos de prueba, comienza el desarrollo de la aplicación.
Selección de un enfoque de implementación, Desarrollo de la aplicación y Prueba y verificación de datos
56 •IMPLEMENTACION.
La IMPLEMENTACIÓN representa la convergencia de la tecnología, los datos y las
aplicaciones de usuarios finales accesible desde el escritorio del usuario del negocio. Hay
varios factores extras que aseguran el correcto funcionamiento de todas estas piezas, entre
ellos se encuentran la capacitación, el soporte técnico, la comunicación, las estrategias de
feedback. Todas estas tareas deben ser tenidas en cuenta antes de que cualquier usuario
pueda tener acceso al data warehouse.
•MANTENIMIENTO Y CRECIMIENTO
Como se remarca siempre, Data Warehousing es un proceso (de etapas bien definidas, con
comienzo y fin, pero de naturaleza espiral) pues acompaña a la evolución de la organización
durante toda su historia. Se necesita continuar con los relevamientos de forma constante
para poder seguir la evolución de las metas por conseguir. Según afirma Kimball. Al
contrario de los sistemas tradicionales, los cambios en el desarrollo deben ser vistos como
signos de éxito y no de falla. Es importante establecer las prioridades para poder manejar
los nuevos requerimientos de los usuarios y de esa forma poder evolucionar y crecer.

CAPITULO 3. Data warehouse REVISADO.pptx

  • 1.
    INF 432 Sistemaspara el soporte a la toma de decisiones TEMA 3. DATA WAREHOUSE M.Sc. Rodolfo Arana Gonzales Octubre 2024 Santa Cruz - Bolivia
  • 2.
    2 Data Warehouse Consideraciones iniciales Eldinamismo del mundo de los negocios requiere acceso rápido y sencillo a información para la toma de decisiones Lo usual es que las empresas tienen Sistemas Transaccionales (ST) para aplicaciones de nivel operacional. Los niveles gerenciales y de decisión necesitan información elaborada para tomar decisiones cruciales, pero con frecuencia usan la experiencia con un enfoque subjetivo. Varios estudios de gestión de calidad han demostrado la trascendencia de la toma de decisiones basada en cifras, datos y hechos.
  • 3.
    3 Data Warehouse Objetivo Un DataWarehouse (DW) almacena información que permite tomar decisiones racionales, proporcionando información confiable y oportuna. Un DW transforma los datos operacionales de los ST en información útil para decidir, además busca: • Relaciones nuevas entre los datos • Predecir el comportamiento futuro bajo condiciones dadas. Su filosofía es modelar los datos a partir de dimensiones basadas en procesamiento analítico.
  • 4.
    4 Data Warehouse Como lologra Los datos operacionales (dispersos) son los insumos de entrada del DW. La función de un DW respecto a la información es : Recolectar - Unificar - Depurar Eliminando inconsistencias y conservando solo información útil para los objetivos empresariales. Los datos en el ambiente DW pueden organizarse en: • Data Warehouse corporativo • Dividirse por área o sector, almacenándose en Data Marts (versión reducida de un DW)
  • 5.
    5 Data Warehouse Aplicaciones Las aplicacionesde usuario final que acceden al DW: • Brindan información a diferentes niveles de agregación (detallados o resumidos) • Permiten filtrar consultas por distintas variables (“rebanar” y “picar” la información). • Utilizan herramientas como el Data Mining, IA y otras, para encontrar relaciones ocultas entre los datos. En consecuencia, un DW en la empresa es una ventaja competitiva en el mundo de los negocios.
  • 6.
    6 Datos operacionales ydatos informativos ¿Datos o información? Los procesos de registro del negocio usan datos operacionales, (registros de las transacciones almacenados en bases de datos). Tener acceso a los datos operacionales por limitaciones de rendimiento y tecnología, es complicado para los usuarios. Lo que el usuario necesita para análisis, en situaciones de incertidumbre, son datos informativos. Los datos informativos son una combinación de datos operacionales con datos de fuentes externas; modificados, depurados, transformados, consolidados y organizados.
  • 7.
    7 Datos operacionales-OLTP Propósito delos OLTP Los datos operacionales de las bases de datos, manejados por sistemas operacionales o transaccionales (OLTP On Line Transactional Processing), se concentran en la administración y la medición de: Indicadores empresariales (capital e inversión), Indicadores financieros (márgenes de utilidades, etc.) Indicadores de ventas (identificación de clientes etc.)
  • 8.
    8 Datos informativos-DW Los datosinformativos Por su parte, los datos informativos que conforman un DW, miden y administran parámetros empresariales estratégicos, como: Crecimiento del ingreso Rentabilidad Participación en el mercado Segmentos del cliente.
  • 9.
    9 Datos operacionales ydatos informativos Datos operacionales vs informativos Datos Operacionales de BD  Orientados a una aplicación  Integración limitada  Constantemente actualizados  Sólo valores actuales  Soportan operaciones diarias Datos Informativos del DW  Orientados a un tema  Integrados  No volátiles, estables  Datos Actuales + históricos  Detallados o resumidos
  • 10.
    10 Data Warehouse (DW) Conceptode Data Warehouse Un Data Warehouse es un sistema de almacenamiento de datos centralizado que integra y organiza información proveniente de diversas fuentes de una empresa, diseñado para soportar el análisis y la toma de decisiones. A diferencia de las bases de datos operacionales, un data warehouse almacena datos históricos y está estructurado para realizar consultas y análisis complejos de forma rápida y eficiente, facilitando el acceso a datos informativos relevantes para la inteligencia empresarial
  • 11.
    11 Data Warehouse (DW) Dosenfoques: Bill Inmon: los Data marts se crearán después de haber terminado el data warehouse completo de la organización. Ralph Kimball: un data warehouse no es más que: “la unión de todos los Data marts de una organización”
  • 12.
    12 Data Mart Data Mart UnData Mart es una implementación de un DW con un menor alcance de información y un soporte limitado para procesos analíticos. Sirve a un sólo departamento de una organización o para el análisis de problemas de un tema particular. Es un subconjunto de información corporativa con formato adicional a la medida de un usuario específico. Será siempre menor en complejidad y alcance de los datos.
  • 13.
    13 Características de DW Características Integray asocia datos de múltiples fuentes: Combina información de distintas bases de datos y otras fuentes. Orientado a temas clave: Enfocado en datos relevantes para la organización. Conserva datos históricos: Almacena información periódica de distintos momentos en el tiempo. Maneja versiones de esquemas: Controla cambios en los esquemas de datos de diversas fuentes. Condensa y agrega datos: Simplifica y organiza la información para hacerla comprensible.
  • 14.
  • 15.
    15 Sistemas de Soportea la decisions - DSS Definición de un DSS Un DSS (Sistema de Soporte a las Decisiones) es una herramienta informática que facilita el proceso de toma de decisiones en una organización, ya sea en planeación, administración u operaciones. Permite seleccionar, manipular y analizar datos, presentando resultados útiles para la toma de decisiones. Además, proporciona acceso transparente a los datos del Data Warehouse (DW) a través de interfaces comunes para diversos usuarios. "Un DSS es una ventana a datos informativos."
  • 16.
    16 Inteligencia de Negocios- BI Definición La Inteligencia de Negocios (BI) es el conjunto de estrategias, tecnologías y herramientas que transforman datos en información útil para la toma de decisiones en una organización. BI permite analizar el rendimiento, identificar tendencias y mejorar la eficiencia empresarial mediante reportes, visualizaciones y análisis de datos. El concepto de Inteligencia entendido como: “Aplicación de la información, habilidades, experiencias y razonamiento para resolver un problema de negocios”
  • 17.
    17 Inteligencia de Negocios- BI Inteligencia de Negocios: DW (Data Warehouse)- Es un almacén centralizado de datos integrados de toda la organización.que almacena datos históricos y actuales para análisis y reporting.. DSS (Decision Support System)- Es un sistema que soporte la toma de decisiones en una organización. Utiliza datos del DW y proporciona herramientas para la toma de decisiones informadas. BI (Business Intelligence)- Es un conjunto de herramientas y técnicas para analizar y visualizar datos. Utiliza datos del DW para generar informes y análisis y ayuda a identificar tendencias y patrones en los datos. DW ---> DSS + BI
  • 18.
    18 Beneficios del DATAWAREHOUSE Beneficios del DW 1. Integración de datos de diversas fuentes 2. Facilita análisis y reporting 3. Toma de decisiones informadas 4. Mejora eficiencia y productividad en tiempo y costo 5. Flexibilidad y escalabilidad 6. Mejora calidad de datos 7. Visibilidad en un solo lugar y control sobre datos
  • 19.
    19 Componentes de unsistema BI/DW
  • 20.
    20 Arquitectura de unData Warehouse Un DW típico consta de las siguientes capas: 1. Capa de Fuente datos (Source Layer) • Sistemas operacionales • Bases de datos transaccionales • Archivos planos1 • . 2. Capa de Extracción (Extraction Layer) • ETL (Extracción, Transformación, Carga) • Herramientas de integración de datos 3. Capa de Almacenamiento (Storage Layer) • Almacén de datos centralizado • Base de datos relacional o NoSQL 4. Capa de Acceso (Access Layer) • Interfaces de consulta (SQL, MDX, etc.) • Herramientas de reporting y análisis 5. Capa de Presentación (Presentation Layer) • Informes y dashboards • Visualización de datos (gráficos, tablas, etc.) Arquitectura del DW
  • 21.
  • 22.
    22 ELEMENTOS DE unDSS 1. Fuentes de datos Sistemas de Procesamiento de Transacciones (TPS) Sistemas de Información de Gestión (MIS) Aplicaciones de Negocio: Como ERP y CRM. Archivos Planos y Documentos: archivos CSV, Excel  Datos Externos: bases de datos publicas y privadas. Big Data y Fuentes de Datos No Estructurados: logs de internet, datos de sensores, textos, imágenes y video.
  • 23.
    23 2. Extracción,transformación y carga (ETL) • Capturar y copiar los datos requeridos de uno o más sistemas operacionales o fuentes de datos, que luego son colocados en un archivo intermedio con un formato definido. • Pueden presentarse errores como ser violaciones de integridad, claves duplicadas, formatos de datos incorrectos y datos inválidos como campos vacíos, fechas futuras e importes negativos si no correspondan • Son subsistemas para poblar el Data Warehouse. Se pueden construir utilizando herramientas y productos disponibles en el mercado o programas y procesos codificados desde cero, para el crecimiento evolutivo del DW (mapeo). EXTRACCION TRANSFORMACION Y CARGA
  • 24.
    24 Transformación (Transformation) Esta faseconsiste en  leer los archivos intermedios generados por la extracción  realizar las transformaciones necesarias  construir los registros en el formato del Data Warehouse  crear un archivo de salida conteniendo todos los registros nuevos a ser cargados en el Data Warehouse. PROCESOS DE ETL
  • 25.
    25 Las transformaciones incluyen: Combinar campos múltiples de nombres y apellidos en un solo campo.  Fusionar campos o datos homónimos.  Separar un campo de fecha en año, mes día.  Cambiar la representación de los datos, como TRUE a 1, y FALSE a 0, o códigos numéricos a alfanuméricos.  Cambiar un dato que tiene múltiples representaciones a una sola representación, como por ejemplo definir un formato común para números telefónicos etc. PROCESOS DE ETL
  • 26.
    26 Carga (Loading) El últimopaso es cargar los datos transformados en el DW. La carga puede ser completa, donde todo el conjunto de datos se carga en el DW, o incremental, donde solo se añaden los cambios realizados desde la última carga. Este proceso debe ser cuidadosamente gestionado para mantener la integridad y el rendimiento del DW. PROCESOS DE ETL
  • 27.
    27 MODELADO DEL DATAWAREHOUSE Modelado lógico de Datos: En los Data Warehouses, el modelado dimensional (esquemas estrella o copo de nieve) es común. Se organizan en tablas de hechos (que contienen medidas cuantitativas) y tablas de dimensiones (que contienen datos descriptivos). Abstracción de la Complejidad: Los datos se presentan de manera que analistas y gerentes, puedan entenderlos y analizarlos sin necesidad de comprender los detalles técnicos de la base de datos. Independencia de Datos: Los usuarios acceden y utilizan los datos sin preocuparse por cómo y dónde se almacenan físicamente. Esto proporciona una capa de independencia que facilita la adaptabilidad y la escalabilidad. ELEMENTOS DE LOS DSS
  • 28.
    28 Arquitectura de unData Warehouse 4. Herramientas de acceso y consulta Se incluye software y hardware para visualización, reportes, hojas de calculo, graficos y diagramas de analisis. Estas pantallas se llaman Cuadros de Mando (Dashboard) ELEMENTOS DE LOS DSS
  • 29.
    29 INTELIGENCIA DE NEGOCIOSBI Herramientas de acceso y uso Son sistemas de software basados en técnicas para capturar datos, analizarlos desde distintos puntos de vista y transformarlos en información útil para el negocio. Se llaman genéricamente Herramientas de Inteligencia de Negocio (Business Inteligence Tools, BIT) Ver video Consultas SQL Herramientas MDA (Multidimensinal Analysis) OLAP (On-Line Analitical Processing) Data Minning
  • 30.
    30 Modelo dimensional OLAP Modelodimensional OLAP (On Line Analisys Processing)  El Procesamiento Analítico en Línea (OLAP) es una tecnología de análisis de datos.  Crea nueva información empresarial a partir de los datos existentes.  Basado en el modelo relacional (modelo R, con restricciones)  Resume, organiza y presenta la información para soportar el análisis.
  • 31.
    31 Modelo dimensional OLAP Característicasde OLAP:  Presenta visión multidimensional lógica de los datos del DW, independientemente de su almacenamiento.  Crea resúmenes, agrupaciones y jerarquías.  Soporta consultas interactivas y análisis de los datos.  Permite una profundización hacia niveles más detallados o un ascenso a niveles superiores de resumen y agrupacion. Cubos OLAP Son estructuras relacionales compuesta por dimensiones separadas y heterogéneas, cuyos datos que se obtienen de varias fuentes (tablas relacionales, archivos planos).
  • 32.
    32 Modelo dimensional OLAP Características: Ofrece opciones de modelado analítico, así como también provee modelos estadísticos básicos.  Responde con rapidez a las consultas, de modo que el proceso de análisis no se interrumpe y la información no se desactualiza.  Recupera y exhibe datos tabulares en dos o tres dimensiones, cuadros o gráficos, con un fácil pivoteo de los ejes.
  • 33.
    33 OLAP OLTP Usuario Gerente,Ejecutivo Empleado, Prof. de Sistemas Función Soporte a las Decisiones Operación diaria Diseño de la Base de Datos Orientado a una materia Orientado a una aplicación Datos Históricos, resumidos, multidimensionales, integrados, consolidados, detallados Actuales, detallados, relacionales, aislados Uso Ad-hoc, requerimientos del momento Repetitivo Acceso Exploración Lectura/Escritura, Índices/Algoritmos de dispersión Unidad de Trabajo Consultas complejas Transacciones simples Cantidad registros accedidos Millones Decenas Cantidad usuarios Cientos Miles Volumen Base de Datos Mayor Menor Métrica Consultas por unidad tiempo Transacciones por unid. tiempo
  • 34.
    34 Modelo dimensional OLAP Elementosfundamentales de OLAP: *Áreas temas *Indicadores *Dimensiones *Hechos
  • 35.
    35 Modelo dimensional dedatos Area tema Son temas clave de interés de una función empresarial. Por ejemplo, el depto. de comercialización puede estar interesado en áreas tema: Pedidos, Promociones, Mercados y Ventas. Medidas (indicadores) Son cuantificadores del desempeño de un ítem o una actividad del negocio. Es usada en consultas para evaluar el desempeño de un área tema Para el área tema “llamadas”, los indicadores serían: duración de las llamadas y cantidad de llamadas. En un “banco”, los indicadores pueden ser: creditos, comisiones, cant. clientes, % particip. mercado
  • 36.
    36 Modelo dimensional Dimensiones Son atributosdescriptivos usados por los analistas para identificar el contexto de las medidas con las que trabajan. Vienen expresadas en forma de cualidades de las medidas y que no cambian en el tiempo. En una compañía telefónica: Tipo de Llamada, Duración, Organización Telefónica En un banco se tendrán: Cuentas, Clientes, Tiempo, Productos, Agencias, Regiones, etc. Las dimensiones están compuestas por «miembros», que pueden tener jerarquías. Por ejemplo, el mes dentro de un trimestre. (otro ej. areas o deptos., dentro de empresa)
  • 37.
    37 Modelo dimensional cubosOLAP Medida: Duración de Llamadas. Dimensiones: Tiempo, Tipo de Llamada y Organización Telefónica (secciones)
  • 38.
    38 Técnicas para navegarpor distintos niveles de detalle de una jerarquía de datos.  Drill Down explora los hechos hacia los niveles más detallados de la jerarquía de dimensiones.  Roll Up explora los hechos iterativamente hacia el nivel más alto de agregación. Drill Down y Roll Up *Navegación en OLAP
  • 39.
    39 Los datos multidimensionalespueden ser mostrados aplicando diferentes filtros a los cubos. Slice (Rebanar) a un subconjunto de datos de un cubo se aplica una única restricción a una sola dimensión. Cuando se combinan varios Slice la acción efectuada es llamada Dice (Picar). Slice y Dice *Navegación en OLAP
  • 40.
    40 Reportes en elModelo Relacional Ventas productos farmaceuticos (en miles de Bs.) Enero Agencia 1 Agencia 2 Agencia 3 Refrianex 558 553 644 Optigen 323 290 307 Amoxicilina 922 452 455 Risperidona 457 691 821
  • 41.
    41 Agencia 1 Agencia2 Agencia 3 Refrianex 428 523 301 Optigen 33 91 33 Amoxicilina 769 821 502 Risperidona 688 500 680 Agencia 1 Agencia 2 Agencia 3 Refrianex 501 490 490 Optigen 33 91 33 Amoxicilina 769 821 502 Risperidona 688 500 680 Reportes en el Modelo dimensional Ventas productos farmaceuticos (en miles de Bs.) Abril Marzo Febrero Enero Agencia 1 Agencia 2 Agencia 3 Refrianex 244 663 533 Optigen 64 66 17 Amoxicilina 755 983 742 Risperidona 544 876 558 Agencia 1 Agencia 2 Agencia 3 Refrianex 558 553 644 Optigen 323 290 307 Amoxicilina 922 452 455 Risperidona 457 691 821 Dimensiones Productos Agencias Meses Medida Monto de ventas
  • 42.
    42 Modelo dimensional: Implementacion Tiposde implementación El esquema multidimensional puede ser implementado por dos tipos de esquemas o modelos relacionales: Modelo estrella - star schema (más usado) Modelo copo de nieve - snowflake schema
  • 43.
    43 Modelo estrella Elementos delmodelo estrella Tablas dimensión - Tabla de hechos Las tablas periféricas dimensión guardan la información cualitativa de los miembros y sus relaciones. La tabla central de hechos almacena datos cuantitativos. Indicadores o medidas Son medidas candidatas los atributos numéricos de valor continuo. No todo atributo numérico es una medida. Están involucradas en «queries de usuario» que calculan resúmenes. Ejemplos: Cantidades, tamaños, montos, duración, etc.
  • 44.
    44 Modelo estrella Tablas dedimensión Cada tabla dimensión tiene su clave primaria que corresponde con uno de los atributos de la clave compuesta en la tabla de hechos. Las tablas de dimensiones contienen información textual descriptiva, sus atributos se usan para las restricciones en las consultas al DW. Las dimensiones son referenciadas por las llaves de dimension. Contienen: Entidades de dimensión Atributos de dimensión Jerarquías de dimensión Niveles de agregación
  • 45.
    45 Modelo estrella Tabla dehechos La tablas de hechos, además de sus campos clave, contiene uno o más indicadores o “hechos”. Los indicadores más útiles en una tabla de hechos son numéricos y aditivos. Contienen: Un identificador de hechos Llaves de dimensión (que los enlaza con las dimensiones) Medidas Varios tipos de atributos (se derivan de otros datos del modelo)
  • 46.
  • 47.
    47 Modelo copo denieve Modelo copo de nieve En este modelado se normalizan algunas las dimensiones reflejando las jerarquías en las mismas y conservando lo esencial del modelo en estrella: las tablas de hechos. La ventaja del modelo copo de nieve es eliminar la redundancia de datos y por lo tanto ocupar menos espacio en disco Cuando no es posible recopilar toda la información necesaria en un único esquema estrella o copo ne nuieve, se puede utilizar varios esquemas. Cada uno de estos esquemas se denomina Datamart.
  • 48.
  • 49.
    49 A N EX O S
  • 50.
    50 Ciclo de vidade un DW  PLANIFICACIÓN DEL PROYECTO.  La planificación busca identificar la definición y el alcance del proyecto de datawarehouse, incluyendo justificaciones del negocio y evaluaciones de factibilidad. La planificación del proyecto se focaliza sobre recursos, perfiles, tareas, duraciones y secuencialidad. El plan de proyecto resultante identifica todas las tareas asociadas con el BDL e identifica las partes involucradas. Esta etapa se concentra sobre la definición del proyecto (identificación del escenario del proyecto para saber de dónde surge la necesidad del data warehouse).  DEFINICIÓN DE LOS REQUERIMIENTOS DE NEGOCIOS  Un factor determinante en el éxito de un proceso de Data Warehousing es la interpretación correcta de los diferentes niveles de requerimientos expresados por los diferentes niveles de usuarios. La técnica utilizada para relevar los requerimientos de los analistas del negocio difiere de los enfoques tradicionales guiados por los datos [Inm92] [Gol99]. Los diseñadores de los data warehouses deben entender los factores claves que guían al negocio para determinar efectivamente los requerimientos y traducirlos en consideraciones de diseño apropiadas.
  • 51.
  • 52.
    52 •DISEÑO DE LAARQUITECTURA TÉCNICA. Los ambientes de data warehousing requieren la integración de numerosas tecnologías. Se debe saber tres factores: los requerimientos del negocio, los actuales ambientes técnicos y las directrices técnicas estratégicas futuras planificadas para de esta forma poder establecer el diseño de la arquitectura técnica del ambiente de data warehousing . •MODELO DIMENSIONAL. La definición de los requerimientos del negocio determina los datos necesarios para cumplir los requerimientos analíticos de los usuarios. Diseñar los modelos de datos para soportar estos análisis requiere un enfoque diferente al usado en los sistemas operacionales. Básicamente se comienza con una matriz donde se determina la dimensionalidad de cada indicador y luego se especifican los diferentes grados de detalle (atributos) dentro de cada concepto del negocio (dimensión), como así también la granularidad de cada indicador (variable o métrica) y las diferentes jerarquías que dan forma al modelo dimensional del negocio (BDM) o mapa dimensional.
  • 53.
  • 54.
    54 •ESPECIFICACIÓN DEIMPLEMENTACIÓN PARA USUARIOS FINALES. No todos los usuarios del warehouse necesitan el mismo nivel de análisis. Es por ello que en esta etapa se identifican los diferentes roles o perfiles de usuarios para determinar los diferentes tipos de aplicaciones necesarias en base al alcance de los diferentes perfiles (gerencial, analista del negocio, vendedor, etc.) Kimball se concentra sobre el proceso de creación de aplicaciones “templates”. Comienza definiendo el concepto de la aplicación para usuario final y su rol en el acceso a la información del negocio. Brinda un marco metodológico bastante estándard en lo que ha desarrollo de aplicaciones (como piezas de software) se refiere. •SELECCIÓN DEL PRODUCTO E INSTALACIÓN. Utilizando el diseño de arquitectura técnica como marco, es necesario evaluar y seleccionar componentes específicos de la arquitectura como ser la plataforma de hardware, el motor de base de datos, la herramienta de ETL o el desarrollo pertinente, herramientas de acceso, etc. Una vez evaluados y seleccionados los componentes determinados se procede con la instalación y prueba de los mismos en un ambiente integrado de data warehousing.
  • 55.
    55 •DISEÑO FÍSICO. Eldiseño físico de las base de datos se focaliza sobre la selección de las estructuras necesarias para soportar el diseño lógico. Algunos de los elementos principales de este proceso son la definición de convenciones estándares de nombres y seteos específicos del ambiente de la base de datos. La indexación y las estrategias de particionamiento son también determinadas en esta etapa. •DISEÑO Y DESARROLLO DE PRESENTACION DE DATOS. Esta etapa es típicamente la más subestimada de las tareas en un proyecto de data warehouse. Las principales subetapas de esta zona del ciclo de vida son: la extracción, la transformación y la carga (ETL process). Se definen como procesos de extracción a aquellos requeridos para obtener los datos que permitirán efectuar la carga del Modelo Físico acordado. Asimismo, se definen como procesos de transformación los procesos para convertir o recodificar los datos fuente a fin poder efectuar la carga efectiva del Modelo Físico. •DESARROLLO DE APLICACIÓN PARA USUARIOS FINALES. Siguiendo a la especificación de las aplicaciones para usuarios finales, el desarrollo de las aplicaciones de los usuarios finales involucra configuraciones del metadata y construcción de reportes específicos. Una vez que se ha cumplido con todos los pasos de la especificación y se tiene la posibilidad de trabajar con algunos datos de prueba, comienza el desarrollo de la aplicación. Selección de un enfoque de implementación, Desarrollo de la aplicación y Prueba y verificación de datos
  • 56.
    56 •IMPLEMENTACION. La IMPLEMENTACIÓNrepresenta la convergencia de la tecnología, los datos y las aplicaciones de usuarios finales accesible desde el escritorio del usuario del negocio. Hay varios factores extras que aseguran el correcto funcionamiento de todas estas piezas, entre ellos se encuentran la capacitación, el soporte técnico, la comunicación, las estrategias de feedback. Todas estas tareas deben ser tenidas en cuenta antes de que cualquier usuario pueda tener acceso al data warehouse. •MANTENIMIENTO Y CRECIMIENTO Como se remarca siempre, Data Warehousing es un proceso (de etapas bien definidas, con comienzo y fin, pero de naturaleza espiral) pues acompaña a la evolución de la organización durante toda su historia. Se necesita continuar con los relevamientos de forma constante para poder seguir la evolución de las metas por conseguir. Según afirma Kimball. Al contrario de los sistemas tradicionales, los cambios en el desarrollo deben ser vistos como signos de éxito y no de falla. Es importante establecer las prioridades para poder manejar los nuevos requerimientos de los usuarios y de esa forma poder evolucionar y crecer.