1. INTELIGENCIA DE NEGOCIOS
Elena López
Especialista en Inteligencia de Negocios
elopez@srlsti.com
TERCERA PARTE – DATAWARE HOUSE
2. Base de Datos Corporativa, que integra datos de una o varias fuentes relacionados
a un tema en específico, guardando un histórico no volátil (invariable) de los datos
a través del tiempo.
Almacén de Datos o Data Warehouse
www.srlsti.com
3. Una Dimensión es una estructura que categoriza hechos y medidas que permiten a
los usuarios responder preguntas de negocio, en otras palabras, una dimensión no
es más que una colección de información relacionadas a algún evento medible.
Pueden sufrir cambios o transformaciones en el tiempo, que dependiendo o no de
su nivel de impacto se va a almacenar o no.
Los hechos hacen referencia a la estructura de datos que almacena los valores de
las medidas relacionadas con las dimensiones, a diferencia de estas, nunca
cambian.
Dimensiones y Hechos
www.srlsti.com
4. La tabla de Dimensión tiene siempre una clave primaria que únicamente se utiliza
para identificar cada registro de la dimensión (cada fila) y para relacionar los
hechos a través de esta columna.
Los hechos pueden ser filtrados y agrupados por varias combinaciones de atributos
de cada dimensión.
Algunas dimensiones contienen jerarquías de atributos que soportan ver los datos
en forma de drill down.
Dimensiones y Hechos
www.srlsti.com
5. La tabla de Dimensión tiene siempre una clave primaria que únicamente se utiliza
para identificar cada registro de la dimensión (cada fila) y para relacionar los
hechos a través de esta columna.
Los hechos pueden ser filtrados y agrupados por varias combinaciones de atributos
de cada dimensión.
Dimensiones y Hechos
www.srlsti.com
6. Esquema Estrella
Su característica más obvia y
principal es que las tablas de
dimensiones NO están
normalizadas.
Esquemas Estrella (star) y Copo de nieve (snowflake)
www.srlsti.com
7. Esquema Copo de Nieve
Su característica más obvia y
principal es que las tablas de
dimensiones SI están
normalizadas.
Esquemas Estrella (star) y Copo de nieve (snowflake)
www.srlsti.com
8. Esquemas Estrella (star) y Copo de nieve (snowflake)
www.srlsti.com
El esquema Snowflake ocupa menos espacio para almacenar los registros.
Los datos no normalizados incrementan el riesgo de tener datos con
problemas de integridad que pueden ser muy difíciles de detectar y corregir
en DWH.
9. SCD por sus siglas en inglés, Slowly Changing Dimensions, se refiere a los
datos de las dimensiones que van cambiando a través del tiempo.
Las dimensiones pueden ser estáticas como los años y meses, o cambiar
lentamente como los nombres de los países, o cambiar más rápidamente
como la clasificación de los productos.
Existen distintos tipos conceptuales de SCD, pero nos vamos a enfocar
únicamente en los tipos 1 y 2.
Dimensiones Lentamente Cambiantes
www.srlsti.com
10. TIPO 1:
Se sobrescriben los valores.
- Cambios en columnas que no necesariamente impactan el modelo de
negocio.
TIPO 2:
- Debe incluir las columnas Fecha de inicio, fecha de fin y un flag que indique
si es la versión actual del registro.
Dimensiones Lentamente Cambiantes
www.srlsti.com