INTELIGENCIA DE NEGOCIOS
Elena López
Especialista en Inteligencia de Negocios
elopez@srlsti.com
TERCERA PARTE – DATAWARE HOUSE
Base de Datos Corporativa, que integra datos de una o varias fuentes relacionados
a un tema en específico, guardando un histórico no volátil (invariable) de los datos
a través del tiempo.
Almacén de Datos o Data Warehouse
www.srlsti.com
Una Dimensión es una estructura que categoriza hechos y medidas que permiten a
los usuarios responder preguntas de negocio, en otras palabras, una dimensión no
es más que una colección de información relacionadas a algún evento medible.
Pueden sufrir cambios o transformaciones en el tiempo, que dependiendo o no de
su nivel de impacto se va a almacenar o no.
Los hechos hacen referencia a la estructura de datos que almacena los valores de
las medidas relacionadas con las dimensiones, a diferencia de estas, nunca
cambian.
Dimensiones y Hechos
www.srlsti.com
La tabla de Dimensión tiene siempre una clave primaria que únicamente se utiliza
para identificar cada registro de la dimensión (cada fila) y para relacionar los
hechos a través de esta columna.
Los hechos pueden ser filtrados y agrupados por varias combinaciones de atributos
de cada dimensión.
Algunas dimensiones contienen jerarquías de atributos que soportan ver los datos
en forma de drill down.
Dimensiones y Hechos
www.srlsti.com
La tabla de Dimensión tiene siempre una clave primaria que únicamente se utiliza
para identificar cada registro de la dimensión (cada fila) y para relacionar los
hechos a través de esta columna.
Los hechos pueden ser filtrados y agrupados por varias combinaciones de atributos
de cada dimensión.
Dimensiones y Hechos
www.srlsti.com
Esquema Estrella
Su característica más obvia y
principal es que las tablas de
dimensiones NO están
normalizadas.
Esquemas Estrella (star) y Copo de nieve (snowflake)
www.srlsti.com
Esquema Copo de Nieve
Su característica más obvia y
principal es que las tablas de
dimensiones SI están
normalizadas.
Esquemas Estrella (star) y Copo de nieve (snowflake)
www.srlsti.com
Esquemas Estrella (star) y Copo de nieve (snowflake)
www.srlsti.com
El esquema Snowflake ocupa menos espacio para almacenar los registros.
Los datos no normalizados incrementan el riesgo de tener datos con
problemas de integridad que pueden ser muy difíciles de detectar y corregir
en DWH.
SCD por sus siglas en inglés, Slowly Changing Dimensions, se refiere a los
datos de las dimensiones que van cambiando a través del tiempo.
Las dimensiones pueden ser estáticas como los años y meses, o cambiar
lentamente como los nombres de los países, o cambiar más rápidamente
como la clasificación de los productos.
Existen distintos tipos conceptuales de SCD, pero nos vamos a enfocar
únicamente en los tipos 1 y 2.
Dimensiones Lentamente Cambiantes
www.srlsti.com
TIPO 1:
Se sobrescriben los valores.
- Cambios en columnas que no necesariamente impactan el modelo de
negocio.
TIPO 2:
- Debe incluir las columnas Fecha de inicio, fecha de fin y un flag que indique
si es la versión actual del registro.
Dimensiones Lentamente Cambiantes
www.srlsti.com

Inteligencia de negocios - tercera parte

  • 1.
    INTELIGENCIA DE NEGOCIOS ElenaLópez Especialista en Inteligencia de Negocios elopez@srlsti.com TERCERA PARTE – DATAWARE HOUSE
  • 2.
    Base de DatosCorporativa, que integra datos de una o varias fuentes relacionados a un tema en específico, guardando un histórico no volátil (invariable) de los datos a través del tiempo. Almacén de Datos o Data Warehouse www.srlsti.com
  • 3.
    Una Dimensión esuna estructura que categoriza hechos y medidas que permiten a los usuarios responder preguntas de negocio, en otras palabras, una dimensión no es más que una colección de información relacionadas a algún evento medible. Pueden sufrir cambios o transformaciones en el tiempo, que dependiendo o no de su nivel de impacto se va a almacenar o no. Los hechos hacen referencia a la estructura de datos que almacena los valores de las medidas relacionadas con las dimensiones, a diferencia de estas, nunca cambian. Dimensiones y Hechos www.srlsti.com
  • 4.
    La tabla deDimensión tiene siempre una clave primaria que únicamente se utiliza para identificar cada registro de la dimensión (cada fila) y para relacionar los hechos a través de esta columna. Los hechos pueden ser filtrados y agrupados por varias combinaciones de atributos de cada dimensión. Algunas dimensiones contienen jerarquías de atributos que soportan ver los datos en forma de drill down. Dimensiones y Hechos www.srlsti.com
  • 5.
    La tabla deDimensión tiene siempre una clave primaria que únicamente se utiliza para identificar cada registro de la dimensión (cada fila) y para relacionar los hechos a través de esta columna. Los hechos pueden ser filtrados y agrupados por varias combinaciones de atributos de cada dimensión. Dimensiones y Hechos www.srlsti.com
  • 6.
    Esquema Estrella Su característicamás obvia y principal es que las tablas de dimensiones NO están normalizadas. Esquemas Estrella (star) y Copo de nieve (snowflake) www.srlsti.com
  • 7.
    Esquema Copo deNieve Su característica más obvia y principal es que las tablas de dimensiones SI están normalizadas. Esquemas Estrella (star) y Copo de nieve (snowflake) www.srlsti.com
  • 8.
    Esquemas Estrella (star)y Copo de nieve (snowflake) www.srlsti.com El esquema Snowflake ocupa menos espacio para almacenar los registros. Los datos no normalizados incrementan el riesgo de tener datos con problemas de integridad que pueden ser muy difíciles de detectar y corregir en DWH.
  • 9.
    SCD por sussiglas en inglés, Slowly Changing Dimensions, se refiere a los datos de las dimensiones que van cambiando a través del tiempo. Las dimensiones pueden ser estáticas como los años y meses, o cambiar lentamente como los nombres de los países, o cambiar más rápidamente como la clasificación de los productos. Existen distintos tipos conceptuales de SCD, pero nos vamos a enfocar únicamente en los tipos 1 y 2. Dimensiones Lentamente Cambiantes www.srlsti.com
  • 10.
    TIPO 1: Se sobrescribenlos valores. - Cambios en columnas que no necesariamente impactan el modelo de negocio. TIPO 2: - Debe incluir las columnas Fecha de inicio, fecha de fin y un flag que indique si es la versión actual del registro. Dimensiones Lentamente Cambiantes www.srlsti.com