1. BASE DE DATOS AVANZADAS
Unidad 8: Diseño de almacenes de datos
ESCUELA: Ciencias de la Computación
NOMBRES: Ing. Juan Carlos Morocho
1
2. Diseño de almacenes de datos
Emprender en el diseño de un almacén de
datos no es tarea fácil, pero la utilización de
una metodología adecuada será clave.
Considerando que un almacén de datos tiene
un alcance corporativo, a veces resulta mejor
empezar por mercados de datos, pero hay que
tener en cuenta que el fin último es un
almacén de datos que soporte las necesidades
de toda la organización en forma integrada.
3. Metodología de diseño
1. Selección del proceso
Ejemplo: Cadena de supermercados.
Cadena de supermercados con 300 almacenes
en la que se expenden unos 30.000 productos
distintos.
Actividad: Ventas.
La actividad a modelar son las ventas de
productos en los almacenes de la cadena
4. Metodología de diseño
2. Selección de la granularidad
Ejemplo: Cadena de supermercados.
Gránulo: “se desea almacenar información
sobre las ventas diarias de cada producto en
cada almacén de la cadena”.
Gránulo:
• Define el significado de las tuplas de la tabla
de hechos.
• Determina las dimensiones básicas del
esquema
5. Metodología de diseño
3. Identificación y conformación de las
dimensiones
Ejemplo: Cadena de supermercados.
Definición de Dimensiones •Tiempo
gránulo básicas •Producto
•Establecimiento
6. Metodología de diseño
4. Selección de los hechos
Ejemplo: Cadena de supermercados.
Gránulo: “se desea almacenar información
sobre las ventas diarias de cada producto en
cada establecimiento de la cadena”.
• Importe total de las ventas del producto en el día.
• Número total de unidades vendidas del producto en
el día.
• Número total de clientes distintos que han
comprado el producto en el día.
7. Metodología de diseño
5. Almacenamiento de los valores
precalculados en la tabla de hechos.
Valor precalculado
8. Metodología de diseño
6. Terminación de las tablas de dimensión
La idea es añadir descripciones textuales a las
dimensiones hasta ahora definidas, para que
sean entendibles para los usuarios.
En lugar de “nro_clientes”, una descripción
más inituitiva sería “Total de clientes”.
9. Metodología de diseño
7. Selección de la duración de la base de
datos.
Definir la cantidad de tiempo con la cual se va
a trabajar o a contrastar los datos de las
tablas de hechos. Generalmente se hacen
comparaciones de dos años atrás, pero por
temas legales en otros casos se trabaja con
datos de hasta cinco años atrás.
10. Metodología de diseño
8. Control de las dimensiones lentamente
cambiantes
Tipo 1: Sobreescribe un atributo de dimensión
modificado.
Tipo 2: Un atributo de dimensión modificado
hace que se cree un nuevo registro de
dimensión.
Tipo 3: Un atributo de dimensión modificado
hace que se cree un atributo alternativo.
11. Metodología de diseño
9. Selección de las prioridades de consulta y
de los modos de consulta
Esto es importante ya que hay que considerar
que la consultas siempre manejan gran
cantidad de datos, calculan subtotales,
ordenan resultados, por lo que consume una
cantidad considerable de recursos.
12. Trabajos citados
Hernández Orallo, J. (s.f.). Curso: Análisis y
Extracción de Conocimiento en Sistemas de
Información. Recuperado el 5 de Marzo de
2012, de Departamento de Sistemas
Informáticos y Computación:
http://users.dsic.upv.es/~jorallo/cursoDWD
M/dwdm-II.pdf
12