SlideShare una empresa de Scribd logo
1 de 24
Descargar para leer sin conexión
13
SISTEMAS
&TELEMÁTICA
Propuesta de un método para el diseño
y modelado de una bodega de datos
José Hernando Bahamón L.
Universidad Icesi
jbahamon@icesi.edu.co
RESUMEN
El desarrollo de los Sistemas de In-
formación Gerencial basados en tec-
nologías de Data Warehouse y Herra-
mientas Olap, es relativamente re-
ciente y, por lo tanto, no existe una
propuesta metodológica universal-
mente válida y aceptada como tal, por
la comunidad académica.
El presente artículo expone una pro-
puesta metodológica para la realiza-
ción del diseño de una bodega de da-
tos, que utiliza como eje articulador
la identificación de las necesidades de
información por parte de la gerencia,
para el soporte de los procesos de con-
trol y de toma de decisiones.
El método propuesto está compuesto
de ocho pasos agrupados en tres fa-
ses. La primera fase comprende la
identificación de las necesidades de
información gerencial, desde la pers-
pectiva del negocio. La segunda fase
comprende todas las actividades re-
lacionadas con la elaboración de un
modelo lógico-conceptual de la estruc-
tura de la bodega de datos. La terce-
ra fase incluye los pasos para reali-
zar el diseño físico de la estructura
de la bodega de datos.
PALABRAS CLAVES
Bodegas de datos, método de diseño
de la estructura de una bodega de
datos.
ABSTRACT
The development of Management In-
formation Systems based on Ware-
Fecha de recepción: 15-4-2003 Fecha de aceptación: 25-8-2003
14 SISTEMAS
&TELEMÁTICA
house Data technologies and Olap
tools is relatively new. Therefore, the-
re is no valid methodological appro-
ach that is generally accepted as such
by the academic community.
This article presents a methodologi-
cal approach to the design of a data
warehouse using the identification of
management information require-
ments as a shaft that supports the
control and decision-making proces-
ses. The suggested approach consists
of eight steps grouped in three diffe-
rent stages. The first stage encompas-
ses the identification of management
information requirements from a bu-
siness perspective. The second one
deals with all the activities associa-
ted with the preparation of a logical
conceptual model for the data ware-
house structure, and the third stage
includes the steps to make the phy-
sical design of the data warehouse
structure.
KEYWORDS
Data warehouses, approach to the
design of a data warehouse struc-
ture.
Clasificación: A
15
SISTEMAS
&TELEMÁTICA
INTRODUCCIÓN
El desarrollo de los Sistemas de In-
formación Gerencial basados en tec-
nologías de Data Warehouse y herra-
mientas Olap, es relativamente re-
ciente y, por lo tanto, no existe una
propuesta metodológica universal-
mente válida y aceptada como tal, por
la comunidad académica.
Entre las propuestas más conocidas
están: 1. Ralph Kimball,1
con un es-
quema centrado en la identificación
de los procesos de la empresa, como
elemento clave para la definición de
la estructura de variables y dimen-
siones; 2. W.H. Inmon,2
con un esque-
ma que parte de la construcción del
modelo de datos corporativos, elabo-
rado al más alto nivel de abstracción,
para luego derivar la estructura del
modelo de datos, para el diseño de la
bodega; 3. Golfarelli Matteo, Maio
Dario, Rizzi Stefano3
proponen un
esquema que parte de los modelos E-
R descriptivos de los sistemas tran-
saccionales de la organización, para
luego derivar el modelo E-R de la es-
tructura, para la bodega de datos.
En este artículo se presenta una pro-
puesta de sistematización del proce-
so de diseño de una bodega de datos,
que se aparta de los esquemas de di-
seño referidos, y que utiliza como eje
articulador, la identificación de la in-
formación gerencial, para el soporte
de los procesos de control y de toma
de decisiones en los niveles directi-
vos de la organización.
MÉTODO PROPUESTO
El método de diseño propuesto está
centrado en la identificación de la
información clave y relevante para so-
portar los procesos de dirección y de
toma de decisiones dentro de la orga-
nización. Este método utiliza, como
punto de partida, la identificación y
el modelado de: qué es lo que el
negocio está tratando de alcan-
zar, para luego elaborar una estruc-
tura que apoye el proceso de gestión
hacia el logro de las metas definidas.
Una vez que la información clave de
apoyo a los procesos de gestión y con-
trol de la organización ha sido iden-
tificada, se inicia la elaboración del
modelo lógico-conceptual de la estruc-
tura de la bodega de datos, que so-
portará las consultas y la exploración
de los datos, a partir de los cuales se
construirán los indicadores de gestión
requeridos por los niveles directivos
de la organización.
Para darle un orden a este proceso
sistémico de diseño, los pasos del
método propuesto, tal como se presen-
tan en la Figura 1, se han agrupado
en las siguientes fases:
• Fase 1: Identificación de las ne-
cesidades de información geren-
cial, desde la perspectiva del ne-
gocio.
• Fase 2: Elaboración del modelo ló-
gico-conceptual de la estructura
de la bodega de datos.
1. Kimball R. The Data Warehouse Toolkit. John Wiley & Sons, 1996.
2. Inmon W.H. Building The Data Warehouse. QED Press / John Wiley & Sons, 1992.
3. Golfarelli M., Maio D., Rizzi S. Conceptual Design of Data Warehouse From E/R Schemes.
http//www.csr.unib.it/~golfare/db.html, 1998.
16 SISTEMAS
&TELEMÁTICA
• Fase 3: Elaboración del modelo fí-
sico de la bodega de datos.
Fase 1:
Identificación de las necesidades
de información gerencial, desde
la perspectiva del negocio.
La primera fase, a partir de la cual
se realiza el proceso de diseño de la
estructura para una bodega de datos,
comprende la identificación de las ne-
cesidades de información gerencial,
lo que significa hacer explícitos los
objetivos y los factores claves de éxi-
to de la organización, o de un área
del negocio.
Es bastante común empezar este pro-
ceso de identificación y modelado
mediante entrevistas a los directivos,
en las cuales la pregunta central es:
«¿Cuál es la información que desea
obtener del sistema de información
gerencial?». Este enfoque puede resul-
tar muy peligroso, si el directivo no
realiza un proceso sistemático y orde-
nado, para establecer sus necesidades
de información, en relación con sus ac-
tividades de gestión y control.
Una forma ordenada y sistemática
para realizar esta fase de identifica-
ción de las necesidades de informa-
ción, que soporte los procesos de ges-
tión y control gerencial, es la aplica-
ción del enfoque de sistemas, para
guiar el proceso de revisión o defini-
ción de: 1. Los objetivos estratégicos
del negocio o del área; 2. Los factores
clave para el logro de los objetivos de-
finidos y 3. Los indicadores de con-
trol, tanto de los objetivos como de los
factores clave.4
4. Véase Bahamón José H. Construcción de indicadores de gestión bajo el enfoque de sistemas. S&T Revista
de la Facultad de Ingeniería, Universidad Icesi. 2003.
17
SISTEMAS
&TELEMÁTICA
Método para el diseño y modelado de una bodega de datos
Fase 1: Identificación de las necesidades de infor-
mación gerencial, desde la perspectiva del negocio.
Fase 2: Elaboración del modelo lógico-conceptual
de la estructura de la bodega de datos.
2.1. Definir las tablas de hechos o las variables de la
estructura.
2.2. Identificar, para cada tabla de hechos, las dimen-
siones que la referencian.
2.3. Establecer el nivel de granulación y los niveles de
agregación.
2.4. Elaborar el diagrama en estrella que representa
la estructura de la bodega.
Fase 3: Elaboración del modelo físico de la bodega
de datos.
3.1. Verificación y ajuste del modelo lógico.
3.2. Definición del esquema físico del almacenamien-
to de las dimensiones y sus jerarquías.
3.3. Definición de los atributos que conforman las
tablas de hechos.
Figura 1. Método para el diseño y modelado de una bodega.
18 SISTEMAS
&TELEMÁTICA
Como resultado de esta fase, se ten-
drá una visión del negocio y de la in-
formación requerida para la dirección
y el control gerencial, representada
fundamentalmente por: Los objetivos
del negocio; los factores clave de éxi-
to y, en especial, un conjunto de indi-
cadores clave de la gestión.
Fase 2:
Elaboración del modelo lógico-
conceptual de la estructura de la
bodega.
En esta fase se elabora el modelo ló-
gico de la estructura de la bodega, que
soportará las consultas, mediante las
cuales se obtendrá la información re-
querida por los niveles directivos
como apoyo a sus procesos de gestión
y de toma de decisiones.
La elaboración de este modelo lógico
comienza con los indicadores de ges-
tión (necesidades de información ge-
rencial), identificados en la fase an-
terior, y termina con la construcción
de una representación multidimen-
sional de las variables que conforman
cada indicador. En esta representa-
ción multidimensional, cada variable
es modelada mediante un arreglo di-
mensional (multidimensional) de cel-
das, como se presenta en la Figura 2.
Para facilitar el proceso de elabora-
ción del modelo lógico, se utiliza una
representación gráfica denominada
diagrama tipo estrella, donde el ele-
mento central del esquema es la Va-
riable o Tabla de Hechos («Fact»), la
cual es referenciada por un conjunto
de ejes, denominados Dimensiones, a
través de los cuales se seleccionan los
valores contenidos en la tabla de he-
chos. En la Figura 3, se esquematiza
el modelo de un diagrama en estrella.
19
SISTEMAS
&TELEMÁTICA
Figura 2. Vista multidimensional de una de las variables que conforman
un indicador.
Figura 3. Diagrama en estrella de una estructura multidimensional.
20 SISTEMAS
&TELEMÁTICA
Antes de presentar los pasos propues-
tos por el método para la elaboración
del modelo lógico, es pertinente pre-
cisar algunos de los términos utiliza-
dos en el método propuesto. En el
Cuadro 1 se presentan las definicio-
nes adoptadas para los diferentes
conceptos utilizados en el método pro-
puesto.
Cuadro 1: Definición de conceptos básicos.
Una gráfica es una red de nodos interconectados.
Una gráfica direccional es aquella en la cual la conexión entre
dos nodos tiene una dirección específica.
Un modelo E-R puede ser considerado una gráfica direccional.
En una gráfica, una trayectoria acíclica es aquella que sólo
tiene una forma de recorrido (en un solo sentido).
Una trayectoria cíclica es aquella que se puede recorrer en dos
o más secuencias diferentes.
Es la tabla central de la estructura de la bodega. Esta tabla
contiene los datos de interés para el negocio, es decir, los valo-
res para la construcción de los indicadores claves del negocio.
Técnicamente, la tabla de hechos es una entidad de intersec-
ción cuya llave primaria está compuesta por la unión de los
dominios de las diferentes dimensiones que la referencian.
Las dimensiones corresponden a los ejes con los cuales se cons-
truye la vista multidimensional de la información clave del ne-
gocio, almacenada en la tabla de hechos.
Las atributos almacenados en las dimensiones determinan la
granulación adoptada para el modelo.
Las dimensiones pueden ser:
– Propias: Cuando el conjunto de entidades que conforman
la dimensión se encuentran unidas a la tabla de hechos, en
una trayectoria acíclica.
– Impropias: Cuando el conjunto de entidades que confor-
man la dimensión se encuentran unidas a la tabla de he-
chos, en una trayectoria cíclica.
– De Información: Cuando los atributos contenidos en la
dimensión definen qué tipo de datos se encuentran almace-
nados en la tabla de hechos.
Determinan cómo las instancias de la tabla de hechos pueden ser
agregadas.Lasjerarquíaspermitenlasoperacionesde«drill-down»
o «rollup», en los procesos de consulta.
Una jerarquía está conformada por el conjunto de entidades
que constituyen la dimensión.
Gráfica
Trayectorias cíclicas
y acíclicas
Tabla de hechos
Dimensión
Jerarquías
21
SISTEMAS
&TELEMÁTICA
A continuación se presentan los cua-
tro pasos propuestos para la sistema-
tización del proceso de elaboración del
modelo lógico:
Paso No. 1:
Definir las tablas de hechos o las
variables de la estructura.
Este paso se realiza a partir del con-
junto de los indicadores de gestión,
definidos en la fase de identificación
de las necesidades de información
gerencial, desde la perspectiva del
negocio. El paso se inicia con la eva-
luación de las variables (divisores y
dividendos) de cada indicador, para
determinar cuáles de éstas pueden
ser almacenadas en una tabla de he-
chos, y cuáles no.
En el Cuadro 2 se presenta, a mane-
ra de ejemplo, la información obteni-
da, al aplicar los pasos de la fase 1 al
área de ventas de una organización.
A partir de estos resultados se iden-
tifican las variables o tablas de he-
chos, como lo establece el paso 1 de
esta fase.
Aplicación del paso 1: Identificación
de las tablas de hechos
• El indicador definido para el mo-
nitoreo del objetivo puede ser
construido con una sola tabla de
hechos: Ventas. Se toma una sola
variable, por cuanto las ventas del
año y las ventas del año anterior,
que son las dos variables que con-
forman el indicador, se pueden
almacenar en la misma tabla de
hechos.
• El indicador 1 del F.C.E1 puede
ser construido con dos tablas de
hechos que son: ventas por ven-
dedor y cuota de ventas de cada
vendedor.
• El indicador 2 del F.C.E1 puede
ser construido con dos tablas de
hechos que son: número de visi-
tas realizadas por cada vendedor,
y número de visitas presupuesta-
das por cada vendedor.
• El indicador 1 del F.C.E2 puede
ser construido con una tabla de
hechos: número de clientes nue-
vos en la base de datos. En este
caso, el denominador del indica-
dor se asume como un único valor
y, por lo tanto, no tiene sentido
almacenarlo en otra tabla de he-
chos.
• Los demás indicadores se anali-
zan de igual manera.
En suma, al realizar el análisis de
todos los indicadores, obtenemos las
siguientes tablas de hecho:
• Ventas.
• Ventas por vendedor.
• Cuota de ventas de cada vende-
dor.
• Número de visitas realizadas por
cada vendedor.
• Número de visitas presupuesta-
das por cada vendedor.
• Número de clientes nuevos en la
base de datos.
• Número de vendedores capacita-
dos que aprobaron los cursos.
22 SISTEMAS
&TELEMÁTICA
Cuadro 2: Información gerencial del área de ventas,
obtenida al realizar la fase 1.
Área del Negocio - Descripción. Se trabaja con el área de ventas de una orga-
nización dedicada a la producción de recipientes elaborados en plástico.
Objetivo del Área: para propósitos del ejemplo, se toma el siguiente objetivo:
Lograr al final del año un incremento del 15% en las ventas totales de la
compañía, con respecto a las ventas del año anterior.
Factores claves de éxito. Luego de realizado el análisis de las acciones y las
condiciones necesarias para garantizar el logro del objetivo planteado, se identi-
ficaron los siguientes F.C.E:
• F.C.E.1: Planeación y control de la fuerza de ventas.
• F.C.E.2: Búsqueda de nuevos clientes rentables para la organización.
• F.C.E.3: Capacitación y entrenamiento de la fuerza de ventas.
Indicadores claves de gestión. Para el control y seguimiento de los F.C.E y los
objetivos, se proponen los siguientes indicadores:
Ventas del año
I_obj: -1
Ventas del año anterior
Ventas del vendedor
I1_FCE1:
Cuota de ventas
Número de visitas de venta realizadas
I2_FCE1:
Número de visitas presupuestadas
Número de clientes nuevos en la base de datos
I1_FCE2:
Número de clientes nuevos presupuestados
Número de vendedores capacitados que aprobaron los cursos
I1_FCE3:
Número presupuestado de vendedores capacitados
23
SISTEMAS
&TELEMÁTICA
Paso No. 2:
Identificar, para cada tabla de
hechos, las dimensiones que la
referencian.
Para cada variable o tabla de hechos
se identifican, con la colaboración del
usuario líder del área de negocio, los
ejes de visualización multidimensio-
nal los cuales constituyen las dimen-
siones de la variable.
En este paso, se espera que el usua-
rio visualice cada variable, como un
conjunto de valores almacenados en
una estructura de varias dimensio-
nes, donde los valores almacenados
son referenciados por la combinación
de los valores definidos para cada eje
(dominio de la dimensión), tal como
se esquematiza en la Figura 4.
Figura 4: Esquema de una vista multidimensional de una tabla de hechos.
Paso 3:
Establecer el nivel de granula-
ción y los niveles de agregación
de cada dimensión.
Una vez que las dimensiones han sido
identificadas se debe establecer, para
cada una de ellas, el menor nivel de
granulación, el cual corresponde al
conjunto de atributos que referencian
el mayor nivel de detalle deseado
para la variable o tabla de hechos.
A manera de ejemplo, se aplican los
dos pasos anteriores para la Tabla de
Hechos sobre Ventas, definida en el
ejemplo anterior.
Aplicación del paso 2: Identificación
de las dimensiones.
Supongamos que el gerente de ven-
tas expresa su interés por visualizar
la información de ventas organizada
de la siguiente manera: primero, por
cada producto de la compañía; en se-
gundo término, por cada lugar en
donde se venden los productos y, fi-
nalmente, por cada semana. Podemos
establecer la necesidad de utilizar
24 SISTEMAS
&TELEMÁTICA
tres ejes para elaborar la vista mul-
tidimensional (dimensiones) de la
Tabla de Hechos - Ventas:
• Dim1: Producto
• Dim2: Lugar de venta
• Dim3: Tiempo.
Aplicación del paso 3: Definición del
nivel de granulación.
De acuerdo con la solicitud del geren-
te, se establece para cada dimensión
la siguiente granulación:
• Dim. Producto: El menor nivel
de granulación es el Tipo de Pro-
ductos. Podemos establecer otros
niveles como: Línea de Productos,
que tiene un nivel de granulación
mayor, pero un menor nivel de de-
talle en la variable ventas; o Re-
ferencias de Productos, que tiene
un menor nivel de granulación,
pero un mayor nivel de detalle.
• Dim. Lugar: El nivel de granu-
lación requerido es la Ciudad. Se
habrían podido seleccionar otros
niveles, como Almacén, que tiene
un menor nivel, o Región, que tie-
ne uno mayor.
• Dim. Tiempo: El menor nivel de
granulación requerido es la Sema-
na. Se habrían podido seleccionar
otros niveles, como el Día, que tie-
ne un menor nivel, o el Mes, que
tiene uno mayor.
Una vez se han definido los menores
niveles de granulación para cada di-
mensión, se identifican los niveles de
agregación requeridos para los valo-
res almacenados en la tabla de he-
chos, por cada dimensión. Estos ni-
veles de agregación representan la
jerarquía de cada dimensión.
• Jerarquía en la Dim. Produc-
to: Las ventas por productos pue-
den ser agregadas por grupos de
productos, por líneas de produc-
tos y, por el total de la venta. De
esta manera, los niveles de agre-
gación de la dimensión producto
son:
– Por grupos de productos.
– Por líneas de productos.
– Total.
• Jerarquía en la Dim. Lugar:
Las ventas por lugar pueden ser
agregadas por regiones y por el
total del país.
• Jerarquía en la Dim. Tiempo:
Las ventas por tiempo pueden ser
agregadas por mes, por trimestre,
por semestre, por año.
Paso 4:
Elaborar el diagrama en estrella
que representa la estructura de
la bodega.
Luego de identificar los elementos
que conforman la estructura de la
vista multidimensional, de la infor-
mación gerencial requerida por la
organización, se pasa a la elaboración
de una representación gráfica, en for-
ma de estrella; para ello se puede uti-
lizar la notación simplificada de los
diagramas E-R, o la notación deno-
minada «Dot modeling».5
5. Todman, Chris. Designing a Data Warehouse: Supporting Customer Relationship. Prentice Hall, 2001.
25
SISTEMAS
&TELEMÁTICA
Notación tipo E-R:
En esta notación, el diagrama en es-
trella está conformado por una enti-
dad central asociativa, que correspon-
de a la tabla de hechos, y por un con-
junto de trayectorias de entidades y
relaciones de uno a muchos, que co-
rresponde a las dimensiones y a sus
jerarquías. En la Figura 5 se presen-
ta un diagrama en estrella con esta
notación.
Figura 5. Representación de un diagrama en estrella, mediante la
notación tipo E-R.
Notación «Dot Modeling»
En esta notación, el diagrama en es-
trella está conformado por una enti-
dad central que corresponde a la Ta-
bla de Hechos, y por un conjunto de
trayectorias compuestas por puntos
(«dots»), que representan las dimen-
siones y sus jerarquías. En la Figura
6 se presenta un diagrama en estre-
lla con esta notación.
Figura 6. Representación de un diagrama en estrella, mediante la
notación «Dot Modeling».
26 SISTEMAS
&TELEMÁTICA
A manera de ejemplo se presenta en
la Figura 7, el diagrama en estrella,
con notación «Dot Modeling», para la
Tabla de Hechos y para las dimen-
siones identificadas en el ejemplo
anterior. En la Figura 8 se represen-
tan los mismos elementos de la es-
tructura de la bodega, pero con nota-
ción tipo E-R.
Figura 7. Representación, mediante la notación «Dot Modeling», de la
estructura para la bodega de datos del ejemplo anterior.
Figura 8. Representación, mediante la notación E-R, de la estructura para
la bodega de datos del ejemplo anterior.
27
SISTEMAS
&TELEMÁTICA
Fase 3:
Elaboración de la estructura fí-
sica de la bodega
Durante esta fase, se realiza la trans-
formación del modelo lógico concep-
tual en la estructura física, que pos-
teriormente será implementada en
alguna herramienta de «Data Ware-
house».
Este proceso de transformación se
realiza mediante los siguientes pasos:
1. Verificación y refinamiento del
modelo lógico para determinar su con-
sistencia. 2. Definición del esquema
físico de almacenamiento de las es-
tructuras jerárquicas de las dimen-
siones. 3. Identificación de los atri-
butos que conforman las tablas de
hechos y las dimensiones.
Paso 1:
Verificación y ajuste
del modelo lógico.
Durante este paso, se realiza la veri-
ficación del modelo lógico, obtenido en
la fase anterior, para garantizar que
el modelo, además de soportar todas
las consultas requeridas por los ni-
veles ejecutivos, siempre retorne in-
formación confiable.
Para iniciar este proceso de verifica-
ción se debe elaborar una matriz de
cruce, entre los requerimientos de
información gerencial, definidos en la
fase inicial, y las estructuras (estre-
llas), definidas en la fase anterior. En
la matriz de cruce se confirma si el
requerimiento está completamente
soportado. Si esta verificación no es
correcta, se debe retornar a la fase
anterior, para incorporar las estruc-
turas que soporten los requerimien-
tos faltantes de información.
Terminada la revisión anterior, el
proceso continúa con la evaluación de
la estructura, para asegurar la vali-
dez de todas las consultas de infor-
mación realizadas sobre dicha estruc-
tura.
Para realizar este proceso de compro-
bación de validez de la estructura,
recurrimos a la teoría de grafos, se-
gún la cual una estructura de consul-
ta es válida cuando está conformada
por trayectorias acíclicas. Al aplicar
esta teoría, se puede afirmar que
cualquier diseño para una bodega de
datos permitirá siempre consultas co-
rrectas, si la estructura propuesta
está conformada únicamente por di-
mensiones propias, es decir, por tra-
yectorias acíclicas.
Si al realizar la comprobación de la
estructura se encuentran trayecto-
rias acíclicas, éstas deben ser trans-
formadas, para asegurar la confiabi-
lidad de las consultas. Las posibles
transformaciones son:6
1. Ajuste para los casos de trayecto-
rias cíclicas simples
Este caso ocurre cuando la trayecto-
ria de una dimensión presenta una
trayectoria alterna que tiene dos en-
tidades comunes. En la Figura 9, se
esquematiza una trayectoria cíclica
simple.
6. Mcguff, F. Designing the perfect Data Warehouse. 1998.
28 SISTEMAS
&TELEMÁTICA
Figura 9. Dimensión con trayectoria cíclica.
2. Ajuste para los casos de trayecto-
rias alternas, mezcladas con trayec-
torias cíclicas.
Se presenta cuando la trayectoria de
una dimensión está conformada por
una trayectoria alterna, más una tra-
yectoria cíclica, tal como se esquema-
tiza en la Figura 10.
Figura 10. Dimensión con trayectoria alterna, más trayectoria cíclica.
Las opciones de transformación para
esta clase de trayectorias son:
• Tratar cada trayectoria como una
nueva dimensión, lo cual signifi-
ca redibujar el diagrama, elimi-
nando las relaciones N1-A2 y A3-
N4, para luego crear la relación:
Tabla de Hechos - A2.
• Convertir la trayectoria cíclica en
una trayectoria alterna, eliminan-
do la relación A3-N4.
29
SISTEMAS
&TELEMÁTICA
En estos casos, el problema ocurre con
la trayectoria cíclica; por lo tanto, la
transformación se maneja como se ex-
plicó en el caso anterior.
Paso 2:
Definición del esquema físico del
almacenamiento de las dimensio-
nes y sus jerarquías.
El modelo en estrella que conforma
la estructura lógica propuesta para
la bodega de datos, debe ser conver-
tido en una estructura totalmente
desnormalizada, tal como se presen-
ta en la Figura 11. Este modelo físico
está conformado por una tabla de
hechos, y por las entidades en las cua-
les se almacenarán los dominios de
las dimensiones con sus correspon-
dientes niveles jerárquicos.
Figura 11. Modelo lógico en estrella, y modelo físico de la bodega.
Para el proceso de conversión de cada
una de las trayectorias que confor-
man el modelo en estrella, en entida-
des desnormalizadas, se puede utili-
zar uno de los siguientes esquemas
de conversión.7
1. Conversión vertical
o recursiva
En esta conversión, se utiliza una lla-
ve primaria única, para cada dimen-
sión. El dominio de esta llave prima-
ria se obtiene mediante la unión de
todos los dominios de las entidades
que conforman la trayectoria de la
dimensión, es decir, si los dominios
de las entidades que conforman la
trayectoria son: {enero, febrero, mar-
zo, abril ....}; {1er_trim, 2º_trim,
3er_trim, 4º_trim}; {1er_sem,
2º_sem}, el dominio de la llave prima-
ria será: {enero, febrero, marzo, abril,
...., 1er_trim, 2º_trim, 3er_trim,
4º_trim; 1er_sem,2º_sem}. En la Fi-
gura 12 se presenta, de manera grá-
fica, este esquema de conversión.
7. Mcguff, F. Designing the perfect Data Warehouse. 1998.
30 SISTEMAS
&TELEMÁTICA
Figura 12. Conversión vertical de la trayectoria de una dimensión.
Adicionalmente, en este esquema de
conversión a cada valor del dominio
se le asocia un valor padre, el cual
también pertenece al dominio; de esta
manera se implementa la jerarquía
definida en la trayectoria, represen-
tada en la dimensión, dentro del mo-
delo en estrella.
Este esquema para el manejo de las
jerarquías (id_dimensión, id_padre)
permite implementar fácilmente la
operación de desenrolle («drill-
down»), cuando se realizan consultas
a la bodega de datos. Sin embargo,
esta estructura es eficiente, si las
agregaciones para cada nivel jerár-
quico son precalculadas y almacena-
das en la bodega.
Este esquema de conversión es el más
recomendado para implementar la
estructura física de una bodega, cuan-
do las dimensiones están compuestas
por jerarquías desbalanceadas.
2. Conversión horizontal
En esta conversión, la llave primaria
de la dimensión se conforma como
una llave compuesta por las llaves de
cada una de las entidades que con-
forman la trayectoria de la dimen-
sión. En la Figura 13 se presenta, de
manera gráfica, este esquema de con-
versión.
Figura 13: Conversión horizontal de la trayectoria de una dimensión.
31
SISTEMAS
&TELEMÁTICA
Este esquema de conversión es el más
recomendable, si las agregaciones de
datos se realizan de manera dinámica.
Paso 3:
Definición de los atributos que
conforman las tablas de hechos
y las dimensiones del modelo.
En este paso final, se identifican para
cada tabla de hechos y cada dimen-
sión las características de los atribu-
tos que conforman cada estructura.
Una vez asignados todos los atribu-
tos, se realiza un análisis cruzado en-
tre la tabla de hechos y las dimen-
siones, para establecer los tipos de
cálculo matemático que pueden ser
realizados, sobre la tabla de hechos.
La especificación de los atributos que
conforman la tabla de hechos se debe
realizar siguiendo el formato que apa-
rece en el Cuadro 3.
Cuadro 3: Formato para la definición de los atributos
de una tabla de hechos.
Igualmente, para la especificación de los atributos que conforman las dimen-
siones se debe utilizar el formato que aparece en el Cuadro 4.
Cuadro 4: Formato para la definición
de los atributos de una dimensión.
32 SISTEMAS
&TELEMÁTICA
Finalmente, se deben establecer los
tipos de cálculos matemáticos como
suma, conteo, promedio, mínimo,
máximo, que pueden ser aplicados a
los valores almacenados en las tablas
de hechos. El resultado de esta revi-
sión debe quedar consignado en una
matriz de cruce, como la presentada
en el Cuadro 5.
A manera de ejemplo, se presenta en los siguientes cuadros la definición de
atributos para la tabla de hechos y para las dimensiones definidas en el ejem-
plo anterior, y esquematizadas en la Figura 7.
Tabla de hechos
Atributo 1
Dimensiones Suma Conteo Prom. Mín. Máx.
1. Dimensión a
2. Dimensión b
3. Dimensión c
.....
Atributo 2
Dimensiones Suma Conteo Prom. Mín. Máx.
1. Dimensión a
2. Dimensión b
3. Dimensión c
Atributo 3
Dimensiones Suma Conteo Prom. Mín. Máx.
1. Dimensión a
2. Dimensión b
3. Dimensión c
....
Cuadro 5: Operaciones matemáticas
para cada atributo de la tabla de hechos.
33
SISTEMAS
&TELEMÁTICA
Cuadro 6: Definición de los atributos de la tabla de hechos sobre ventas.
Nombre de la estructura de la bodega Área de ventas
Tabla de hechos Ventas
Atributos tipo Pk Descripción
Id lugar C(35) Sí Identif. de la dimensión lugar
Id tiempo C(12) Sí Identif. de la dimensión tiempo
id producto C(30) Sí Identif. de la dimensión producto
Unidades vendidas N(8,0) Valor 1 de la tabla de hechos
Pesos-venta N(10,2) Valor 2 de la tabla de hechos
Cuadro 7: Definición de los atributos de las dimensiones,
para la estructura de ventas.
Nombre de la estructura de la bodega
Nombre de la estructura de la bodega
Nombre de la estructura de la bodega
34 SISTEMAS
&TELEMÁTICA
Cuadro 8: Operaciones matemáticas para cada atributo
de la tabla de hechos sobre ventas.
Tabla de hechos Ventas
Atributo 1 Unidades vendidas
Dimensiones Suma Conteo Prom Mín Máx
Lugar ✓ ✓ ✓ ✓
Tiempo ✓ ✓ ✓ ✓
Producto ✓ ✓ ✓ ✓
Atributo 2 Pesos-venta
Dimensiones Suma Conteo Prom Mín Máx
Lugar ✓ ✓ ✓ ✓
Tiempo ✓ ✓ ✓ ✓
Producto ✓ ✓ ✓ ✓
CONCLUSIÓN
Mediante la aplicación del enfoque de
Sistemas para la definición de los in-
dicadores claves de gestión de la or-
ganización, se ha logrado articular
una propuesta para modelar, de ma-
nera ordenada y sistémica, las estruc-
turas de las bodegas de datos que ser-
virán de soporte a la implementación
de sistemas de información gerencial,
hechos a la medida de las necesida-
des de información de la gerencia.
Esta propuesta facilita, ordena y sis-
tematiza un proceso que en algunas
organizaciones se realiza de manera
intuitiva y, en otras mediante la uti-
lización de estructuras de bodegas
que han sido definidas para otras or-
ganizaciones. El modelo propuesto,
que se aparta de muchos de los enfo-
ques presentados por los investigado-
res en este campo, se convierte en una
opción válida para el diseño de siste-
mas de información gerencial, en par-
ticular para el diseño de bodegas de
datos departamentalizadas («Data
Marts»).
35
SISTEMAS
&TELEMÁTICA
BIBLIOGRAFÍA
• Mcguff, F. Designing the perfect
Data Warehouse. 1998. http://
members.aol.com/fmcguff/dwmo-
del/index.htm
• Kimball R. The Data Warehouse
Toolkit. John Wiley & Sons, 1996.
• Inmon W.H. Building The Data
Warehouse. QED Press /Jhon
Wiley, 1992.
• Golfarelli, M; Maio, D; Rizzi, S.
Conceptual Design of Data Ware-
house From E/R schemes. http//
www.csr.unib.it/~golfare/db.html,
1998.
• Bahamón, J. H. Construcción de
indicadores de gestión bajo el en-
foque de sistemas. S&T Revista de
la Facultad de Ingeniería, Univer-
sidad Icesi. 2003.
• Chuck, B; Dick, H; Don, S; Rhon-
da; Eunsaeng, K.; Ann, V. Data
Modeling Techniques for Data
Warehouse. IBM. 1998.
• Todman, C. Designing a Data
Warehouse: Supporting Customer
Relationship. Prentice Hall. 2001
CURRÍCULO
José Hernando Bahamón L. Inge-
niero Electrónico de la Universidad
del Cauca, especialista en Adminis-
tración de la Universidad Icesi y ma-
gíster en Dirección Universitaria de
la Universidad de los Andes. Profe-
sor investigador de la Universidad
Icesi. Vinculado a la Universidad Ice-
si desde 1988. Ha sido jefe del Depar-
tamento Académico de Sistemas
(1988-1998), Director del programa
de Ingeniería de Sistemas (1998-
2000), y en la actualidad es el Direc-
tor Académico de la Universidad.
36 SISTEMAS
&TELEMÁTICA

Más contenido relacionado

La actualidad más candente

Sistemas de informacion
Sistemas de informacionSistemas de informacion
Sistemas de informacionDavid Lucena
 
Planeación estratégica los sistemas de información
Planeación estratégica los sistemas de informaciónPlaneación estratégica los sistemas de información
Planeación estratégica los sistemas de informaciónabraham moreno
 
Sistemas informacion gerencial
Sistemas informacion gerencialSistemas informacion gerencial
Sistemas informacion gerencialMDY CONTACT CENTER
 
Pdf para sistemas
Pdf para sistemasPdf para sistemas
Pdf para sistemasduvan-rm
 
Sistemas de Información Gerencial
Sistemas de Información GerencialSistemas de Información Gerencial
Sistemas de Información GerencialIrene Fernandez
 
Plan de sistemas y Procedimiento de Oficina
Plan de sistemas y Procedimiento de OficinaPlan de sistemas y Procedimiento de Oficina
Plan de sistemas y Procedimiento de Oficinakarina maita
 
Informe v2.2 Base de Datos II - Proyecto TodoAutos : venta de carros del año
Informe v2.2  Base de Datos II - Proyecto TodoAutos : venta de carros del añoInforme v2.2  Base de Datos II - Proyecto TodoAutos : venta de carros del año
Informe v2.2 Base de Datos II - Proyecto TodoAutos : venta de carros del añoJuan Polo Cosme
 
Sistemas y Procedimientos de Oficina
Sistemas y Procedimientos de OficinaSistemas y Procedimientos de Oficina
Sistemas y Procedimientos de OficinaDanielMejias8
 
Bernaez m, quijadaj, lopezs, secog, yanezg. cont2, seccion cp03
Bernaez m, quijadaj, lopezs, secog, yanezg. cont2, seccion cp03Bernaez m, quijadaj, lopezs, secog, yanezg. cont2, seccion cp03
Bernaez m, quijadaj, lopezs, secog, yanezg. cont2, seccion cp03JoanaQuijada
 
Sistemas de información gerencial
Sistemas de información gerencialSistemas de información gerencial
Sistemas de información gerencialjegutierrez1
 

La actualidad más candente (15)

Sistemas de informacion
Sistemas de informacionSistemas de informacion
Sistemas de informacion
 
Tema 4. modelo de datos lógicos
Tema 4. modelo de datos lógicosTema 4. modelo de datos lógicos
Tema 4. modelo de datos lógicos
 
Planeación estratégica los sistemas de información
Planeación estratégica los sistemas de informaciónPlaneación estratégica los sistemas de información
Planeación estratégica los sistemas de información
 
Lectura 3
Lectura 3Lectura 3
Lectura 3
 
Sistemas informacion gerencial
Sistemas informacion gerencialSistemas informacion gerencial
Sistemas informacion gerencial
 
SIG - Lectura 3
SIG - Lectura 3SIG - Lectura 3
SIG - Lectura 3
 
Pdf para sistemas
Pdf para sistemasPdf para sistemas
Pdf para sistemas
 
Sistemas
SistemasSistemas
Sistemas
 
Sistemas de Información Gerencial
Sistemas de Información GerencialSistemas de Información Gerencial
Sistemas de Información Gerencial
 
Trabajo valderrama y carlos
Trabajo valderrama y   carlosTrabajo valderrama y   carlos
Trabajo valderrama y carlos
 
Plan de sistemas y Procedimiento de Oficina
Plan de sistemas y Procedimiento de OficinaPlan de sistemas y Procedimiento de Oficina
Plan de sistemas y Procedimiento de Oficina
 
Informe v2.2 Base de Datos II - Proyecto TodoAutos : venta de carros del año
Informe v2.2  Base de Datos II - Proyecto TodoAutos : venta de carros del añoInforme v2.2  Base de Datos II - Proyecto TodoAutos : venta de carros del año
Informe v2.2 Base de Datos II - Proyecto TodoAutos : venta de carros del año
 
Sistemas y Procedimientos de Oficina
Sistemas y Procedimientos de OficinaSistemas y Procedimientos de Oficina
Sistemas y Procedimientos de Oficina
 
Bernaez m, quijadaj, lopezs, secog, yanezg. cont2, seccion cp03
Bernaez m, quijadaj, lopezs, secog, yanezg. cont2, seccion cp03Bernaez m, quijadaj, lopezs, secog, yanezg. cont2, seccion cp03
Bernaez m, quijadaj, lopezs, secog, yanezg. cont2, seccion cp03
 
Sistemas de información gerencial
Sistemas de información gerencialSistemas de información gerencial
Sistemas de información gerencial
 

Similar a 928 article text-959-1-10-20110707 (2)

Metodología integradora de procesos empresariales
Metodología integradora de procesos empresarialesMetodología integradora de procesos empresariales
Metodología integradora de procesos empresarialeskatyorderiqued
 
Expo metodologia de implementacion BI 01
Expo metodologia de implementacion BI 01Expo metodologia de implementacion BI 01
Expo metodologia de implementacion BI 01Cristian Quinteros
 
Sistemas de informacion
Sistemas de informacionSistemas de informacion
Sistemas de informaciongenesisptc_
 
Metodologias de diseño y desarrollo de los sistemas de informacion
Metodologias de diseño y desarrollo de los sistemas de informacionMetodologias de diseño y desarrollo de los sistemas de informacion
Metodologias de diseño y desarrollo de los sistemas de informacionArgimiro Dominguez
 
Sistema de Informacion: Ciclo de Vida y Diseño
Sistema de Informacion: Ciclo de Vida y DiseñoSistema de Informacion: Ciclo de Vida y Diseño
Sistema de Informacion: Ciclo de Vida y DiseñoRaimonKoudsi
 
Sistemas de información
Sistemas de informaciónSistemas de información
Sistemas de informaciónerwin portillo
 
Trabajo de Análisis y Diseños de Sistemas
Trabajo de Análisis y Diseños de SistemasTrabajo de Análisis y Diseños de Sistemas
Trabajo de Análisis y Diseños de SistemasFreddy Ramos
 
Presen Clases Bdd Unidad 4
Presen Clases Bdd Unidad 4Presen Clases Bdd Unidad 4
Presen Clases Bdd Unidad 4Francisco Godoy
 
Sistema de información (ecm)
Sistema de información (ecm)Sistema de información (ecm)
Sistema de información (ecm)chrnorei
 
5 tema 310111
5 tema 3101115 tema 310111
5 tema 310111chrnorei
 
Diapositivas sistemas de información
Diapositivas sistemas de informaciónDiapositivas sistemas de información
Diapositivas sistemas de informaciónelicamar
 
5 tema 310111
5 tema 3101115 tema 310111
5 tema 310111chrnorei
 
Sistema de información (ecm)
Sistema de información (ecm)Sistema de información (ecm)
Sistema de información (ecm)chrnorei
 
Sistema de información (ecm)
Sistema de información (ecm)Sistema de información (ecm)
Sistema de información (ecm)chrnorei
 

Similar a 928 article text-959-1-10-20110707 (2) (20)

Metodología integradora de procesos empresariales
Metodología integradora de procesos empresarialesMetodología integradora de procesos empresariales
Metodología integradora de procesos empresariales
 
Sistemas de informacion
Sistemas de informacionSistemas de informacion
Sistemas de informacion
 
Semana 3
Semana 3Semana 3
Semana 3
 
Semana 3
Semana 3Semana 3
Semana 3
 
Planeación de Sistemas de Información
Planeación de Sistemas de InformaciónPlaneación de Sistemas de Información
Planeación de Sistemas de Información
 
Expo metodologia de implementacion BI 01
Expo metodologia de implementacion BI 01Expo metodologia de implementacion BI 01
Expo metodologia de implementacion BI 01
 
Sistemas de informacion
Sistemas de informacionSistemas de informacion
Sistemas de informacion
 
Metodologias de diseño y desarrollo de los sistemas de informacion
Metodologias de diseño y desarrollo de los sistemas de informacionMetodologias de diseño y desarrollo de los sistemas de informacion
Metodologias de diseño y desarrollo de los sistemas de informacion
 
Sistema de Informacion: Ciclo de Vida y Diseño
Sistema de Informacion: Ciclo de Vida y DiseñoSistema de Informacion: Ciclo de Vida y Diseño
Sistema de Informacion: Ciclo de Vida y Diseño
 
2
22
2
 
Sistemas de información
Sistemas de informaciónSistemas de información
Sistemas de información
 
Ciclo de un sistema de informacion
Ciclo de un sistema de informacionCiclo de un sistema de informacion
Ciclo de un sistema de informacion
 
Trabajo de Análisis y Diseños de Sistemas
Trabajo de Análisis y Diseños de SistemasTrabajo de Análisis y Diseños de Sistemas
Trabajo de Análisis y Diseños de Sistemas
 
Presen Clases Bdd Unidad 4
Presen Clases Bdd Unidad 4Presen Clases Bdd Unidad 4
Presen Clases Bdd Unidad 4
 
Sistema de información (ecm)
Sistema de información (ecm)Sistema de información (ecm)
Sistema de información (ecm)
 
5 tema 310111
5 tema 3101115 tema 310111
5 tema 310111
 
Diapositivas sistemas de información
Diapositivas sistemas de informaciónDiapositivas sistemas de información
Diapositivas sistemas de información
 
5 tema 310111
5 tema 3101115 tema 310111
5 tema 310111
 
Sistema de información (ecm)
Sistema de información (ecm)Sistema de información (ecm)
Sistema de información (ecm)
 
Sistema de información (ecm)
Sistema de información (ecm)Sistema de información (ecm)
Sistema de información (ecm)
 

Último

BOTONES para diseño grafico de paginas web
BOTONES para diseño grafico  de paginas webBOTONES para diseño grafico  de paginas web
BOTONES para diseño grafico de paginas webNikholIk1
 
13.05)PRIMER GRUPO CARNES 2024 - RELACION DE FOTOS CORRECTAS.pdf
13.05)PRIMER GRUPO CARNES 2024 - RELACION DE FOTOS CORRECTAS.pdf13.05)PRIMER GRUPO CARNES 2024 - RELACION DE FOTOS CORRECTAS.pdf
13.05)PRIMER GRUPO CARNES 2024 - RELACION DE FOTOS CORRECTAS.pdfvictoralejandroayala2
 
Blue_Aesthetic_Mood_Board_Brand_Inspiration_Poster.pdf
Blue_Aesthetic_Mood_Board_Brand_Inspiration_Poster.pdfBlue_Aesthetic_Mood_Board_Brand_Inspiration_Poster.pdf
Blue_Aesthetic_Mood_Board_Brand_Inspiration_Poster.pdfNOEMIFONTEROMERO1
 
TECNOLOGIA ARQUITECTONICA - CASO IQUITOS - PERU
TECNOLOGIA ARQUITECTONICA - CASO IQUITOS - PERUTECNOLOGIA ARQUITECTONICA - CASO IQUITOS - PERU
TECNOLOGIA ARQUITECTONICA - CASO IQUITOS - PERUAlexander VA
 
Induccion Personal Mision S&A (nueva).pdf
Induccion Personal Mision S&A (nueva).pdfInduccion Personal Mision S&A (nueva).pdf
Induccion Personal Mision S&A (nueva).pdfstefatoro1392
 
word-ejercicios-tabulaciones-taller..doc
word-ejercicios-tabulaciones-taller..docword-ejercicios-tabulaciones-taller..doc
word-ejercicios-tabulaciones-taller..docGeorgeGuerreroNuez
 
Dominio de internet, materia de diseño web
Dominio de internet, materia de diseño webDominio de internet, materia de diseño web
Dominio de internet, materia de diseño webJAIMEROLANDOESPINURR
 
7.2 -La guerra civil. Evolución de los bandos y consecuencias-Marta y Elena (...
7.2 -La guerra civil. Evolución de los bandos y consecuencias-Marta y Elena (...7.2 -La guerra civil. Evolución de los bandos y consecuencias-Marta y Elena (...
7.2 -La guerra civil. Evolución de los bandos y consecuencias-Marta y Elena (...jose880240
 
Planos seriados, conceptos, caracterización y aplicaciones
Planos seriados, conceptos, caracterización y aplicacionesPlanos seriados, conceptos, caracterización y aplicaciones
Planos seriados, conceptos, caracterización y aplicacionesthauromaniko
 

Último (9)

BOTONES para diseño grafico de paginas web
BOTONES para diseño grafico  de paginas webBOTONES para diseño grafico  de paginas web
BOTONES para diseño grafico de paginas web
 
13.05)PRIMER GRUPO CARNES 2024 - RELACION DE FOTOS CORRECTAS.pdf
13.05)PRIMER GRUPO CARNES 2024 - RELACION DE FOTOS CORRECTAS.pdf13.05)PRIMER GRUPO CARNES 2024 - RELACION DE FOTOS CORRECTAS.pdf
13.05)PRIMER GRUPO CARNES 2024 - RELACION DE FOTOS CORRECTAS.pdf
 
Blue_Aesthetic_Mood_Board_Brand_Inspiration_Poster.pdf
Blue_Aesthetic_Mood_Board_Brand_Inspiration_Poster.pdfBlue_Aesthetic_Mood_Board_Brand_Inspiration_Poster.pdf
Blue_Aesthetic_Mood_Board_Brand_Inspiration_Poster.pdf
 
TECNOLOGIA ARQUITECTONICA - CASO IQUITOS - PERU
TECNOLOGIA ARQUITECTONICA - CASO IQUITOS - PERUTECNOLOGIA ARQUITECTONICA - CASO IQUITOS - PERU
TECNOLOGIA ARQUITECTONICA - CASO IQUITOS - PERU
 
Induccion Personal Mision S&A (nueva).pdf
Induccion Personal Mision S&A (nueva).pdfInduccion Personal Mision S&A (nueva).pdf
Induccion Personal Mision S&A (nueva).pdf
 
word-ejercicios-tabulaciones-taller..doc
word-ejercicios-tabulaciones-taller..docword-ejercicios-tabulaciones-taller..doc
word-ejercicios-tabulaciones-taller..doc
 
Dominio de internet, materia de diseño web
Dominio de internet, materia de diseño webDominio de internet, materia de diseño web
Dominio de internet, materia de diseño web
 
7.2 -La guerra civil. Evolución de los bandos y consecuencias-Marta y Elena (...
7.2 -La guerra civil. Evolución de los bandos y consecuencias-Marta y Elena (...7.2 -La guerra civil. Evolución de los bandos y consecuencias-Marta y Elena (...
7.2 -La guerra civil. Evolución de los bandos y consecuencias-Marta y Elena (...
 
Planos seriados, conceptos, caracterización y aplicaciones
Planos seriados, conceptos, caracterización y aplicacionesPlanos seriados, conceptos, caracterización y aplicaciones
Planos seriados, conceptos, caracterización y aplicaciones
 

928 article text-959-1-10-20110707 (2)

  • 1. 13 SISTEMAS &TELEMÁTICA Propuesta de un método para el diseño y modelado de una bodega de datos José Hernando Bahamón L. Universidad Icesi jbahamon@icesi.edu.co RESUMEN El desarrollo de los Sistemas de In- formación Gerencial basados en tec- nologías de Data Warehouse y Herra- mientas Olap, es relativamente re- ciente y, por lo tanto, no existe una propuesta metodológica universal- mente válida y aceptada como tal, por la comunidad académica. El presente artículo expone una pro- puesta metodológica para la realiza- ción del diseño de una bodega de da- tos, que utiliza como eje articulador la identificación de las necesidades de información por parte de la gerencia, para el soporte de los procesos de con- trol y de toma de decisiones. El método propuesto está compuesto de ocho pasos agrupados en tres fa- ses. La primera fase comprende la identificación de las necesidades de información gerencial, desde la pers- pectiva del negocio. La segunda fase comprende todas las actividades re- lacionadas con la elaboración de un modelo lógico-conceptual de la estruc- tura de la bodega de datos. La terce- ra fase incluye los pasos para reali- zar el diseño físico de la estructura de la bodega de datos. PALABRAS CLAVES Bodegas de datos, método de diseño de la estructura de una bodega de datos. ABSTRACT The development of Management In- formation Systems based on Ware- Fecha de recepción: 15-4-2003 Fecha de aceptación: 25-8-2003
  • 2. 14 SISTEMAS &TELEMÁTICA house Data technologies and Olap tools is relatively new. Therefore, the- re is no valid methodological appro- ach that is generally accepted as such by the academic community. This article presents a methodologi- cal approach to the design of a data warehouse using the identification of management information require- ments as a shaft that supports the control and decision-making proces- ses. The suggested approach consists of eight steps grouped in three diffe- rent stages. The first stage encompas- ses the identification of management information requirements from a bu- siness perspective. The second one deals with all the activities associa- ted with the preparation of a logical conceptual model for the data ware- house structure, and the third stage includes the steps to make the phy- sical design of the data warehouse structure. KEYWORDS Data warehouses, approach to the design of a data warehouse struc- ture. Clasificación: A
  • 3. 15 SISTEMAS &TELEMÁTICA INTRODUCCIÓN El desarrollo de los Sistemas de In- formación Gerencial basados en tec- nologías de Data Warehouse y herra- mientas Olap, es relativamente re- ciente y, por lo tanto, no existe una propuesta metodológica universal- mente válida y aceptada como tal, por la comunidad académica. Entre las propuestas más conocidas están: 1. Ralph Kimball,1 con un es- quema centrado en la identificación de los procesos de la empresa, como elemento clave para la definición de la estructura de variables y dimen- siones; 2. W.H. Inmon,2 con un esque- ma que parte de la construcción del modelo de datos corporativos, elabo- rado al más alto nivel de abstracción, para luego derivar la estructura del modelo de datos, para el diseño de la bodega; 3. Golfarelli Matteo, Maio Dario, Rizzi Stefano3 proponen un esquema que parte de los modelos E- R descriptivos de los sistemas tran- saccionales de la organización, para luego derivar el modelo E-R de la es- tructura, para la bodega de datos. En este artículo se presenta una pro- puesta de sistematización del proce- so de diseño de una bodega de datos, que se aparta de los esquemas de di- seño referidos, y que utiliza como eje articulador, la identificación de la in- formación gerencial, para el soporte de los procesos de control y de toma de decisiones en los niveles directi- vos de la organización. MÉTODO PROPUESTO El método de diseño propuesto está centrado en la identificación de la información clave y relevante para so- portar los procesos de dirección y de toma de decisiones dentro de la orga- nización. Este método utiliza, como punto de partida, la identificación y el modelado de: qué es lo que el negocio está tratando de alcan- zar, para luego elaborar una estruc- tura que apoye el proceso de gestión hacia el logro de las metas definidas. Una vez que la información clave de apoyo a los procesos de gestión y con- trol de la organización ha sido iden- tificada, se inicia la elaboración del modelo lógico-conceptual de la estruc- tura de la bodega de datos, que so- portará las consultas y la exploración de los datos, a partir de los cuales se construirán los indicadores de gestión requeridos por los niveles directivos de la organización. Para darle un orden a este proceso sistémico de diseño, los pasos del método propuesto, tal como se presen- tan en la Figura 1, se han agrupado en las siguientes fases: • Fase 1: Identificación de las ne- cesidades de información geren- cial, desde la perspectiva del ne- gocio. • Fase 2: Elaboración del modelo ló- gico-conceptual de la estructura de la bodega de datos. 1. Kimball R. The Data Warehouse Toolkit. John Wiley & Sons, 1996. 2. Inmon W.H. Building The Data Warehouse. QED Press / John Wiley & Sons, 1992. 3. Golfarelli M., Maio D., Rizzi S. Conceptual Design of Data Warehouse From E/R Schemes. http//www.csr.unib.it/~golfare/db.html, 1998.
  • 4. 16 SISTEMAS &TELEMÁTICA • Fase 3: Elaboración del modelo fí- sico de la bodega de datos. Fase 1: Identificación de las necesidades de información gerencial, desde la perspectiva del negocio. La primera fase, a partir de la cual se realiza el proceso de diseño de la estructura para una bodega de datos, comprende la identificación de las ne- cesidades de información gerencial, lo que significa hacer explícitos los objetivos y los factores claves de éxi- to de la organización, o de un área del negocio. Es bastante común empezar este pro- ceso de identificación y modelado mediante entrevistas a los directivos, en las cuales la pregunta central es: «¿Cuál es la información que desea obtener del sistema de información gerencial?». Este enfoque puede resul- tar muy peligroso, si el directivo no realiza un proceso sistemático y orde- nado, para establecer sus necesidades de información, en relación con sus ac- tividades de gestión y control. Una forma ordenada y sistemática para realizar esta fase de identifica- ción de las necesidades de informa- ción, que soporte los procesos de ges- tión y control gerencial, es la aplica- ción del enfoque de sistemas, para guiar el proceso de revisión o defini- ción de: 1. Los objetivos estratégicos del negocio o del área; 2. Los factores clave para el logro de los objetivos de- finidos y 3. Los indicadores de con- trol, tanto de los objetivos como de los factores clave.4 4. Véase Bahamón José H. Construcción de indicadores de gestión bajo el enfoque de sistemas. S&T Revista de la Facultad de Ingeniería, Universidad Icesi. 2003.
  • 5. 17 SISTEMAS &TELEMÁTICA Método para el diseño y modelado de una bodega de datos Fase 1: Identificación de las necesidades de infor- mación gerencial, desde la perspectiva del negocio. Fase 2: Elaboración del modelo lógico-conceptual de la estructura de la bodega de datos. 2.1. Definir las tablas de hechos o las variables de la estructura. 2.2. Identificar, para cada tabla de hechos, las dimen- siones que la referencian. 2.3. Establecer el nivel de granulación y los niveles de agregación. 2.4. Elaborar el diagrama en estrella que representa la estructura de la bodega. Fase 3: Elaboración del modelo físico de la bodega de datos. 3.1. Verificación y ajuste del modelo lógico. 3.2. Definición del esquema físico del almacenamien- to de las dimensiones y sus jerarquías. 3.3. Definición de los atributos que conforman las tablas de hechos. Figura 1. Método para el diseño y modelado de una bodega.
  • 6. 18 SISTEMAS &TELEMÁTICA Como resultado de esta fase, se ten- drá una visión del negocio y de la in- formación requerida para la dirección y el control gerencial, representada fundamentalmente por: Los objetivos del negocio; los factores clave de éxi- to y, en especial, un conjunto de indi- cadores clave de la gestión. Fase 2: Elaboración del modelo lógico- conceptual de la estructura de la bodega. En esta fase se elabora el modelo ló- gico de la estructura de la bodega, que soportará las consultas, mediante las cuales se obtendrá la información re- querida por los niveles directivos como apoyo a sus procesos de gestión y de toma de decisiones. La elaboración de este modelo lógico comienza con los indicadores de ges- tión (necesidades de información ge- rencial), identificados en la fase an- terior, y termina con la construcción de una representación multidimen- sional de las variables que conforman cada indicador. En esta representa- ción multidimensional, cada variable es modelada mediante un arreglo di- mensional (multidimensional) de cel- das, como se presenta en la Figura 2. Para facilitar el proceso de elabora- ción del modelo lógico, se utiliza una representación gráfica denominada diagrama tipo estrella, donde el ele- mento central del esquema es la Va- riable o Tabla de Hechos («Fact»), la cual es referenciada por un conjunto de ejes, denominados Dimensiones, a través de los cuales se seleccionan los valores contenidos en la tabla de he- chos. En la Figura 3, se esquematiza el modelo de un diagrama en estrella.
  • 7. 19 SISTEMAS &TELEMÁTICA Figura 2. Vista multidimensional de una de las variables que conforman un indicador. Figura 3. Diagrama en estrella de una estructura multidimensional.
  • 8. 20 SISTEMAS &TELEMÁTICA Antes de presentar los pasos propues- tos por el método para la elaboración del modelo lógico, es pertinente pre- cisar algunos de los términos utiliza- dos en el método propuesto. En el Cuadro 1 se presentan las definicio- nes adoptadas para los diferentes conceptos utilizados en el método pro- puesto. Cuadro 1: Definición de conceptos básicos. Una gráfica es una red de nodos interconectados. Una gráfica direccional es aquella en la cual la conexión entre dos nodos tiene una dirección específica. Un modelo E-R puede ser considerado una gráfica direccional. En una gráfica, una trayectoria acíclica es aquella que sólo tiene una forma de recorrido (en un solo sentido). Una trayectoria cíclica es aquella que se puede recorrer en dos o más secuencias diferentes. Es la tabla central de la estructura de la bodega. Esta tabla contiene los datos de interés para el negocio, es decir, los valo- res para la construcción de los indicadores claves del negocio. Técnicamente, la tabla de hechos es una entidad de intersec- ción cuya llave primaria está compuesta por la unión de los dominios de las diferentes dimensiones que la referencian. Las dimensiones corresponden a los ejes con los cuales se cons- truye la vista multidimensional de la información clave del ne- gocio, almacenada en la tabla de hechos. Las atributos almacenados en las dimensiones determinan la granulación adoptada para el modelo. Las dimensiones pueden ser: – Propias: Cuando el conjunto de entidades que conforman la dimensión se encuentran unidas a la tabla de hechos, en una trayectoria acíclica. – Impropias: Cuando el conjunto de entidades que confor- man la dimensión se encuentran unidas a la tabla de he- chos, en una trayectoria cíclica. – De Información: Cuando los atributos contenidos en la dimensión definen qué tipo de datos se encuentran almace- nados en la tabla de hechos. Determinan cómo las instancias de la tabla de hechos pueden ser agregadas.Lasjerarquíaspermitenlasoperacionesde«drill-down» o «rollup», en los procesos de consulta. Una jerarquía está conformada por el conjunto de entidades que constituyen la dimensión. Gráfica Trayectorias cíclicas y acíclicas Tabla de hechos Dimensión Jerarquías
  • 9. 21 SISTEMAS &TELEMÁTICA A continuación se presentan los cua- tro pasos propuestos para la sistema- tización del proceso de elaboración del modelo lógico: Paso No. 1: Definir las tablas de hechos o las variables de la estructura. Este paso se realiza a partir del con- junto de los indicadores de gestión, definidos en la fase de identificación de las necesidades de información gerencial, desde la perspectiva del negocio. El paso se inicia con la eva- luación de las variables (divisores y dividendos) de cada indicador, para determinar cuáles de éstas pueden ser almacenadas en una tabla de he- chos, y cuáles no. En el Cuadro 2 se presenta, a mane- ra de ejemplo, la información obteni- da, al aplicar los pasos de la fase 1 al área de ventas de una organización. A partir de estos resultados se iden- tifican las variables o tablas de he- chos, como lo establece el paso 1 de esta fase. Aplicación del paso 1: Identificación de las tablas de hechos • El indicador definido para el mo- nitoreo del objetivo puede ser construido con una sola tabla de hechos: Ventas. Se toma una sola variable, por cuanto las ventas del año y las ventas del año anterior, que son las dos variables que con- forman el indicador, se pueden almacenar en la misma tabla de hechos. • El indicador 1 del F.C.E1 puede ser construido con dos tablas de hechos que son: ventas por ven- dedor y cuota de ventas de cada vendedor. • El indicador 2 del F.C.E1 puede ser construido con dos tablas de hechos que son: número de visi- tas realizadas por cada vendedor, y número de visitas presupuesta- das por cada vendedor. • El indicador 1 del F.C.E2 puede ser construido con una tabla de hechos: número de clientes nue- vos en la base de datos. En este caso, el denominador del indica- dor se asume como un único valor y, por lo tanto, no tiene sentido almacenarlo en otra tabla de he- chos. • Los demás indicadores se anali- zan de igual manera. En suma, al realizar el análisis de todos los indicadores, obtenemos las siguientes tablas de hecho: • Ventas. • Ventas por vendedor. • Cuota de ventas de cada vende- dor. • Número de visitas realizadas por cada vendedor. • Número de visitas presupuesta- das por cada vendedor. • Número de clientes nuevos en la base de datos. • Número de vendedores capacita- dos que aprobaron los cursos.
  • 10. 22 SISTEMAS &TELEMÁTICA Cuadro 2: Información gerencial del área de ventas, obtenida al realizar la fase 1. Área del Negocio - Descripción. Se trabaja con el área de ventas de una orga- nización dedicada a la producción de recipientes elaborados en plástico. Objetivo del Área: para propósitos del ejemplo, se toma el siguiente objetivo: Lograr al final del año un incremento del 15% en las ventas totales de la compañía, con respecto a las ventas del año anterior. Factores claves de éxito. Luego de realizado el análisis de las acciones y las condiciones necesarias para garantizar el logro del objetivo planteado, se identi- ficaron los siguientes F.C.E: • F.C.E.1: Planeación y control de la fuerza de ventas. • F.C.E.2: Búsqueda de nuevos clientes rentables para la organización. • F.C.E.3: Capacitación y entrenamiento de la fuerza de ventas. Indicadores claves de gestión. Para el control y seguimiento de los F.C.E y los objetivos, se proponen los siguientes indicadores: Ventas del año I_obj: -1 Ventas del año anterior Ventas del vendedor I1_FCE1: Cuota de ventas Número de visitas de venta realizadas I2_FCE1: Número de visitas presupuestadas Número de clientes nuevos en la base de datos I1_FCE2: Número de clientes nuevos presupuestados Número de vendedores capacitados que aprobaron los cursos I1_FCE3: Número presupuestado de vendedores capacitados
  • 11. 23 SISTEMAS &TELEMÁTICA Paso No. 2: Identificar, para cada tabla de hechos, las dimensiones que la referencian. Para cada variable o tabla de hechos se identifican, con la colaboración del usuario líder del área de negocio, los ejes de visualización multidimensio- nal los cuales constituyen las dimen- siones de la variable. En este paso, se espera que el usua- rio visualice cada variable, como un conjunto de valores almacenados en una estructura de varias dimensio- nes, donde los valores almacenados son referenciados por la combinación de los valores definidos para cada eje (dominio de la dimensión), tal como se esquematiza en la Figura 4. Figura 4: Esquema de una vista multidimensional de una tabla de hechos. Paso 3: Establecer el nivel de granula- ción y los niveles de agregación de cada dimensión. Una vez que las dimensiones han sido identificadas se debe establecer, para cada una de ellas, el menor nivel de granulación, el cual corresponde al conjunto de atributos que referencian el mayor nivel de detalle deseado para la variable o tabla de hechos. A manera de ejemplo, se aplican los dos pasos anteriores para la Tabla de Hechos sobre Ventas, definida en el ejemplo anterior. Aplicación del paso 2: Identificación de las dimensiones. Supongamos que el gerente de ven- tas expresa su interés por visualizar la información de ventas organizada de la siguiente manera: primero, por cada producto de la compañía; en se- gundo término, por cada lugar en donde se venden los productos y, fi- nalmente, por cada semana. Podemos establecer la necesidad de utilizar
  • 12. 24 SISTEMAS &TELEMÁTICA tres ejes para elaborar la vista mul- tidimensional (dimensiones) de la Tabla de Hechos - Ventas: • Dim1: Producto • Dim2: Lugar de venta • Dim3: Tiempo. Aplicación del paso 3: Definición del nivel de granulación. De acuerdo con la solicitud del geren- te, se establece para cada dimensión la siguiente granulación: • Dim. Producto: El menor nivel de granulación es el Tipo de Pro- ductos. Podemos establecer otros niveles como: Línea de Productos, que tiene un nivel de granulación mayor, pero un menor nivel de de- talle en la variable ventas; o Re- ferencias de Productos, que tiene un menor nivel de granulación, pero un mayor nivel de detalle. • Dim. Lugar: El nivel de granu- lación requerido es la Ciudad. Se habrían podido seleccionar otros niveles, como Almacén, que tiene un menor nivel, o Región, que tie- ne uno mayor. • Dim. Tiempo: El menor nivel de granulación requerido es la Sema- na. Se habrían podido seleccionar otros niveles, como el Día, que tie- ne un menor nivel, o el Mes, que tiene uno mayor. Una vez se han definido los menores niveles de granulación para cada di- mensión, se identifican los niveles de agregación requeridos para los valo- res almacenados en la tabla de he- chos, por cada dimensión. Estos ni- veles de agregación representan la jerarquía de cada dimensión. • Jerarquía en la Dim. Produc- to: Las ventas por productos pue- den ser agregadas por grupos de productos, por líneas de produc- tos y, por el total de la venta. De esta manera, los niveles de agre- gación de la dimensión producto son: – Por grupos de productos. – Por líneas de productos. – Total. • Jerarquía en la Dim. Lugar: Las ventas por lugar pueden ser agregadas por regiones y por el total del país. • Jerarquía en la Dim. Tiempo: Las ventas por tiempo pueden ser agregadas por mes, por trimestre, por semestre, por año. Paso 4: Elaborar el diagrama en estrella que representa la estructura de la bodega. Luego de identificar los elementos que conforman la estructura de la vista multidimensional, de la infor- mación gerencial requerida por la organización, se pasa a la elaboración de una representación gráfica, en for- ma de estrella; para ello se puede uti- lizar la notación simplificada de los diagramas E-R, o la notación deno- minada «Dot modeling».5 5. Todman, Chris. Designing a Data Warehouse: Supporting Customer Relationship. Prentice Hall, 2001.
  • 13. 25 SISTEMAS &TELEMÁTICA Notación tipo E-R: En esta notación, el diagrama en es- trella está conformado por una enti- dad central asociativa, que correspon- de a la tabla de hechos, y por un con- junto de trayectorias de entidades y relaciones de uno a muchos, que co- rresponde a las dimensiones y a sus jerarquías. En la Figura 5 se presen- ta un diagrama en estrella con esta notación. Figura 5. Representación de un diagrama en estrella, mediante la notación tipo E-R. Notación «Dot Modeling» En esta notación, el diagrama en es- trella está conformado por una enti- dad central que corresponde a la Ta- bla de Hechos, y por un conjunto de trayectorias compuestas por puntos («dots»), que representan las dimen- siones y sus jerarquías. En la Figura 6 se presenta un diagrama en estre- lla con esta notación. Figura 6. Representación de un diagrama en estrella, mediante la notación «Dot Modeling».
  • 14. 26 SISTEMAS &TELEMÁTICA A manera de ejemplo se presenta en la Figura 7, el diagrama en estrella, con notación «Dot Modeling», para la Tabla de Hechos y para las dimen- siones identificadas en el ejemplo anterior. En la Figura 8 se represen- tan los mismos elementos de la es- tructura de la bodega, pero con nota- ción tipo E-R. Figura 7. Representación, mediante la notación «Dot Modeling», de la estructura para la bodega de datos del ejemplo anterior. Figura 8. Representación, mediante la notación E-R, de la estructura para la bodega de datos del ejemplo anterior.
  • 15. 27 SISTEMAS &TELEMÁTICA Fase 3: Elaboración de la estructura fí- sica de la bodega Durante esta fase, se realiza la trans- formación del modelo lógico concep- tual en la estructura física, que pos- teriormente será implementada en alguna herramienta de «Data Ware- house». Este proceso de transformación se realiza mediante los siguientes pasos: 1. Verificación y refinamiento del modelo lógico para determinar su con- sistencia. 2. Definición del esquema físico de almacenamiento de las es- tructuras jerárquicas de las dimen- siones. 3. Identificación de los atri- butos que conforman las tablas de hechos y las dimensiones. Paso 1: Verificación y ajuste del modelo lógico. Durante este paso, se realiza la veri- ficación del modelo lógico, obtenido en la fase anterior, para garantizar que el modelo, además de soportar todas las consultas requeridas por los ni- veles ejecutivos, siempre retorne in- formación confiable. Para iniciar este proceso de verifica- ción se debe elaborar una matriz de cruce, entre los requerimientos de información gerencial, definidos en la fase inicial, y las estructuras (estre- llas), definidas en la fase anterior. En la matriz de cruce se confirma si el requerimiento está completamente soportado. Si esta verificación no es correcta, se debe retornar a la fase anterior, para incorporar las estruc- turas que soporten los requerimien- tos faltantes de información. Terminada la revisión anterior, el proceso continúa con la evaluación de la estructura, para asegurar la vali- dez de todas las consultas de infor- mación realizadas sobre dicha estruc- tura. Para realizar este proceso de compro- bación de validez de la estructura, recurrimos a la teoría de grafos, se- gún la cual una estructura de consul- ta es válida cuando está conformada por trayectorias acíclicas. Al aplicar esta teoría, se puede afirmar que cualquier diseño para una bodega de datos permitirá siempre consultas co- rrectas, si la estructura propuesta está conformada únicamente por di- mensiones propias, es decir, por tra- yectorias acíclicas. Si al realizar la comprobación de la estructura se encuentran trayecto- rias acíclicas, éstas deben ser trans- formadas, para asegurar la confiabi- lidad de las consultas. Las posibles transformaciones son:6 1. Ajuste para los casos de trayecto- rias cíclicas simples Este caso ocurre cuando la trayecto- ria de una dimensión presenta una trayectoria alterna que tiene dos en- tidades comunes. En la Figura 9, se esquematiza una trayectoria cíclica simple. 6. Mcguff, F. Designing the perfect Data Warehouse. 1998.
  • 16. 28 SISTEMAS &TELEMÁTICA Figura 9. Dimensión con trayectoria cíclica. 2. Ajuste para los casos de trayecto- rias alternas, mezcladas con trayec- torias cíclicas. Se presenta cuando la trayectoria de una dimensión está conformada por una trayectoria alterna, más una tra- yectoria cíclica, tal como se esquema- tiza en la Figura 10. Figura 10. Dimensión con trayectoria alterna, más trayectoria cíclica. Las opciones de transformación para esta clase de trayectorias son: • Tratar cada trayectoria como una nueva dimensión, lo cual signifi- ca redibujar el diagrama, elimi- nando las relaciones N1-A2 y A3- N4, para luego crear la relación: Tabla de Hechos - A2. • Convertir la trayectoria cíclica en una trayectoria alterna, eliminan- do la relación A3-N4.
  • 17. 29 SISTEMAS &TELEMÁTICA En estos casos, el problema ocurre con la trayectoria cíclica; por lo tanto, la transformación se maneja como se ex- plicó en el caso anterior. Paso 2: Definición del esquema físico del almacenamiento de las dimensio- nes y sus jerarquías. El modelo en estrella que conforma la estructura lógica propuesta para la bodega de datos, debe ser conver- tido en una estructura totalmente desnormalizada, tal como se presen- ta en la Figura 11. Este modelo físico está conformado por una tabla de hechos, y por las entidades en las cua- les se almacenarán los dominios de las dimensiones con sus correspon- dientes niveles jerárquicos. Figura 11. Modelo lógico en estrella, y modelo físico de la bodega. Para el proceso de conversión de cada una de las trayectorias que confor- man el modelo en estrella, en entida- des desnormalizadas, se puede utili- zar uno de los siguientes esquemas de conversión.7 1. Conversión vertical o recursiva En esta conversión, se utiliza una lla- ve primaria única, para cada dimen- sión. El dominio de esta llave prima- ria se obtiene mediante la unión de todos los dominios de las entidades que conforman la trayectoria de la dimensión, es decir, si los dominios de las entidades que conforman la trayectoria son: {enero, febrero, mar- zo, abril ....}; {1er_trim, 2º_trim, 3er_trim, 4º_trim}; {1er_sem, 2º_sem}, el dominio de la llave prima- ria será: {enero, febrero, marzo, abril, ...., 1er_trim, 2º_trim, 3er_trim, 4º_trim; 1er_sem,2º_sem}. En la Fi- gura 12 se presenta, de manera grá- fica, este esquema de conversión. 7. Mcguff, F. Designing the perfect Data Warehouse. 1998.
  • 18. 30 SISTEMAS &TELEMÁTICA Figura 12. Conversión vertical de la trayectoria de una dimensión. Adicionalmente, en este esquema de conversión a cada valor del dominio se le asocia un valor padre, el cual también pertenece al dominio; de esta manera se implementa la jerarquía definida en la trayectoria, represen- tada en la dimensión, dentro del mo- delo en estrella. Este esquema para el manejo de las jerarquías (id_dimensión, id_padre) permite implementar fácilmente la operación de desenrolle («drill- down»), cuando se realizan consultas a la bodega de datos. Sin embargo, esta estructura es eficiente, si las agregaciones para cada nivel jerár- quico son precalculadas y almacena- das en la bodega. Este esquema de conversión es el más recomendado para implementar la estructura física de una bodega, cuan- do las dimensiones están compuestas por jerarquías desbalanceadas. 2. Conversión horizontal En esta conversión, la llave primaria de la dimensión se conforma como una llave compuesta por las llaves de cada una de las entidades que con- forman la trayectoria de la dimen- sión. En la Figura 13 se presenta, de manera gráfica, este esquema de con- versión. Figura 13: Conversión horizontal de la trayectoria de una dimensión.
  • 19. 31 SISTEMAS &TELEMÁTICA Este esquema de conversión es el más recomendable, si las agregaciones de datos se realizan de manera dinámica. Paso 3: Definición de los atributos que conforman las tablas de hechos y las dimensiones del modelo. En este paso final, se identifican para cada tabla de hechos y cada dimen- sión las características de los atribu- tos que conforman cada estructura. Una vez asignados todos los atribu- tos, se realiza un análisis cruzado en- tre la tabla de hechos y las dimen- siones, para establecer los tipos de cálculo matemático que pueden ser realizados, sobre la tabla de hechos. La especificación de los atributos que conforman la tabla de hechos se debe realizar siguiendo el formato que apa- rece en el Cuadro 3. Cuadro 3: Formato para la definición de los atributos de una tabla de hechos. Igualmente, para la especificación de los atributos que conforman las dimen- siones se debe utilizar el formato que aparece en el Cuadro 4. Cuadro 4: Formato para la definición de los atributos de una dimensión.
  • 20. 32 SISTEMAS &TELEMÁTICA Finalmente, se deben establecer los tipos de cálculos matemáticos como suma, conteo, promedio, mínimo, máximo, que pueden ser aplicados a los valores almacenados en las tablas de hechos. El resultado de esta revi- sión debe quedar consignado en una matriz de cruce, como la presentada en el Cuadro 5. A manera de ejemplo, se presenta en los siguientes cuadros la definición de atributos para la tabla de hechos y para las dimensiones definidas en el ejem- plo anterior, y esquematizadas en la Figura 7. Tabla de hechos Atributo 1 Dimensiones Suma Conteo Prom. Mín. Máx. 1. Dimensión a 2. Dimensión b 3. Dimensión c ..... Atributo 2 Dimensiones Suma Conteo Prom. Mín. Máx. 1. Dimensión a 2. Dimensión b 3. Dimensión c Atributo 3 Dimensiones Suma Conteo Prom. Mín. Máx. 1. Dimensión a 2. Dimensión b 3. Dimensión c .... Cuadro 5: Operaciones matemáticas para cada atributo de la tabla de hechos.
  • 21. 33 SISTEMAS &TELEMÁTICA Cuadro 6: Definición de los atributos de la tabla de hechos sobre ventas. Nombre de la estructura de la bodega Área de ventas Tabla de hechos Ventas Atributos tipo Pk Descripción Id lugar C(35) Sí Identif. de la dimensión lugar Id tiempo C(12) Sí Identif. de la dimensión tiempo id producto C(30) Sí Identif. de la dimensión producto Unidades vendidas N(8,0) Valor 1 de la tabla de hechos Pesos-venta N(10,2) Valor 2 de la tabla de hechos Cuadro 7: Definición de los atributos de las dimensiones, para la estructura de ventas. Nombre de la estructura de la bodega Nombre de la estructura de la bodega Nombre de la estructura de la bodega
  • 22. 34 SISTEMAS &TELEMÁTICA Cuadro 8: Operaciones matemáticas para cada atributo de la tabla de hechos sobre ventas. Tabla de hechos Ventas Atributo 1 Unidades vendidas Dimensiones Suma Conteo Prom Mín Máx Lugar ✓ ✓ ✓ ✓ Tiempo ✓ ✓ ✓ ✓ Producto ✓ ✓ ✓ ✓ Atributo 2 Pesos-venta Dimensiones Suma Conteo Prom Mín Máx Lugar ✓ ✓ ✓ ✓ Tiempo ✓ ✓ ✓ ✓ Producto ✓ ✓ ✓ ✓ CONCLUSIÓN Mediante la aplicación del enfoque de Sistemas para la definición de los in- dicadores claves de gestión de la or- ganización, se ha logrado articular una propuesta para modelar, de ma- nera ordenada y sistémica, las estruc- turas de las bodegas de datos que ser- virán de soporte a la implementación de sistemas de información gerencial, hechos a la medida de las necesida- des de información de la gerencia. Esta propuesta facilita, ordena y sis- tematiza un proceso que en algunas organizaciones se realiza de manera intuitiva y, en otras mediante la uti- lización de estructuras de bodegas que han sido definidas para otras or- ganizaciones. El modelo propuesto, que se aparta de muchos de los enfo- ques presentados por los investigado- res en este campo, se convierte en una opción válida para el diseño de siste- mas de información gerencial, en par- ticular para el diseño de bodegas de datos departamentalizadas («Data Marts»).
  • 23. 35 SISTEMAS &TELEMÁTICA BIBLIOGRAFÍA • Mcguff, F. Designing the perfect Data Warehouse. 1998. http:// members.aol.com/fmcguff/dwmo- del/index.htm • Kimball R. The Data Warehouse Toolkit. John Wiley & Sons, 1996. • Inmon W.H. Building The Data Warehouse. QED Press /Jhon Wiley, 1992. • Golfarelli, M; Maio, D; Rizzi, S. Conceptual Design of Data Ware- house From E/R schemes. http// www.csr.unib.it/~golfare/db.html, 1998. • Bahamón, J. H. Construcción de indicadores de gestión bajo el en- foque de sistemas. S&T Revista de la Facultad de Ingeniería, Univer- sidad Icesi. 2003. • Chuck, B; Dick, H; Don, S; Rhon- da; Eunsaeng, K.; Ann, V. Data Modeling Techniques for Data Warehouse. IBM. 1998. • Todman, C. Designing a Data Warehouse: Supporting Customer Relationship. Prentice Hall. 2001 CURRÍCULO José Hernando Bahamón L. Inge- niero Electrónico de la Universidad del Cauca, especialista en Adminis- tración de la Universidad Icesi y ma- gíster en Dirección Universitaria de la Universidad de los Andes. Profe- sor investigador de la Universidad Icesi. Vinculado a la Universidad Ice- si desde 1988. Ha sido jefe del Depar- tamento Académico de Sistemas (1988-1998), Director del programa de Ingeniería de Sistemas (1998- 2000), y en la actualidad es el Direc- tor Académico de la Universidad.