Este documento describe el modelo multidimensional y sus esquemas más comunes como el esquema estrella y el esquema copo de nieve. Explica la diferencia entre OLAP y OLTP, con OLAP enfocado en el análisis de datos y OLTP en el procesamiento de transacciones. Finalmente, define los conceptos clave de un modelo multidimensional como hechos, dimensiones y niveles.
1. UNIVERSIDAD CATÓLICA DE CUENCA
COMUNIDAD EDUCATIVA AL SERVICIO DEL PUEBLO
EXTENSION CAÑAR
CARRERA:
TECNOLOGIAS DE LA INFORMACIÓN
CÁTEDRA:
ARQUITECTURA DE DATOS EMPRESARIALES
CATEDRÁTICO:
ING. ANONIO CAJAMARCA
ESTUDIANTE:
CARLOS TENELEMA
CICLO:
SEXTO
CAÑAR – ECUADOR
2. MODELO MULTIDIMENSIONAL
El modelo multidimensional dentro del entorno de las bases de datos, es una disciplina de
diseño que se sustenta en el modelo entidad-relación y en las realidades de la ingeniería de
texto y datos numéricos.
Modela las particularidades de los procesos que ocurren en una organización, dividiéndolos
en mediciones y entorno. Las medidas son en su mayoría, medidas numéricas, y se les
denomina hechos. Alrededor de estos hechos existe un contexto que describe en qué
condiciones y en qué momento se registró este hecho. Aunque el entorno se ve como un todo,
existen registros lógicos de diferentes características que describen un hecho, por ejemplo, si
el hecho referido, es la venta de un producto en una cadena de tiendas, se podría dividir el
entorno que rodea al hecho de la cantidad vendida, en el producto vendido, el cliente que lo
compró, la tienda y la fecha en que se realizó la venta. A estas divisiones se le denomina
dimensiones y a diferencia de los hechos que son numéricos, estos son fundamentalmente
textos descriptivos. Las medidas, como se expresó anteriormente, se registran en las tablas de
hechos, siendo la llave de esta tabla, la combinación de las múltiples llaves foráneas que hacen
referencia a las dimensiones que describen la ocurrencia de este hecho, en otras palabras,
cada una de las llaves extranjeras en las tablas de hecho se corresponden con la llave primaria
de una dimensión. (Alexis Cedeño Trujillo, 2005)
ESQUEMAS MÁS COMUNES PARA EL MODELO MULTIDIMENSIONAL
Existen varios esquemas para el modelado de los datos en un Data Warehouse, los
esquemas más usados son:
Esquema estrella: Es un paradigma de modelado que tiene un solo objeto en el medio
conectado con varios objetos de manera radial (figura 1) El objeto en el centro de la
estrella es la tabla de hechos y los objetos conectados a ella son las tablas de
dimensiones. Las tablas de dimensiones solo se relacionan con la tabla de hechos, es
decir, no existen relaciones entre estas.
Esquema copo de nieve: El esquema copo de nieve es una extensión del esquema
estrella en donde cada una de las puntas de la estrella puede dividirse en más puntas. En
esta forma de esquema, las tablas de dimensión pueden tener relación con otras tablas
de dimensión.
La ventaja fundamental que proporciona este esquema, es que se ocupa menor
espacio de almacenamiento, sin embargo, aumenta el número de tablas con las que el
usuario debe interactuar e incrementa la complejidad de las consultas a realizar. El
esquema estrella proporciona mayor compresión, navegabilidad, es más cercano a cómo
el usuario final refleja la visión de una consulta empresarial. Se recomienda, de ser
posible, que se emplee un esquema estrella antes que un copo de nieve (figura 2),
justificándose la utilización de mayor espacio de almacenamiento, en la disminución del
tiempo de obtención de la información que se necesita. (Alexis Cedeño Trujillo, 2005)
3. Bases de Datos Multidimensionales
Una base de datos multidimensional es una base de datos diseñada con el propósito de
almacenar y recuperar grandes volúmenes de información en forma eficiente. Esta
información estará representada por un conjunto de datos íntimamente relacionados,
vistos y analizados desde diferentes perspectivas. Estas perspectivas son llamadas
dimensiones. Cuando el usuario necesita utilizar los datos almacenados con el propósito
de tomar decisiones importantes de su negocio, identificar tendencias o formular
estrategias efectivas requieren ver los datos desde distintos puntos de vista.
Por ejemplo: En una agencia de automóviles un punto importante sería examinar los
datos de ventas realizadas. La evaluación requeriría ver datos históricos de ventas desde
diferentes perspectivas:
✓ Ventas por Modelo
✓ Ventas por Color
✓ Ventas a través del tiempo
✓ Ventas por Vendedor
En realidad, las bases de datos relaciónales podrían responder estas consultas, pero los
queries deberían darnos resultados de una manera significativa (no sólo un listado de
4. datos) con un buen tiempo de respuesta. Los usuarios finales cuando necesitan acceso
interactivo a grandes cantidades de datos almacenados en un entorno relacional se ven
muchas veces frustrados por los pobres tiempos de repuesta y la falta de flexibilidad
ofrecida por la tecnología relacional y las herramientas de construcción de queries SQL.
(Gabriela Lopez Ubalde, 2005)
Modelos multidimensionales
En un modelo de datos multidimensional los datos se organizan alrededor de los temas
de la organización. La estructura de datos manejada en este modelo son matrices
multidimensionales o hipercubos. Un hipercubo consiste en un conjunto de celdas, cada
una se identifica por la combinación de los miembros de las diferentes dimensiones y
contiene el valor de la medida analizada para dicha combinación de dimensiones.
- Hecho: es el objeto a analizar, posee atributos llamados de hechos o de síntesis, y son
de tipo cuantitativo. Sus valores (medidas) se obtienen generalmente por la aplicación de
una función estadística que resume un conjunto de valores en único valor. Por ejemplo:
ventas en dólares, cantidad de unidades en inventario, cantidad de unidades de producto
vendidas, horas trabajadas, promedio de piezas producidas, consumo de combustible de
un vehículo, etcétera.
- Dimensiones: representan cada uno de los ejes en un espacio multidimensional.
Suministran el contexto en el que se obtienen las medidas de un hecho. Algunos ejemplos
son: tiempo, producto, cliente, departamento, entre otras. Las dimensiones se utilizan para
seleccionar y agrupar los datos en un nivel de detalle deseado. Los componentes de una
dimensión se denominan niveles y se organizan en jerarquías, verbigracia, la dimensión
tiempo puede tener niveles día, mes y año.
Los hechos se guardan en tablas de hechos y las dimensiones en tablas de dimensiones.
(Tamayo, 2006)
5. OLAP vs. OLTP
¿Qué es OLAP?
OLAP (On-Line Analytical Processing), es un método para organizar y consultar datos
sobre una estructura multidimensional proporcionando una mayor agilidad y flexibilidad
al usuario de negocio.
Forma parte de lo que se conoce como sistemas analíticos, está formada por un motor y
un visor.
Ventajas
✓ Tiene acceso a grandes cantidades de información.
✓ Analiza las relaciones entre muchos tipos de elementos empresariales.
✓ Compara datos agregados a través de periodos jerárquicos.
✓ Involucran cálculos complejos entre elementos de datos.
✓ Pueden responder con rapidez a consultas de usuarios.
Desventajas
• Imposibilidad de realizar cambios en su estructura.
• Requiere organizar los datos en un esquema estrella el cual es complicado de
implementar y administrar.
• No puede tener un gran número de dimensiones en un único cubo OLAP
Operaciones analíticas básicas de la OLAP
Cuatro tipos de operaciones analíticas en OLAP son:
• Roll-up
• Desglose
• Cortar y dados
• Pivotar (girar)
OLTP
Es el procesamiento de transacciones en línea, admite aplicaciones orientadas a
transacciones en una arquitectura de 3 niveles. Administra las transacciones diarias de
una organización. Su objetivo principal es el procesamiento de datos y no el análisis de
datos.
Beneficios del método
• Administra las transacciones diarias de una organización.
• OLTP amplia la base de clientes de una organización al simplificar los procesos
individuales.
Inconvenientes del método
• Si el sistema se enfrenta a fallos de hardware las transacciones en línea se ven
gravemente afectadas.
6. • Los sistemas permiten a varios usuarios acceder y cambiar los mismos datos al
mismo tiempo, lo que muchas veces creo una situación sin precedentes. (Páez,
2018)
7. Bibliografía
Alexis Cedeño Trujillo. (Diciembre de 2005). Informática. MODELO MULTIDIMENSIONAL, pág.
18.
Gabriela Lopez Ubalde, S. M. (2005). El rol de las bases de datos multidimensionales. 86.
Páez, D. C. (2018). Unidad de aprendizaje: Data Warehouse I. Aspectos técnicos en el proceso
de creación y explotación del Data Warehouse, 8-9-10-11-12-20-21-22.
Tamayo, M. y. (2006). An·lisis del modelo de almacenamiento MOLAP frente n·lisis del modelo
de almacenamiento MOLAP frente. Ingeniería e Investigación , 136.
Referencias
Alexis Cedeño Trujillo. (00 de Diciembre de 2005). Informática. MODELO MULTIDIMENSIONAL,
pág. 18.
Gabriela Lopez Ubalde, S. M. (2005). El rol de las bases de datos multidimensionales. 86.
Páez, D. C. (2018). Unidad de aprendizaje: Data Warehouse I. Aspectos técnicos en el proceso
de creación y explotación del Data Warehouse, 8-9-10-11-12-20-21-22.
Tamayo, M. y. (2006). An·lisis del modelo de almacenamiento MOLAP frente n·lisis del modelo
de almacenamiento MOLAP frente. Ingeniería e Investigación , 136.