Este documento describe un proyecto de base de datos para una tienda de autos usando OLAP. Presenta la implementación de un cubo multidimensional en SQL Server para almacenar y analizar datos de ventas de autos. Incluye detalles sobre el modelo de datos dimensional, creación de la base de datos, conexión a la fuente de datos, y generación de vistas para el cubo multidimensional.
1. Facultad de Ciencias Físicas y Matemáticas Semestre 2015-1
Escuela de Informática Fecha:
UNIVERSIDAD NACIONAL DE TRUJILLO
FACULTAD DE CIENCIAS FISICAS Y MATEMATICAS
ESCUELA PROFESIONAL DE INFORMATICA
PROYECTO DE BASE DE DATOS II
TITULO:
TodoAutos Venta de Carros del Año
AUTORES:
Polo Cosme Juan Diego
Quizpe Andrade Edir
Sebastian Vera Victor
Vazques Lara Anibal
Villanueva Calvanapon Edu
Zavaleta Espejo Gerson
PROFESOR:
Ing. Arturo Pulido Díaz
2. Facultad de Ciencias Físicas y Matemáticas Semestre 2015-1
Escuela de Informática Fecha:
RESUMEN
En los últimos años el área de aplicaciones OLAP ha tenido un importante desarrollo.
Este tipo de aplicaciones utiliza estructuras multidimensionales para proporcionar un
acceso rápido a los datos con el fin de analizarlos. Los datos del origen de OLAP se
almacenan habitualmente en almacenes de datos en una base de datos relacional.
Nuestro Proyecto Trata acerca de la venta de autos del año , usando SQL Server para la
Base de Datos y SQL Server Data Tool(visual Studio) para generar nuestro Cubo
Multidimensional OLAP. Interfaces para Acceder a los Datos de nuestro Cubo en Excel,
mediante el lenguaje de programación Java
Palabras Clave
OLAP, esquema de estrella, esquema Copo de nieve Business Intelligence, ROLAP,
MOLAP
3. Facultad de Ciencias Físicas y Matemáticas Semestre 2015-1
Escuela de Informática Fecha:
1. INTRODUCCION.
Los sistemas OLAP son una de las herramientas más utilizadas en el campo de
las soluciones Business Intelligence ya que brinda la posibilidad de disponer de una
base de datos multidimensional que permite llevar a cabo el procesamiento analítico
de la información de manera online.
OLAP es el acrónimo en ingles de procesamiento analítico en línea(on-Line
Analytical Processing). OLAP te permite navegar fácilmente por la información,
solicitándola con detalle preciso y con filtros adecuados que puedes hacerlo de
manera dinámica fácil.
1.1. Usos de un Sistema OLAP o BI.
Es una solución utilizada en el campo de la llamada Inteligencia de negocios (o
Business Intelligence) cuyo objetivo es agilizar la consulta de grandes cantidades
de datos. Para ello utiliza estructuras multidimensionales (o Cubos OLAP) que
contienen datos resumidos de grandes Bases de datos o Sistemas
Transaccionales (OLTP).
Una de las características fundamentales por las cuales la herramienta OLAP
es ampliamente utilizada por distintas empresas es porque reside en que la misma
brinda una solución ideal para llevar a cabo consultas de los datos de manera
sencilla y veloz
Ofrece a los usuarios una solución que permite agilizar de manera notable las
consultas y evaluaciones de la gran cantidad de datos que produce
constantemente una compañía, utilizando información proveniente de todos los
sectores de la misma que fluye en un sistema central, es por ello que la velocidad
de respuesta que ofrece OLAP hace que las soluciones a los posibles problemas
surgidos durante los procesos productivos y las posteriores decisiones gerenciales
tengan lugar en tiempo y forma precisa.
Los sistemas OLAP, son utilizados por las empresas para conocer la historia
del negocio y poder analizar la toma de decisiones. Podemos enunciar entonces
las siguientes áreas en donde el uso de un sistema OLAP esta difundido:
SISTEMAS DE INFORMACION EJECUTIVOS
Los usuarios y administradores generalmente de mandos altos y medios, reciben la
información sobre los indicadores de funcionamiento dominantes del negocio y de
las excepciones o variaciones según sea de patrones y de estándares
preestablecidas.
APLICACIONES FINACIERAS
Para diversos usos de tipo financiero se utilizan la base de datos de OLAP, para
comunicar, planear y analizar. Los ejemplos de usos financieros incluyen la
4. Facultad de Ciencias Físicas y Matemáticas Semestre 2015-1
Escuela de Informática Fecha:
comunicación, análisis del mes-cierre, análisis de beneficios del producto, los
presupuestos y pronostico.
VENTAS Y APLICACIONES DE MARKETING
Existen diferentes formas de llegar a los clientes para alcanzar los objetivos de
venta y de comercialización propuestos. Por eso la utilización de sistemas OLAP
donde es importante contar con información organizada de manera rápido es
aconsejable.
1.2. Arquitectura y Funcionamiento de un CUBO o BI.
El objetivo OLAP básico s el cubo, que consiste en una representación
multidimensional de datos de detalle y resumen. Un cubo consta de un origen de
datos, dimensiones, medidas y particiones. Los cubos se diseñan a partir de los
requisitos de análisis de los usuarios. Un almacén de datos puede contener
muchos cubos distintos por ejemplo el cubo de ventas.
- El origende datos del cubo identifica y seconecta con la base de datos donde
se encuentra el almacén de datos que es el origen de los datos del cubo
- Una dimensión es un tipo especial de dio mención que asigna las
propiedades de los miembros de otra dimensión a una dimensión que a partir
de ese momento se puede utilizar en cubos.
- Las medidas identifican los valores numéricos extraídos de la tabla de hechos
resumidas para realizar el análisis.
- Las particiones son los contenedores multidimensionales de
almacenamiento que guardan datos del cubo. Cada cubo contiene , al menos
una Partición y los datos de un cubo pueden combinar a partir de varias
particiones.
1.2.1. Modelo del Negocio Dimensional
El modelo dimensional es una adaptación especializada del modelo
relacional usado para almacenar datos en depósitos de datos, de
modo que los datos fácilmente puedan ser extraídos usando
consultas OLAP.
Existen dos modelos de representación:
- Modelo Estrella
Es un modelo de datos que tiene una tabla de hechos, que
contiene los datos para el análisis, rodeada de las tablas
dimensionales. Este aspecto de tabla de hechos más grande
rodeada de radios o tablas mas pequeñas es lo que se asemeja a
una estrella.
Este esquema es ideal por su simplicidad y velocidad para ser
usado en análisis multidimensionales ya que permite acceder tanto a
los datos agregados como de detalle.
5. Facultad de Ciencias Físicas y Matemáticas Semestre 2015-1
Escuela de Informática Fecha:
- Modelo Copo de Nieve
Es una estructura algo más compleja que el esquema estrella. Se da
cuando alguna de las dimensiones se implementa con más de una tabla de
datos. La finalidad es normalizar las tablas y así reducir el espacio de
almacenamiento al eliminar la redundancia de datos. Pero tiene la
contrapartida de generar peores rendimientos al tener que crear más tablas
de dimensiones y más relaciones entre tablas lo que tiene un impacto
directo sobre el rendimiento.
6. Facultad de Ciencias Físicas y Matemáticas Semestre 2015-1
Escuela de Informática Fecha:
1.2.2. Base de Datos
La base de datos o base de hechos es una parte de la memoria
del ordenador que se utiliza para almacenar los datos recibidos
inicialmente para la resolución de un problema. Contiene
conocimiento sobre el caso concreto en que se trabaja. También se
registrarán en ella las conclusiones intermedias y los datos
generados en el proceso de inferencia.
1.2.3. Modelo Relacional
En este modelo todos los datos son almacenados en relaciones,
y como cada relación es un conjunto de datos, el orden en el que
estos se almacenen no tiene relevancia. Esto tiene la considerable
ventaja de que es más fácil de entender y de utilizar por un usuario
no experto. La información puede ser recuperada o almacenada por
medio de consultas que ofrecen una amplia flexibilidad y poder para
administrar la información.
7. Facultad de Ciencias Físicas y Matemáticas Semestre 2015-1
Escuela de Informática Fecha:
1.2.4. Interfaz con el Usuario
Es el medio con que el usuario puede comunicarse con la
máquina, un equipo o una computadora y comprende todos los
puntos de contacto entre el usuario y el equipo. Normalmente suelen
ser fáciles de entender y fáciles de accionar.
Posibilita que la respuesta proporcionada por el sistema sea
inteligible para el interesado. También puede solicitar mar
información si le es necesaria al sistema experto.
1.2.5. Módulo de Explicación
La mayoría de los sistemas OLAP contienen un módulo de
explicación diseñado para aclarar al usuario la línea de razonamiento
seguida en el proceso de inferencia.
Esta posibilidad de a explicación es especialmentevaliosa cuándo
se tiene la necesitada de tomardecisiones importantes amparándose
en el consejo del sistema experto.
Gracias a la estructura aportada por los CUBOS OLAP el acceso
a la información es prácticamente instantánea.
1.2.6. Módulo de Adquisición
El módulo de adquisición permite que se puedan añadir, eliminar
o modificar datos en la base de datos.
Si el entorno es dinámico es muy necesario, puesto que, el
sistemafuncionara correctamentesolo si se mantiene actualizado su
conocimiento.
1.3. Ventajas e Inconvenientes de un CUBO
1.3.1. Ventajas
La más importante es la facilidad de uso, una vez construido el cubo,
el usuario de negocio puede consultarlo con facilidad, incluso si se
trata de un usuario con escasos o nulos conocimientos técnicos.
También los rápidos de respuesta, habitualmente el cubo tiene pre
calculados las distintas agregaciones, por lo que los tiempos de
respuesta son muy cortos.
Otras Ventajas:
Tiene acceso a grandes cantidades de información.
8. Facultad de Ciencias Físicas y Matemáticas Semestre 2015-1
Escuela de Informática Fecha:
Analiza las relaciones entre muchos tipos de elementos
empresariales.
Involucra datos agregados.
Compara datos agregados a través de periodos jerárquicos.
Presentan los datos en diferentes perspectivas.
Involucran cálculos complejos entre elementos de datos.
Pueden responder con rapidez a consultas de usuarios.
1.3.2. Inconvenientes
El cubo es estructura adicional de datos que mantener y actualizar,
eso supone un gasto extra de recursos (servidores, discos, procesos
de carga, etc.)
Otra es sobre el modelo de negocio no siempre se adapta bien en un
modelo jerárquico.
1.4. Lenguaje de Programación Usado: Transact - SQL
1.4.1. Introducción:
Transact-SQL es un lenguaje sumamente potente que nos ayuda a
definir tareas mientras trabajamos con bases de datos. Debido a que
este lenguaje tiene algunas restricciones en el propio lenguaje casi
siempre lio vemos utilizado en creaciones de los procedimientos
almacenados, funciones de usuario y también triggers. Podemos
hacer uso de ¨T-SQL en lenguajes de programación como puede ser
Java, Visual Basic, SQL Server Management Studio.
1.4.2. Características
Nos permite Definir bloques de instrucciones SQL que se tratan
como unidades de ejecución.
Realizar ejecuciones condicionales.
Realizar ejecuciones iterativas o repetitivas.
Garantizar el tratamiento modular con la declaración de variables
locales y el uso de procedimientos almacenados.
Manipular tupla a tupla el resultado de una consulta.
Sin embargo no permite:
Crear interfaces de usuario.
Crear aplicaciones ejecutables, sino elementos que en algún
momento llegarían al servidor de datos y serán ejecutados.
Los tipos de datos más usados son:
Los números enteros, decimales(int-float)
9. Facultad de Ciencias Físicas y Matemáticas Semestre 2015-1
Escuela de Informática Fecha:
Fecha, hora(date- datetime)
Cadenas(varchar)
Los operadores:
Operadores numéricos.
Operadores bit a bit.
Operadores de comparación.
Operadores lógicos.
Operadores de cadenas.
DDL (Lenguaje de definición de Datos)
CREATE.
DROP.
ALTER.
DML (Lenguaje de Manipulación de Datos)
INSERT.
DELETE.
UPDATE.
SELECT.
2. Análisis Multidimensional para Registro de Matriculas UNT de Alumnos
2.1. Planteamiento y Diseño
Queremos implementar un sistema de venta de carros del año,
donde la base de datos constara con las tablas, carro, cliente,
vendedor, tienda, comprobante, y la tabla más importante Venta.
La base de datos esta creada en base al esquema Estrella.
Mediante estos datos, podremos ver la venta completa,con cada uno
de los datos ya mencionados,cuanto costoel carro, que tipo de carro
compro el cliente, que modelo de carros se vende más, y una serie
de consultas definidas en el proyecto.
La base de datos Fue generada usando SQL Server 2012, EL cubo
multidimensional fue hecho en Visual Studio.
Para el muestreo de los datos del cubo, se usara Excel.
10. Facultad de Ciencias Físicas y Matemáticas Semestre 2015-1
Escuela de Informática Fecha:
2.2. Implementación
CREACION DE NUESTRABASE DE DATOS
Podremos crearnos una sesión SQL server entrando con la autentificación de Windows
Fig. 1 Inicio de sesión con autentificación de SQL server
Una vez iniciado sesión podremos crear nuestra base de datos
Fig. 2 Creamos nueva base de datos
11. Facultad de Ciencias Físicas y Matemáticas Semestre 2015-1
Escuela de Informática Fecha:
Luego creamos lo que vendría hacer nuestro modelo relacional, para luego llenarla de
datos.
Fig. 3 Creación de Modelo Relacional
CONEXIÓN AORIGEN DE DATOS
Al crear un nuevo origen de datos nos pide el nombre del servidor, luego lleno los datos
con la cuenta de autentificación de SQL server, luego buscamos la base de datos creada
anteriormente.
Fig. 4 Asistente para Origen de Datos y Administración de conexiones
12. Facultad de Ciencias Físicas y Matemáticas Semestre 2015-1
Escuela de Informática Fecha:
Una vez creada la conexión ya podremos seleccionarla.
Fig. 5 Selección de conexión de datos
Luego nos pedirá información de Windows un usuario y contraseña, para luego darle
siguiente y finalizar la creación de conexión.
Fig. 6 Definición de credenciales Windows
13. Facultad de Ciencias Físicas y Matemáticas Semestre 2015-1
Escuela de Informática Fecha:
VISTAS DEL ORIGEN DE DATOS
Al querer crear una nueva vista, nos saldrá esta ventana donde está la conexión a origen
de datos que habíamos creado anteriormente.
Fig. 7 Asistente para vistas del origen de datos
Pasamos las tablas importantes.
Fig. 8 Selección de tablas y vistas
14. Facultad de Ciencias Físicas y Matemáticas Semestre 2015-1
Escuela de Informática Fecha:
Luego nos saldrá una serie de tablas donde le damos siguiente.
Fig. 9 Finalización del asistente
Acá estaría la gráfica de la base de datos Venta_carro
Fig. 10 Vista del origen de dato
15. Facultad de Ciencias Físicas y Matemáticas Semestre 2015-1
Escuela de Informática Fecha:
CREACION DEL CUBO OLAP
Al crear nuestro cubo, seleccionamos “usar tablas existentes” para trabajar con la base
de datos trabajada hasta el momento.
Fig. 11 Asistente para Cubos
Después nos sugiere seleccionar una tabla principal. Para luego dar siguiente a varias
ventanas, hasta llegar a esta ventana.
Fig. 12 Finalización del Asistente.
16. Facultad de Ciencias Físicas y Matemáticas Semestre 2015-1
Escuela de Informática Fecha:
Una ves finalizado la creación del cubo, le damos a procesar.
Fig. 13 Procesar Cubo
Al dar procesar nos sale esta ventana diciendo que el proceso se finalizado
correctamente.
Fig. 14 Finalización sin errores del proceso del cubo
17. Facultad de Ciencias Físicas y Matemáticas Semestre 2015-1
Escuela de Informática Fecha:
3. EJECUCION
Abrimos Excel nos ubicamos en la pestaña “DATOS” nos vamos a
“De Otras fuentes” y seleccionamos “Desde Analysis services”
Fig. 15 Conectando Excel con nuestro cubo
Luego nos saldrá para iniciar sección a nuestra base de datos y le
damos siguiente
Fig. 16 conexiones del Excel con el servidor de base de datos
18. Facultad de Ciencias Físicas y Matemáticas Semestre 2015-1
Escuela de Informática Fecha:
Luego seleccionamos nuestro proyecto “Cubo_carro”, le damos
siguiente.
Fig. 17 Selección de nuestro cubo
Ahora finalizar
Fig. 18 Finalización de configuración de conexión
19. Facultad de Ciencias Físicas y Matemáticas Semestre 2015-1
Escuela de Informática Fecha:
Listo ya tenemos nuestras consultas en Excel podemos seleccionar
lo que queremos ver.
Fig. 19 Visualización de nuestra tabla dinámica
4. REFERENCIAS BIBLIOGRAFICAS
EcuRed. Obtenido de http://www.ecured.cu/Cubos_OLAP
EcuRed. Obtenido de http://www.ecured.cu/Transact_SQL
Prezi. Obtenido de https://prezi.com/sntfliot-z6i/cubos-olap/
AulaClic. Obtenido de http://www.aulaclic.es/sqlserver/t_2_1.htm
DATAPRIX. Obtenido de http://www.dataprix.com/olap-rolap-molap
SlideShare. Obtenido de http://es.slideshare.net/miguelorquera/modelo-dimensional-de-
un-proceso-de-negocio-12802599
WIKI. Obtenido de https://es.wikipedia.org/wiki/Esquema_en_estrella
WIKI. Obtenido de https://es.wikipedia.org/wiki/Esquema_en_copo_de_nieve
Business Intelligence facil. Obtenido de
http://www.businessintelligence.info/definiciones/cubos-olap.html