1. Universidad Austral de Chile
Escuela de Ingeniería Comercial
Tarea Ayudantía
DATAWAREHOUSE
Ayudante:
Jose Luis Carrasco V.
Viviana Negrón Salcedo
Luisa Subiabre Freixas
VALDIVIA – CHILE
2009
2. Introducción
La presente tarea trata de dar a conocer diferentes conceptos orientados
a los sistemas de información, tales como: Business Intelligence, ERPs,
ETL entre otros. Así como, definir tres modelos de datos.
Además, describir las etapas del diseño de un DW ejemplificando en dos
modelos como el Star Schema y el Snowflake Schema.
Y por último, elegir un área de negocio en el cual se desarrolle BI,
incluyendo las descripciones claras del negocio escogido y porque fue
escogido.
I. Debe investigar los siguientes términos:
- Business Intelligence: es la habilidad para transformar los datos en
información, y la información en conocimiento, de forma que se pueda
optimizar el proceso de toma de decisiones en los negocios.
- ERPs: Enterprise Resource Planning. Es un sistema de gestión de la
información estructurado para satisfacer la demanda de soluciones de
gestión empresarial, basado en el ofrecimiento de una solución completa
que permite a las empresas evaluar, implementar y gestionar más
facilmente su negocio.
- ETL: sigla que en ingles extract, transform and load que en español
significa extraer, transformar y cargar, es el proceso que permite a las
organizaciones mover datos desde múltiples fuentes, reformatearlos y
limpiarlos, y cargarlos en otra base de datos, data mart, o data
warehouse para analizar, o en otro sistema operacional para apoyar
un proceso de negocio.
- Interfase Web: una conexión física y funcional entre dos aparatos o
sistemas independientes. La interfaz será el mecanismo, entorno o
herramienta que hace posible dicha comunicación.
- Interfase Cliente-Servidor: La modalidad Cliente/Servidor es
aquella en la que confluyen una serie de aplicaciones basadas en dos
categorías que cumplen funciones diferentes (una requiere servicios y la
otra los brinda) pero que a la vez, pueden realizar tanto actividades en
3. forma conjunta como independientemente. Esas dos categorías son
justamente cliente y servidor.
http://www.mastermagazine.info/termino/4294.php
•Front/end
–Es la parte de la aplicación que interactúa con el usuario.
–Basados en una interfaz gráfica con el usuario (GUI). El Cliente
corre la aplicación que ofrece la interfaz con el usuario.
•Back/end
–Es la parte no-interactiva de la aplicación. La mayor
parte reside en las Bases de Datos (relacionales o no).
www.cyta.com.ar/elearn/inbiblio/teoricos/.../arquitectura.ppt
- Modelos de Datos: Un modelo de datos para las bases de datos es
una colección de conceptos que se emplean para describir la estructura
de una base de datos. Esa colección de conceptos incluyen entidades,
atributos y relaciones. La mayoría de los modelos de datos poseen un
conjunto de operaciones básicas para especificar consultas y
actualizaciones de la base de datos.
- ER (Entidad Relación): El modelo entidad-relación es una técnica
para definir las necesidades de información de la organización. Este
modelo implica identificar los asuntos de importancia dentro de una
organización (entidades), las propiedades de esos asuntos (atributos y
cómo se relacionan entre sí (relación). el parentesis ¿?
Ejemplo:
Consideremos una empresa que requiere controlar a los vendedores
y las ventas que ellos realizan; de este problema determinamos que los
objetos o entidades principales a estudiar son el empleado (vendedor) y
el artículo (que es el producto en venta), y las características que los
identifican son:
Empleado: Artículo:
Nombre Descripción
Puesto Costo
Salario Clave
R.F.C.
La relación entre ambas entidades la podemos establecer como Venta.
representado de la siguiente forma:
4. http://sistemas.itlp.edu.mx/tutoriales/basedat1/tema1_4.htm
- UML (Lenguaje de Modelado Unificado): UML puede utilizarse para
visualizar, especificar, construir y documentar los artefactos de un
sistema que involucra gran cantidad de software. Con este lenguaje, se
pretende unificar las experiencias acumuladas sobre técnicas de
modelado e incorporar las mejores prácticas actuales en un
acercamiento estándar.
- OO (Orientado a Objetos): La Programación Orientada a Objetos
desde el punto de vista computacional "es un método de
implementación en el cuál los programas son organizados como grupos
cooperativos de objetos, cada uno de los cuales representa una
instancia de alguna clase, y estas clases, todas son miembros de una
jerarquía de clases unidas vía relaciones de herencia".
ll. Describir cada etapa del diseño de un DW o almacén de datos.
Etapas del Diseño Warehouse
• Origen (Source): Define los orígenes de datos del Almacén de
Datos, como los sistemas de Procesamiento de Transacciones en
Línea (On-Line Transaction Processing, OLTP), las fuentes de
datos externas (datos sindicados, datos censales), etc.
• Integración (Integration): Define el mapeo entre los orígenes
de datos y el propio Almacén de Datos.
• Almacén de Datos (Data Warehouse):Define la estructura del
Almacén de Datos.
• Adaptación (Customization): Define el mapeo entre el Almacén
de Datos y las estructuras empleadas por el cliente.
5. • Cliente (Client): Define las estructuras concretas que son
empleadas por los clientes para acceder al Almacén de Datos,
como Data Marts o aplicaciones OLAP.
Cada una de las etapas es analizado por las siguientes etapas y en el
mismo orden.
Niveles por Etapa del Diseño del Almacén de Datos
• Conceptual: Define el Almacén de Datos desde un punto de vista
conceptual, es decir, desde el mayor nivel de abstracción y
contiene únicamente los objetos y relaciones más importantes.
• Lógico: Abarca aspectos lógicos del diseño del Almacén de Datos,
como la definición de las tablas y claves, la definición de los
procesos ETL, etc.
• Físico: Define los aspectos físicos del Almacén de Datos, como el
almacenamiento de las estructuras lógicas en diferentes discos o
la configuración de los servidores de bases de datos que
mantienen el almacén de datos.
http://hp.fciencias.unam.mx/~alg/bd/dwh.pdf
III) Modelos de DW:
-Star Schema
6. -Snowflake Shema
IV) Buscar un área de negocio en el cual sea interesante
desarrollar/aplicar BI (Ej.: Ventas en Falabella ).
Vamos a trabajar con el área de ventas de Rockford. El Datawarehouse
quedaría de la siguiente forma:
7. sucursal
Ven
tas
Tiempo
Marca
Sucursales
Las sucursales de Rockford las podemos dividir en dos:
• sucursales de Santiago y
• sucursales de Regiones, las cuales son las siguientes:
8. Sucursales Santiago Sucursales Regiones
• Alto Las Condes • Iquique
• Arauco Maipú • Mall Calama
• Florida Center • Mall Curicó
• La dehesa • Mall Marina Arauco
• Parque Arauco • Mall Pionero
• Plaza Norte • Mall Plaza Antofagasta
• Plaza Oeste • Mall Plaza La Serena
• Plaza Vespucio • Mall Temuco
• Plaza El Roble
• Plaza El Trébol
• Plaza Los Angeles
• Pucón
• Punta Arenas
• Puerto Montt
• Puerto Natales
• Puerto Varas
• San Pedro de Atacama
• Temuco
• Valdivia
• Centro Comercial “La
esquina”
• Rkf Chillán
Marcas:
Rockford trabaja con las siguientes marcas:
También cada marca la podemos subdividir en los productos que ofrece
cada marca; donde podemos encontrar:
• Chaquetas
• Pantalones
• Zapatillas
9. • Zapatos
• Botas
• Gorros
• Sweaters
• Camisas
• Guantes, entre otras
Tiempo:
Al ser Rockford una tienda principalmente de ropa y calzado, la
podemos dividir en las temporadas en que trabaja la tienda
Temporada Primavera – Verano
• Día
• Mes
• Año
Temporada Otoño Invierno
• Día
• Mes
• Año
El Datawarehouse quedaría de la siguiente forma:
10. Ciuda Ciuda
Región Región
Unidades
Sucursales Sucursales
Santiago Regiones
Sucursales
Ventas Tiemp
o
Rockford
Temporada Temporada
Marca Primavera - Verano Otoño - Invierno
día día
Producto
Monto
mes mes
Categoría
año año
CONCLUSION