Universidad Austral de Chile Facultad de Ciencias Económicas y Administrativas Instituto de Administración Escuela de Ingeniería Comercial ADMI 273 Tarea N° 4: DATAWAREHOUSE
El documento presenta un resumen de 3 oraciones de un trabajo sobre datawarehouse. Introduce conceptos clave como Business Intelligence, ETL y describe las etapas principales del diseño de un almacén de datos incluyendo origen, integración y almacenamiento de datos. El autor concluye que el datawarehouse es una gran colección de información de diversas fuentes que ayuda a la toma de decisiones empresariales.
Similar a Universidad Austral de Chile Facultad de Ciencias Económicas y Administrativas Instituto de Administración Escuela de Ingeniería Comercial ADMI 273 Tarea N° 4: DATAWAREHOUSE
Similar a Universidad Austral de Chile Facultad de Ciencias Económicas y Administrativas Instituto de Administración Escuela de Ingeniería Comercial ADMI 273 Tarea N° 4: DATAWAREHOUSE (20)
Universidad Austral de Chile Facultad de Ciencias Económicas y Administrativas Instituto de Administración Escuela de Ingeniería Comercial ADMI 273 Tarea N° 4: DATAWAREHOUSE
1. Universidad Austral de Chile
Facultad de Ciencias Económicas y Administrativas
Instituto de Administración
Escuela de Ingeniería Comercial
ADMI 273
Tarea N° 4: DATAWAREHOUSE
Curso: Sistema de Información Empresarial
Profesor: Cristian Salazar
Ayudante: José Luis Daniel Carrasco
Integrante:
Diego Nauto C.
Valdivia, 3O de Noviembre de 2010.
2. Introducción.
En un comienzo solo se contaba con bases de datos que guardaban la información,
para que luego aparecieran nuevos sistemas que a parte de guardar información, ofrecían un
enfoque gerencial, para la toma final de decisiones.
Las organizaciones para poder tener una mejor propuesta laboral, necesitan de la
recolección y almacenaje de información además de datos para la mejor toma de
decisiones. El correcto análisis acerca de inteligencia de negocios es realizado en
colaboración de otras herramientas que ayudan al mejor desempeño corporativo.
El buen conocimiento y aplicación de los conceptos analizados en este trabajo serán
sin duda de gran apoyo para las organizaciones y así poder tener una ventaja competitiva y
tener un mejor desempeño.
La globalización que nos mueve día a día, nos hace adentrarnos mucho mas a la
tecnología, la cual para una persona común y corriente como yo antes de iniciar este curso
era solo saber navegar y utilizar las diferentes herramientas tan comunes en la web, es por
eso que con el inicio del curso “Sistema de la Información”, me di cuenta de que todo lo
que había utilizado y que yo creía mantener “al día” y a la “vanguardia” en lo que respecta
a la tecnología de la información, era tan solo una minima parte.
Es por eso que trabajos como el realizado, en el cual uno se da cuenta que el avance
logrado a lo largo del curso a sido optimo y lleno de conocimientos, conceptos y practica,
lo invitan a seguir interiorizándose en temas como Business Intelligence, ETL o ERPs, los
cuales son habilidades, gestión y componentes si pudiéramos resumirlo así dentro de una
idea o proyecto a generar.
Es por eso que también términos como Interfase Web o Modelo de Datos, nos han
ayudado a trabajar con programas como “PLSQL Developer”, en conjunto con modelos
como el de entidad-relación, UML y OO.
Finalmente, podemos decir que el datawarehouse, es una gran colección, en la cual se
recoge mucha información, de diversas fuentes y diversas operaciones, las cuales nos
ayudaran a tomar una decisión, la cual en nuestro rol de Ingeniero Comercial, nos ayuda a
sentenciar si por ejemplo un proyecto tiene o no vigencia, o si se sigue o no con un plan de
ventas, debido a que nosotros somos los que gestionamos la empresa. Por tal motivo, si en
un futuro no muy lejano, estemos en un gran sillón realizando otro tipo de actividades, es
muy necesario dentro de la formación académica como profesional tener ese conocimiento
técnico, para tener y saber el leguaje común con el resto de personal de una determinada
empresa en la cual se trabaja, porque como decía anteriormente uno es quien gestiona la
empresa.
3. I. Debe investigar los siguientes términos.
Business Intelligence:
Business Intelligence es la habilidad para transformar los datos en información, y la
información en conocimiento, de forma que se pueda optimizar el proceso de toma de
decisiones en los negocios.
Desde un punto de vista más pragmático, y asociándolo directamente con las
tecnologías de la información, podemos definir Business Intelligence como el conjunto de
metodologías, aplicaciones y tecnologías que permiten reunir, depurar y transformar datos
de los sistemas transaccionales e información desestructurada (interna y externa a la
compañía) en información estructurada, para su explotación directa (reporting, análisis
OLTP / OLAP, alertas...) o para su análisis y conversión en conocimiento, dando así
soporte a la toma de decisiones sobre el negocio.
La inteligencia de negocio actúa como un factor estratégico para una empresa u
organización, generando una potencial ventaja competitiva, que no es otra que proporcionar
información privilegiada para responder a los problemas de negocio: entrada a nuevos
mercados, promociones u ofertas de productos, eliminación de islas de información, control
financiero, optimización de costes, planificación de la producción, análisis de perfiles de
clientes o rentabilidad de un producto concreto.
ERPs.
Los sistemas de gestión empresarial (en inglés ERP, acrónimo de Enterprise Resource
Planning) son sistemas de gestión de información que integran y automatizan muchas de las
prácticas de negocio asociadas con los aspectos operativos o productivos de una empresa,
eliminando complejas conexiones entre sistemas de distintos proveedores.
Este tipo de sistemas suele presentar una arquitectura modular, donde cada módulo
gestiona las funciones de un área empresarial diferente, como pueden ser: nóminas,
finanzas, gestión de proyectos, sistema de gestión geográfica, contabilidad, logística, stock,
pedidos. Estas áreas de la empresa realizan funciones diferentes pero se interrelacionan
entre sí compartiendo información. Es importante resaltar que los sistemas ERP, son
integrales, es decir, una agrupación de todos los módulos que los componen, y que agrupan
a su vez todos los procesos de gestión de la empresa.
4. ETL.
Sigla que en ingles extract, transform and load que en español significa extraer,
transformar y cargar, es el proceso que permite a las organizaciones mover datos desde
múltiples fuentes, reformatearlos y limpiarlos, y cargarlos en otra base de datos, data mart,
o data warehouse para analizar, o en otro sistema operacional para apoyar un proceso de
negocio.
Microsoft Integration Services es una plataforma para crear soluciones de integración
de datos de alto rendimiento, incluidos los paquetes de extracción, transformación y carga
(ETL) para el almacenamiento de datos.
Los procesos ETL (Extraction, Transformation and Loading - extracción,
transformación y carga) son los componentes más importantes y de valor añadido de una
infraestructura de Business Intelligence (BI). Aún pueden ser invisibles por los usuarios de
la plataforma de BI, los procesos ETL recuperan los datos de todos los sistemas operativos
y les pre-elaboran para las herramientas de análisis y de reporting. La exactitud de la
plataforma BI entera depende de los procesos ETL.
Interfase Web.
Es la parte de una Aplicación que se encarga de interactuar con el usuario. Los
diseñadores del programa crean esta "parte visible" que permite al usuario establecer una
comunicación con la aplicación, mediante las herramientas que puede utilizar para
manejarla. Una buena interfaz de un diseño web debe ser intuitiva y permitir al usuario
identificar con facilidad sus componentes mediante la utilización de símbolos, iconos o
cualquier tipo de objeto que sirva para que el usuario entienda mejor el software. Dentro de
la informática, hay otros ámbitos donde se utiliza el término interfaz:
• Conjunto de comandos y/o métodos que permiten la intercomunicación de un
programa con cualquier otro o entre partes (módulos) del propio programa. De
hecho, los periféricos son controlados por interfaces.
• En el Lenguaje de programación C++, una interfaz de personas es la parte del
interfaz informático que permite la circulación correcta y sencilla de información
entre varias aplicaciones y entre el propio programa y el monousuario.
• Dentro del hardware, una interfaz es el puerto (circuito físico) a través del que se
envían o reciben señales desde un sistema o subsistemas hacia otros.
5. Modelo de Datos.
Un modelo de datos es un lenguaje orientado a describir una Base de Datos.
Típicamente un modelo de datos permite describir:
Las estructuras de datos de la base: El tipo de los datos que hay en la base y la
forma en que se relacionan.
Las restricciones de integridad: Un conjunto de condiciones que deben cumplir los
datos para reflejar correctamente la realidad deseada.
Operaciones de manipulación de los datos: típicamente, operaciones de agregado,
borrado, modificación y recuperación de los datos de la base.
Otro enfoque es pensar que un modelo de datos permite describir los elementos de la
realidad que intervienen en un problema dado y la forma en que se relacionan esos
elementos entre sí.
No hay que perder de vista que una Base de Datos siempre está orientada a resolver
un problema determinado, por lo que los dos enfoques propuestos son necesarios en
cualquier desarrollo de software. La mayoría de los modelos de datos poseen
un conjunto de operaciones básicas para especificar consultas y actualizaciones de
la base de datos.
El modelado de datos es uno de los elementos más importantes a la hora de iniciar el
desarrollo de cualquier proyecto. Esta es la estructura, sobre la que realmente reside la
verdadera esencia de la aplicación. Incluso determina si el proyecto va a cumplir con su
verdadero objetivo.
ER (Entidad Relación).
El modelo entidad-relación es una técnica para definir las necesidades de información
de la organización. Este modelo implica identificar los asuntos de importancia dentro de
una organización (entidades), las propiedades de esos asuntos (atributos y cómo se
relacionan entre sí (relación).
El modelo de datos más extendido es el denominado ENTIDAD/RELACIÓN (E/R)
En el modelo E/R se parte de una situación real a partir de la cual se
definen entidades y relaciones entre dichas entidades:
• Entidad: Objeto del mundo real sobre el que queremos almacenar información (Ej:
una persona). Las entidades están compuestas de atributos que son los datos que
definen el objeto (para la entidad persona serían, nombre, apellidos, dirección,...).
De entre los atributos habrá uno o un conjunto de ellos que no se repite; a este
atributo o conjunto de atributos se le llama “clave” de la entidad, (para la entidad
persona una clave seria DNI).
6. • En toda entidad siempre hay al menos una clave que en el peor de los casos estará
formada por todos los atributos de la tabla. Ya que pueden haber varias claves y
necesitamos elegir una, lo haremos atendiendo a estas normas:
• Que sea única.
• Que se tenga pleno conocimiento de ella.- ¿Por qué en las empresas se asigna a cada
cliente un número de cliente?
• Que sea mínima, ya que será muy utilizada por el gestor de base de datos.
• Relación.- Asociación entre entidades, sin existencia propia en el mundo real que
estamos modelando, pero necesaria para reflejar las interacciones existentes entre
entidades. Las relaciones pueden ser de tres tipos:
• Relaciones 1-1.- Las entidades que intervienen en la relación se asocian una a una
(Ej: la entidad HOMBRE, la entidad MUJER y entre ellos la relación
MATRIMONIO).
• Relaciones 1-n.- Una ocurrencia de una entidad está asociada con muchas (n) de
otra (Ej: la entidad EMPERSA, la entidad TRABAJADOR y entre ellos la relación
TRABAJAR-EN).
• Relaciones n-n.-Cada ocurrencia, en cualquiera de las dos entidades de la relación,
puede estar asociada con muchas (n) de la otra y viceversa (Ej: la entidad
ALUMNO, la entidad EMPRESA y entre ellos la relación MATRÍCULA).
Relación 1 a 1.
Indicamos con este ejemplo que existe una relación de pertenencia de uno a uno, ya que
existe una tarjeta de circulación registrada por cada automóvil.
En este ejemplo, representamos que existe un solo presidente para cada país.
7. Relación muchos a muchos.
UML (Lenguaje de Modelado Unificado)
Una exigencia de la gran mayoría de instituciones dentro de su Plan Informático
estratégico, es que los desarrollos de software bajo una arquitectura en Capas, se formalicen
con un lenguaje estándar y unificado.
Es decir, se requiere que cada una de las partes que comprende el desarrollo de todo
software de diseño orientado a objetos, se visualice, especifique y documente con lenguaje
común. Se necesitaba un lenguaje que fuese gráfico, a fin de especificar y documentar un
sistema de software, de un modo estándar incluyendo aspectos conceptuales tales como
procesos de negocios y funciones del sistema.
Este lenguaje unificado que cumple con estos requerimientos, es ciertamente UML, el
cual cuenta con una notación estándar y semánticas esenciales para el modelado de un
sistema orientado a objetos.
El lenguaje para modelamiento unificado (UML), es un lenguaje para la
especificación, visualización, construcción y documentación de los artefactos de un proceso
de sistema intensivo. Fue originalmente concebido por la Corporación Rational Software y
tres de los más prominentes métodologistas en la industria de la tecnología y sistemas de
información: Grady Booch, James Rumbaugh, y Ivar Jacobson ("The Three Amigos"). El
lenguaje ha ganado un significante soporte de la industria de varias organizaciones vía el
consorcio de socios de UML y ha sido presentado al Object Management Group (OMG) y
aprobado por éste como un estándar (noviembre 17 de 1997).
OO (Orientado a Objetos).
Hoy en día la tecnología orientada a objetos ya no se aplica solamente a los lenguajes
de programación, además se viene aplicando en el análisis y diseño con mucho éxito, al
igual que en las bases de datos. Es que para hacer una buena programación orientada a
objetos hay que desarrollar todo el sistema aplicando esta tecnología, de ahí la importancia
del análisis y el diseño orientado a objetos.
8. La programación orientada a objetos es una de las formas más populares de
programar y viene teniendo gran acogida en el desarrollo de proyectos de software desde
los últimos años. Esta acogida se debe a sus grandes capacidades y ventajas frente a las
antiguas formas de programar.
La Programación Orientada a Objetos desde el punto de vista computacional "es un
método de implementación en el cuál los programas son organizados como grupos
cooperativos de objetos, cada uno de los cuales representa una instancia de alguna clase, y
estas clases, todas son miembros de una jerarquía de clases unidas vía relaciones de
herencia", donde se destacan las siguientes ventajas:
• Fomenta la reutilización y extensión del código.
• Permite crear sistemas más complejos.
• Relacionar el sistema al mundo real.
• Facilita la creación de programas visuales.
• Construcción de prototipos
• Agiliza el desarrollo de software
• Facilita el trabajo en equipo
• Facilita el mantenimiento del software
ll. Describir cada etapa del diseño de un DW o almacén de datos.
Etapas del Diseño Warehouse
• Origen (Source): Define los orígenes de datos del Almacén de Datos, como los
sistemas de Procesamiento de Transacciones en Línea (On-Line Transaction
Processing, OLTP), las fuentes de datos externas (datos sindicados, datos censales),
etc.
• Integración (Integration): Define el mapeo entre los orígenes de datos y el propio
Almacén de Datos.
• Almacén de Datos (Data Warehouse):Define la estructura del Almacén de Datos.
• Adaptación (Customization): Define el mapeo entre el Almacén de Datos y las
estructuras empleadas por el cliente.
• Cliente (Client): Define las estructuras concretas que son empleadas por los
clientes para acceder al Almacén de Datos, como Data Marts o aplicaciones OLAP.
9. Cada una de las etapas es analizado por las siguientes etapas y en el mismo orden, los
niveles por Etapa del Diseño del Almacén de Datos
• Conceptual: Define el Almacén de Datos desde un punto de vista conceptual, es
decir, desde el mayor nivel de abstracción y contiene únicamente los objetos y
relaciones más importantes.
• Lógico: Abarca aspectos lógicos del diseño del Almacén de Datos, como la
definición de las tablas y claves, la definición de los procesos ETL, etc.
• Físico: Define los aspectos físicos del Almacén de Datos, como el almacenamiento
de las estructuras lógicas en diferentes discos o la configuración de los servidores de
bases de datos que mantienen el almacén de datos.
(http://hp.fciencias.unam.mx/~alg/bd/dwh.pdf)
III. Modelos de DW.
• Star Schema:
10. • Snowflake Shema:
IV) Buscar un área de negocio en el cual sea interesante desarrollar/aplicar BI.
Vamos a trabajar con el área de ventas Belsport.
11. Sucursales
Las sucursales de Belsport las podemos dividir en dos:
• Sucursales de Santiago
• Sucursales de Regiones, las cuales serian las siguientes:
Sucursales Santiago Sucursales Regiones
• Mall Plaza Norte. • Mall Calama.
• Apumanque. • Mall Plaza Antofagasta.
• Mall Parque Arauco. • Copiapó.
• Mall del centro. • Mall Plaza La Serena.
• Paseo Ahumada. • Viña de Mar centro.
• Mall Plaza Alameda. • Mall Valparaíso.
• Paseo Arauco Estación. • Rancagua.
• Mall Plaza Oeste. • Mall Center Curico.
• Mall Arauco Maipú. • Plaza Trébol (Talcahuano).
• Mall Plaza del Sur. • Mall plaza El Roble (Chillan).
• San Bernardo. • Concepción.
• Mall Florida Center. • Mall Plaza Los Ángeles.
• Mall Plaza Vespucio. • Mall Portal Temuco.
• Plaza Puente. • Mall Plaza de Los Ríos (Valdivia)
• Puente Alto. • Mall Paseo Costanera (Pto. Montt)
• Mall Espacio Urbano(Pta. Arenas)
Marcas:
También cada marca la podemos subdividir en los productos que ofrece cada marca;
donde podemos encontrar, accesorios deportivos como:
• Buzos deportivos de diferentes marcas.
• Pantalones deportivos largos y cortos.
• Zapatillas de futbol y baby futbol
• Gorros (de lana y con visera)
• Guantes de arquero y lana.
• Pelotas de futbol, basketball y voleibol.
• Medias deportivas.
• Camisetas de equipo de futbol.
• Canilleras deportivas.
12. Tiempo:
Al ser Belsport una tienda principalmente de ropa y calzado, la podemos dividir en las
temporadas en que trabaja la tienda
Temporada Primavera – Verano
• Día
• Mes
• Año
Temporada Otoño Invierno
• Día
• Mes
• Año
El data Warehouse, quedaría de la siguiente forma:
Ciuda Ciuda
Región Región
Unidades
Sucursales Sucursales
Santiago Regiones
Sucursales
Ventas Tiempo
Rockford
Temporada Temporada
Marca Primavera - Verano Otoño - Invierno
día día
Producto
Monto
mes mes
Categoría
año año
Conclusión.
13. En el presente trabajo, he podido darme cuenta de la importancia de las bases de batos
dentro de una organización y su relevancia para los altos directivos para la toma final de
decisiones. Para la construcción de una base de datos en forma optima y clara, esta debe
seguir todos sus procedimientos para un resultado final optimo y eficiente.
Lo que respecta al datawarehouse, es muy importante mencionar que esta
herramienta, ayuda a disminuir los costos para la organización, además de mantener
siempre el contacto de información entre empresas.
Finalmente me he dado cuenta que importante son las herramientas de la información
en cada ámbito de la empresa y que estas deben ir de la mano con la comunicación debido a
que este termino es muy nombrado, pero a la vez poco utilizado porque la clave es romper
las barreras físicas, para llegar a la estructura interior la cual son las personas. Si no
conquistamos la voluntad de las personas, no podemos asegurar el éxito empresarial.
Preocuparse por la inteligencia y la voluntad de las personas que laboran en la empresa, es
aportar por la excelencia en conjunto con el sistema de información a elaborar.
Como sistemas de información, creo fielmente que es un conjunto de recursos que se
utilizan para gestionar, controlar y transmitir información dentro de una empresa u
organización, es por tal motivo que desde hace varios años atrás, los sistemas de base de
datos han ido reemplazando a los antiguos sistemas de información de las empresas, de
modo que estos contengan muchos mas componentes en donde destaca la rapidez, fluidez y
fácil interpretación de los datos a obtener.