2. Data Warehouse.
Un Data Warehouse es un
almacenamiento separado y
homogéneo donde son
cargados datos
transformados provenientes
de diferentes bases de
datos.
Conceptos Básicos
3. Data Warehouse.
Colección integrada de información corporativa diseñada para la recuperación y el
análisis en apoyo a los procesos de toma de decisiones.
Repositorio completo de datos de la empresa, donde se almacenan datos
estratégicos, tácticos y operativos, al objeto de obtener información estratégica y
táctica
Conceptos Básicos
4. Ventajas - Data Warehouse.
Datos de toda la compañía, organizados para facilitar las
consultas más analíticas que transaccionales.
Los procesos de transformación han sido aplicados a los datos
para permitir un tiempo de respuesta mínimo a las consultas.
Modelo de datos multidimensional para hacer más fácil la
navegación y explotación de datos.
La administración de la seguridad está centralizada para
garantizar la necesidad de información dependiendo del perfil
de los usuarios.
Conceptos Básicos
5. Introducidos los conceptos anteriores, vamos a exponer a continuación un ejemplo
que iremos elaborando a partir de las diferentes fases de construcción de un
dataware house.
“La compañía de alquiler de vehículos Rent4you desea diseñar un dataware house
como sistema de soporte de ayuda a la toma de decisiones estratégicas. La
compañía tiene varias sucursales, en las cuales ofertan alquileres de una amplia
variedad de vehículos como, coches, motos, caravanas, furgonetas, etc.
El dataware house pretende centralizar la información de todas las sucursales con
objetivo de definir nuevas estrategias de negocio. Se quiere analizar tanto las
(alquileres realizados en cada sucursal) así como los gastos para poder estudiar
cuáles son los puntos de venta que más beneficios aportan, los perfiles de los
por tipo de vehículo para ajustar los seguros, la eficiencia de los empleados por
sucursal, etc.
El dataware house se va a alimentar de grandes bases de datos operacionales como
son la de ventas, gastos, clientes y administración de RRHH.”
EJEMPLO:
8. Datamart.
Un subconjunto del
Data Warehouse
para cierto grupo de
usuarios o funciones
del negocio.
Conceptos Básicos
9. Datamart.
Qué es
Es una parte de un DWH
De un fin específico o actividad de negocio
Una solución táctica
Por qué construir un Datamart
Consultas más rápidas y menos usuarios
Tiempo de desarrollo más rápido
Datamarts integrados
Asegurar la consistencia de datos
Requiere de una planeación avanzada
Conceptos Básicos
10. Ejemplos
Por ejemplo, una empresa puede almacenar datos de varias
fuentes, como información de proveedores, pedidos, datos de
sensores, información de empleados y registros financieros en su
almacenamiento de datos o lago de datos. Sin embargo, la
empresa almacena información relevante, por ejemplo, para el
Departamento de Marketing, como reseñas de redes sociales y
registros de clientes, en un data mart.
11. Metadatos.
Los metadatos son datos sobre los datos almacenados.
Por ejemplo, definir los tipos de datos, tamaños, diccionario
de datos, etc.
Es fundamental para una bodega de datos conocer la
naturaleza de los datos y su localización.
Los metadatos pueden proporcionar una visión estandarizada,
facilitan hacer transformaciones y cambios de los datos.
Para desarrollar aplicaciones exitosas es importante compartir
la información de los metadatos.
Conceptos Básicos
12.
13. Son sistemas de información operacionales que facilitan y manejan
aplicaciones orientadas a transacciones.
Manejan gran detalle de cada operación
Ejemplos:
Banca
Aerolíneas
Manufactura
Supermercados
OLTP (Online Transaction Processing).
Conceptos Básicos
14. Tiempo de respuesta corto
Pequeñas transacciones
Operaciones de mantenimiento de datos
Grandes poblaciones de usuarios
Alta concurrencia
Grandes volúmenes de datos
Alta disponibilidad
Uso de datos relacionados con el ciclo de vida
CARACTERÍSTICAS DE OLTP
15. Tecnología que permite la
explotación de datos en
diferentes puntos de vista o
dimensiones
OLAP (Online Analytical Processing).
Conceptos Básicos
16. VENTAJAS DE OLAP EN LA INTELIGENCIA DE
NEGOCIOS
1.Usar OLAP permite aumentar el nivel de abstracción de los datos porque es posible
hacer búsquedas con diferentes estructuras al mismo tiempo.
1.Los usuarios pueden dividir los datos en segmentos fáciles de visualizar y de filtrar,
lo que a su vez permite entender mejor las tendencias o patrones.
1.Es sencillo acceder a los datos que se gestionan con OLAP, así que la información está al
alcance de aquellos equipos que ayudarán a comprender mejor a la empresa o negocio y
por lo tanto habrá una mejor toma de decisiones en la gestión de la empresa.
1.Gracias a la rapidez de la entrega de información segmentada se entienden mejor
las demandas del mercado y de los clientes de la empresa. Esto agiliza los ajustes
necesarios de la oferta para atender las peticiones.
1.Se tiene acceso a la información desde una sola herramienta en la que se deposita
toda la información de todas las áreas de una empresa o negocio, sin importar la
jerarquía.
1.Es más sencillo crear informes y reportes.
1.OLAP simplifica la gestión de datos multidimensionales porque reagrupa, organiza
y ordena la información, no importa de dónde vengan los datos.
18. SISTEMA ROLAP
ROLAP (OLAP Relacional) es un sistema en el cual los datos se
encuentran almacenados en una base de datos relacional.
Típicamente, los datos son detallados, evitando las agregaciones y las
tablas se encuentran normalizadas.
Es el que más se utiliza, y sus siglas corresponden al término en inglés
de Procesamiento Analítico en Línea Relacional. Se considera que es el
ideal para grandes cantidades de datos, pues permite escalar esta
cantidad de información.
Entre sus ventajas destacan su rapidez y permite acceso a cualquier
usuario que se encuentre en la base de datos relacionados con el uso
de herramientas SQL aunque no almacena los resultados
19. NIVELES ROLAP
El sistema ROLAP utiliza una arquitectura de tres niveles. La base de
datos relacional maneja los requerimientos de almacenamiento de
datos, y el motor ROLAP proporciona la funcionalidad analítica.
•El nivel de base de datos usa bases de datos relacionales para
el manejo, acceso y obtención del dato.
•El nivel de aplicación es el motor que ejecuta las consultas
multidimensionales de los usuarios.
•El motor ROLAP se integra con niveles de presentación, a través de los
cuales los usuarios realizan
los análisis OLAP.
20.
21. SISTEMA MOLAP
En un sistema MOLAP (OLAP multidimensional) los datos se
encuentran almacenados en una estructura multidimensional.
Para optimizar los tiempos de respuesta, el resumen de la
información es usualmente calculado por adelantado. Estos
valores precalculados o agregaciones son la base de las
ganancias de desempeño de este sistema.
Algunos sistemas utilizan técnicas de compresión de datos
para disminuir el espacio de almacenamiento en disco debido
a los valores precalculados.
22. NIVELES MOLAP
•La base de datos multidimensional es la
encargada del manejo, acceso y obtención del
dato.
•El nivel de aplicación es el responsable de la ejecución de
los requerimientos OLAP. El nivel de presentación se
integra con el de aplicación y proporciona un interfaz a
través del cual los usuarios finales visualizan los análisis
OLAP. Una arquitectura cliente/servidor permite a varios
usuarios acceder a la misma base de datos
multidimensional.
23. HOLAP
Un sistema HOLAP (OLAP Híbrido) mantiene
los registros detallados en la base de datos
relacional, mientras que los datos resumidos o
agregados se almacenan en una base de
datos multidimensional separada. Este
método de almacenamiento es una
combinación de los dos anteriores e intenta
rescatar lo mejor de cada uno.
Aunque no es tan bueno para los datos
complejos (que necesitan varios vectores), es
una buena opción para las empresas que no
son de gran tamaño y cuya operación no es
complicada.
24. OLTP - OLAP
Característica OLTP OLAP
Tamaño BBDD GigaBytes Giga a TeraBytes
Origen Datos Interno Interno y Externo
Actualización On-Line Batch
Periodos Actual Histórico
Consultas Predecibles Ad Hoc
Actividad Operacional Analítica
Conceptos Básicos