SlideShare una empresa de Scribd logo
1 de 31
DATA WAREHOUSE Ing. Erick Espinoza Torpoco Ing. Hans Camayo Peña Ing. Markos, Jorge Gonzales Ing. Jesus, Conde Pérez Ing. Edson Pablo Morales
INTRODUCCION Desde los inicios de la era de la computadora, las organizaciones  ha usado los datos desde sus sistemas operacionales para entender sus necesidades de información. El data warehouse, es el centro de las grandes instituciones, por que provee un ambiente para que las organizaciones hagan un mejor uso de la información que esta siendo administrada por diversas aplicaciones operacionales. Data warehouse es una colección de datos en la cual se encuentra integrada la información, no volátil de tiempo variante que se usa como soporte para la toma de decisiones. Al reunir los elementos de datos apropiados desde diversas fuentes, simplifica el proceso de análisis y consultas de esta información en menos tiempo. Un data warehouse se crea al extraer la información desde una o más bases de datos, esta información es transformada para eliminar inconsistencias y luego es cargada en la datawarehouse. La innovación que se brinda dentro de un ambiente datawarehousing, puede permitir a cualquier organización hacer un uso optimo de los datos, y hacer la toma de decisiones mas efectiva.  El data warehouse es siempre un almacén de datos transformados y separados de la aplicación o base de donde se encontraron.
SISTEMAS DE INFORMACION ESTATREGICO TACTICO TECNICO-OPERATIVO INTERINSTUCIONAL
SISTEMAS DE INFORMACION ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
CARACTERISTICAS ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],Los datos de un Warehouse difieren de los datos operacionales usados por las aplicaciones de producción.  Base de datos Operacional Data Warehouse
CARACTERISTICAS ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
ESTRUCTURA Detalle histórico de los datos Detalle actual Ligeramente resumido Altamente resumido
ARQUITECTURA DE UN DATAWAREHOUSE Nos sirve para comprender como se relacionan los componentes involucrados en una estrategia de Datawarehouse. INTERFAZ ADMINISTRADOR DE CONSULTAS INTEGRADOR DATAWAREHOUSE EXTRACTOR / MONITOR EXTRACTOR / MONITOR FUENTE FUENTE
ELEMENTOS CONSTITUYENTES DE UNA ARQUITECTURA DATAWAREHOUSE En la parte inferior de la figura se pueden ver las  fuente s  conectadas a un  extractor / monitor .  El extractor  es el responsable de homogenizar la información.  El monitor  es el responsable de detectar los cambios que puedan ser realizados en las fuentes y reportarlos al integrador. El integrador  recibe los resultados de los extractores y después de integrarlos, los carga al DW. Para poder cargar la información, se debe diseñar una estructura, para almacenar los datos, el esquema multidimensional del DW. El administrador de consultas  se encarga de organizar las consultas y seleccionar los operadores para permitir su análisis. Para explicar la actividad de un DW podemos identificar dos grandes fases: construcción y explotación. La fase de construcción se refiere al diseño e implementación de herramientas encargados de llevar los datos de las fuentes al repositorio. Tomando en cuenta que se debe integrar y homogenizar la información previamente. Un proceso posterior pero asociad a esta mis fase es el proceso de mantenimiento. Este se encarga de llevar los datos nuevos al DW.
En la fase de explotación se lleva a cabo el análisis de los datos almacenados dentro del DW a través de técnicas que facilitan y hacen mas eficiente su consulta. Ya con el DW poblado lo ultimo es diseñar e implementar una interfaz que le permita al usuario final interactuar con el repositorio, brindándole todas las ventajas del análisis de la información. MODELO MULTIDIMENSIONAL El modelo multidimensional describe la organización de la información en un DW. Define los conceptos para agregar hechos a lo largo de muchos atributos, llamados dimensiones. CONCEPTOS. Dimensión. Una dimensión representa una perspectiva de los datos. Las dimensiones son usadas para seleccionar y agregar datos a un cierto nivel deseado de detalle. Podemos definir el concepto de dimensión como el grado de libertad de movimiento en el espacio. Entenderemos esta libertad como el numero de direcciones ortogonales diferentes que podamos tomar.
Las dimensiones se relacionan en jerarquías o niveles. Por ejemplo, la dimensión Zona puede tener los siguientes niveles: ciudad, estado, región, país y continente. ,[object Object],[object Object],[object Object],[object Object],[object Object]
[object Object],[object Object],[object Object],[object Object],Cubo. Una instancia del modelo multidimensional, esquema multidimensional, es conocida como Cubo o hipercubo de n dimensiones. Cuando la gente observa los datos de un cubo de n dimensiones, es mas fácil interpretar la información que contiene dicho cubo, así como las distintas operaciones que se le pueden realizar.
Para ejemplificar consideramos la existencia de una aplicación que realiza la venta de juguetes. Para organizar sus ventas se define el cubo formado por las dimensiones producto, tiempo y región. La figura presenta el esquema multidimensional de un DW para la venta de productos que organiza un conjunto de medidas según las dimensiones REGION, TIEMPO y PRODUCTO. ESQUEMA MULTIDIMENSIONAL
Cada dimensión tiene asociada una jerarquía de niveles que denota la granularidad de observación de la medida con respecto a una dimensión. Por ejemplo, la dimensión REGION se organiza por Ciudad-Estado-Región-País. Así se puede observar la cantidad de muñecas vendidas el martes 26 en la tienda ubicada en la ciudad de Puebla. ESQUEMA DE REPRESENTACION Un esquema multidimensional puede instrumentarse usando un esquema relacional en estrella (Star Schema) o usando un esquema copo de nieve (Snow Flake Schema). Un esquema de estrella esta formado por una tabla para cada dimensión y una tabla principal de hechos. En la tabla de hechos cada uno de los atributos es a una llave extranjera hacia cada tabla de dimensión como se puede apreciar en la sig. figura. ESQUEMA EN ESTRELLA Región Id Ciudad Nombre Dirección Región Tiempo Id Tiempo Fecha Producto Id Producto Descripción Marca Grupo Familia Tipo Precio Medida Id Producto Id Ciudad Id Tiempo unid vendidas
En un esquema copo de nieve las tablas de dimensiones están normalizadas. Esto evita redundancia en los datos. Este esquema representa mejor la semántica de las dimensiones del ambiente de negocios, ya que tiene un acceso mas directos a los datos. Región Id Ciudad Nombre Dirección Tiempo Id Tiempo día Producto Id Producto Descripción Marca Tipo Precio Id Región Región Id Tiempo mes Id Tiempo año Id Grupo grupo Id Familia familia Medida Id Producto Id Ciudad Id Tiempo unid vendidas
CONSTRUCCION Y MANTENIMIENTO DE UN DW CONSTRUCCIÓN. Para poder llevar a cabo la construcción del DW, se necesitan herramientas de extracción de datos a partir de las fuentes externas. Estas herramientas extraen y homogenizan los datos y se comunican con un integrados que integra los datos con respecto al esquema del DW. La figura siguiente presenta la arquitecta del mecanismo de construcción de un DW que consiste en un conjunto de extractores asociados a las fuentes. Un extractor con la fuente para extraer la información y la transforma a una representación comprendida por un integrador. El extractor conoce el formato de las fuentes, el formato de representación de datos del DW, el protocolo de comunicación y la ubicación de ambos. INTEGRADOR DATAWAREHOUSE EXTRACTOR / MONITOR FUENTE FUENTE FUENTE EXTRACTOR / MONITOR EXTRACTOR / MONITOR
El integrador integra la información y calcula los valores agregados con respecto al esquema del DW. Las tareas principales del integrador son: combinar los datos obtenidos de las diversas fuentes y cargar estos datos ya integrados en el DW. ,[object Object],[object Object],[object Object],[object Object],[object Object]
[object Object],[object Object],[object Object],El refrescado de un DW esta considerado como un problema difícil debido a las siguientes razones: EXPLOTACIÓN DE UN DW La explotación consiste en llevar a cabo consultas al DW. Cuando hablamos de consultas nos referimos a la manipulación, análisis y visualización de la información que realiza el usuario sobre la información del DW. Para el análisis de los datos almacenados en el QW se utiliza la tecnología OLAP (On Line Analytical Proccesing). Esta tecnología cuenta con operadores tales como: Slice´n dice roll-up y drill down.
Slice´n dice permite restringir los valores asociados a una o varias dimensiones del cubo, es decir, toma un subconjunto de dimensiones y de niveles seleccionados del DW. En la sig. figura se observa un ejemplo en el que se restringe el resultado para analizar solo las ventas de las cubetas y los trapeadores en 2003 y 2002 en Monterrey y Puebla.
Roll up agrega medidas que van de un nivel Ni a un nivel mas general Nj de una dimensión. Permite analizar la información a través de diferentes niveles de granularidad de las dimensiones. Drill down es la operación inversa. A partir de un nivel superior este operador permitir bajar de nivel. En la sig. figura se observa un claro ejemplo de cómo la dimensión tiempo cambia de nivel días a meses y viceversa.
CONSIDERACIONES ADICIONALES AL CONSTRUIR EL DW ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],Excepciones en el DW.
* Aplicación Piloto. - Una prueba limitada para medir el beneficio de manera clara ORGANIZACION DEL PROYECTO 1.  Factores en la Planificación del DW. : * Asociación entre Usuarios, Gestores y Grupos. - Información que satisfaga los requerimientos de la empresa. - Selección de Herramientas. * Prototipos . - Verificar la necesidades del usuario durante el proceso de    implementación. * Implementación Incremental. - Reduce riesgos y controla el tamaño del proyecto para que sea manejable. * Reportar y Publicar casos exitosos. - Publicidad interna de cómo le ayuda a la gente que ya lo utiliza
* Primero. - Acceso fácil al directorio de datos y gestión del proceso. - Entrenamiento al usuario final. - Uso de las Instalaciones del DW. 2. Estrategias para el Desarrollo del DW. : Desarrollar un estrategia apropiada a las necesidades de los usuarios. * Segundo. - Construir una copia de los datos operacionales. Esto por si los datos existente son de mala calidad. * Tercero. - Seleccionar el numero de usuarios. - Construir prototipos para los usuarios final para poder experimentar o  modificar su es necesario. - Cargar los datos de los sistemas existentes o de fuentes externas.
* Se requiere en ocasiones una Reingeniería de Proceso del Negocio. 3. Estrategias para el Diseño del DW. : * Estrategia de diseño de afuera hacia adentro (outside-in). * Los usuarios no conocen sus requerimientos, como los usuarios operacionales.  * Reconocer que el mantenimiento de la estructura del DW es critica. 4. Estrategias para la Gestión de un Diseño del DW. : * Esto solo es una buena inversión si los usuarios finales consiguen información vital y rápida.
DESARROLLO DE UN PROYECTO. * Puede contener toda la infamación de la empresa desde su inicio, o tan limitado a un gerente durante un año. Almacenaje de  un DW. * Estos significa que los usuarios finales pueden acceder a bases operacionales directamente, usando cualquier herramienta (red de acceso de datos). Virtual o Point to Point. * Se seleccionan donde hay necesidades comunes de información y un gran numero de usuarios. DW Centrales * Los componentes de deposito se distribuyen en un numero de bases de datos físicas diferentes. DW Distribuidos *  Ejecutivos y gerentes * “Power users” o “Buzo de Información”. Analistas financieros, Ingenieros,  *  Usuarios de soporte. De oficinas, administrativos. Tipo De Usuario
* Esta integrado por un servidor de Hardware * Los DBMS que conforman el dispositivo. (Sistemas de Gestión de Base de Batos.) 1) Arquitectura total del deposito. Estructura física de la base de datos de deposito. BLOQUES CLAVES DE CONSTRUCCIÓN. ELEMENTOS CLAVES PARA EL DESARROLLO. a) DW Integrado o centralizado; Las bases de datos separados son todos integrados y físicamente almacenados en la misma plataforma. Financiero Comercio Manufactura Distribución Mainframe Usuario Final Data Warehouse Corporativo Servidor Local
b) Arquitectura Global; Los datos es consolidad lógicamente pero se almacena por separado sin las bases de datos físicamente relacionadas, en el mismo lugar físico. Financiero Comercio Manufactura Distribución Corporativo Data Warehouse Usuario Final
c) Arquitectura por Niveles; Datos altamente resumidos en la 1er estación de trabajo del usuario, con resúmenes mas detallaos en el 2do. servidor y mas detallada en el 3er servidor. Financiero Comercio Manufactura Distribución Corporativo Data Warehouse Estación de Trabajo Modelos Complementarios de datos Nivel 1 Nivel 2 Nivel 3 Financiero Comercio Manufactura Distribución
2) Arquitectura del servidor. Estructura física de la base de datos de deposito. BLOQUES CLAVES DE CONSTRUCCIÓN. a) De un solo Servidor; Fácil de administrar pero con limitaciones de potencia de procesamiento y escalabilidad. b) Multiprocesamiento Simétrico (SMP); Adición de procesadores que comparten la memoria interna de los servidores y de los dispositivos de almacenaje del disco. c) Procesamiento en Paralelo Masivo (MMP); Conjunto de procesadores con un enlace de banda ancha y de alta velocidad. Cada modo es un servidor con su propio procesador SMP y memoria interna. d) Acceso de memoria no uniforme (NUMA); Se crea con una sola gran maquina SMP al conectar múltiples nodos en uno solo, ventajas en la gestión y simplicidad de un ambiente SMP.
3) Sistema de Gestión de Base de Datos. Los Relational Data Base Managment Systems (RDBMS); son muy flexibles cuando se usan con una estructura de datos normalizada y tienen la capacidad para efectuar consultas con un único objetivo concreto. BLOQUES CLAVES DE CONSTRUCCIÓN. Base Normalizada, las estructura de datos son No Redundantes y que representan las entidades  básicas. Los modelos super relacionados soportan extensiones para almacenar formatos,  operaciones y diagramas indexacion especializados.
BIBLIOGRAFIA Data Wareahousing (http://porgramacion.com/bbdd/tutorial/warehouse/ GRACIAS

Más contenido relacionado

La actualidad más candente

La actualidad más candente (20)

Data warehouse
Data warehouseData warehouse
Data warehouse
 
Data warehouse
Data warehouseData warehouse
Data warehouse
 
Que Es Un Data Warehouse
Que Es Un Data WarehouseQue Es Un Data Warehouse
Que Es Un Data Warehouse
 
Datawarehouse
DatawarehouseDatawarehouse
Datawarehouse
 
DATAWAREHOUSE, importancia del almacén de datos
DATAWAREHOUSE, importancia del almacén de datosDATAWAREHOUSE, importancia del almacén de datos
DATAWAREHOUSE, importancia del almacén de datos
 
Que Es Un Data Warehouse
Que Es Un Data WarehouseQue Es Un Data Warehouse
Que Es Un Data Warehouse
 
Data warehouse
Data warehouseData warehouse
Data warehouse
 
Que Es Un Datawarehouse
Que Es Un DatawarehouseQue Es Un Datawarehouse
Que Es Un Datawarehouse
 
Almacén de datos
Almacén de datosAlmacén de datos
Almacén de datos
 
Almacenes de datos
Almacenes de datosAlmacenes de datos
Almacenes de datos
 
Data mart-data-warehouse-data-mining
Data mart-data-warehouse-data-miningData mart-data-warehouse-data-mining
Data mart-data-warehouse-data-mining
 
Data warehouse
Data warehouseData warehouse
Data warehouse
 
Datawarehouse práctica 6
Datawarehouse   práctica 6Datawarehouse   práctica 6
Datawarehouse práctica 6
 
Almacen de datos
Almacen de datosAlmacen de datos
Almacen de datos
 
Datawarehouse
DatawarehouseDatawarehouse
Datawarehouse
 
Almacen de datos
Almacen de datosAlmacen de datos
Almacen de datos
 
Diseño de un Datamart
Diseño de un DatamartDiseño de un Datamart
Diseño de un Datamart
 
Almacén de datos
Almacén de datosAlmacén de datos
Almacén de datos
 
Topicos de ingeneria_de_sistema_sii_calzada1
Topicos de ingeneria_de_sistema_sii_calzada1Topicos de ingeneria_de_sistema_sii_calzada1
Topicos de ingeneria_de_sistema_sii_calzada1
 
Modelado de Data Warehouse
Modelado de Data WarehouseModelado de Data Warehouse
Modelado de Data Warehouse
 

Destacado

Construcción de un DataWareHouse - FISI - UNMSM - DataWareHouse
Construcción de un DataWareHouse - FISI - UNMSM - DataWareHouseConstrucción de un DataWareHouse - FISI - UNMSM - DataWareHouse
Construcción de un DataWareHouse - FISI - UNMSM - DataWareHouseJulio Pari
 
Analisys services 2005 cubos olap con o sin data warehouse
Analisys services 2005 cubos olap con o sin data warehouseAnalisys services 2005 cubos olap con o sin data warehouse
Analisys services 2005 cubos olap con o sin data warehouseSalvador Ramos
 
Tareas 1- 4 Olap, Molap Y Rolap
Tareas 1- 4 Olap, Molap Y RolapTareas 1- 4 Olap, Molap Y Rolap
Tareas 1- 4 Olap, Molap Y Rolapbrenda carolina
 
Los sistemas-de-informacion-de-la-mercadotecnia-sim
Los sistemas-de-informacion-de-la-mercadotecnia-simLos sistemas-de-informacion-de-la-mercadotecnia-sim
Los sistemas-de-informacion-de-la-mercadotecnia-simabigail
 
Sistema de Información de Mercadotecnia (SIM)
Sistema de Información de Mercadotecnia (SIM)Sistema de Información de Mercadotecnia (SIM)
Sistema de Información de Mercadotecnia (SIM)Miguel Angel
 

Destacado (8)

Construcción de un DataWareHouse - FISI - UNMSM - DataWareHouse
Construcción de un DataWareHouse - FISI - UNMSM - DataWareHouseConstrucción de un DataWareHouse - FISI - UNMSM - DataWareHouse
Construcción de un DataWareHouse - FISI - UNMSM - DataWareHouse
 
Datawarehouse
DatawarehouseDatawarehouse
Datawarehouse
 
Sim
SimSim
Sim
 
Analisys services 2005 cubos olap con o sin data warehouse
Analisys services 2005 cubos olap con o sin data warehouseAnalisys services 2005 cubos olap con o sin data warehouse
Analisys services 2005 cubos olap con o sin data warehouse
 
Tareas 1- 4 Olap, Molap Y Rolap
Tareas 1- 4 Olap, Molap Y RolapTareas 1- 4 Olap, Molap Y Rolap
Tareas 1- 4 Olap, Molap Y Rolap
 
Cubos ppt
Cubos pptCubos ppt
Cubos ppt
 
Los sistemas-de-informacion-de-la-mercadotecnia-sim
Los sistemas-de-informacion-de-la-mercadotecnia-simLos sistemas-de-informacion-de-la-mercadotecnia-sim
Los sistemas-de-informacion-de-la-mercadotecnia-sim
 
Sistema de Información de Mercadotecnia (SIM)
Sistema de Información de Mercadotecnia (SIM)Sistema de Información de Mercadotecnia (SIM)
Sistema de Información de Mercadotecnia (SIM)
 

Similar a DATA WAREHOUSE

Similar a DATA WAREHOUSE (20)

Bussiness inteligence
Bussiness inteligenceBussiness inteligence
Bussiness inteligence
 
tarea 3 ayudantia
tarea 3 ayudantiatarea 3 ayudantia
tarea 3 ayudantia
 
tarea 4 ayudantia
tarea 4 ayudantiatarea 4 ayudantia
tarea 4 ayudantia
 
Data warehouse
Data warehouseData warehouse
Data warehouse
 
Data Warehouse
Data WarehouseData Warehouse
Data Warehouse
 
Data warehouse
Data warehouseData warehouse
Data warehouse
 
Data warehouse.
Data warehouse.Data warehouse.
Data warehouse.
 
Data warehouse
Data warehouseData warehouse
Data warehouse
 
Data warehouse
Data warehouseData warehouse
Data warehouse
 
Data warehouse
Data warehouseData warehouse
Data warehouse
 
Data warehouse
Data warehouseData warehouse
Data warehouse
 
Data warehouse
Data warehouseData warehouse
Data warehouse
 
Data warehouse
Data warehouseData warehouse
Data warehouse
 
Data warehouse
Data warehouseData warehouse
Data warehouse
 
Trabajo de sistemas tarea 4[1]
Trabajo de sistemas tarea 4[1]Trabajo de sistemas tarea 4[1]
Trabajo de sistemas tarea 4[1]
 
Trabajo de sistemas tarea 4
Trabajo de sistemas tarea 4Trabajo de sistemas tarea 4
Trabajo de sistemas tarea 4
 
Tarea 3 Ayudantía
Tarea 3 AyudantíaTarea 3 Ayudantía
Tarea 3 Ayudantía
 
Data warehouse
Data warehouseData warehouse
Data warehouse
 
Minería de datos Presentación
Minería de datos PresentaciónMinería de datos Presentación
Minería de datos Presentación
 
Minera de-datos-presentacin-1205263710628735-3
Minera de-datos-presentacin-1205263710628735-3Minera de-datos-presentacin-1205263710628735-3
Minera de-datos-presentacin-1205263710628735-3
 

Más de Grupo Dos

Más de Grupo Dos (8)

Qd
QdQd
Qd
 
Ps
PsPs
Ps
 
Pensamiento sistémico
Pensamiento sistémicoPensamiento sistémico
Pensamiento sistémico
 
Micro macro
Micro macroMicro macro
Micro macro
 
Tecnica
TecnicaTecnica
Tecnica
 
SISTEMAS
SISTEMASSISTEMAS
SISTEMAS
 
Tecnica y tecnologia
Tecnica y tecnologiaTecnica y tecnologia
Tecnica y tecnologia
 
Qué es la web 2
Qué es la web 2Qué es la web 2
Qué es la web 2
 

Último

El uso de las tic en la vida ,lo importante que son
El uso de las tic en la vida ,lo importante  que sonEl uso de las tic en la vida ,lo importante  que son
El uso de las tic en la vida ,lo importante que son241514984
 
Los Microcontroladores PIC, Aplicaciones
Los Microcontroladores PIC, AplicacionesLos Microcontroladores PIC, Aplicaciones
Los Microcontroladores PIC, AplicacionesEdomar AR
 
El_Blog_como_herramienta_de_publicacion_y_consulta_de_investigacion.pptx
El_Blog_como_herramienta_de_publicacion_y_consulta_de_investigacion.pptxEl_Blog_como_herramienta_de_publicacion_y_consulta_de_investigacion.pptx
El_Blog_como_herramienta_de_publicacion_y_consulta_de_investigacion.pptxAlexander López
 
AREA TECNOLOGIA E INFORMATICA TRABAJO EN EQUIPO
AREA TECNOLOGIA E INFORMATICA TRABAJO EN EQUIPOAREA TECNOLOGIA E INFORMATICA TRABAJO EN EQUIPO
AREA TECNOLOGIA E INFORMATICA TRABAJO EN EQUIPOnarvaezisabella21
 
GonzalezGonzalez_Karina_M1S3AI6... .pptx
GonzalezGonzalez_Karina_M1S3AI6... .pptxGonzalezGonzalez_Karina_M1S3AI6... .pptx
GonzalezGonzalez_Karina_M1S3AI6... .pptx241523733
 
Medidas de formas, coeficiente de asimetría y coeficiente de curtosis.pptx
Medidas de formas, coeficiente de asimetría y coeficiente de curtosis.pptxMedidas de formas, coeficiente de asimetría y coeficiente de curtosis.pptx
Medidas de formas, coeficiente de asimetría y coeficiente de curtosis.pptxaylincamaho
 
FloresMorales_Montserrath_M1S3AI6 (1).pptx
FloresMorales_Montserrath_M1S3AI6 (1).pptxFloresMorales_Montserrath_M1S3AI6 (1).pptx
FloresMorales_Montserrath_M1S3AI6 (1).pptx241522327
 
La Electricidad Y La Electrónica Trabajo Tecnología.pdf
La Electricidad Y La Electrónica Trabajo Tecnología.pdfLa Electricidad Y La Electrónica Trabajo Tecnología.pdf
La Electricidad Y La Electrónica Trabajo Tecnología.pdfjeondanny1997
 
Actividad integradora 6 CREAR UN RECURSO MULTIMEDIA
Actividad integradora 6    CREAR UN RECURSO MULTIMEDIAActividad integradora 6    CREAR UN RECURSO MULTIMEDIA
Actividad integradora 6 CREAR UN RECURSO MULTIMEDIA241531640
 
LUXOMETRO EN SALUD OCUPACIONAL(FINAL).ppt
LUXOMETRO EN SALUD OCUPACIONAL(FINAL).pptLUXOMETRO EN SALUD OCUPACIONAL(FINAL).ppt
LUXOMETRO EN SALUD OCUPACIONAL(FINAL).pptchaverriemily794
 
Tecnologias Starlink para el mundo tec.pptx
Tecnologias Starlink para el mundo tec.pptxTecnologias Starlink para el mundo tec.pptx
Tecnologias Starlink para el mundo tec.pptxGESTECPERUSAC
 
Mapa-conceptual-del-Origen-del-Universo-3.pptx
Mapa-conceptual-del-Origen-del-Universo-3.pptxMapa-conceptual-del-Origen-del-Universo-3.pptx
Mapa-conceptual-del-Origen-del-Universo-3.pptxMidwarHenryLOZAFLORE
 
Crear un recurso multimedia. Maricela_Ponce_DomingoM1S3AI6-1.pptx
Crear un recurso multimedia. Maricela_Ponce_DomingoM1S3AI6-1.pptxCrear un recurso multimedia. Maricela_Ponce_DomingoM1S3AI6-1.pptx
Crear un recurso multimedia. Maricela_Ponce_DomingoM1S3AI6-1.pptxNombre Apellidos
 
Red Dorsal Nacional de Fibra Óptica y Redes Regionales del Perú
Red Dorsal Nacional de Fibra Óptica y Redes Regionales del PerúRed Dorsal Nacional de Fibra Óptica y Redes Regionales del Perú
Red Dorsal Nacional de Fibra Óptica y Redes Regionales del PerúCEFERINO DELGADO FLORES
 
tarea de exposicion de senati zzzzzzzzzz
tarea de exposicion de senati zzzzzzzzzztarea de exposicion de senati zzzzzzzzzz
tarea de exposicion de senati zzzzzzzzzzAlexandergo5
 
Presentación inteligencia artificial en la actualidad
Presentación inteligencia artificial en la actualidadPresentación inteligencia artificial en la actualidad
Presentación inteligencia artificial en la actualidadMiguelAngelVillanuev48
 
El uso de las TIC's en la vida cotidiana.
El uso de las TIC's en la vida cotidiana.El uso de las TIC's en la vida cotidiana.
El uso de las TIC's en la vida cotidiana.241514949
 
Presentación sobre la Inteligencia Artificial
Presentación sobre la Inteligencia ArtificialPresentación sobre la Inteligencia Artificial
Presentación sobre la Inteligencia Artificialcynserafini89
 
Modelo de Presentacion Feria Robotica Educativa 2024 - Versión3.pptx
Modelo de Presentacion Feria Robotica Educativa 2024 - Versión3.pptxModelo de Presentacion Feria Robotica Educativa 2024 - Versión3.pptx
Modelo de Presentacion Feria Robotica Educativa 2024 - Versión3.pptxtjcesar1
 
Excel (1) tecnologia.pdf trabajo Excel taller
Excel  (1) tecnologia.pdf trabajo Excel tallerExcel  (1) tecnologia.pdf trabajo Excel taller
Excel (1) tecnologia.pdf trabajo Excel tallerValentinaTabares11
 

Último (20)

El uso de las tic en la vida ,lo importante que son
El uso de las tic en la vida ,lo importante  que sonEl uso de las tic en la vida ,lo importante  que son
El uso de las tic en la vida ,lo importante que son
 
Los Microcontroladores PIC, Aplicaciones
Los Microcontroladores PIC, AplicacionesLos Microcontroladores PIC, Aplicaciones
Los Microcontroladores PIC, Aplicaciones
 
El_Blog_como_herramienta_de_publicacion_y_consulta_de_investigacion.pptx
El_Blog_como_herramienta_de_publicacion_y_consulta_de_investigacion.pptxEl_Blog_como_herramienta_de_publicacion_y_consulta_de_investigacion.pptx
El_Blog_como_herramienta_de_publicacion_y_consulta_de_investigacion.pptx
 
AREA TECNOLOGIA E INFORMATICA TRABAJO EN EQUIPO
AREA TECNOLOGIA E INFORMATICA TRABAJO EN EQUIPOAREA TECNOLOGIA E INFORMATICA TRABAJO EN EQUIPO
AREA TECNOLOGIA E INFORMATICA TRABAJO EN EQUIPO
 
GonzalezGonzalez_Karina_M1S3AI6... .pptx
GonzalezGonzalez_Karina_M1S3AI6... .pptxGonzalezGonzalez_Karina_M1S3AI6... .pptx
GonzalezGonzalez_Karina_M1S3AI6... .pptx
 
Medidas de formas, coeficiente de asimetría y coeficiente de curtosis.pptx
Medidas de formas, coeficiente de asimetría y coeficiente de curtosis.pptxMedidas de formas, coeficiente de asimetría y coeficiente de curtosis.pptx
Medidas de formas, coeficiente de asimetría y coeficiente de curtosis.pptx
 
FloresMorales_Montserrath_M1S3AI6 (1).pptx
FloresMorales_Montserrath_M1S3AI6 (1).pptxFloresMorales_Montserrath_M1S3AI6 (1).pptx
FloresMorales_Montserrath_M1S3AI6 (1).pptx
 
La Electricidad Y La Electrónica Trabajo Tecnología.pdf
La Electricidad Y La Electrónica Trabajo Tecnología.pdfLa Electricidad Y La Electrónica Trabajo Tecnología.pdf
La Electricidad Y La Electrónica Trabajo Tecnología.pdf
 
Actividad integradora 6 CREAR UN RECURSO MULTIMEDIA
Actividad integradora 6    CREAR UN RECURSO MULTIMEDIAActividad integradora 6    CREAR UN RECURSO MULTIMEDIA
Actividad integradora 6 CREAR UN RECURSO MULTIMEDIA
 
LUXOMETRO EN SALUD OCUPACIONAL(FINAL).ppt
LUXOMETRO EN SALUD OCUPACIONAL(FINAL).pptLUXOMETRO EN SALUD OCUPACIONAL(FINAL).ppt
LUXOMETRO EN SALUD OCUPACIONAL(FINAL).ppt
 
Tecnologias Starlink para el mundo tec.pptx
Tecnologias Starlink para el mundo tec.pptxTecnologias Starlink para el mundo tec.pptx
Tecnologias Starlink para el mundo tec.pptx
 
Mapa-conceptual-del-Origen-del-Universo-3.pptx
Mapa-conceptual-del-Origen-del-Universo-3.pptxMapa-conceptual-del-Origen-del-Universo-3.pptx
Mapa-conceptual-del-Origen-del-Universo-3.pptx
 
Crear un recurso multimedia. Maricela_Ponce_DomingoM1S3AI6-1.pptx
Crear un recurso multimedia. Maricela_Ponce_DomingoM1S3AI6-1.pptxCrear un recurso multimedia. Maricela_Ponce_DomingoM1S3AI6-1.pptx
Crear un recurso multimedia. Maricela_Ponce_DomingoM1S3AI6-1.pptx
 
Red Dorsal Nacional de Fibra Óptica y Redes Regionales del Perú
Red Dorsal Nacional de Fibra Óptica y Redes Regionales del PerúRed Dorsal Nacional de Fibra Óptica y Redes Regionales del Perú
Red Dorsal Nacional de Fibra Óptica y Redes Regionales del Perú
 
tarea de exposicion de senati zzzzzzzzzz
tarea de exposicion de senati zzzzzzzzzztarea de exposicion de senati zzzzzzzzzz
tarea de exposicion de senati zzzzzzzzzz
 
Presentación inteligencia artificial en la actualidad
Presentación inteligencia artificial en la actualidadPresentación inteligencia artificial en la actualidad
Presentación inteligencia artificial en la actualidad
 
El uso de las TIC's en la vida cotidiana.
El uso de las TIC's en la vida cotidiana.El uso de las TIC's en la vida cotidiana.
El uso de las TIC's en la vida cotidiana.
 
Presentación sobre la Inteligencia Artificial
Presentación sobre la Inteligencia ArtificialPresentación sobre la Inteligencia Artificial
Presentación sobre la Inteligencia Artificial
 
Modelo de Presentacion Feria Robotica Educativa 2024 - Versión3.pptx
Modelo de Presentacion Feria Robotica Educativa 2024 - Versión3.pptxModelo de Presentacion Feria Robotica Educativa 2024 - Versión3.pptx
Modelo de Presentacion Feria Robotica Educativa 2024 - Versión3.pptx
 
Excel (1) tecnologia.pdf trabajo Excel taller
Excel  (1) tecnologia.pdf trabajo Excel tallerExcel  (1) tecnologia.pdf trabajo Excel taller
Excel (1) tecnologia.pdf trabajo Excel taller
 

DATA WAREHOUSE

  • 1. DATA WAREHOUSE Ing. Erick Espinoza Torpoco Ing. Hans Camayo Peña Ing. Markos, Jorge Gonzales Ing. Jesus, Conde Pérez Ing. Edson Pablo Morales
  • 2. INTRODUCCION Desde los inicios de la era de la computadora, las organizaciones ha usado los datos desde sus sistemas operacionales para entender sus necesidades de información. El data warehouse, es el centro de las grandes instituciones, por que provee un ambiente para que las organizaciones hagan un mejor uso de la información que esta siendo administrada por diversas aplicaciones operacionales. Data warehouse es una colección de datos en la cual se encuentra integrada la información, no volátil de tiempo variante que se usa como soporte para la toma de decisiones. Al reunir los elementos de datos apropiados desde diversas fuentes, simplifica el proceso de análisis y consultas de esta información en menos tiempo. Un data warehouse se crea al extraer la información desde una o más bases de datos, esta información es transformada para eliminar inconsistencias y luego es cargada en la datawarehouse. La innovación que se brinda dentro de un ambiente datawarehousing, puede permitir a cualquier organización hacer un uso optimo de los datos, y hacer la toma de decisiones mas efectiva. El data warehouse es siempre un almacén de datos transformados y separados de la aplicación o base de donde se encontraron.
  • 3. SISTEMAS DE INFORMACION ESTATREGICO TACTICO TECNICO-OPERATIVO INTERINSTUCIONAL
  • 4.
  • 5.
  • 6.
  • 7. ESTRUCTURA Detalle histórico de los datos Detalle actual Ligeramente resumido Altamente resumido
  • 8. ARQUITECTURA DE UN DATAWAREHOUSE Nos sirve para comprender como se relacionan los componentes involucrados en una estrategia de Datawarehouse. INTERFAZ ADMINISTRADOR DE CONSULTAS INTEGRADOR DATAWAREHOUSE EXTRACTOR / MONITOR EXTRACTOR / MONITOR FUENTE FUENTE
  • 9. ELEMENTOS CONSTITUYENTES DE UNA ARQUITECTURA DATAWAREHOUSE En la parte inferior de la figura se pueden ver las fuente s conectadas a un extractor / monitor . El extractor es el responsable de homogenizar la información. El monitor es el responsable de detectar los cambios que puedan ser realizados en las fuentes y reportarlos al integrador. El integrador recibe los resultados de los extractores y después de integrarlos, los carga al DW. Para poder cargar la información, se debe diseñar una estructura, para almacenar los datos, el esquema multidimensional del DW. El administrador de consultas se encarga de organizar las consultas y seleccionar los operadores para permitir su análisis. Para explicar la actividad de un DW podemos identificar dos grandes fases: construcción y explotación. La fase de construcción se refiere al diseño e implementación de herramientas encargados de llevar los datos de las fuentes al repositorio. Tomando en cuenta que se debe integrar y homogenizar la información previamente. Un proceso posterior pero asociad a esta mis fase es el proceso de mantenimiento. Este se encarga de llevar los datos nuevos al DW.
  • 10. En la fase de explotación se lleva a cabo el análisis de los datos almacenados dentro del DW a través de técnicas que facilitan y hacen mas eficiente su consulta. Ya con el DW poblado lo ultimo es diseñar e implementar una interfaz que le permita al usuario final interactuar con el repositorio, brindándole todas las ventajas del análisis de la información. MODELO MULTIDIMENSIONAL El modelo multidimensional describe la organización de la información en un DW. Define los conceptos para agregar hechos a lo largo de muchos atributos, llamados dimensiones. CONCEPTOS. Dimensión. Una dimensión representa una perspectiva de los datos. Las dimensiones son usadas para seleccionar y agregar datos a un cierto nivel deseado de detalle. Podemos definir el concepto de dimensión como el grado de libertad de movimiento en el espacio. Entenderemos esta libertad como el numero de direcciones ortogonales diferentes que podamos tomar.
  • 11.
  • 12.
  • 13. Para ejemplificar consideramos la existencia de una aplicación que realiza la venta de juguetes. Para organizar sus ventas se define el cubo formado por las dimensiones producto, tiempo y región. La figura presenta el esquema multidimensional de un DW para la venta de productos que organiza un conjunto de medidas según las dimensiones REGION, TIEMPO y PRODUCTO. ESQUEMA MULTIDIMENSIONAL
  • 14. Cada dimensión tiene asociada una jerarquía de niveles que denota la granularidad de observación de la medida con respecto a una dimensión. Por ejemplo, la dimensión REGION se organiza por Ciudad-Estado-Región-País. Así se puede observar la cantidad de muñecas vendidas el martes 26 en la tienda ubicada en la ciudad de Puebla. ESQUEMA DE REPRESENTACION Un esquema multidimensional puede instrumentarse usando un esquema relacional en estrella (Star Schema) o usando un esquema copo de nieve (Snow Flake Schema). Un esquema de estrella esta formado por una tabla para cada dimensión y una tabla principal de hechos. En la tabla de hechos cada uno de los atributos es a una llave extranjera hacia cada tabla de dimensión como se puede apreciar en la sig. figura. ESQUEMA EN ESTRELLA Región Id Ciudad Nombre Dirección Región Tiempo Id Tiempo Fecha Producto Id Producto Descripción Marca Grupo Familia Tipo Precio Medida Id Producto Id Ciudad Id Tiempo unid vendidas
  • 15. En un esquema copo de nieve las tablas de dimensiones están normalizadas. Esto evita redundancia en los datos. Este esquema representa mejor la semántica de las dimensiones del ambiente de negocios, ya que tiene un acceso mas directos a los datos. Región Id Ciudad Nombre Dirección Tiempo Id Tiempo día Producto Id Producto Descripción Marca Tipo Precio Id Región Región Id Tiempo mes Id Tiempo año Id Grupo grupo Id Familia familia Medida Id Producto Id Ciudad Id Tiempo unid vendidas
  • 16. CONSTRUCCION Y MANTENIMIENTO DE UN DW CONSTRUCCIÓN. Para poder llevar a cabo la construcción del DW, se necesitan herramientas de extracción de datos a partir de las fuentes externas. Estas herramientas extraen y homogenizan los datos y se comunican con un integrados que integra los datos con respecto al esquema del DW. La figura siguiente presenta la arquitecta del mecanismo de construcción de un DW que consiste en un conjunto de extractores asociados a las fuentes. Un extractor con la fuente para extraer la información y la transforma a una representación comprendida por un integrador. El extractor conoce el formato de las fuentes, el formato de representación de datos del DW, el protocolo de comunicación y la ubicación de ambos. INTEGRADOR DATAWAREHOUSE EXTRACTOR / MONITOR FUENTE FUENTE FUENTE EXTRACTOR / MONITOR EXTRACTOR / MONITOR
  • 17.
  • 18.
  • 19. Slice´n dice permite restringir los valores asociados a una o varias dimensiones del cubo, es decir, toma un subconjunto de dimensiones y de niveles seleccionados del DW. En la sig. figura se observa un ejemplo en el que se restringe el resultado para analizar solo las ventas de las cubetas y los trapeadores en 2003 y 2002 en Monterrey y Puebla.
  • 20. Roll up agrega medidas que van de un nivel Ni a un nivel mas general Nj de una dimensión. Permite analizar la información a través de diferentes niveles de granularidad de las dimensiones. Drill down es la operación inversa. A partir de un nivel superior este operador permitir bajar de nivel. En la sig. figura se observa un claro ejemplo de cómo la dimensión tiempo cambia de nivel días a meses y viceversa.
  • 21.
  • 22. * Aplicación Piloto. - Una prueba limitada para medir el beneficio de manera clara ORGANIZACION DEL PROYECTO 1. Factores en la Planificación del DW. : * Asociación entre Usuarios, Gestores y Grupos. - Información que satisfaga los requerimientos de la empresa. - Selección de Herramientas. * Prototipos . - Verificar la necesidades del usuario durante el proceso de implementación. * Implementación Incremental. - Reduce riesgos y controla el tamaño del proyecto para que sea manejable. * Reportar y Publicar casos exitosos. - Publicidad interna de cómo le ayuda a la gente que ya lo utiliza
  • 23. * Primero. - Acceso fácil al directorio de datos y gestión del proceso. - Entrenamiento al usuario final. - Uso de las Instalaciones del DW. 2. Estrategias para el Desarrollo del DW. : Desarrollar un estrategia apropiada a las necesidades de los usuarios. * Segundo. - Construir una copia de los datos operacionales. Esto por si los datos existente son de mala calidad. * Tercero. - Seleccionar el numero de usuarios. - Construir prototipos para los usuarios final para poder experimentar o modificar su es necesario. - Cargar los datos de los sistemas existentes o de fuentes externas.
  • 24. * Se requiere en ocasiones una Reingeniería de Proceso del Negocio. 3. Estrategias para el Diseño del DW. : * Estrategia de diseño de afuera hacia adentro (outside-in). * Los usuarios no conocen sus requerimientos, como los usuarios operacionales. * Reconocer que el mantenimiento de la estructura del DW es critica. 4. Estrategias para la Gestión de un Diseño del DW. : * Esto solo es una buena inversión si los usuarios finales consiguen información vital y rápida.
  • 25. DESARROLLO DE UN PROYECTO. * Puede contener toda la infamación de la empresa desde su inicio, o tan limitado a un gerente durante un año. Almacenaje de un DW. * Estos significa que los usuarios finales pueden acceder a bases operacionales directamente, usando cualquier herramienta (red de acceso de datos). Virtual o Point to Point. * Se seleccionan donde hay necesidades comunes de información y un gran numero de usuarios. DW Centrales * Los componentes de deposito se distribuyen en un numero de bases de datos físicas diferentes. DW Distribuidos * Ejecutivos y gerentes * “Power users” o “Buzo de Información”. Analistas financieros, Ingenieros, * Usuarios de soporte. De oficinas, administrativos. Tipo De Usuario
  • 26. * Esta integrado por un servidor de Hardware * Los DBMS que conforman el dispositivo. (Sistemas de Gestión de Base de Batos.) 1) Arquitectura total del deposito. Estructura física de la base de datos de deposito. BLOQUES CLAVES DE CONSTRUCCIÓN. ELEMENTOS CLAVES PARA EL DESARROLLO. a) DW Integrado o centralizado; Las bases de datos separados son todos integrados y físicamente almacenados en la misma plataforma. Financiero Comercio Manufactura Distribución Mainframe Usuario Final Data Warehouse Corporativo Servidor Local
  • 27. b) Arquitectura Global; Los datos es consolidad lógicamente pero se almacena por separado sin las bases de datos físicamente relacionadas, en el mismo lugar físico. Financiero Comercio Manufactura Distribución Corporativo Data Warehouse Usuario Final
  • 28. c) Arquitectura por Niveles; Datos altamente resumidos en la 1er estación de trabajo del usuario, con resúmenes mas detallaos en el 2do. servidor y mas detallada en el 3er servidor. Financiero Comercio Manufactura Distribución Corporativo Data Warehouse Estación de Trabajo Modelos Complementarios de datos Nivel 1 Nivel 2 Nivel 3 Financiero Comercio Manufactura Distribución
  • 29. 2) Arquitectura del servidor. Estructura física de la base de datos de deposito. BLOQUES CLAVES DE CONSTRUCCIÓN. a) De un solo Servidor; Fácil de administrar pero con limitaciones de potencia de procesamiento y escalabilidad. b) Multiprocesamiento Simétrico (SMP); Adición de procesadores que comparten la memoria interna de los servidores y de los dispositivos de almacenaje del disco. c) Procesamiento en Paralelo Masivo (MMP); Conjunto de procesadores con un enlace de banda ancha y de alta velocidad. Cada modo es un servidor con su propio procesador SMP y memoria interna. d) Acceso de memoria no uniforme (NUMA); Se crea con una sola gran maquina SMP al conectar múltiples nodos en uno solo, ventajas en la gestión y simplicidad de un ambiente SMP.
  • 30. 3) Sistema de Gestión de Base de Datos. Los Relational Data Base Managment Systems (RDBMS); son muy flexibles cuando se usan con una estructura de datos normalizada y tienen la capacidad para efectuar consultas con un único objetivo concreto. BLOQUES CLAVES DE CONSTRUCCIÓN. Base Normalizada, las estructura de datos son No Redundantes y que representan las entidades básicas. Los modelos super relacionados soportan extensiones para almacenar formatos, operaciones y diagramas indexacion especializados.
  • 31. BIBLIOGRAFIA Data Wareahousing (http://porgramacion.com/bbdd/tutorial/warehouse/ GRACIAS