SlideShare una empresa de Scribd logo
1 de 14
DATA WAREHOUSE
Que SI es un Data Warehouse
Un Data Warehouse es un repositorio de datos
corporativo que se caracteriza por integrar y depurar
información de una o más fuentes distintas, para
luego procesarla permitiendo su análisis desde
infinidad de perspectivas y con grandes velocidades
de respuesta.
Un Data Warehouse proporciona información a
Sistemas de Soporte a Decisiones (DSS), Sistemas de
información ejecutiva (EIS) o herramientas para hacer
consultas o informes. Los usuarios finales pueden
hacer fácilmente consultas sin tocar o afectar la
operación del sistema.
Que NO es un Data Warehouse
• Un Producto: Un Data warehouse no es un sistema
desarrollado en masa.
• Un Lenguaje: Un Data warehouse no se codifica
mediante un lenguaje de programación, porque se
basa en diferentes tecnologías que pueden tener
diferentes entornos.
• Una copia del sistema de transacciones: Un error
común es creer que duplicar la base de datos
transaccional es crear un Data warehouse.
Características
Integrado: los datos almacenados deben integrarse en una
estructura consistente, por lo que las inconsistencias
existentes entre los diversos sistemas operacionales deben
ser eliminadas.
Temático: Los datos se organizan por temas para facilitar su
acceso y entendimiento por parte de los usuarios finales.
Histórico: el tiempo es parte implícita de la información
contenida en un repositorio. la cual sirve, entre otras cosas,
para realizar análisis de tendencias.
No volátil: la información existe para ser leída y no para ser
modificada. la actualización se refleja con la incorporación
de los últimos valores de las distintas variables y sin ningún
tipo de acción sobre lo que ya existía.
Diferencias con un DB
Transaccional
DB Relacional Data WareHouse
Almacena datos actuales Almacena datos históricos
(datos tienen clave de tiempo)
Los datos son dinámicos (actualizables) Los datos son principalmente estáticos
Las actualizaciones no suelen estar programadas Las actualizaciones son escasas y programadas,
incremental a intervalos regulares
Los procesos (transacciones) son repetitivos. Los procesos no son previsibles
Dedicado al procesamiento de transacciones Dedicado al análisis de datos
Orientado a los procesos operativos Orientado a la obtención de información
Soporta decisiones diarias (corto plazo) Soporta decisiones estratégicas
(medio y largo plazo)
Sirve a muchos usuarios Sirve a técnicos de dirección (pocos usuarios)
Requerimientos de respuesta inmediata Requerimientos de respuesta no críticos
Modelo de datos relacional (normalmente) Modelo de datos multidimensional
Estructura
ETL
Extract – Tranform - Load
Extracción: obtención de información de las distintas
fuentes tanto internas como externas.
Transformación: filtrado, limpieza, depuración,
homogeneización y agrupación de la información.
Carga: organización y actualización de los datos y los
metadatos en la base de datos.
Data Marts
Un Datamart es una base de datos departamental,
especializada en un área de negocio específica. Se
caracteriza por disponer la estructura óptima de
datos para analizar la información al detalle desde
todas las perspectivas que afecten a los procesos de
dicho departamento.
Data Marts
Dpto
Contable
Data Marts
Dpto Ventas
Data Marts
Dpto RH
CUBOS
es una base de datos especial, en la cual el
almacenamiento físico de los datos se realiza en un
vector multidimensional.
HERRAMIENTAS
Open Source Comerciales
Talend Open Source Data Integrator Talend Studio
GeoKettle Microsoft Integration Services
Apatar Oracle Warehouse Builder
CloverETL SAP Data Services
Jaspersoft ETL IBM InfoSphere Information Server
KETL QlikView Expressor
Pentaho’s Data Integration Pentaho’s Data Integration
SQ-ALL Syncsort DMX
VIDEO
Talend Open Source Data Integrator
http://1drv.ms/1GybhKT
VENTAJAS
• Proporciona información clave para la toma de decisiones
empresariales.
• Especialmente útil para el medio y largo plazo.
• Son sistemas relativamente sencillos de instalar si las
fuentes de datos y los objetivos están claros.
• Transforma los datos en información y la información en
conocimiento.
• Las empresas obtienen un aumento de la productividad.
• Proporciona una comunicación fiable entre todos los
departamentos de la empresa.
• Permite conocer qué está pasando en el negocio, es decir,
estar siempre enterado de los buenos y malos resultados.
FACTORES CRÍTICOS DE ÉXITO
• Requiere una gran inversión, debido a que su correcta
construcción no es tarea sencilla y consume muchos
recursos, además, su misma implementación implica
desde la adquisición de herramientas de consulta y
análisis, hasta la capacitación de los usuarios.
• Los beneficios del almacén de datos son apreciados en el
mediano y largo plazo. Este punto básicamente se refiere a
que no todos los usuarios confiarán en el DW en una
primera instancia.
• Requiere de continua limpieza, transformación e
integración de datos.
• Si se incluyen datos propios y confidenciales, el depósito
de datos atentará contra la privacidad de los mismos, ya
que cualquier usuario podrá tener acceso a ellos.
CONCLUSIONES
El concepto de Data Warehouse abarca mucho más que
simplemente copiar datos operacionales a una base de
datos informacional distinta. El sistema deberá ofrecer una
solución completa para gestionar y controlar el flujo de
información desde bases de datos corporativas y fuentes
externas a sistemas de soporte de decisiones de usuarios
finales.
Además, debe permitir a los usuarios conocer qué
información existe en el almacén de datos, y cómo poder
acceder a ella y manipularla

Más contenido relacionado

Similar a Datewarehouse.ppt

Bussiness inteligence
Bussiness inteligenceBussiness inteligence
Bussiness inteligence
Maryy Aqua
 
Bussiness inteligence
Bussiness inteligenceBussiness inteligence
Bussiness inteligence
Irene Lorza
 
Arquitectura de datos empresariales ta. informe
Arquitectura de datos empresariales   ta. informeArquitectura de datos empresariales   ta. informe
Arquitectura de datos empresariales ta. informe
CarlosTenelema1
 
Que Es Un Data Warehouse
Que Es Un Data WarehouseQue Es Un Data Warehouse
Que Es Un Data Warehouse
guest10616d
 
Topicos de ingeneria_de_sistema_sii_calzada1
Topicos de ingeneria_de_sistema_sii_calzada1Topicos de ingeneria_de_sistema_sii_calzada1
Topicos de ingeneria_de_sistema_sii_calzada1
Calzada Meza
 
PLANTILLA INCEPERÚ Sesión 3.pdf-xxxxxxxx
PLANTILLA INCEPERÚ Sesión 3.pdf-xxxxxxxxPLANTILLA INCEPERÚ Sesión 3.pdf-xxxxxxxx
PLANTILLA INCEPERÚ Sesión 3.pdf-xxxxxxxx
edwin520324
 
05 exposicion data warehouse no. 5
05   exposicion data warehouse              no. 505   exposicion data warehouse              no. 5
05 exposicion data warehouse no. 5
Gustavo Cuxum
 
Exposición data
Exposición dataExposición data
Exposición data
Telygarci
 

Similar a Datewarehouse.ppt (20)

Bussiness inteligence
Bussiness inteligenceBussiness inteligence
Bussiness inteligence
 
Data warehouse
Data warehouseData warehouse
Data warehouse
 
Bussiness inteligence
Bussiness inteligenceBussiness inteligence
Bussiness inteligence
 
Arquitectura de datos empresariales ta. informe
Arquitectura de datos empresariales   ta. informeArquitectura de datos empresariales   ta. informe
Arquitectura de datos empresariales ta. informe
 
Data werehouse
Data werehouseData werehouse
Data werehouse
 
Data warehouse
Data warehouseData warehouse
Data warehouse
 
Datawarehouse
DatawarehouseDatawarehouse
Datawarehouse
 
Actividad #1 introducción a la inteligencia de negocios
Actividad #1 introducción a la inteligencia de negociosActividad #1 introducción a la inteligencia de negocios
Actividad #1 introducción a la inteligencia de negocios
 
Data warehouse
Data warehouseData warehouse
Data warehouse
 
Repositorio De InformacióN
Repositorio De InformacióNRepositorio De InformacióN
Repositorio De InformacióN
 
Que Es Un Data Warehouse
Que Es Un Data WarehouseQue Es Un Data Warehouse
Que Es Un Data Warehouse
 
Data-Warehouse-I.pdf
Data-Warehouse-I.pdfData-Warehouse-I.pdf
Data-Warehouse-I.pdf
 
Topicos de ingeneria_de_sistema_sii_calzada1
Topicos de ingeneria_de_sistema_sii_calzada1Topicos de ingeneria_de_sistema_sii_calzada1
Topicos de ingeneria_de_sistema_sii_calzada1
 
GRUPO 3_DATA WAREHOUSE_PRESENTACION.pptx
GRUPO 3_DATA WAREHOUSE_PRESENTACION.pptxGRUPO 3_DATA WAREHOUSE_PRESENTACION.pptx
GRUPO 3_DATA WAREHOUSE_PRESENTACION.pptx
 
Cuestiones de repaso_cap_31_utpl
Cuestiones de repaso_cap_31_utplCuestiones de repaso_cap_31_utpl
Cuestiones de repaso_cap_31_utpl
 
PLANTILLA INCEPERÚ Sesión 3.pdf-xxxxxxxx
PLANTILLA INCEPERÚ Sesión 3.pdf-xxxxxxxxPLANTILLA INCEPERÚ Sesión 3.pdf-xxxxxxxx
PLANTILLA INCEPERÚ Sesión 3.pdf-xxxxxxxx
 
05 exposicion data warehouse no. 5
05   exposicion data warehouse              no. 505   exposicion data warehouse              no. 5
05 exposicion data warehouse no. 5
 
Exposición data
Exposición dataExposición data
Exposición data
 
Bussines Inteligence
Bussines InteligenceBussines Inteligence
Bussines Inteligence
 
Consideraciones sobre BI
Consideraciones sobre BIConsideraciones sobre BI
Consideraciones sobre BI
 

Datewarehouse.ppt

  • 2. Que SI es un Data Warehouse Un Data Warehouse es un repositorio de datos corporativo que se caracteriza por integrar y depurar información de una o más fuentes distintas, para luego procesarla permitiendo su análisis desde infinidad de perspectivas y con grandes velocidades de respuesta. Un Data Warehouse proporciona información a Sistemas de Soporte a Decisiones (DSS), Sistemas de información ejecutiva (EIS) o herramientas para hacer consultas o informes. Los usuarios finales pueden hacer fácilmente consultas sin tocar o afectar la operación del sistema.
  • 3. Que NO es un Data Warehouse • Un Producto: Un Data warehouse no es un sistema desarrollado en masa. • Un Lenguaje: Un Data warehouse no se codifica mediante un lenguaje de programación, porque se basa en diferentes tecnologías que pueden tener diferentes entornos. • Una copia del sistema de transacciones: Un error común es creer que duplicar la base de datos transaccional es crear un Data warehouse.
  • 4. Características Integrado: los datos almacenados deben integrarse en una estructura consistente, por lo que las inconsistencias existentes entre los diversos sistemas operacionales deben ser eliminadas. Temático: Los datos se organizan por temas para facilitar su acceso y entendimiento por parte de los usuarios finales. Histórico: el tiempo es parte implícita de la información contenida en un repositorio. la cual sirve, entre otras cosas, para realizar análisis de tendencias. No volátil: la información existe para ser leída y no para ser modificada. la actualización se refleja con la incorporación de los últimos valores de las distintas variables y sin ningún tipo de acción sobre lo que ya existía.
  • 5. Diferencias con un DB Transaccional DB Relacional Data WareHouse Almacena datos actuales Almacena datos históricos (datos tienen clave de tiempo) Los datos son dinámicos (actualizables) Los datos son principalmente estáticos Las actualizaciones no suelen estar programadas Las actualizaciones son escasas y programadas, incremental a intervalos regulares Los procesos (transacciones) son repetitivos. Los procesos no son previsibles Dedicado al procesamiento de transacciones Dedicado al análisis de datos Orientado a los procesos operativos Orientado a la obtención de información Soporta decisiones diarias (corto plazo) Soporta decisiones estratégicas (medio y largo plazo) Sirve a muchos usuarios Sirve a técnicos de dirección (pocos usuarios) Requerimientos de respuesta inmediata Requerimientos de respuesta no críticos Modelo de datos relacional (normalmente) Modelo de datos multidimensional
  • 7. ETL Extract – Tranform - Load Extracción: obtención de información de las distintas fuentes tanto internas como externas. Transformación: filtrado, limpieza, depuración, homogeneización y agrupación de la información. Carga: organización y actualización de los datos y los metadatos en la base de datos.
  • 8. Data Marts Un Datamart es una base de datos departamental, especializada en un área de negocio específica. Se caracteriza por disponer la estructura óptima de datos para analizar la información al detalle desde todas las perspectivas que afecten a los procesos de dicho departamento. Data Marts Dpto Contable Data Marts Dpto Ventas Data Marts Dpto RH
  • 9. CUBOS es una base de datos especial, en la cual el almacenamiento físico de los datos se realiza en un vector multidimensional.
  • 10. HERRAMIENTAS Open Source Comerciales Talend Open Source Data Integrator Talend Studio GeoKettle Microsoft Integration Services Apatar Oracle Warehouse Builder CloverETL SAP Data Services Jaspersoft ETL IBM InfoSphere Information Server KETL QlikView Expressor Pentaho’s Data Integration Pentaho’s Data Integration SQ-ALL Syncsort DMX
  • 11. VIDEO Talend Open Source Data Integrator http://1drv.ms/1GybhKT
  • 12. VENTAJAS • Proporciona información clave para la toma de decisiones empresariales. • Especialmente útil para el medio y largo plazo. • Son sistemas relativamente sencillos de instalar si las fuentes de datos y los objetivos están claros. • Transforma los datos en información y la información en conocimiento. • Las empresas obtienen un aumento de la productividad. • Proporciona una comunicación fiable entre todos los departamentos de la empresa. • Permite conocer qué está pasando en el negocio, es decir, estar siempre enterado de los buenos y malos resultados.
  • 13. FACTORES CRÍTICOS DE ÉXITO • Requiere una gran inversión, debido a que su correcta construcción no es tarea sencilla y consume muchos recursos, además, su misma implementación implica desde la adquisición de herramientas de consulta y análisis, hasta la capacitación de los usuarios. • Los beneficios del almacén de datos son apreciados en el mediano y largo plazo. Este punto básicamente se refiere a que no todos los usuarios confiarán en el DW en una primera instancia. • Requiere de continua limpieza, transformación e integración de datos. • Si se incluyen datos propios y confidenciales, el depósito de datos atentará contra la privacidad de los mismos, ya que cualquier usuario podrá tener acceso a ellos.
  • 14. CONCLUSIONES El concepto de Data Warehouse abarca mucho más que simplemente copiar datos operacionales a una base de datos informacional distinta. El sistema deberá ofrecer una solución completa para gestionar y controlar el flujo de información desde bases de datos corporativas y fuentes externas a sistemas de soporte de decisiones de usuarios finales. Además, debe permitir a los usuarios conocer qué información existe en el almacén de datos, y cómo poder acceder a ella y manipularla