SlideShare una empresa de Scribd logo
TEMA 1 GSR - 600
ESCUELA INDUSTRIAL SUPERIOR
PEDRO DOMINGO MURILLO
INSTITUTO TECNOLÓGICO
CARRERA INFORMÁTICA INDUSTRIAL
INFORME # 1
DATAWEREHOUSE
INTEGRANTES:
- ALVARO CANAVIRI CERON
DOCENTE:
- ING. RICARDO GOTTRET
MATERIA: GSR – 600
LA PAZ – BOLIVIA
Julio 2020
TEMA 1 GSR - 600
DATAWEREHOUSE
1 OBJETIVO
2. TEORIA
Un Datawarehouse es una base de datos corporativa que se caracteriza por integrar y
depurar información de una o más fuentes distintas, para luego procesarla permitiendo su
análisis desde infinidad de perspectivas y con grandes velocidades de respuesta. La
creación de un datawarehouse representa en la mayoría de las ocasiones el primer paso,
desde el punto de vista técnico, para implantar una solución completa y fiable de Business
Inteligencie.
La ventaja principal de este tipo de bases de datos radica en las estructuras en las que se
almacena la información (modelos de tablas en estrella, en copo de nieve, cubos
relacionales... etc.). Este tipo de persistencia de la información es homogénea y fiable, y
permite la consulta y el tratamiento jerarquizado de la misma (siempre en un entorno
diferente a los sistemas operacionales).
El concepto de data warehouse se originó en 1988 con el trabajo de los investigadores de
IBM, Barry Devlin y Paul Murphy aunque el término data warehouse fue acuñado por
William H. Inmon, el cual es conocido como el padre de Data Warehousing. Inmon
describió un data warehouse como una colección de datos orientada a un tema específico,
integrado, variante en el tiempo y no volátil, que soporta el proceso de toma de decisiones.
El término Datawarehouse fue acuñado por primera vez por Bill Inmon, y se traduce
literalmente como almacén de datos. No obstante, y como cabe suponer, es mucho más
que eso. Según definió el propio Bill Inmon, un datawarehouse se caracteriza por ser:
- Integrado: los datos almacenados en el datawarehouse deben integrarse en una
estructura consistente, por lo que las inconsistencias existentes entre los diversos
sistemas operacionales deben ser eliminadas. La información suele estructurarse
también en distintos niveles de detalle para adecuarse a las distintas necesidades
de los usuarios.
- Temático: sólo los datos necesarios para el proceso de generación del
conocimiento del negocio se integran desde el entorno operacional. Los datos se
organizan por temas para facilitar su acceso y entendimiento por parte de los
usuarios finales. Por ejemplo, todos los datos sobre clientes pueden ser
consolidados en una única tabla del datawarehouse. De esta forma, las peticiones
de información sobre clientes serán más fáciles de responder dado que toda la
información reside en el mismo lugar.
- Histórico: el tiempo es parte implícita de la información contenida en un
datawarehouse. En los sistemas operacionales, los datos siempre reflejan el estado
de la actividad del negocio en el momento presente. Por el contrario, la
información almacenada en el datawarehouse sirve, entre otras cosas, para realizar
TEMA 1 GSR - 600
análisis de tendencias. Por lo tanto, el datawarehouse se carga con los distintos
valores que toma una variable en el tiempo para permitir comparaciones.
- No volátil: el almacén de información de un datawarehouse existe para ser leído,
pero no modificado. La información es por tanto permanente, significando la
actualización del datawarehouse la incorporación de los últimos valores que
tomaron las distintas variables contenidas en él sin ningún tipo de acción sobre lo
que ya existía.
Otra característica del datawarehouse es que contiene metadatos, es decir, datos sobre los
datos. Los metadatos permiten saber la procedencia de la información, su periodicidad de
refresco, su fiabilidad, forma de cálculo... etc.
Los metadatos serán los que permiten simplificar y automatizar la obtención de la
información desde los sistemas operacionales a los sistemas informacionales.
Los objetivos que deben cumplir los metadatos, según el colectivo al que va dirigido, son:
Dar soporte al usuario final, ayudándole a acceder al datawarehouse con su propio
lenguaje de negocio, indicando qué información hay y qué significado tiene. Ayudar a
construir consultas, informes y análisis, mediante herramientas de Business Inteligencie
como DSS, EIS o CMI.
- Dar soporte a los responsables técnicos del datawarehouse en aspectos de
auditoría, gestión de la información histórica, administración del datawarehouse,
elaboración de programas de extracción de la información, especificación de las
interfaces para la realimentación a los sistemas operacionales de los resultados
obtenidos... etc.
Por último, destacar que para comprender íntegramente el concepto de datawarehouse, es
importante entender cuál es el proceso de construcción del mismo, denominado ETL
(Extracción, Transformación y Carga), a partir de los sistemas operaciones de una
compañía:
Extracción: obtención de información de las distintas fuentes tanto internas como
externas.
Transformación: filtrado, limpieza, depuración, homogeneización y agrupación de la
información.
Carga: organización y actualización de los datos y los metadatos en la base de datos.
Una de las claves del éxito en la construcción de un datawarehouse es el desarrollo de
forma gradual, seleccionando a un departamento usuario como piloto y expandiendo
progresivamente el almacén de datos a los demás usuarios. Por ello es importante elegir
este usuario inicial o piloto, siendo importante que sea un departamento con pocos
usuarios, en el que la necesidad de este tipo de sistemas es muy alta y se puedan obtener
y medir resultados a corto plazo.
Principales aportaciones de un datawarehouse
TEMA 1 GSR - 600
- Proporciona una herramienta para la toma de decisiones en cualquier área
funcional, basándose en información integrada y global del negocio.
-
- Facilita la aplicación de técnicas estadísticas de análisis y modelización para
encontrar relaciones ocultas entre los datos del almacén; obteniendo un valor
añadido para el negocio de dicha información.
3. DATA WAREHOUSE EN LA NUBE
Los data warehouses están atravesando actualmente dos transformaciones muy
importantes que tienen el potencial de impulsar niveles significativos de innovación
empresarial:
- La primera área de transformación es el impulso para aumentar la agilidad general.
La gran mayoría de los departamentos de TI están experimentando un rápido
aumento de la demanda de datos. Los directivos quieren tener acceso a más y más
datos históricos, mientras que al mismo tiempo, los científicos de datos y los
analistas de negocios están explorando formas de introducir nuevos flujos de datos
en el almacén para enriquecer el análisis existente, así como impulsar nuevas áreas
de análisis. Esta rápida expansión de los volúmenes y fuentes de datos significa
que los equipos de TI necesitan invertir más tiempo y esfuerzo asegurando que el
rendimiento de las consultas permanezca constante y necesitan proporcionar cada
vez más entornos para equipos individuales para validar el valor comercial de los
nuevos conjuntos de datos.
- La segunda área de transformación gira en torno a la necesidad de mejorar el
control de costes. Existe una creciente necesidad de hacer más con cada vez menos
recursos, al mismo tiempo que se garantiza que todos los datos sensibles y
estratégicos estén completamente asegurados, a lo largo de todo el ciclo de vida,
de la manera más rentable.
La nube está demostrando ser un facilitador dominante. Permite a las organizaciones
enfrentarse de forma activa a los desafíos que presentan estas dos transformaciones clave.
TEMA 1 GSR - 600
La importancia de la nube para el datawarehouse está directamente vinculado a tres
factores clave:
- Mayor agilidad
- Mejor control de costes
- Co-localización
5 BIG DATA
Llamamos big data a un gran volumen de datos con una variedad, complejidad y
velocidad de crecimiento enorme y que además tienen la característica de no ser
estructurados. Eso significa que no son relacionales, estando además fuera del entorno
corporativo. Es un tipo de tecnología que te permite analizar los datos en tiempo real y
puede provenir de diferentes fuentes y formas, tales como mensajería instantánea, redes
sociales, registros de grabaciones, imágenes, mensajes de correo electrónico, etc.
6 BUSINESS INTELLIGENCE
Un Business Intelligence (BI) es una especie de “cuello de botella” de los datos recogidos
del data warehouse, que llegan de forma exacta y útil para ayudar a la toma de
decisiones. Business Intelligence transforma los datos en información útil para analizar
no sólo los negocios, sino también las principales estrategias corporativas.
TEMA 1 GSR - 600
4 CONCLUSIÓN
¿Qué es un Data Waterhouse?
- Un data Waterhouse es un repositorio unificado para todos los datos que recogen los
diversos sistemas de una empresa. El repositorio puede ser físico o lógico y hace hincapié
en la captura de datos de diversas fuentes sobre todo para fines analíticos y de acceso.
Normalmente, un datawarehouse se aloja en un servidor corporativo o cada vez más, en la
nube. Los datos de diferentes aplicaciones de procesamiento de transacciones Online
(OLTP) y otras fuentes se extraen selectivamente para su uso por aplicaciones analíticas
y de consultas por usuarios.
¿Por qué migrar a la nube?
- Las 3 tecnologías que ya tienen y seguirán teniendo un gran impacto en la
transformación de negocios son: la nube, datos y análisis, e Internet de las Cosas. Estas
tres tecnologías son parte clave del ecosistema de la data warehouse actual. Por lo tanto,
es posible sacar la conclusión de que el data warehouse en la nube tiene un gran potencial
para generar un impacto significativo en los negocios.

Más contenido relacionado

La actualidad más candente

Fundamentos de DataWareHouse - FISI - UNMSM - DataWareHouse
Fundamentos de DataWareHouse - FISI - UNMSM - DataWareHouseFundamentos de DataWareHouse - FISI - UNMSM - DataWareHouse
Fundamentos de DataWareHouse - FISI - UNMSM - DataWareHouseJulio Pari
 
Arquitectura de un dw
Arquitectura de un dwArquitectura de un dw
Arquitectura de un dw
Max Santiago
 
05 exposicion data warehouse no. 5
05   exposicion data warehouse              no. 505   exposicion data warehouse              no. 5
05 exposicion data warehouse no. 5Gustavo Cuxum
 
Data WareHouse. Introduccion
Data WareHouse. IntroduccionData WareHouse. Introduccion
Data WareHouse. Introduccion
Ricardo Mendoza
 
Que Es Un Data Warehouse
Que Es Un Data WarehouseQue Es Un Data Warehouse
Que Es Un Data Warehouseguest10616d
 
Topicos de ingeneria_de_sistema_sii_calzada1
Topicos de ingeneria_de_sistema_sii_calzada1Topicos de ingeneria_de_sistema_sii_calzada1
Topicos de ingeneria_de_sistema_sii_calzada1Calzada Meza
 
Negocios inteligentes
Negocios inteligentesNegocios inteligentes
Negocios inteligentes
Victor Dolores Marcos
 
Data warehouse
Data warehouseData warehouse
Data warehouse
Anyeni Garay
 
Datawarehouse1
Datawarehouse1Datawarehouse1
Datawarehouse1nestor
 
data warehouse
data warehousedata warehouse
data warehouse
Juan Carlos Pérez Pardo
 
Datawarehouse
DatawarehouseDatawarehouse
Datawarehouse
roseneri182
 
Data warehouse
Data warehouseData warehouse
Data warehouse
malupahu
 
DATAWAREHOUSE, importancia del almacén de datos
DATAWAREHOUSE, importancia del almacén de datosDATAWAREHOUSE, importancia del almacén de datos
DATAWAREHOUSE, importancia del almacén de datosMaría Isabel Bautista
 
Data warehouse
Data warehouseData warehouse
Data warehouse
Jose Sajajú
 
Almacen de datos
Almacen de datosAlmacen de datos
Almacen de datosen mi casa
 
Datawarehouse
DatawarehouseDatawarehouse
Datawarehouse
Alberto J. Belloso B.
 
Exposición data
Exposición dataExposición data
Exposición dataTelygarci
 
Datawarehouse práctica 6
Datawarehouse   práctica 6Datawarehouse   práctica 6
Datawarehouse práctica 6
Gustavo Araque
 

La actualidad más candente (20)

Fundamentos de DataWareHouse - FISI - UNMSM - DataWareHouse
Fundamentos de DataWareHouse - FISI - UNMSM - DataWareHouseFundamentos de DataWareHouse - FISI - UNMSM - DataWareHouse
Fundamentos de DataWareHouse - FISI - UNMSM - DataWareHouse
 
Arquitectura de un dw
Arquitectura de un dwArquitectura de un dw
Arquitectura de un dw
 
05 exposicion data warehouse no. 5
05   exposicion data warehouse              no. 505   exposicion data warehouse              no. 5
05 exposicion data warehouse no. 5
 
Data WareHouse. Introduccion
Data WareHouse. IntroduccionData WareHouse. Introduccion
Data WareHouse. Introduccion
 
Que Es Un Data Warehouse
Que Es Un Data WarehouseQue Es Un Data Warehouse
Que Es Un Data Warehouse
 
Almacén de datos
Almacén de datosAlmacén de datos
Almacén de datos
 
Topicos de ingeneria_de_sistema_sii_calzada1
Topicos de ingeneria_de_sistema_sii_calzada1Topicos de ingeneria_de_sistema_sii_calzada1
Topicos de ingeneria_de_sistema_sii_calzada1
 
Negocios inteligentes
Negocios inteligentesNegocios inteligentes
Negocios inteligentes
 
Data warehouse
Data warehouseData warehouse
Data warehouse
 
Datawarehouse1
Datawarehouse1Datawarehouse1
Datawarehouse1
 
data warehouse
data warehousedata warehouse
data warehouse
 
Datawarehouse
DatawarehouseDatawarehouse
Datawarehouse
 
Data warehouse
Data warehouseData warehouse
Data warehouse
 
Almacén de datos
Almacén de datosAlmacén de datos
Almacén de datos
 
DATAWAREHOUSE, importancia del almacén de datos
DATAWAREHOUSE, importancia del almacén de datosDATAWAREHOUSE, importancia del almacén de datos
DATAWAREHOUSE, importancia del almacén de datos
 
Data warehouse
Data warehouseData warehouse
Data warehouse
 
Almacen de datos
Almacen de datosAlmacen de datos
Almacen de datos
 
Datawarehouse
DatawarehouseDatawarehouse
Datawarehouse
 
Exposición data
Exposición dataExposición data
Exposición data
 
Datawarehouse práctica 6
Datawarehouse   práctica 6Datawarehouse   práctica 6
Datawarehouse práctica 6
 

Similar a Datawarehouse 1

Data warehouse
Data warehouseData warehouse
Data warehouse
LUISA VEGA MONTENEGRO
 
Bussiness inteligence
Bussiness inteligenceBussiness inteligence
Bussiness inteligenceMaryy Aqua
 
Consideraciones sobre BI
Consideraciones sobre BIConsideraciones sobre BI
Unidad 5 mercadotecnia
Unidad 5 mercadotecniaUnidad 5 mercadotecnia
Unidad 5 mercadotecnia
miguel Rodriguez
 
Data-Warehouse-I.pdf
Data-Warehouse-I.pdfData-Warehouse-I.pdf
Data-Warehouse-I.pdf
Yair Ambrocio
 
La planificacion segun_data_ware_house
La planificacion segun_data_ware_houseLa planificacion segun_data_ware_house
La planificacion segun_data_ware_house
ernestoicidec
 
business intelligence
business intelligencebusiness intelligence
business intelligence
amada villarreal santiago
 
UNIDAD 5 los conceptos de inteligencia de negocios
UNIDAD 5 los conceptos de inteligencia de negociosUNIDAD 5 los conceptos de inteligencia de negocios
UNIDAD 5 los conceptos de inteligencia de negocios
ISABEL PUENTE
 
Data warehouse
Data warehouseData warehouse
Data warehouse
Cleiver Huamani
 
Datewarehouse.ppt
Datewarehouse.pptDatewarehouse.ppt
Datewarehouse.ppt
JONATHANLEANDROPALAD
 
Curso : Inteligencia de Negocios - Dia1
Curso : Inteligencia de Negocios - Dia1Curso : Inteligencia de Negocios - Dia1
Curso : Inteligencia de Negocios - Dia1
Michael Macavilca Mejia
 
GRUPO 3_DATA WAREHOUSE_PRESENTACION.pptx
GRUPO 3_DATA WAREHOUSE_PRESENTACION.pptxGRUPO 3_DATA WAREHOUSE_PRESENTACION.pptx
GRUPO 3_DATA WAREHOUSE_PRESENTACION.pptx
ChristianCuzquillo
 
Cuestiones de repaso_cap_31_utpl
Cuestiones de repaso_cap_31_utplCuestiones de repaso_cap_31_utpl
Cuestiones de repaso_cap_31_utpl
Carlos Francisco Ojeda Ureña
 
Actividad 1
Actividad 1Actividad 1
Bussines Inteligence
Bussines InteligenceBussines Inteligence
Bussines Inteligence
Flor de la Luz
 
Repositorio De InformacióN
Repositorio De InformacióNRepositorio De InformacióN
Repositorio De InformacióN
gabisss
 
PLANTILLA INCEPERÚ Sesión 3.pdf-xxxxxxxx
PLANTILLA INCEPERÚ Sesión 3.pdf-xxxxxxxxPLANTILLA INCEPERÚ Sesión 3.pdf-xxxxxxxx
PLANTILLA INCEPERÚ Sesión 3.pdf-xxxxxxxx
edwin520324
 
Que Es Un Datawarehouse
Que Es Un DatawarehouseQue Es Un Datawarehouse
Que Es Un Datawarehouseguest10616d
 
Arquitectura de datos empresariales ta. informe
Arquitectura de datos empresariales   ta. informeArquitectura de datos empresariales   ta. informe
Arquitectura de datos empresariales ta. informe
CarlosTenelema1
 

Similar a Datawarehouse 1 (20)

Data warehouse
Data warehouseData warehouse
Data warehouse
 
Bussiness inteligence
Bussiness inteligenceBussiness inteligence
Bussiness inteligence
 
Consideraciones sobre BI
Consideraciones sobre BIConsideraciones sobre BI
Consideraciones sobre BI
 
Unidad 5 mercadotecnia
Unidad 5 mercadotecniaUnidad 5 mercadotecnia
Unidad 5 mercadotecnia
 
Data-Warehouse-I.pdf
Data-Warehouse-I.pdfData-Warehouse-I.pdf
Data-Warehouse-I.pdf
 
La planificacion segun_data_ware_house
La planificacion segun_data_ware_houseLa planificacion segun_data_ware_house
La planificacion segun_data_ware_house
 
business intelligence
business intelligencebusiness intelligence
business intelligence
 
UNIDAD 5 los conceptos de inteligencia de negocios
UNIDAD 5 los conceptos de inteligencia de negociosUNIDAD 5 los conceptos de inteligencia de negocios
UNIDAD 5 los conceptos de inteligencia de negocios
 
Data warehouse
Data warehouseData warehouse
Data warehouse
 
Datewarehouse.ppt
Datewarehouse.pptDatewarehouse.ppt
Datewarehouse.ppt
 
Curso : Inteligencia de Negocios - Dia1
Curso : Inteligencia de Negocios - Dia1Curso : Inteligencia de Negocios - Dia1
Curso : Inteligencia de Negocios - Dia1
 
Datawarehouse
DatawarehouseDatawarehouse
Datawarehouse
 
GRUPO 3_DATA WAREHOUSE_PRESENTACION.pptx
GRUPO 3_DATA WAREHOUSE_PRESENTACION.pptxGRUPO 3_DATA WAREHOUSE_PRESENTACION.pptx
GRUPO 3_DATA WAREHOUSE_PRESENTACION.pptx
 
Cuestiones de repaso_cap_31_utpl
Cuestiones de repaso_cap_31_utplCuestiones de repaso_cap_31_utpl
Cuestiones de repaso_cap_31_utpl
 
Actividad 1
Actividad 1Actividad 1
Actividad 1
 
Bussines Inteligence
Bussines InteligenceBussines Inteligence
Bussines Inteligence
 
Repositorio De InformacióN
Repositorio De InformacióNRepositorio De InformacióN
Repositorio De InformacióN
 
PLANTILLA INCEPERÚ Sesión 3.pdf-xxxxxxxx
PLANTILLA INCEPERÚ Sesión 3.pdf-xxxxxxxxPLANTILLA INCEPERÚ Sesión 3.pdf-xxxxxxxx
PLANTILLA INCEPERÚ Sesión 3.pdf-xxxxxxxx
 
Que Es Un Datawarehouse
Que Es Un DatawarehouseQue Es Un Datawarehouse
Que Es Un Datawarehouse
 
Arquitectura de datos empresariales ta. informe
Arquitectura de datos empresariales   ta. informeArquitectura de datos empresariales   ta. informe
Arquitectura de datos empresariales ta. informe
 

Último

MODELO PEDAG DE LA FPI SENA PARA LA FORMACION PROFESIONAL E INTEGRAL
MODELO PEDAG DE LA FPI SENA PARA LA FORMACION PROFESIONAL E INTEGRALMODELO PEDAG DE LA FPI SENA PARA LA FORMACION PROFESIONAL E INTEGRAL
MODELO PEDAG DE LA FPI SENA PARA LA FORMACION PROFESIONAL E INTEGRAL
Fernando540828
 
Las plantas ornamental su importancia, sus variedades etc
Las plantas ornamental su importancia, sus variedades etcLas plantas ornamental su importancia, sus variedades etc
Las plantas ornamental su importancia, sus variedades etc
60475271
 
TRABAJO DE TECNOLOGIA increíble y próspero epico
TRABAJO DE TECNOLOGIA increíble y próspero epicoTRABAJO DE TECNOLOGIA increíble y próspero epico
TRABAJO DE TECNOLOGIA increíble y próspero epico
edepjuanorozco
 
Presentación- PLATAFORMA VIRTUAL E-LEARNING .pptx
Presentación-  PLATAFORMA VIRTUAL E-LEARNING .pptxPresentación-  PLATAFORMA VIRTUAL E-LEARNING .pptx
Presentación- PLATAFORMA VIRTUAL E-LEARNING .pptx
arelisguerra707
 
TAREA DE TECNOLOGIA DE LA FICHHA 1 Y DOS
TAREA DE TECNOLOGIA DE LA FICHHA 1 Y DOSTAREA DE TECNOLOGIA DE LA FICHHA 1 Y DOS
TAREA DE TECNOLOGIA DE LA FICHHA 1 Y DOS
darlingreserved
 
Solucionario 5° P2P16.pptxihiuhiuhihihini
Solucionario 5° P2P16.pptxihiuhiuhihihiniSolucionario 5° P2P16.pptxihiuhiuhihihini
Solucionario 5° P2P16.pptxihiuhiuhihihini
corderojulia187
 
QUÉ ES ALARA proteccion rayografica.pptx
QUÉ ES ALARA proteccion rayografica.pptxQUÉ ES ALARA proteccion rayografica.pptx
QUÉ ES ALARA proteccion rayografica.pptx
AnthonyFernandoArias
 

Último (7)

MODELO PEDAG DE LA FPI SENA PARA LA FORMACION PROFESIONAL E INTEGRAL
MODELO PEDAG DE LA FPI SENA PARA LA FORMACION PROFESIONAL E INTEGRALMODELO PEDAG DE LA FPI SENA PARA LA FORMACION PROFESIONAL E INTEGRAL
MODELO PEDAG DE LA FPI SENA PARA LA FORMACION PROFESIONAL E INTEGRAL
 
Las plantas ornamental su importancia, sus variedades etc
Las plantas ornamental su importancia, sus variedades etcLas plantas ornamental su importancia, sus variedades etc
Las plantas ornamental su importancia, sus variedades etc
 
TRABAJO DE TECNOLOGIA increíble y próspero epico
TRABAJO DE TECNOLOGIA increíble y próspero epicoTRABAJO DE TECNOLOGIA increíble y próspero epico
TRABAJO DE TECNOLOGIA increíble y próspero epico
 
Presentación- PLATAFORMA VIRTUAL E-LEARNING .pptx
Presentación-  PLATAFORMA VIRTUAL E-LEARNING .pptxPresentación-  PLATAFORMA VIRTUAL E-LEARNING .pptx
Presentación- PLATAFORMA VIRTUAL E-LEARNING .pptx
 
TAREA DE TECNOLOGIA DE LA FICHHA 1 Y DOS
TAREA DE TECNOLOGIA DE LA FICHHA 1 Y DOSTAREA DE TECNOLOGIA DE LA FICHHA 1 Y DOS
TAREA DE TECNOLOGIA DE LA FICHHA 1 Y DOS
 
Solucionario 5° P2P16.pptxihiuhiuhihihini
Solucionario 5° P2P16.pptxihiuhiuhihihiniSolucionario 5° P2P16.pptxihiuhiuhihihini
Solucionario 5° P2P16.pptxihiuhiuhihihini
 
QUÉ ES ALARA proteccion rayografica.pptx
QUÉ ES ALARA proteccion rayografica.pptxQUÉ ES ALARA proteccion rayografica.pptx
QUÉ ES ALARA proteccion rayografica.pptx
 

Datawarehouse 1

  • 1. TEMA 1 GSR - 600 ESCUELA INDUSTRIAL SUPERIOR PEDRO DOMINGO MURILLO INSTITUTO TECNOLÓGICO CARRERA INFORMÁTICA INDUSTRIAL INFORME # 1 DATAWEREHOUSE INTEGRANTES: - ALVARO CANAVIRI CERON DOCENTE: - ING. RICARDO GOTTRET MATERIA: GSR – 600 LA PAZ – BOLIVIA Julio 2020
  • 2. TEMA 1 GSR - 600 DATAWEREHOUSE 1 OBJETIVO 2. TEORIA Un Datawarehouse es una base de datos corporativa que se caracteriza por integrar y depurar información de una o más fuentes distintas, para luego procesarla permitiendo su análisis desde infinidad de perspectivas y con grandes velocidades de respuesta. La creación de un datawarehouse representa en la mayoría de las ocasiones el primer paso, desde el punto de vista técnico, para implantar una solución completa y fiable de Business Inteligencie. La ventaja principal de este tipo de bases de datos radica en las estructuras en las que se almacena la información (modelos de tablas en estrella, en copo de nieve, cubos relacionales... etc.). Este tipo de persistencia de la información es homogénea y fiable, y permite la consulta y el tratamiento jerarquizado de la misma (siempre en un entorno diferente a los sistemas operacionales). El concepto de data warehouse se originó en 1988 con el trabajo de los investigadores de IBM, Barry Devlin y Paul Murphy aunque el término data warehouse fue acuñado por William H. Inmon, el cual es conocido como el padre de Data Warehousing. Inmon describió un data warehouse como una colección de datos orientada a un tema específico, integrado, variante en el tiempo y no volátil, que soporta el proceso de toma de decisiones. El término Datawarehouse fue acuñado por primera vez por Bill Inmon, y se traduce literalmente como almacén de datos. No obstante, y como cabe suponer, es mucho más que eso. Según definió el propio Bill Inmon, un datawarehouse se caracteriza por ser: - Integrado: los datos almacenados en el datawarehouse deben integrarse en una estructura consistente, por lo que las inconsistencias existentes entre los diversos sistemas operacionales deben ser eliminadas. La información suele estructurarse también en distintos niveles de detalle para adecuarse a las distintas necesidades de los usuarios. - Temático: sólo los datos necesarios para el proceso de generación del conocimiento del negocio se integran desde el entorno operacional. Los datos se organizan por temas para facilitar su acceso y entendimiento por parte de los usuarios finales. Por ejemplo, todos los datos sobre clientes pueden ser consolidados en una única tabla del datawarehouse. De esta forma, las peticiones de información sobre clientes serán más fáciles de responder dado que toda la información reside en el mismo lugar. - Histórico: el tiempo es parte implícita de la información contenida en un datawarehouse. En los sistemas operacionales, los datos siempre reflejan el estado de la actividad del negocio en el momento presente. Por el contrario, la información almacenada en el datawarehouse sirve, entre otras cosas, para realizar
  • 3. TEMA 1 GSR - 600 análisis de tendencias. Por lo tanto, el datawarehouse se carga con los distintos valores que toma una variable en el tiempo para permitir comparaciones. - No volátil: el almacén de información de un datawarehouse existe para ser leído, pero no modificado. La información es por tanto permanente, significando la actualización del datawarehouse la incorporación de los últimos valores que tomaron las distintas variables contenidas en él sin ningún tipo de acción sobre lo que ya existía. Otra característica del datawarehouse es que contiene metadatos, es decir, datos sobre los datos. Los metadatos permiten saber la procedencia de la información, su periodicidad de refresco, su fiabilidad, forma de cálculo... etc. Los metadatos serán los que permiten simplificar y automatizar la obtención de la información desde los sistemas operacionales a los sistemas informacionales. Los objetivos que deben cumplir los metadatos, según el colectivo al que va dirigido, son: Dar soporte al usuario final, ayudándole a acceder al datawarehouse con su propio lenguaje de negocio, indicando qué información hay y qué significado tiene. Ayudar a construir consultas, informes y análisis, mediante herramientas de Business Inteligencie como DSS, EIS o CMI. - Dar soporte a los responsables técnicos del datawarehouse en aspectos de auditoría, gestión de la información histórica, administración del datawarehouse, elaboración de programas de extracción de la información, especificación de las interfaces para la realimentación a los sistemas operacionales de los resultados obtenidos... etc. Por último, destacar que para comprender íntegramente el concepto de datawarehouse, es importante entender cuál es el proceso de construcción del mismo, denominado ETL (Extracción, Transformación y Carga), a partir de los sistemas operaciones de una compañía: Extracción: obtención de información de las distintas fuentes tanto internas como externas. Transformación: filtrado, limpieza, depuración, homogeneización y agrupación de la información. Carga: organización y actualización de los datos y los metadatos en la base de datos. Una de las claves del éxito en la construcción de un datawarehouse es el desarrollo de forma gradual, seleccionando a un departamento usuario como piloto y expandiendo progresivamente el almacén de datos a los demás usuarios. Por ello es importante elegir este usuario inicial o piloto, siendo importante que sea un departamento con pocos usuarios, en el que la necesidad de este tipo de sistemas es muy alta y se puedan obtener y medir resultados a corto plazo. Principales aportaciones de un datawarehouse
  • 4. TEMA 1 GSR - 600 - Proporciona una herramienta para la toma de decisiones en cualquier área funcional, basándose en información integrada y global del negocio. - - Facilita la aplicación de técnicas estadísticas de análisis y modelización para encontrar relaciones ocultas entre los datos del almacén; obteniendo un valor añadido para el negocio de dicha información. 3. DATA WAREHOUSE EN LA NUBE Los data warehouses están atravesando actualmente dos transformaciones muy importantes que tienen el potencial de impulsar niveles significativos de innovación empresarial: - La primera área de transformación es el impulso para aumentar la agilidad general. La gran mayoría de los departamentos de TI están experimentando un rápido aumento de la demanda de datos. Los directivos quieren tener acceso a más y más datos históricos, mientras que al mismo tiempo, los científicos de datos y los analistas de negocios están explorando formas de introducir nuevos flujos de datos en el almacén para enriquecer el análisis existente, así como impulsar nuevas áreas de análisis. Esta rápida expansión de los volúmenes y fuentes de datos significa que los equipos de TI necesitan invertir más tiempo y esfuerzo asegurando que el rendimiento de las consultas permanezca constante y necesitan proporcionar cada vez más entornos para equipos individuales para validar el valor comercial de los nuevos conjuntos de datos. - La segunda área de transformación gira en torno a la necesidad de mejorar el control de costes. Existe una creciente necesidad de hacer más con cada vez menos recursos, al mismo tiempo que se garantiza que todos los datos sensibles y estratégicos estén completamente asegurados, a lo largo de todo el ciclo de vida, de la manera más rentable. La nube está demostrando ser un facilitador dominante. Permite a las organizaciones enfrentarse de forma activa a los desafíos que presentan estas dos transformaciones clave.
  • 5. TEMA 1 GSR - 600 La importancia de la nube para el datawarehouse está directamente vinculado a tres factores clave: - Mayor agilidad - Mejor control de costes - Co-localización 5 BIG DATA Llamamos big data a un gran volumen de datos con una variedad, complejidad y velocidad de crecimiento enorme y que además tienen la característica de no ser estructurados. Eso significa que no son relacionales, estando además fuera del entorno corporativo. Es un tipo de tecnología que te permite analizar los datos en tiempo real y puede provenir de diferentes fuentes y formas, tales como mensajería instantánea, redes sociales, registros de grabaciones, imágenes, mensajes de correo electrónico, etc. 6 BUSINESS INTELLIGENCE Un Business Intelligence (BI) es una especie de “cuello de botella” de los datos recogidos del data warehouse, que llegan de forma exacta y útil para ayudar a la toma de decisiones. Business Intelligence transforma los datos en información útil para analizar no sólo los negocios, sino también las principales estrategias corporativas.
  • 6. TEMA 1 GSR - 600 4 CONCLUSIÓN ¿Qué es un Data Waterhouse? - Un data Waterhouse es un repositorio unificado para todos los datos que recogen los diversos sistemas de una empresa. El repositorio puede ser físico o lógico y hace hincapié en la captura de datos de diversas fuentes sobre todo para fines analíticos y de acceso. Normalmente, un datawarehouse se aloja en un servidor corporativo o cada vez más, en la nube. Los datos de diferentes aplicaciones de procesamiento de transacciones Online (OLTP) y otras fuentes se extraen selectivamente para su uso por aplicaciones analíticas y de consultas por usuarios. ¿Por qué migrar a la nube? - Las 3 tecnologías que ya tienen y seguirán teniendo un gran impacto en la transformación de negocios son: la nube, datos y análisis, e Internet de las Cosas. Estas tres tecnologías son parte clave del ecosistema de la data warehouse actual. Por lo tanto, es posible sacar la conclusión de que el data warehouse en la nube tiene un gran potencial para generar un impacto significativo en los negocios.