SlideShare una empresa de Scribd logo
Inteligencia de
Negocios
INY6001
Data
Warehousing
Es el proceso para construir un Data
Warehouse
Un Data Warehouse (DWH) es una
colección de datos “orientada a un
tema específico”, integrada, no volátil y
variante en el tiempo.
De manera práctica es una base de
datos que reúne datos de diversas
fuentes para apoyar el proceso de toma
decisiones.
¿Qué es Data Warehousing?
Arquiectura de un DWH
En esta arquitectura se puede apreciar de izquierda a derecha:
✔ Diversar fuentes de datos, que generalmente contienen los
datos transaccionales u operacionales de la organización
✔ Procesos de Extracción, Transformación y Carga de Datos (ETL)
✔ Data Warehouse o almacén de datos
✔ Capa de explotación, la cual puede ser representada como
reportes, minería de datos o herramientas OLAP
Arquiectura de un DWH
En esta arquitectura se
incorpora al
ecosistema un
repositorio de Big
Data, para capturar
datos
semiestructurados o
no estructurados.
Arquiectura de un DWH en la era del Big Data
Estrategias para desarrollar un DWH
• Enfoque de Data Warehouse Corporativo
• Top-down
• Metodología de Bill Inmon (Padre del DWH)
Estrategias para desarrollar un DWH
• Enfoque de Data Mart
• Bottom-up
• Metodología de Ralph Kimball (Padre del BI)
Este enfoque se basa en el modelamiento Dimensional.
Para ellos se deben realizar las siguientes actividades:
I. Elegir el proceso de negocio
II. Establecer el nivel de granularidad
III. Elegir las dimensiones
IV. Identificar medidas y las tablas de hechos
Modelamiento Dimensional
I. Seleccionar un Proceso de Negocio
• Por ejemplo:
• Proceso de Venta
• Proceso de Compras
• Proceso de Selección de Personal
II. Determinar la Granularidad
• Definir el nivel de detalle que se desea almacenar los datos del proceso.
• Depende de los requerimientos del negocio y los datos que existe en los
sistemas que soportan el proceso
• La sugerencia es comenzar a diseñar el DW al mayor nivel de detalle posible
• Se puede luego realizar Sumarizaciones (Agregaciones) al nivel deseado
Modelamiento Dimensional
III. Identificar las Dimensiones
• Surgen naturalmente de las sesiones de análisis y facilitadas por la elección del
nivel de granularidad y de la matriz de procesos/dimensiones
• Por ejemplo:
• Tiempo: ¿cuándo se produce la actividad?
• Producto: ¿cuál es el objeto de la actividad?
• Almacén: ¿dónde se produce la actividad?
• Cliente: ¿quién es el destinatario de la actividad?
Vent
a
Tiempo
Tienda
Empleado
Producto
Modelamiento Dimensional
III. Identificar las Métricas y Tablas de Hecho
• Decidir la información a almacenar sobre el proceso.
• Hechos: información (sobre la actividad) que se desea almacenar en cada
registro de la tabla de hechos y que será objeto del análisis.
• Ejemplos: cantidades, sumas, máximos,…
Métricas Directas:
• Unidades Vendidas
• Monto Vendido
• Monto Pago
• Puntos
• Vuelto
• Métricas del Contexto
• Costo Venta
• Margen Venta
Modelamiento Dimensional
Diseño Físico
• Esquema Estrella
• El centro del mdelo es la tabla de hechos (Fact Table)
• Alrededor de la tabla de hechos se organizan las tablas de Dimensiones
(Dimension Table)
• La tabla de hechos de arma en base a las Primary Key de cada tabla de
dimensión y con atributos numéricos (medidas), que corresponden a los
valores medibles sobre el proceso que se está modelando
• Se sugiere que cada dimensión tenga como Primary Key un clave subrogada,
para independizarla de cambios del negocio o para generar distintas versiones
de la información (Slowly Changing Dimension)
• Las Dimensiones se utilizan para filtrar o agrupar las medidas
Diseño Físico
Diseño Físico
• Esquema Copo de Nieve
• Es una extensión del modelo Estrella
• Cada dimensión se normaliza, por lo que cada nivel (atributo) se lleva a una
tabla (Lookup Table)
Diseño Físico
• Comparación de Esquemas
Estrella
• Mayor espacio
• Menos Join
• Menos flexible
Copo de Nieve
• Menos Espacio
• Más Flexible

Más contenido relacionado

La actualidad más candente

eZ Systems Brochure - ES
eZ Systems Brochure - ESeZ Systems Brochure - ES
eZ Systems Brochure - ES
Linda Martin
 
Kinetical K Viewer
Kinetical K Viewer Kinetical K Viewer
Kinetical K Viewer
Kinetical
 
CX Tech Day 2021 - CXPocket (Lukkap)
CX Tech Day 2021 - CXPocket (Lukkap)CX Tech Day 2021 - CXPocket (Lukkap)
CX Tech Day 2021 - CXPocket (Lukkap)
Asociación DEC
 
IBM & SAP
IBM & SAPIBM & SAP
CX Tech Day 2021 - Oracle Service Cloud (Oracle)
CX Tech Day 2021 - Oracle Service Cloud (Oracle)CX Tech Day 2021 - Oracle Service Cloud (Oracle)
CX Tech Day 2021 - Oracle Service Cloud (Oracle)
Asociación DEC
 
"Innovación en la relación con clientes", conferencia de Miguel Montes, direc...
"Innovación en la relación con clientes", conferencia de Miguel Montes, direc..."Innovación en la relación con clientes", conferencia de Miguel Montes, direc...
"Innovación en la relación con clientes", conferencia de Miguel Montes, direc...
Banco Sabadell
 
Pasando al siguiente nivel de las operaciones de TI
Pasando al siguiente nivel de las operaciones de TIPasando al siguiente nivel de las operaciones de TI
Pasando al siguiente nivel de las operaciones de TI
everis
 
Neteris Company Profile
Neteris Company ProfileNeteris Company Profile
Neteris Company Profile
Juan Manuel Grajera
 
Oracle Aplicaciones CRM Day 21 Octubre 2010
Oracle Aplicaciones CRM Day  21 Octubre 2010 Oracle Aplicaciones CRM Day  21 Octubre 2010
Oracle Aplicaciones CRM Day 21 Octubre 2010 AppsMk
 
Servicios para SAP Business Objects- Nova Praxis
Servicios para SAP Business Objects- Nova PraxisServicios para SAP Business Objects- Nova Praxis
Servicios para SAP Business Objects- Nova Praxis
Nova Praxis Soluciones de Negocio, S.L.
 
Presentación Genérica Soluciones
Presentación Genérica SolucionesPresentación Genérica Soluciones
Presentación Genérica Soluciones
arigur
 
Creando la Plataforma para la Transformación Digital @ Red Hat Forum Latin Am...
Creando la Plataforma para la Transformación Digital @ Red Hat Forum Latin Am...Creando la Plataforma para la Transformación Digital @ Red Hat Forum Latin Am...
Creando la Plataforma para la Transformación Digital @ Red Hat Forum Latin Am...
Martín Cabrera
 
Cisco CIO Summit 2016 Everis - Martin_Cabrera - v3
Cisco CIO Summit 2016 Everis - Martin_Cabrera - v3Cisco CIO Summit 2016 Everis - Martin_Cabrera - v3
Cisco CIO Summit 2016 Everis - Martin_Cabrera - v3
Martín Cabrera
 
Presentación Neointec. Tu aliado tecnológico
Presentación Neointec. Tu aliado tecnológicoPresentación Neointec. Tu aliado tecnológico
Presentación Neointec. Tu aliado tecnológico
Neointec
 
Centro de Operaciones Remotas Integradas
Centro de Operaciones Remotas IntegradasCentro de Operaciones Remotas Integradas
Centro de Operaciones Remotas Integradas
accenture
 
CGDL2018 - Sessió: "Cómo la transformación digital impacta positivamente en e...
CGDL2018 - Sessió: "Cómo la transformación digital impacta positivamente en e...CGDL2018 - Sessió: "Cómo la transformación digital impacta positivamente en e...
CGDL2018 - Sessió: "Cómo la transformación digital impacta positivamente en e...
Consorci Administració Oberta de Catalunya
 
La economía conectada: cuando los objetos también tomen decisiones
La economía conectada: cuando los objetos también tomen decisionesLa economía conectada: cuando los objetos también tomen decisiones
La economía conectada: cuando los objetos también tomen decisiones
AMETIC
 
¿Qué debemos hacer desde Tecnología para estar alineados con la Transformac...
¿Qué debemos hacer desde Tecnología para estar alineados con la Transformac...¿Qué debemos hacer desde Tecnología para estar alineados con la Transformac...
¿Qué debemos hacer desde Tecnología para estar alineados con la Transformac...
Martín Cabrera
 
Servicios, soluciones y productos ironbit 2018
Servicios, soluciones y productos  ironbit 2018Servicios, soluciones y productos  ironbit 2018
Servicios, soluciones y productos ironbit 2018
David Martínez Carmona
 

La actualidad más candente (19)

eZ Systems Brochure - ES
eZ Systems Brochure - ESeZ Systems Brochure - ES
eZ Systems Brochure - ES
 
Kinetical K Viewer
Kinetical K Viewer Kinetical K Viewer
Kinetical K Viewer
 
CX Tech Day 2021 - CXPocket (Lukkap)
CX Tech Day 2021 - CXPocket (Lukkap)CX Tech Day 2021 - CXPocket (Lukkap)
CX Tech Day 2021 - CXPocket (Lukkap)
 
IBM & SAP
IBM & SAPIBM & SAP
IBM & SAP
 
CX Tech Day 2021 - Oracle Service Cloud (Oracle)
CX Tech Day 2021 - Oracle Service Cloud (Oracle)CX Tech Day 2021 - Oracle Service Cloud (Oracle)
CX Tech Day 2021 - Oracle Service Cloud (Oracle)
 
"Innovación en la relación con clientes", conferencia de Miguel Montes, direc...
"Innovación en la relación con clientes", conferencia de Miguel Montes, direc..."Innovación en la relación con clientes", conferencia de Miguel Montes, direc...
"Innovación en la relación con clientes", conferencia de Miguel Montes, direc...
 
Pasando al siguiente nivel de las operaciones de TI
Pasando al siguiente nivel de las operaciones de TIPasando al siguiente nivel de las operaciones de TI
Pasando al siguiente nivel de las operaciones de TI
 
Neteris Company Profile
Neteris Company ProfileNeteris Company Profile
Neteris Company Profile
 
Oracle Aplicaciones CRM Day 21 Octubre 2010
Oracle Aplicaciones CRM Day  21 Octubre 2010 Oracle Aplicaciones CRM Day  21 Octubre 2010
Oracle Aplicaciones CRM Day 21 Octubre 2010
 
Servicios para SAP Business Objects- Nova Praxis
Servicios para SAP Business Objects- Nova PraxisServicios para SAP Business Objects- Nova Praxis
Servicios para SAP Business Objects- Nova Praxis
 
Presentación Genérica Soluciones
Presentación Genérica SolucionesPresentación Genérica Soluciones
Presentación Genérica Soluciones
 
Creando la Plataforma para la Transformación Digital @ Red Hat Forum Latin Am...
Creando la Plataforma para la Transformación Digital @ Red Hat Forum Latin Am...Creando la Plataforma para la Transformación Digital @ Red Hat Forum Latin Am...
Creando la Plataforma para la Transformación Digital @ Red Hat Forum Latin Am...
 
Cisco CIO Summit 2016 Everis - Martin_Cabrera - v3
Cisco CIO Summit 2016 Everis - Martin_Cabrera - v3Cisco CIO Summit 2016 Everis - Martin_Cabrera - v3
Cisco CIO Summit 2016 Everis - Martin_Cabrera - v3
 
Presentación Neointec. Tu aliado tecnológico
Presentación Neointec. Tu aliado tecnológicoPresentación Neointec. Tu aliado tecnológico
Presentación Neointec. Tu aliado tecnológico
 
Centro de Operaciones Remotas Integradas
Centro de Operaciones Remotas IntegradasCentro de Operaciones Remotas Integradas
Centro de Operaciones Remotas Integradas
 
CGDL2018 - Sessió: "Cómo la transformación digital impacta positivamente en e...
CGDL2018 - Sessió: "Cómo la transformación digital impacta positivamente en e...CGDL2018 - Sessió: "Cómo la transformación digital impacta positivamente en e...
CGDL2018 - Sessió: "Cómo la transformación digital impacta positivamente en e...
 
La economía conectada: cuando los objetos también tomen decisiones
La economía conectada: cuando los objetos también tomen decisionesLa economía conectada: cuando los objetos también tomen decisiones
La economía conectada: cuando los objetos también tomen decisiones
 
¿Qué debemos hacer desde Tecnología para estar alineados con la Transformac...
¿Qué debemos hacer desde Tecnología para estar alineados con la Transformac...¿Qué debemos hacer desde Tecnología para estar alineados con la Transformac...
¿Qué debemos hacer desde Tecnología para estar alineados con la Transformac...
 
Servicios, soluciones y productos ironbit 2018
Servicios, soluciones y productos  ironbit 2018Servicios, soluciones y productos  ironbit 2018
Servicios, soluciones y productos ironbit 2018
 

Similar a 2.1 fundamentos de data warehousing

Inteligencia de Negocios – Data Warehouse
Inteligencia de Negocios – Data WarehouseInteligencia de Negocios – Data Warehouse
Inteligencia de Negocios – Data Warehouse
JOSE AHIAS LOPEZ PORTILLO
 
Unidad vii esp parte 3 clase de datawarehouse ( ing. doño)
Unidad vii esp parte 3 clase de datawarehouse ( ing. doño)Unidad vii esp parte 3 clase de datawarehouse ( ing. doño)
Unidad vii esp parte 3 clase de datawarehouse ( ing. doño)Titiushko Jazz
 
Unidad vii esp parte 3 clase de datawarehouse ( ing. doño)
Unidad vii esp parte 3 clase de datawarehouse ( ing. doño)Unidad vii esp parte 3 clase de datawarehouse ( ing. doño)
Unidad vii esp parte 3 clase de datawarehouse ( ing. doño)Titiushko Jazz
 
Implementando un Data Mart con SQL Server 2016
Implementando un Data Mart con SQL Server 2016Implementando un Data Mart con SQL Server 2016
Implementando un Data Mart con SQL Server 2016
Raul Martin Sarachaga Diaz
 
Introduccion datawarehouse
Introduccion datawarehouseIntroduccion datawarehouse
Introduccion datawarehouse
Eduardo Castro
 
BusinessIntelligence Introduction
BusinessIntelligence IntroductionBusinessIntelligence Introduction
BusinessIntelligence Introduction
andres hurtado
 
18305938 e4 implementaciondeunsistema_bi
18305938 e4 implementaciondeunsistema_bi18305938 e4 implementaciondeunsistema_bi
18305938 e4 implementaciondeunsistema_bi
Jose Antonio Perez Vega
 
Modelado de Data Warehouse
Modelado de Data WarehouseModelado de Data Warehouse
Modelado de Data Warehouse
Eduardo Castro
 
Minería de datos Presentación
Minería de datos PresentaciónMinería de datos Presentación
Minería de datos Presentaciónedmaga
 
Minera de-datos-presentacin-1205263710628735-3
Minera de-datos-presentacin-1205263710628735-3Minera de-datos-presentacin-1205263710628735-3
Minera de-datos-presentacin-1205263710628735-3Climanfef
 
Entregable final
Entregable finalEntregable final
Entregable final
Jose Luis Sanchez Isaias
 
Fundamentos de BI
Fundamentos de BIFundamentos de BI
Fundamentos de BI
JOSE AHIAS LOPEZ PORTILLO
 
Lab 01 modelado
Lab 01   modeladoLab 01   modelado
Lab 01 modelado
juan morales
 
Business Inteligence
Business InteligenceBusiness Inteligence
Business Inteligence
River velasco tadeo
 
Sql server analysis services 2008
Sql server analysis services 2008Sql server analysis services 2008
Sql server analysis services 2008
Will Flores Soto
 
Software Libre para la Toma de Decisiones
Software Libre para la Toma de DecisionesSoftware Libre para la Toma de Decisiones
Software Libre para la Toma de Decisiones
Héctor Neri
 

Similar a 2.1 fundamentos de data warehousing (20)

Inteligencia de Negocios – Data Warehouse
Inteligencia de Negocios – Data WarehouseInteligencia de Negocios – Data Warehouse
Inteligencia de Negocios – Data Warehouse
 
Unidad vii esp parte 3 clase de datawarehouse ( ing. doño)
Unidad vii esp parte 3 clase de datawarehouse ( ing. doño)Unidad vii esp parte 3 clase de datawarehouse ( ing. doño)
Unidad vii esp parte 3 clase de datawarehouse ( ing. doño)
 
Unidad vii esp parte 3 clase de datawarehouse ( ing. doño)
Unidad vii esp parte 3 clase de datawarehouse ( ing. doño)Unidad vii esp parte 3 clase de datawarehouse ( ing. doño)
Unidad vii esp parte 3 clase de datawarehouse ( ing. doño)
 
Implementando un Data Mart con SQL Server 2016
Implementando un Data Mart con SQL Server 2016Implementando un Data Mart con SQL Server 2016
Implementando un Data Mart con SQL Server 2016
 
Kdd fase1
Kdd fase1Kdd fase1
Kdd fase1
 
Introduccion datawarehouse
Introduccion datawarehouseIntroduccion datawarehouse
Introduccion datawarehouse
 
BusinessIntelligence Introduction
BusinessIntelligence IntroductionBusinessIntelligence Introduction
BusinessIntelligence Introduction
 
18305938 e4 implementaciondeunsistema_bi
18305938 e4 implementaciondeunsistema_bi18305938 e4 implementaciondeunsistema_bi
18305938 e4 implementaciondeunsistema_bi
 
Modelado de Data Warehouse
Modelado de Data WarehouseModelado de Data Warehouse
Modelado de Data Warehouse
 
Minería de datos Presentación
Minería de datos PresentaciónMinería de datos Presentación
Minería de datos Presentación
 
Minera de-datos-presentacin-1205263710628735-3
Minera de-datos-presentacin-1205263710628735-3Minera de-datos-presentacin-1205263710628735-3
Minera de-datos-presentacin-1205263710628735-3
 
Entregable final
Entregable finalEntregable final
Entregable final
 
Fundamentos de BI
Fundamentos de BIFundamentos de BI
Fundamentos de BI
 
Grupo eGlu Bi
Grupo eGlu BiGrupo eGlu Bi
Grupo eGlu Bi
 
Lab 01 modelado
Lab 01   modeladoLab 01   modelado
Lab 01 modelado
 
Data Warehouse
Data WarehouseData Warehouse
Data Warehouse
 
Datawarehouse2
Datawarehouse2Datawarehouse2
Datawarehouse2
 
Business Inteligence
Business InteligenceBusiness Inteligence
Business Inteligence
 
Sql server analysis services 2008
Sql server analysis services 2008Sql server analysis services 2008
Sql server analysis services 2008
 
Software Libre para la Toma de Decisiones
Software Libre para la Toma de DecisionesSoftware Libre para la Toma de Decisiones
Software Libre para la Toma de Decisiones
 

2.1 fundamentos de data warehousing

  • 3. Es el proceso para construir un Data Warehouse Un Data Warehouse (DWH) es una colección de datos “orientada a un tema específico”, integrada, no volátil y variante en el tiempo. De manera práctica es una base de datos que reúne datos de diversas fuentes para apoyar el proceso de toma decisiones. ¿Qué es Data Warehousing?
  • 5. En esta arquitectura se puede apreciar de izquierda a derecha: ✔ Diversar fuentes de datos, que generalmente contienen los datos transaccionales u operacionales de la organización ✔ Procesos de Extracción, Transformación y Carga de Datos (ETL) ✔ Data Warehouse o almacén de datos ✔ Capa de explotación, la cual puede ser representada como reportes, minería de datos o herramientas OLAP Arquiectura de un DWH
  • 6. En esta arquitectura se incorpora al ecosistema un repositorio de Big Data, para capturar datos semiestructurados o no estructurados. Arquiectura de un DWH en la era del Big Data
  • 7. Estrategias para desarrollar un DWH • Enfoque de Data Warehouse Corporativo • Top-down • Metodología de Bill Inmon (Padre del DWH)
  • 8. Estrategias para desarrollar un DWH • Enfoque de Data Mart • Bottom-up • Metodología de Ralph Kimball (Padre del BI)
  • 9. Este enfoque se basa en el modelamiento Dimensional. Para ellos se deben realizar las siguientes actividades: I. Elegir el proceso de negocio II. Establecer el nivel de granularidad III. Elegir las dimensiones IV. Identificar medidas y las tablas de hechos Modelamiento Dimensional
  • 10. I. Seleccionar un Proceso de Negocio • Por ejemplo: • Proceso de Venta • Proceso de Compras • Proceso de Selección de Personal II. Determinar la Granularidad • Definir el nivel de detalle que se desea almacenar los datos del proceso. • Depende de los requerimientos del negocio y los datos que existe en los sistemas que soportan el proceso • La sugerencia es comenzar a diseñar el DW al mayor nivel de detalle posible • Se puede luego realizar Sumarizaciones (Agregaciones) al nivel deseado Modelamiento Dimensional
  • 11. III. Identificar las Dimensiones • Surgen naturalmente de las sesiones de análisis y facilitadas por la elección del nivel de granularidad y de la matriz de procesos/dimensiones • Por ejemplo: • Tiempo: ¿cuándo se produce la actividad? • Producto: ¿cuál es el objeto de la actividad? • Almacén: ¿dónde se produce la actividad? • Cliente: ¿quién es el destinatario de la actividad? Vent a Tiempo Tienda Empleado Producto Modelamiento Dimensional
  • 12. III. Identificar las Métricas y Tablas de Hecho • Decidir la información a almacenar sobre el proceso. • Hechos: información (sobre la actividad) que se desea almacenar en cada registro de la tabla de hechos y que será objeto del análisis. • Ejemplos: cantidades, sumas, máximos,… Métricas Directas: • Unidades Vendidas • Monto Vendido • Monto Pago • Puntos • Vuelto • Métricas del Contexto • Costo Venta • Margen Venta Modelamiento Dimensional
  • 13. Diseño Físico • Esquema Estrella • El centro del mdelo es la tabla de hechos (Fact Table) • Alrededor de la tabla de hechos se organizan las tablas de Dimensiones (Dimension Table) • La tabla de hechos de arma en base a las Primary Key de cada tabla de dimensión y con atributos numéricos (medidas), que corresponden a los valores medibles sobre el proceso que se está modelando • Se sugiere que cada dimensión tenga como Primary Key un clave subrogada, para independizarla de cambios del negocio o para generar distintas versiones de la información (Slowly Changing Dimension) • Las Dimensiones se utilizan para filtrar o agrupar las medidas
  • 15. Diseño Físico • Esquema Copo de Nieve • Es una extensión del modelo Estrella • Cada dimensión se normaliza, por lo que cada nivel (atributo) se lleva a una tabla (Lookup Table)
  • 16. Diseño Físico • Comparación de Esquemas Estrella • Mayor espacio • Menos Join • Menos flexible Copo de Nieve • Menos Espacio • Más Flexible