SlideShare una empresa de Scribd logo
1 de 10
INTELIGENCIA DE NEGOCIOS
Elena López
Especialista en Inteligencia de Negocios
elopez@srlsti.com
TERCERA PARTE – DATAWARE HOUSE
Base de Datos Corporativa, que integra datos de una o varias fuentes relacionados
a un tema en específico, guardando un histórico no volátil (invariable) de los datos
a través del tiempo.
Almacén de Datos o Data Warehouse
www.srlsti.com
Una Dimensión es una estructura que categoriza hechos y medidas que permiten a
los usuarios responder preguntas de negocio, en otras palabras, una dimensión no
es más que una colección de información relacionadas a algún evento medible.
Pueden sufrir cambios o transformaciones en el tiempo, que dependiendo o no de
su nivel de impacto se va a almacenar o no.
Los hechos hacen referencia a la estructura de datos que almacena los valores de
las medidas relacionadas con las dimensiones, a diferencia de estas, nunca
cambian.
Dimensiones y Hechos
www.srlsti.com
La tabla de Dimensión tiene siempre una clave primaria que únicamente se utiliza
para identificar cada registro de la dimensión (cada fila) y para relacionar los
hechos a través de esta columna.
Los hechos pueden ser filtrados y agrupados por varias combinaciones de atributos
de cada dimensión.
Algunas dimensiones contienen jerarquías de atributos que soportan ver los datos
en forma de drill down.
Dimensiones y Hechos
www.srlsti.com
La tabla de Dimensión tiene siempre una clave primaria que únicamente se utiliza
para identificar cada registro de la dimensión (cada fila) y para relacionar los
hechos a través de esta columna.
Los hechos pueden ser filtrados y agrupados por varias combinaciones de atributos
de cada dimensión.
Dimensiones y Hechos
www.srlsti.com
Esquema Estrella
Su característica más obvia y
principal es que las tablas de
dimensiones NO están
normalizadas.
Esquemas Estrella (star) y Copo de nieve (snowflake)
www.srlsti.com
Esquema Copo de Nieve
Su característica más obvia y
principal es que las tablas de
dimensiones SI están
normalizadas.
Esquemas Estrella (star) y Copo de nieve (snowflake)
www.srlsti.com
Esquemas Estrella (star) y Copo de nieve (snowflake)
www.srlsti.com
El esquema Snowflake ocupa menos espacio para almacenar los registros.
Los datos no normalizados incrementan el riesgo de tener datos con
problemas de integridad que pueden ser muy difíciles de detectar y corregir
en DWH.
SCD por sus siglas en inglés, Slowly Changing Dimensions, se refiere a los
datos de las dimensiones que van cambiando a través del tiempo.
Las dimensiones pueden ser estáticas como los años y meses, o cambiar
lentamente como los nombres de los países, o cambiar más rápidamente
como la clasificación de los productos.
Existen distintos tipos conceptuales de SCD, pero nos vamos a enfocar
únicamente en los tipos 1 y 2.
Dimensiones Lentamente Cambiantes
www.srlsti.com
TIPO 1:
Se sobrescriben los valores.
- Cambios en columnas que no necesariamente impactan el modelo de
negocio.
TIPO 2:
- Debe incluir las columnas Fecha de inicio, fecha de fin y un flag que indique
si es la versión actual del registro.
Dimensiones Lentamente Cambiantes
www.srlsti.com

Más contenido relacionado

Similar a Inteligencia de negocios - tercera parte

Procesamiento de datos.
Procesamiento de datos. Procesamiento de datos.
Procesamiento de datos.
iyaokun
 
Unidad vii esp parte 2 introduccion a data warehouse y datamining
Unidad vii esp parte 2 introduccion a data warehouse y dataminingUnidad vii esp parte 2 introduccion a data warehouse y datamining
Unidad vii esp parte 2 introduccion a data warehouse y datamining
Titiushko Jazz
 
Unidad vii esp parte 2 introduccion a data warehouse y datamining
Unidad vii esp parte 2 introduccion a data warehouse y dataminingUnidad vii esp parte 2 introduccion a data warehouse y datamining
Unidad vii esp parte 2 introduccion a data warehouse y datamining
Titiushko Jazz
 
BASE DE DATOS
 BASE DE DATOS BASE DE DATOS
BASE DE DATOS
anyeley
 
Tecnicas de presentacion de Cubos de analisis OLAP.pptx
Tecnicas de presentacion de Cubos de analisis OLAP.pptxTecnicas de presentacion de Cubos de analisis OLAP.pptx
Tecnicas de presentacion de Cubos de analisis OLAP.pptx
JUANCARLOSGALINDOPIR
 
Procesamiento de datos
Procesamiento de datosProcesamiento de datos
Procesamiento de datos
armelinda
 
Modelo dimensional de un proceso de negocio
Modelo dimensional de un proceso de negocioModelo dimensional de un proceso de negocio
Modelo dimensional de un proceso de negocio
Miguel Orquera
 

Similar a Inteligencia de negocios - tercera parte (20)

Base dts
Base dtsBase dts
Base dts
 
Base dts
Base dtsBase dts
Base dts
 
ASOCEU SPAIN - Lesson 2 - Data Refining (slides ES)
ASOCEU SPAIN - Lesson 2 - Data Refining (slides ES)ASOCEU SPAIN - Lesson 2 - Data Refining (slides ES)
ASOCEU SPAIN - Lesson 2 - Data Refining (slides ES)
 
Presentacion base de datos
Presentacion base de datosPresentacion base de datos
Presentacion base de datos
 
Procesamiento de datos.
Procesamiento de datos. Procesamiento de datos.
Procesamiento de datos.
 
Base de datos
Base de datosBase de datos
Base de datos
 
Acceso a datos en aplicaciones web del entorno servidor
Acceso a datos en aplicaciones web del entorno servidorAcceso a datos en aplicaciones web del entorno servidor
Acceso a datos en aplicaciones web del entorno servidor
 
Informacion
InformacionInformacion
Informacion
 
Unidad vii esp parte 2 introduccion a data warehouse y datamining
Unidad vii esp parte 2 introduccion a data warehouse y dataminingUnidad vii esp parte 2 introduccion a data warehouse y datamining
Unidad vii esp parte 2 introduccion a data warehouse y datamining
 
Unidad vii esp parte 2 introduccion a data warehouse y datamining
Unidad vii esp parte 2 introduccion a data warehouse y dataminingUnidad vii esp parte 2 introduccion a data warehouse y datamining
Unidad vii esp parte 2 introduccion a data warehouse y datamining
 
Tablas exel que son
Tablas exel que sonTablas exel que son
Tablas exel que son
 
Base de datos_aci_253_26_10 [autoguardado]
Base de datos_aci_253_26_10 [autoguardado]Base de datos_aci_253_26_10 [autoguardado]
Base de datos_aci_253_26_10 [autoguardado]
 
BASE DE DATOS
 BASE DE DATOS BASE DE DATOS
BASE DE DATOS
 
Base de datos
Base de datosBase de datos
Base de datos
 
2 Desa Sincrono 2 Caso Modelamiento.doc
2 Desa Sincrono 2 Caso Modelamiento.doc2 Desa Sincrono 2 Caso Modelamiento.doc
2 Desa Sincrono 2 Caso Modelamiento.doc
 
Modelos de datos
Modelos de datosModelos de datos
Modelos de datos
 
Tecnicas de presentacion de Cubos de analisis OLAP.pptx
Tecnicas de presentacion de Cubos de analisis OLAP.pptxTecnicas de presentacion de Cubos de analisis OLAP.pptx
Tecnicas de presentacion de Cubos de analisis OLAP.pptx
 
Procesamiento de datos
Procesamiento de datosProcesamiento de datos
Procesamiento de datos
 
Modelo dimensional de un proceso de negocio
Modelo dimensional de un proceso de negocioModelo dimensional de un proceso de negocio
Modelo dimensional de un proceso de negocio
 
Fases para la creacion de una bd
Fases para la creacion de una bdFases para la creacion de una bd
Fases para la creacion de una bd
 

Más de Elena Lopez

Más de Elena Lopez (12)

Data driven decision making
Data driven decision makingData driven decision making
Data driven decision making
 
Data pipeline
Data pipelineData pipeline
Data pipeline
 
Modern data warehouse
Modern data warehouseModern data warehouse
Modern data warehouse
 
Arquitectura de Datos en Azure
Arquitectura de Datos en AzureArquitectura de Datos en Azure
Arquitectura de Datos en Azure
 
Data analytics on Azure
Data analytics on AzureData analytics on Azure
Data analytics on Azure
 
El valor de los datos 3.0
El valor de los datos 3.0El valor de los datos 3.0
El valor de los datos 3.0
 
Gestión de Proyectos de Ciencia de Datos
Gestión de Proyectos de Ciencia de DatosGestión de Proyectos de Ciencia de Datos
Gestión de Proyectos de Ciencia de Datos
 
Analitica avanzada
Analitica avanzadaAnalitica avanzada
Analitica avanzada
 
Consideraciones para un buen diseño lógico de base de datos
Consideraciones para un buen diseño lógico de base de datosConsideraciones para un buen diseño lógico de base de datos
Consideraciones para un buen diseño lógico de base de datos
 
El valor de los datos
El valor de los datosEl valor de los datos
El valor de los datos
 
1. introduccion las Bases de Datos
1. introduccion las Bases de Datos1. introduccion las Bases de Datos
1. introduccion las Bases de Datos
 
1. introduccion a las Bases de datos
1. introduccion a las Bases de datos1. introduccion a las Bases de datos
1. introduccion a las Bases de datos
 

Último

Los más ricos administradores de fondo de cobertura (1968-2024).pdf
Los más ricos administradores de fondo de cobertura (1968-2024).pdfLos más ricos administradores de fondo de cobertura (1968-2024).pdf
Los más ricos administradores de fondo de cobertura (1968-2024).pdf
JC Díaz Herrera
 
MÍNIMO COMÚN MÚLTIPLO, MÁXIMO COMÚN DIVISOR.pptx
MÍNIMO COMÚN MÚLTIPLO, MÁXIMO COMÚN DIVISOR.pptxMÍNIMO COMÚN MÚLTIPLO, MÁXIMO COMÚN DIVISOR.pptx
MÍNIMO COMÚN MÚLTIPLO, MÁXIMO COMÚN DIVISOR.pptx
CristianCastro978067
 

Último (20)

presentacion de conjuntos para primaria.ppt
presentacion de conjuntos para primaria.pptpresentacion de conjuntos para primaria.ppt
presentacion de conjuntos para primaria.ppt
 
Industria musical de EUA vs Industria musical Corea del Sur (2024).pdf
Industria musical de EUA vs Industria musical Corea del Sur (2024).pdfIndustria musical de EUA vs Industria musical Corea del Sur (2024).pdf
Industria musical de EUA vs Industria musical Corea del Sur (2024).pdf
 
Las mujeres más ricas del mundo (2024).pdf
Las mujeres más ricas del mundo (2024).pdfLas mujeres más ricas del mundo (2024).pdf
Las mujeres más ricas del mundo (2024).pdf
 
PANTEÓN DE Paris en historia de la arquitectura
PANTEÓN DE Paris en historia de la arquitecturaPANTEÓN DE Paris en historia de la arquitectura
PANTEÓN DE Paris en historia de la arquitectura
 
Novelas Turcas vs Series de EUA en audiencia (2024).pdf
Novelas Turcas vs Series de EUA en audiencia  (2024).pdfNovelas Turcas vs Series de EUA en audiencia  (2024).pdf
Novelas Turcas vs Series de EUA en audiencia (2024).pdf
 
Posiciones_del_sionismo_en_los_imperios globales de la humanidad (2024).pdf
Posiciones_del_sionismo_en_los_imperios globales de la humanidad (2024).pdfPosiciones_del_sionismo_en_los_imperios globales de la humanidad (2024).pdf
Posiciones_del_sionismo_en_los_imperios globales de la humanidad (2024).pdf
 
Listas de Fundamentos de Programación 2024
Listas de Fundamentos de Programación 2024Listas de Fundamentos de Programación 2024
Listas de Fundamentos de Programación 2024
 
INFORME DE EVALUACIÓN DE LOS REQUERIMIENTOS.pdf
INFORME DE EVALUACIÓN DE LOS REQUERIMIENTOS.pdfINFORME DE EVALUACIÓN DE LOS REQUERIMIENTOS.pdf
INFORME DE EVALUACIÓN DE LOS REQUERIMIENTOS.pdf
 
Los más ricos administradores de fondo de cobertura (1968-2024).pdf
Los más ricos administradores de fondo de cobertura (1968-2024).pdfLos más ricos administradores de fondo de cobertura (1968-2024).pdf
Los más ricos administradores de fondo de cobertura (1968-2024).pdf
 
llllllllllllllllllllllllllllllllllllllllllllllllllllllllll
llllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllll
llllllllllllllllllllllllllllllllllllllllllllllllllllllllll
 
CNEB-CURRICULO NACIONAL DE EDUCACION BASICA
CNEB-CURRICULO NACIONAL DE EDUCACION BASICACNEB-CURRICULO NACIONAL DE EDUCACION BASICA
CNEB-CURRICULO NACIONAL DE EDUCACION BASICA
 
Presentacion-Prevencion-Incendios-Forestales.pdf
Presentacion-Prevencion-Incendios-Forestales.pdfPresentacion-Prevencion-Incendios-Forestales.pdf
Presentacion-Prevencion-Incendios-Forestales.pdf
 
Triptico-del-Bullying qué es, cómo detectarlo, donde acudir
Triptico-del-Bullying qué es, cómo detectarlo, donde acudirTriptico-del-Bullying qué es, cómo detectarlo, donde acudir
Triptico-del-Bullying qué es, cómo detectarlo, donde acudir
 
Análisis de datos en acción: Optimizando el crecimiento de Cyclistic
Análisis de datos en acción: Optimizando el crecimiento de CyclisticAnálisis de datos en acción: Optimizando el crecimiento de Cyclistic
Análisis de datos en acción: Optimizando el crecimiento de Cyclistic
 
PIB PERÚ datos y análisis de los últimos años
PIB PERÚ datos y análisis de los últimos añosPIB PERÚ datos y análisis de los últimos años
PIB PERÚ datos y análisis de los últimos años
 
Las familias más ricas del sionismo en el siglo XXI.pdf
Las familias más ricas del sionismo en el siglo XXI.pdfLas familias más ricas del sionismo en el siglo XXI.pdf
Las familias más ricas del sionismo en el siglo XXI.pdf
 
Investigacion cualitativa y cuantitativa....pdf
Investigacion cualitativa y cuantitativa....pdfInvestigacion cualitativa y cuantitativa....pdf
Investigacion cualitativa y cuantitativa....pdf
 
MÍNIMO COMÚN MÚLTIPLO, MÁXIMO COMÚN DIVISOR.pptx
MÍNIMO COMÚN MÚLTIPLO, MÁXIMO COMÚN DIVISOR.pptxMÍNIMO COMÚN MÚLTIPLO, MÁXIMO COMÚN DIVISOR.pptx
MÍNIMO COMÚN MÚLTIPLO, MÁXIMO COMÚN DIVISOR.pptx
 
Los idiomas más hablados en el mundo (2024).pdf
Los idiomas más hablados en el mundo  (2024).pdfLos idiomas más hablados en el mundo  (2024).pdf
Los idiomas más hablados en el mundo (2024).pdf
 
INTRODUCCION-A-LOS-ALGORITMOS-BASICOS.pptx
INTRODUCCION-A-LOS-ALGORITMOS-BASICOS.pptxINTRODUCCION-A-LOS-ALGORITMOS-BASICOS.pptx
INTRODUCCION-A-LOS-ALGORITMOS-BASICOS.pptx
 

Inteligencia de negocios - tercera parte

  • 1. INTELIGENCIA DE NEGOCIOS Elena López Especialista en Inteligencia de Negocios elopez@srlsti.com TERCERA PARTE – DATAWARE HOUSE
  • 2. Base de Datos Corporativa, que integra datos de una o varias fuentes relacionados a un tema en específico, guardando un histórico no volátil (invariable) de los datos a través del tiempo. Almacén de Datos o Data Warehouse www.srlsti.com
  • 3. Una Dimensión es una estructura que categoriza hechos y medidas que permiten a los usuarios responder preguntas de negocio, en otras palabras, una dimensión no es más que una colección de información relacionadas a algún evento medible. Pueden sufrir cambios o transformaciones en el tiempo, que dependiendo o no de su nivel de impacto se va a almacenar o no. Los hechos hacen referencia a la estructura de datos que almacena los valores de las medidas relacionadas con las dimensiones, a diferencia de estas, nunca cambian. Dimensiones y Hechos www.srlsti.com
  • 4. La tabla de Dimensión tiene siempre una clave primaria que únicamente se utiliza para identificar cada registro de la dimensión (cada fila) y para relacionar los hechos a través de esta columna. Los hechos pueden ser filtrados y agrupados por varias combinaciones de atributos de cada dimensión. Algunas dimensiones contienen jerarquías de atributos que soportan ver los datos en forma de drill down. Dimensiones y Hechos www.srlsti.com
  • 5. La tabla de Dimensión tiene siempre una clave primaria que únicamente se utiliza para identificar cada registro de la dimensión (cada fila) y para relacionar los hechos a través de esta columna. Los hechos pueden ser filtrados y agrupados por varias combinaciones de atributos de cada dimensión. Dimensiones y Hechos www.srlsti.com
  • 6. Esquema Estrella Su característica más obvia y principal es que las tablas de dimensiones NO están normalizadas. Esquemas Estrella (star) y Copo de nieve (snowflake) www.srlsti.com
  • 7. Esquema Copo de Nieve Su característica más obvia y principal es que las tablas de dimensiones SI están normalizadas. Esquemas Estrella (star) y Copo de nieve (snowflake) www.srlsti.com
  • 8. Esquemas Estrella (star) y Copo de nieve (snowflake) www.srlsti.com El esquema Snowflake ocupa menos espacio para almacenar los registros. Los datos no normalizados incrementan el riesgo de tener datos con problemas de integridad que pueden ser muy difíciles de detectar y corregir en DWH.
  • 9. SCD por sus siglas en inglés, Slowly Changing Dimensions, se refiere a los datos de las dimensiones que van cambiando a través del tiempo. Las dimensiones pueden ser estáticas como los años y meses, o cambiar lentamente como los nombres de los países, o cambiar más rápidamente como la clasificación de los productos. Existen distintos tipos conceptuales de SCD, pero nos vamos a enfocar únicamente en los tipos 1 y 2. Dimensiones Lentamente Cambiantes www.srlsti.com
  • 10. TIPO 1: Se sobrescriben los valores. - Cambios en columnas que no necesariamente impactan el modelo de negocio. TIPO 2: - Debe incluir las columnas Fecha de inicio, fecha de fin y un flag que indique si es la versión actual del registro. Dimensiones Lentamente Cambiantes www.srlsti.com