SlideShare una empresa de Scribd logo
17/09/2023
➢ Antecedentes.
➢ Enfoque de Inmon.
➢ Enfoque de Kimball.
➢ Metodología de Kimball
➢Planificación del proyecto
➢Requerimientos del Negocio
➢Línea tecnológica
➢Línea de datos
➢Línea de aplicación del BI
➢Despliegue
Agenda
➢ Antecedentes.
➢ Enfoque Inmon.
➢ Enfoque Kimball.
➢ Metodología de Kimball
➢Planificación del proyecto
➢Requerimientos del Negocio
➢Línea tecnológica
➢Línea de datos
➢Línea de aplicación del BI
➢Despliegue
Agenda
Metodologías OLAP / OLTP
Sistemas de Información Data Warehouse
• Los procesos a automatizar son
repetibles y previsibles.
• Modelado Entidad Relación.
• Atención en una rápida modificación en
línea de los datos.
• El uso de los datos es exploratorio y
menos predictible.
• Modelado multidimensional.
• Enfocado en la carga y la presentación
de los datos
DWH no es solamente crear un conjunto de reportes que corren periódicamente.
Se trata de preguntas que hay que alcanzar y que puede llevar a lugares imprevistos.
Conceptos Clave
• Datamart. Repositorio de datos especifico.
– Diseñado para responder las preguntas específicas.
– Diseñado para servir las necesidades de unidades de negocio (ventas,
comercialización, operaciones, contabilidad, etc.)
– Es construido usando modelado dimensional
• Data warehouse. Repositorio de datos organizacional
– Almacena datos de toda la empresa y de todas las áreas.
– Es una colección empresarial de datamarts.
– Contiene data masiva e integrada
• Inteligencia de Negocios.
– Reportes y análisis de datos almacenadas en el DWH
– Data warehouse/business intelligence (DW/BI) se refiere al sistema completo de
extremo a extremo.
Metodologías para el DWH
Top-Down Bottom-Up Hybrid Federated
Profesional Bill Inmon Rodolfo Kimball Muchos profesionales Doug Hackney
Énfasis DWH DataMarts DWH y DataMarts
Integrado a entornos BI
heterogéneos
Diseño
Modelo normalizado basado
en la empresa
El modelo dimensional de
datamarts, usa esquema de
estrella
Modelos locales y uno o más
esquemas de estrella
Una arquitectura de
arquitecturas; comparte
dimensiones, hechos, reglas,
definiciones a través de la
organización
Arquitectura
Compuesto de varios niveles
de áreas de interés y
datamarts dependientes
Área de interés y datamarts
Modelo empresarial
normalizado de alto nivel;
datamarts iníciales.
Realidad del cambio en
organizaciones y sistemas
Data set
DWH datos a nivel atómico;
datamarts datos
sumarizados
Contiene datos atómicos y
sumarizados
Carga datamarts con datos
atómicos y sumarizados vía
un área de interés no
persistente
Uso de cualquiera significado
posible para integrar las
necesidades de negocio
Historia de DWH
Inmon.
1990 Publica Building the Data Warehouse
2002 Mejora su libro y define una arquitectura como una colección
de fuentes dispares en almacenes de datos detalles y
variantes en el tiempo.
Kimball
1996 Publica The Data Warehouse Toolkit
2002 Mejora su libro y define multiples bases de datos llamados
datamarts que son organizados por procesos de negocio,
pero usan medios de datos estandarizados para la empresa.
Top-Down
Botton-Up
Enfoques acerca del DWH
• Bill Inmon → Normalizado.
– Building the Data Warehouse
– Corporate Information Factory
• Ralph Kimball -> Dimensional.
– The Data Warehouse Lifecycle Toolkit
– The Data Warehouse Toolkit
Enfoques acerca del DWH
• Bill Inmon → Top-Down
– El DWH usa modelo de datos de toda la empresa
– El DWH es un depósito de datamarts
– Más tiempo para implementar.
– Fracasos por falta de paciencia y de compromiso
• Ralph Kimball -> Bottom-Up
– Inicia con un datamart, luego otros datamarts.
– El flujo de datos: fuente → datamart
datamart → DWH
– Rápido de implementar, por etapas
– Necesita asegurar:
• La consistencia de la metadata.
• Estar seguro que cada cosa es llamado por su nombre.
➢ Antecedentes.
➢ Enfoque Inmon.
➢ Enfoque Kimball.
➢ Metodología de Kimball
➢Planificación del proyecto
➢Requerimientos del Negocio
➢Línea tecnológica
➢Línea de datos
➢Línea de aplicación del BI
➢Despliegue
Agenda
El modelo Inmon
• Consiste de todas las bases y sistemas de información de una
organización
– Modelo CIF (Corporate Information Factory)
– Fabrica de Información corporativa.
• Define el medio ambiente de las bases de datos como:
– Operacional
– DWH atómico
– Departamental
– Individual
• El DWH es parte de un todo más grande (CIF)
Modelado Inmon
• Con la normalización beneficios:
– Evita la redundancia de los datos,
– Integridad referencial,
– Facilitar el mantenimiento de las tablas y
– Disminuir el tamaño de la base de datos.
• Las consultas DWH exigen el empleo de “querys” complejos para análisis y uso
de las herramientas de reporting. Necesidad de construir los DataMarts.
Modelado Inmon
Tres niveles en el modelado de los datos
• Entidad Relación
– Relaciones entre entidades, atributos y relaciones
• Modelo MID-Level (MID-Level Model o *DIS*)
– Conjunto de items de datos
– Conjunto de datos por departamento
– Cuatro construcciones:
1. Agrupamiento de datos primarios
2. Agrupamiento de datos secundarios
3. Conectores
4. Datos de “Tipo de”
• Modelo de datos físico
– Optimizado para mejor rendimiento (de-normalizado
Modelado Inmon
• Relación entre los niveles Uno y Dos del modelo de datos
de Inmon
➢ Antecedentes.
➢ Enfoque Inmon.
➢ Enfoque Kimball.
➢ Metodología de Kimball
➢Planificación del proyecto
➢Requerimientos del Negocio
➢Línea tecnológica
➢Línea de datos
➢Línea de aplicación del BI
➢Despliegue
Agenda
Enfoque Kimball
• El modelo dimensional se inicia con tablas:
– De hechos
– De dimensiones
• Los hechos contienen métricas
• Las dimensiones contienen atributos
– Puede contener grupos de datos repetidos
• Los datos no están normalizados
• Accesible al usuario final
➢ Antecedentes.
➢ Enfoque Inmon.
➢ Enfoque Kimball.
➢ Metodología de Kimball
➢Planificación del proyecto
➢Requerimientos del Negocio
➢Línea tecnológica
➢Línea de datos
➢Línea de aplicación del BI
➢Despliegue
Agenda
El Ciclo de Vida Kimball
• Ilustra el flujo general de implementación de un DWH.
• Identifica secuencia de tareas ordenadas y actividades principales que
debe suceder concurrentemente.
• Muchas necesidades deben ser acomodadas para lograr única
necesidad de la organización.
• No todos los detalles de las tareas del ciclo de vida deben ser
ejecutados en todos los proyectos.
Kimball LifeCycle
El Ciclo de Vida Kimball
Ciclos de vida SDLC, y DBLC
DB Initial Study
Ejecución
Operación
Mantenimiento
DB Design
Comprobación
Planificación
Análisis
Diseño del
Sistema detallado
Ejecución
Mantenimiento
System Development Life Cycle Data Base Life Cycle
➢ Antecedentes.
➢ Enfoque Inmon.
➢ Enfoque Kimball.
➢ Metodología de Kimball.
➢Planificación del proyecto.
➢Requerimientos del Negocio
➢Línea tecnológica
➢Línea de datos
➢Línea de aplicación del BI
➢Despliegue
Agenda
Ciclo de Vida
• Planificación del proyecto
• Requerimientos del Negocio
• Línea tecnológica
– Arquitectura tecnológica
– Selección e instalación de productos
• Línea de datos
– Modelo dimensional
– Modelo físico
– ETL
• Línea de aplicación del BI
– Diseño del BI
– Desarrollo del BI
• Despliegue
– Despliegue
– Crecimiento
– Mantenimiento
Planificación del programa/proyecto
• Visión de programas y proyectos de Kimball
– Proyecto, se refiere a una iteración simple del KLC
Desde el lanzamiento hasta el despliegue.
– Programa, se refiere a la amplia coordinación progresiva de recursos,
infraestructura, tiempos y comunicación a través de múltiples proyectos
Un programa contiene proyectos múltiples
• En la realidad los programas no necesariamente inician antes del
proyecto, aunque debería ser así.
Planificación del programa/proyecto
• Planificación de proyecto.
– Definir el alcance ↔ Entender los requerimientos
del negocio.
– Identificar tareas
– Programación de tareas
– Planificar el uso de los recursos.
– Asignar la carga de trabajo a los recursos
– El documento final representa un plan del proyecto.
Administración del programa/proyecto
• Refuerza el plan del proyecto.
• Actividades:
– Monitoreo del estado de los procesos y actividades.
– Rastreo de problemas
– Desarrollo de un plan de comunicación comprensiva que
direccione la empresa y las áreas de TI
Línea de desarrollo
• Luego de definir los requerimientos del negocio, enfocar el proyecto a tres
líneas (tracks) concurrentes:
– Tecnología
– Datos
– Aplicaciones de BI
• El flujo de actividad de las líneas, se indican por las flechas
• La dependencia entre tareas se indican por el alineamiento vertical de las
tareas
➢ Antecedentes.
➢ Enfoque Inmon.
➢ Enfoque Kimball.
➢ Metodología de Kimball
➢Planificación del proyecto
➢Requerimientos del Negocio.
➢Línea tecnológica
➢Línea de datos
➢Línea de aplicación del BI
➢Despliegue
Agenda
Ciclo de Vida
• Planificación del proyecto
• Requerimientos del Negocio
• Línea tecnológica
– Arquitectura tecnológica
– Selección e instalación de productos
• Línea de datos
– Modelo dimensional
– Modelo físico
– ETL
• Línea de aplicación del BI
– Diseño del BI
– Desarrollo del BI
• Despliegue
– Despliegue
– Crecimiento
– Mantenimiento
Definición de requerimientos del negocio
• El éxito del proyecto depende de una comprensión sólida de las
necesidades de negocio.
• Comprender los factores claves que dirigen el negocio es crucial para
traducir exitosamente las necesidades de negocio en las
consideraciones de diseño
Requerimientos del Negocio
• Requerimientos de uso de información
– Tipo de información que las personas necesitan.
– Tipo de análisis.
• Requerimiento de datos
– Fuente de datos
– Calidad de datos y limpieza de datos
– Almacenamiento de datos
– Carga de datos
Proceso de definición de requerimientos
Preparación
Realizar entrevistas de negocios y de TI.
Escribir resúmenes de las entrevistas con
los temas analíticos.
Identificar los procesos de negocios de
los temas analíticos.
Construir la matriz inicial del bus.
Realizar la sesión de priorización de la
dirección superior.
Utilice el perfil de datos para
investigar las fuentes de datos
según sea necesario.
Escribir el documento de definiciones de
requisitos.
Bus Matriz
• Relaciona los procesos organizacionales a las entidades u objetos que
participan en el proceso.
• Cada fila es un proceso y cada columna una dimensión
Priorización de Procesos
Recolección de Requerimientos
• Quién va ha ir a recoger los requerimientos?.
• Los usuarios pueden ser clasificados como:
– Ejecutivos Senior
– Administradores de departamentos clave
– Analistas de negocio
– DBA de sistemas operacionales
– Personal de TI
• Los ejecutivos senior le darán un sentido de dirección y alcance para su
almacén de los datos.
➢ Antecedentes.
➢ Enfoque Inmon.
➢ Enfoque Kimball.
➢ Metodología de Kimball
➢Planificación del proyecto
➢Requerimientos del Negocio
➢Línea tecnológica.
➢Línea de datos
➢Línea de aplicación del BI
➢Despliegue
Agenda
Ciclo de Vida
• Planificación del proyecto
• Requerimientos del Negocio
• Línea tecnológica
– Arquitectura tecnológica
– Selección e instalación de productos
• Línea de datos
– Modelo dimensional
– Modelo físico
– ETL
• Línea de aplicación del BI
– Diseño del BI
– Desarrollo del BI
• Despliegue
– Despliegue
– Crecimiento
– Mantenimiento
Diseño de la arquitectura tecnológica
• Marco arquitectural completo del proyecto
• Consideraciones a tomarse en cuenta:
– Las necesidades de negocio
– Medio ambiente tecnológico actual
– Dirección técnica estratégica planeada.
Selección de producto e instalación
• Basado en la arquitectura técnica diseñada.
• Evaluación y selección de
– Plataforma de hardware
– DBMS (base de datos)
– Herramienta ETL
– Herramientas de consultas (query tools)
– Herramienta de reportes.
• Instalación de productos/componentes/herramientas.
• Prueba de productos instalados para garantizar la integración de
extremo a extremo con el entorno del DWH.
➢ Antecedentes.
➢ Enfoque Inmon.
➢ Enfoque Kimball.
➢ Metodología de Kimball
➢Planificación del proyecto
➢Requerimientos del Negocio
➢Línea tecnológica
➢Línea de datos.
➢Línea de aplicación del BI
➢Despliegue
Agenda
Ciclo de Vida
• Planificación del proyecto
• Requerimientos del Negocio
• Línea tecnológica
– Arquitectura tecnológica
– Selección e instalación de productos
• Línea de datos
– Modelo dimensional
– Modelo físico
– ETL
• Línea de aplicación del BI
– Diseño del BI
– Desarrollo del BI
• Despliegue
– Despliegue
– Crecimiento
– Mantenimiento
Línea de datos
Diseño del modelo dimensional Diseño del modelo físico
ETL
Modelado dimensional
• Análisis de los datos de un proceso de negocio
para:
– identificar la granularidad de las tablas de
hechos
– dimensiones y atributos asociados
– hechos numéricos.
• Contiene los mismos datos y relaciones que un
modelo normalizado en la 3FN, pero estructurado
de manera diferente.
• Mejora el entendimiento y desempeño de
consultas al DW
• Las construcciones primarias son:
– Tablas de hechos
– Tablas de dimensiones
Modelado dimensional – tabla de hechos
• Contiene métricas derivadas de un proceso
de negocio o un evento.
– Ventas, contabilidad, logística, etc.
• El MD debe ser estructurado alrededor de un
proceso del negocio
• Se diseña vistas similares y consistentes de
los datos para toda la organización.
• La granularidad de la tabla de hechos, debe
ser el más atómico posible
• Esto permite mayor flexibilidad y
extensibilidad.
Modelado dimensional – tabla de dimensiones
• Contiene la descripción de atributos y características
asociadas con medidas de eventos tangibles y específicos,
tales como clientes, productos, representantes de ventas.
• Los atributos de dimensión son usados por limitar, agrupar, o
rotular una pregunta.
• Las relaciones jerárquicas N:1 son desnormalizadas en
tablas de dimensión simples.
Esquema de estrella
• Una tabla de hechos
• Varias tablas de dimensiones.
• Ejemplo:
– Asuma este esquema para una cadena de venta al por menor.
– El hecho puede ser el ingreso de dinero.
Ventas
Montos-Cantidad
Productos Tiempo
Clientes Canales
Tabla de Dimensiones
Tabla de Dimensiones
Tabla de Hechos
Esquema de copo de nieve
• Es una variación del esquema de estrella.
• Es un esquema más complejo que el esquema de estrella
porque las tablas que describen las dimensiones están
normalizadas.
Ventas
Montos-Cantidad
Productos Tiempo
Clientes Canales
Tabla de Dimensiones
Tabla de Dimensiones
Tabla de Hechos
Proveedores
País
Esquema de copo de nieve
• Desventajas:
– Las tablas de hecho ocupan +90% del
almacenamiento, (el beneficio es poco).
– Normalizar las tablas de dimensión pueda
deteriorar la ejecución de un DWH.
• Ventajas:
– Es apropiado si se presenta alguna de las
siguientes condiciones:
• Una dimensión es esparcida
• Una dimensión tiene una lista muy larga de
atributos
• En la práctica, muchos DWH normalizarán
algunas dimensiones y otros no (usan una
combinación de copo de nieve y de estrella)
Diseño físico
• Preparando el entorno de base de datos.
• Preparando la seguridad apropiada.
• Estrategia preliminar de afinamiento (tuning) de indexación y
agregación.
• Si son apropiadas las bases de datos OLAP que se diseñan durante
este proceso.
ETL Diseño y desarrollo
• Es la fase más importante.
– Corresponde al 70% del riesgo y esfuerzo de un proyecto de DWH.
– Capacidades de sistema ETL:
• Extracción
• Limpieza y conformidad
• Entrega y administración
ETL
• Los datos en bruto son extraídos de los sistemas operacionales y
transformados en información significativa para el negocio
• Los procesos ETL deben diseñados mucho antes que cualquier
datos sea extraída de la fuente
• Se verifica la calidad de los datos de entrada.
• Las condiciones de calidad de datos se controlan continuamente
➢ Antecedentes.
➢ Enfoque Inmon.
➢ Enfoque Kimball.
➢ Metodología de Kimball
➢Planificación del proyecto
➢Requerimientos del Negocio
➢Línea tecnológica
➢Línea de datos.
➢Línea de aplicación del BI.
➢Despliegue
Agenda
Ciclo de Vida
• Planificación del proyecto
• Requerimientos del Negocio
• Línea tecnológica
– Arquitectura tecnológica
– Selección e instalación de productos
• Línea de datos
– Modelo dimensional
– Modelo físico
– ETL
• Línea de aplicación del BI
– Diseño del BI
– Desarrollo del BI
• Despliegue
– Despliegue
– Crecimiento
– Mantenimiento
Aplicación del BI
• Aplicaciones que consultan, analizan y
presentan información desde el modelo
dimensional.
• Las aplicaciones BI entregan valor al
negocio desde la solución DW/BI.
• La meta es entregar capacidades al
negocio para soportar y mejorar la toma
de decisiones.
1. Diseño de Aplicaciones BI.
2. Desarrollo de aplicaciones BI.
Aplicación del BI
• Diseño de Aplicaciones BI.
– Identifica las aplicaciones de BI candidatas y
interfaces de navegación apropiadas
– Orienta las necesidades de los usuarios.
– Produce la especificación de las aplicaciones BI
• Desarrollo de aplicaciones BI.
– Configuración de la metadata del negocio y de la
infraestructura de herramientas.
– Construcción y validación de aplicaciones BI
analíticas y operacionales y un portal de
navegación.
➢ Antecedentes.
➢ Enfoque Inmon.
➢ Enfoque Kimball.
➢ Metodología de Kimball
➢Planificación del proyecto
➢Requerimientos del Negocio
➢Línea tecnológica
➢Línea de datos.
➢Línea de aplicación del BI
➢Despliegue
Agenda
Ciclo de Vida
• Planificación del proyecto
• Requerimientos del Negocio
• Línea tecnológica
– Arquitectura tecnológica
– Selección e instalación de productos
• Línea de datos
– Modelo dimensional
– Modelo físico
– ETL
• Línea de aplicación del BI
– Diseño del BI
– Desarrollo del BI
• Despliegue
– Despliegue
– Crecimiento
– Mantenimiento
Despliegue
• Si la planificación se ha ejecutado se puede asegurar:
– Los resultados de las líneas de tecnología, datos y aplicación del BI.
– Disponibilidad de la infraestructura de capacitación y apoyo.
• El despliegue debe ser bien sincronizado.
• El despliegue debe ser aplazado si todas las piezas, tales como
entrenamiento, documentación, y validación de datos, no están listos para
la liberación de producción.
Mantenimiento
• Cuando el sistema esta en producción
• Incluye:
– Tareas técnico operacionales que son
necesarias para mantener el sistema operando
óptimamente.
• Monitorio del uso.
• Tuning del desempeño.
• Mantenimiento de la tabla de índices.
• Backup del sistema.
• Apoyo permanente, capacitación y comunicación
con los usuarios finales
Crecimiento
• Los DWH tienden a expandirse
(si son exitosos)
• Es considerado como un signo
de éxito.
• Nuevos requerimientos deben
ser priorizados.
• Empezar el ciclo de nuevo
– Construir sobre las bases ya establecidas.
– Enfoque en los nuevos requerimientos
PREGUNTAS

Más contenido relacionado

Similar a Sesión 4 - Metodologias de contstruccion DWH.pdf

Business dylangau
Business dylangauBusiness dylangau
Business dylangau
Dylan Catzim
 
Demostración: ¿Cómo acelera la plataforma Denodo su tiempo para obtener infor...
Demostración: ¿Cómo acelera la plataforma Denodo su tiempo para obtener infor...Demostración: ¿Cómo acelera la plataforma Denodo su tiempo para obtener infor...
Demostración: ¿Cómo acelera la plataforma Denodo su tiempo para obtener infor...
Denodo
 
Entregable final
Entregable finalEntregable final
Entregable final
Jose Luis Sanchez Isaias
 
Autoservicio BI
Autoservicio BI Autoservicio BI
Autoservicio BI
NexTReT
 
Data mart
Data martData mart
Data mart
Christian Rosado
 
Datawarehouse
DatawarehouseDatawarehouse
Datawarehouse
dagmalu
 
Implementación de inteligencia de Negocios paso a paso (Business Intelligence)
Implementación de inteligencia de Negocios paso a paso (Business Intelligence)Implementación de inteligencia de Negocios paso a paso (Business Intelligence)
Implementación de inteligencia de Negocios paso a paso (Business Intelligence)DANIEL VENTURA
 
Presentación Vmining
Presentación VminingPresentación Vmining
Presentación Vmining
kamirik
 
Power BI - Gobernabilidad
Power BI - GobernabilidadPower BI - Gobernabilidad
Power BI - Gobernabilidad
Gaston Cruz
 
ADM BD UNIDAD 1 CLASE 1 y 2.pptx
ADM BD UNIDAD 1 CLASE 1 y 2.pptxADM BD UNIDAD 1 CLASE 1 y 2.pptx
ADM BD UNIDAD 1 CLASE 1 y 2.pptx
Karina88635
 
Fundamentos de BI
Fundamentos de BIFundamentos de BI
Fundamentos de BI
JOSE AHIAS LOPEZ PORTILLO
 
1 gestión de informacion
1 gestión de informacion1 gestión de informacion
1 gestión de informacion
Oscar Correa
 
Buenas prácticas que debes seguir en la administración de tu SQL Server
Buenas prácticas que debes seguir en la administración de tu SQL ServerBuenas prácticas que debes seguir en la administración de tu SQL Server
Buenas prácticas que debes seguir en la administración de tu SQL Server
SolidQ
 
Que Es Un Data Warehouse
Que Es Un Data WarehouseQue Es Un Data Warehouse
Que Es Un Data Warehouseguest10616d
 
Power-bi-fundamentals
Power-bi-fundamentalsPower-bi-fundamentals
Power-bi-fundamentals
JhonnyAlmercoMurillo1
 
18305938 e4 implementaciondeunsistema_bi
18305938 e4 implementaciondeunsistema_bi18305938 e4 implementaciondeunsistema_bi
18305938 e4 implementaciondeunsistema_bi
Jose Antonio Perez Vega
 
¿Cómo abordar con éxito una migración a Microsoft Dynamics NAV? Sin morir en ...
¿Cómo abordar con éxito una migración a Microsoft Dynamics NAV? Sin morir en ...¿Cómo abordar con éxito una migración a Microsoft Dynamics NAV? Sin morir en ...
¿Cómo abordar con éxito una migración a Microsoft Dynamics NAV? Sin morir en ...
CLARA CAMPROVIN
 

Similar a Sesión 4 - Metodologias de contstruccion DWH.pdf (20)

Business dylangau
Business dylangauBusiness dylangau
Business dylangau
 
Demostración: ¿Cómo acelera la plataforma Denodo su tiempo para obtener infor...
Demostración: ¿Cómo acelera la plataforma Denodo su tiempo para obtener infor...Demostración: ¿Cómo acelera la plataforma Denodo su tiempo para obtener infor...
Demostración: ¿Cómo acelera la plataforma Denodo su tiempo para obtener infor...
 
Entregable final
Entregable finalEntregable final
Entregable final
 
Autoservicio BI
Autoservicio BI Autoservicio BI
Autoservicio BI
 
Data mart
Data martData mart
Data mart
 
Datawarehouse
DatawarehouseDatawarehouse
Datawarehouse
 
Inducción
InducciónInducción
Inducción
 
Implementación de inteligencia de Negocios paso a paso (Business Intelligence)
Implementación de inteligencia de Negocios paso a paso (Business Intelligence)Implementación de inteligencia de Negocios paso a paso (Business Intelligence)
Implementación de inteligencia de Negocios paso a paso (Business Intelligence)
 
Presentación Vmining
Presentación VminingPresentación Vmining
Presentación Vmining
 
S15 bi v1-1
S15 bi v1-1S15 bi v1-1
S15 bi v1-1
 
Power BI - Gobernabilidad
Power BI - GobernabilidadPower BI - Gobernabilidad
Power BI - Gobernabilidad
 
01.introduccion
01.introduccion01.introduccion
01.introduccion
 
ADM BD UNIDAD 1 CLASE 1 y 2.pptx
ADM BD UNIDAD 1 CLASE 1 y 2.pptxADM BD UNIDAD 1 CLASE 1 y 2.pptx
ADM BD UNIDAD 1 CLASE 1 y 2.pptx
 
Fundamentos de BI
Fundamentos de BIFundamentos de BI
Fundamentos de BI
 
1 gestión de informacion
1 gestión de informacion1 gestión de informacion
1 gestión de informacion
 
Buenas prácticas que debes seguir en la administración de tu SQL Server
Buenas prácticas que debes seguir en la administración de tu SQL ServerBuenas prácticas que debes seguir en la administración de tu SQL Server
Buenas prácticas que debes seguir en la administración de tu SQL Server
 
Que Es Un Data Warehouse
Que Es Un Data WarehouseQue Es Un Data Warehouse
Que Es Un Data Warehouse
 
Power-bi-fundamentals
Power-bi-fundamentalsPower-bi-fundamentals
Power-bi-fundamentals
 
18305938 e4 implementaciondeunsistema_bi
18305938 e4 implementaciondeunsistema_bi18305938 e4 implementaciondeunsistema_bi
18305938 e4 implementaciondeunsistema_bi
 
¿Cómo abordar con éxito una migración a Microsoft Dynamics NAV? Sin morir en ...
¿Cómo abordar con éxito una migración a Microsoft Dynamics NAV? Sin morir en ...¿Cómo abordar con éxito una migración a Microsoft Dynamics NAV? Sin morir en ...
¿Cómo abordar con éxito una migración a Microsoft Dynamics NAV? Sin morir en ...
 

Último

1º Caso Practico Lubricacion Rodamiento Motor 10CV
1º Caso Practico Lubricacion Rodamiento Motor 10CV1º Caso Practico Lubricacion Rodamiento Motor 10CV
1º Caso Practico Lubricacion Rodamiento Motor 10CV
CarlosAroeira1
 
164822219-Clase-4-Estructuras-3.pdf losas
164822219-Clase-4-Estructuras-3.pdf losas164822219-Clase-4-Estructuras-3.pdf losas
164822219-Clase-4-Estructuras-3.pdf losas
jcbarriopedro69
 
TR-514 (3) - BIS copia seguridad DOS COLUMNAS 2024 1.6.24 PREFERIDO.wbk.wbk S...
TR-514 (3) - BIS copia seguridad DOS COLUMNAS 2024 1.6.24 PREFERIDO.wbk.wbk S...TR-514 (3) - BIS copia seguridad DOS COLUMNAS 2024 1.6.24 PREFERIDO.wbk.wbk S...
TR-514 (3) - BIS copia seguridad DOS COLUMNAS 2024 1.6.24 PREFERIDO.wbk.wbk S...
FRANCISCOJUSTOSIERRA
 
PLAN DE TRABAJO DE REFUERZO ESCOLAR 2024.pdf
PLAN DE TRABAJO DE REFUERZO ESCOLAR 2024.pdfPLAN DE TRABAJO DE REFUERZO ESCOLAR 2024.pdf
PLAN DE TRABAJO DE REFUERZO ESCOLAR 2024.pdf
MariaCortezRuiz
 
Diagrama de flujo "Resolución de problemas".pdf
Diagrama de flujo "Resolución de problemas".pdfDiagrama de flujo "Resolución de problemas".pdf
Diagrama de flujo "Resolución de problemas".pdf
joseabachesoto
 
UNIVERSIDAD NACIONAL ALTIPLANO PUNO - FACULTAD DE INGENIERIA MECANICA ELECTRICA.
UNIVERSIDAD NACIONAL ALTIPLANO PUNO - FACULTAD DE INGENIERIA MECANICA ELECTRICA.UNIVERSIDAD NACIONAL ALTIPLANO PUNO - FACULTAD DE INGENIERIA MECANICA ELECTRICA.
UNIVERSIDAD NACIONAL ALTIPLANO PUNO - FACULTAD DE INGENIERIA MECANICA ELECTRICA.
HaroldKewinCanaza1
 
Aletas de Transferencia de Calor o Superficies Extendidas.pdf
Aletas de Transferencia de Calor o Superficies Extendidas.pdfAletas de Transferencia de Calor o Superficies Extendidas.pdf
Aletas de Transferencia de Calor o Superficies Extendidas.pdf
JuanAlbertoLugoMadri
 
Curso Basico de DIgSILENT power factorys
Curso Basico de DIgSILENT power factorysCurso Basico de DIgSILENT power factorys
Curso Basico de DIgSILENT power factorys
LuisPerezIgnacio1
 
01-introduccion-a-la-perforacion.pdf de minas
01-introduccion-a-la-perforacion.pdf de minas01-introduccion-a-la-perforacion.pdf de minas
01-introduccion-a-la-perforacion.pdf de minas
ivan848686
 
Clasificacion geomecanica de Q de Barton
Clasificacion geomecanica de Q de BartonClasificacion geomecanica de Q de Barton
Clasificacion geomecanica de Q de Barton
edujunes132
 
Ejercicios-de-Divisibilidad-para-Primero-de-Primaria (3).doc
Ejercicios-de-Divisibilidad-para-Primero-de-Primaria (3).docEjercicios-de-Divisibilidad-para-Primero-de-Primaria (3).doc
Ejercicios-de-Divisibilidad-para-Primero-de-Primaria (3).doc
LuisEnriqueCarboneDe
 
Análisis Combinatorio ,EJERCICIOS Y PROBLEMAS RESUELTOS
Análisis Combinatorio ,EJERCICIOS Y PROBLEMAS RESUELTOSAnálisis Combinatorio ,EJERCICIOS Y PROBLEMAS RESUELTOS
Análisis Combinatorio ,EJERCICIOS Y PROBLEMAS RESUELTOS
ppame8010
 
CONTROL DE MOTORES DE CORRIENTE ALTERNA PPT
CONTROL DE MOTORES DE CORRIENTE ALTERNA  PPTCONTROL DE MOTORES DE CORRIENTE ALTERNA  PPT
CONTROL DE MOTORES DE CORRIENTE ALTERNA PPT
LuisLobatoingaruca
 
FISICA_Hidrostatica_uyhHidrodinamica.pdf
FISICA_Hidrostatica_uyhHidrodinamica.pdfFISICA_Hidrostatica_uyhHidrodinamica.pdf
FISICA_Hidrostatica_uyhHidrodinamica.pdf
JavierAlejosM
 
PLAN DE EMERGENCIAS Y EVACUACION 2024.pdf
PLAN DE EMERGENCIAS Y EVACUACION 2024.pdfPLAN DE EMERGENCIAS Y EVACUACION 2024.pdf
PLAN DE EMERGENCIAS Y EVACUACION 2024.pdf
Daniel Jose Sierra Garcia
 
Flujograma de gestión de pedidos de usuarios.
Flujograma de gestión de pedidos de usuarios.Flujograma de gestión de pedidos de usuarios.
Flujograma de gestión de pedidos de usuarios.
thatycameron2004
 
LA SEÑALES ANALOGICAS Y LAS SEÑALES DIGITALES
LA SEÑALES ANALOGICAS Y LAS SEÑALES DIGITALESLA SEÑALES ANALOGICAS Y LAS SEÑALES DIGITALES
LA SEÑALES ANALOGICAS Y LAS SEÑALES DIGITALES
LuisLobatoingaruca
 
Voladura de mineria subterránea pppt.ppt
Voladura de mineria subterránea pppt.pptVoladura de mineria subterránea pppt.ppt
Voladura de mineria subterránea pppt.ppt
AldithoPomatay2
 
Vehiculo para niños con paralisis cerebral
Vehiculo para niños con paralisis cerebralVehiculo para niños con paralisis cerebral
Vehiculo para niños con paralisis cerebral
everchanging2020
 
choro ciclo de vida anatomía y fisiología
choro ciclo de vida anatomía y fisiologíachoro ciclo de vida anatomía y fisiología
choro ciclo de vida anatomía y fisiología
elvis2000x
 

Último (20)

1º Caso Practico Lubricacion Rodamiento Motor 10CV
1º Caso Practico Lubricacion Rodamiento Motor 10CV1º Caso Practico Lubricacion Rodamiento Motor 10CV
1º Caso Practico Lubricacion Rodamiento Motor 10CV
 
164822219-Clase-4-Estructuras-3.pdf losas
164822219-Clase-4-Estructuras-3.pdf losas164822219-Clase-4-Estructuras-3.pdf losas
164822219-Clase-4-Estructuras-3.pdf losas
 
TR-514 (3) - BIS copia seguridad DOS COLUMNAS 2024 1.6.24 PREFERIDO.wbk.wbk S...
TR-514 (3) - BIS copia seguridad DOS COLUMNAS 2024 1.6.24 PREFERIDO.wbk.wbk S...TR-514 (3) - BIS copia seguridad DOS COLUMNAS 2024 1.6.24 PREFERIDO.wbk.wbk S...
TR-514 (3) - BIS copia seguridad DOS COLUMNAS 2024 1.6.24 PREFERIDO.wbk.wbk S...
 
PLAN DE TRABAJO DE REFUERZO ESCOLAR 2024.pdf
PLAN DE TRABAJO DE REFUERZO ESCOLAR 2024.pdfPLAN DE TRABAJO DE REFUERZO ESCOLAR 2024.pdf
PLAN DE TRABAJO DE REFUERZO ESCOLAR 2024.pdf
 
Diagrama de flujo "Resolución de problemas".pdf
Diagrama de flujo "Resolución de problemas".pdfDiagrama de flujo "Resolución de problemas".pdf
Diagrama de flujo "Resolución de problemas".pdf
 
UNIVERSIDAD NACIONAL ALTIPLANO PUNO - FACULTAD DE INGENIERIA MECANICA ELECTRICA.
UNIVERSIDAD NACIONAL ALTIPLANO PUNO - FACULTAD DE INGENIERIA MECANICA ELECTRICA.UNIVERSIDAD NACIONAL ALTIPLANO PUNO - FACULTAD DE INGENIERIA MECANICA ELECTRICA.
UNIVERSIDAD NACIONAL ALTIPLANO PUNO - FACULTAD DE INGENIERIA MECANICA ELECTRICA.
 
Aletas de Transferencia de Calor o Superficies Extendidas.pdf
Aletas de Transferencia de Calor o Superficies Extendidas.pdfAletas de Transferencia de Calor o Superficies Extendidas.pdf
Aletas de Transferencia de Calor o Superficies Extendidas.pdf
 
Curso Basico de DIgSILENT power factorys
Curso Basico de DIgSILENT power factorysCurso Basico de DIgSILENT power factorys
Curso Basico de DIgSILENT power factorys
 
01-introduccion-a-la-perforacion.pdf de minas
01-introduccion-a-la-perforacion.pdf de minas01-introduccion-a-la-perforacion.pdf de minas
01-introduccion-a-la-perforacion.pdf de minas
 
Clasificacion geomecanica de Q de Barton
Clasificacion geomecanica de Q de BartonClasificacion geomecanica de Q de Barton
Clasificacion geomecanica de Q de Barton
 
Ejercicios-de-Divisibilidad-para-Primero-de-Primaria (3).doc
Ejercicios-de-Divisibilidad-para-Primero-de-Primaria (3).docEjercicios-de-Divisibilidad-para-Primero-de-Primaria (3).doc
Ejercicios-de-Divisibilidad-para-Primero-de-Primaria (3).doc
 
Análisis Combinatorio ,EJERCICIOS Y PROBLEMAS RESUELTOS
Análisis Combinatorio ,EJERCICIOS Y PROBLEMAS RESUELTOSAnálisis Combinatorio ,EJERCICIOS Y PROBLEMAS RESUELTOS
Análisis Combinatorio ,EJERCICIOS Y PROBLEMAS RESUELTOS
 
CONTROL DE MOTORES DE CORRIENTE ALTERNA PPT
CONTROL DE MOTORES DE CORRIENTE ALTERNA  PPTCONTROL DE MOTORES DE CORRIENTE ALTERNA  PPT
CONTROL DE MOTORES DE CORRIENTE ALTERNA PPT
 
FISICA_Hidrostatica_uyhHidrodinamica.pdf
FISICA_Hidrostatica_uyhHidrodinamica.pdfFISICA_Hidrostatica_uyhHidrodinamica.pdf
FISICA_Hidrostatica_uyhHidrodinamica.pdf
 
PLAN DE EMERGENCIAS Y EVACUACION 2024.pdf
PLAN DE EMERGENCIAS Y EVACUACION 2024.pdfPLAN DE EMERGENCIAS Y EVACUACION 2024.pdf
PLAN DE EMERGENCIAS Y EVACUACION 2024.pdf
 
Flujograma de gestión de pedidos de usuarios.
Flujograma de gestión de pedidos de usuarios.Flujograma de gestión de pedidos de usuarios.
Flujograma de gestión de pedidos de usuarios.
 
LA SEÑALES ANALOGICAS Y LAS SEÑALES DIGITALES
LA SEÑALES ANALOGICAS Y LAS SEÑALES DIGITALESLA SEÑALES ANALOGICAS Y LAS SEÑALES DIGITALES
LA SEÑALES ANALOGICAS Y LAS SEÑALES DIGITALES
 
Voladura de mineria subterránea pppt.ppt
Voladura de mineria subterránea pppt.pptVoladura de mineria subterránea pppt.ppt
Voladura de mineria subterránea pppt.ppt
 
Vehiculo para niños con paralisis cerebral
Vehiculo para niños con paralisis cerebralVehiculo para niños con paralisis cerebral
Vehiculo para niños con paralisis cerebral
 
choro ciclo de vida anatomía y fisiología
choro ciclo de vida anatomía y fisiologíachoro ciclo de vida anatomía y fisiología
choro ciclo de vida anatomía y fisiología
 

Sesión 4 - Metodologias de contstruccion DWH.pdf

  • 2. ➢ Antecedentes. ➢ Enfoque de Inmon. ➢ Enfoque de Kimball. ➢ Metodología de Kimball ➢Planificación del proyecto ➢Requerimientos del Negocio ➢Línea tecnológica ➢Línea de datos ➢Línea de aplicación del BI ➢Despliegue Agenda
  • 3. ➢ Antecedentes. ➢ Enfoque Inmon. ➢ Enfoque Kimball. ➢ Metodología de Kimball ➢Planificación del proyecto ➢Requerimientos del Negocio ➢Línea tecnológica ➢Línea de datos ➢Línea de aplicación del BI ➢Despliegue Agenda
  • 4. Metodologías OLAP / OLTP Sistemas de Información Data Warehouse • Los procesos a automatizar son repetibles y previsibles. • Modelado Entidad Relación. • Atención en una rápida modificación en línea de los datos. • El uso de los datos es exploratorio y menos predictible. • Modelado multidimensional. • Enfocado en la carga y la presentación de los datos DWH no es solamente crear un conjunto de reportes que corren periódicamente. Se trata de preguntas que hay que alcanzar y que puede llevar a lugares imprevistos.
  • 5. Conceptos Clave • Datamart. Repositorio de datos especifico. – Diseñado para responder las preguntas específicas. – Diseñado para servir las necesidades de unidades de negocio (ventas, comercialización, operaciones, contabilidad, etc.) – Es construido usando modelado dimensional • Data warehouse. Repositorio de datos organizacional – Almacena datos de toda la empresa y de todas las áreas. – Es una colección empresarial de datamarts. – Contiene data masiva e integrada • Inteligencia de Negocios. – Reportes y análisis de datos almacenadas en el DWH – Data warehouse/business intelligence (DW/BI) se refiere al sistema completo de extremo a extremo.
  • 6. Metodologías para el DWH Top-Down Bottom-Up Hybrid Federated Profesional Bill Inmon Rodolfo Kimball Muchos profesionales Doug Hackney Énfasis DWH DataMarts DWH y DataMarts Integrado a entornos BI heterogéneos Diseño Modelo normalizado basado en la empresa El modelo dimensional de datamarts, usa esquema de estrella Modelos locales y uno o más esquemas de estrella Una arquitectura de arquitecturas; comparte dimensiones, hechos, reglas, definiciones a través de la organización Arquitectura Compuesto de varios niveles de áreas de interés y datamarts dependientes Área de interés y datamarts Modelo empresarial normalizado de alto nivel; datamarts iníciales. Realidad del cambio en organizaciones y sistemas Data set DWH datos a nivel atómico; datamarts datos sumarizados Contiene datos atómicos y sumarizados Carga datamarts con datos atómicos y sumarizados vía un área de interés no persistente Uso de cualquiera significado posible para integrar las necesidades de negocio
  • 7. Historia de DWH Inmon. 1990 Publica Building the Data Warehouse 2002 Mejora su libro y define una arquitectura como una colección de fuentes dispares en almacenes de datos detalles y variantes en el tiempo. Kimball 1996 Publica The Data Warehouse Toolkit 2002 Mejora su libro y define multiples bases de datos llamados datamarts que son organizados por procesos de negocio, pero usan medios de datos estandarizados para la empresa. Top-Down Botton-Up
  • 8. Enfoques acerca del DWH • Bill Inmon → Normalizado. – Building the Data Warehouse – Corporate Information Factory • Ralph Kimball -> Dimensional. – The Data Warehouse Lifecycle Toolkit – The Data Warehouse Toolkit
  • 9. Enfoques acerca del DWH • Bill Inmon → Top-Down – El DWH usa modelo de datos de toda la empresa – El DWH es un depósito de datamarts – Más tiempo para implementar. – Fracasos por falta de paciencia y de compromiso • Ralph Kimball -> Bottom-Up – Inicia con un datamart, luego otros datamarts. – El flujo de datos: fuente → datamart datamart → DWH – Rápido de implementar, por etapas – Necesita asegurar: • La consistencia de la metadata. • Estar seguro que cada cosa es llamado por su nombre.
  • 10. ➢ Antecedentes. ➢ Enfoque Inmon. ➢ Enfoque Kimball. ➢ Metodología de Kimball ➢Planificación del proyecto ➢Requerimientos del Negocio ➢Línea tecnológica ➢Línea de datos ➢Línea de aplicación del BI ➢Despliegue Agenda
  • 11. El modelo Inmon • Consiste de todas las bases y sistemas de información de una organización – Modelo CIF (Corporate Information Factory) – Fabrica de Información corporativa. • Define el medio ambiente de las bases de datos como: – Operacional – DWH atómico – Departamental – Individual • El DWH es parte de un todo más grande (CIF)
  • 12. Modelado Inmon • Con la normalización beneficios: – Evita la redundancia de los datos, – Integridad referencial, – Facilitar el mantenimiento de las tablas y – Disminuir el tamaño de la base de datos. • Las consultas DWH exigen el empleo de “querys” complejos para análisis y uso de las herramientas de reporting. Necesidad de construir los DataMarts.
  • 13. Modelado Inmon Tres niveles en el modelado de los datos • Entidad Relación – Relaciones entre entidades, atributos y relaciones • Modelo MID-Level (MID-Level Model o *DIS*) – Conjunto de items de datos – Conjunto de datos por departamento – Cuatro construcciones: 1. Agrupamiento de datos primarios 2. Agrupamiento de datos secundarios 3. Conectores 4. Datos de “Tipo de” • Modelo de datos físico – Optimizado para mejor rendimiento (de-normalizado
  • 14. Modelado Inmon • Relación entre los niveles Uno y Dos del modelo de datos de Inmon
  • 15. ➢ Antecedentes. ➢ Enfoque Inmon. ➢ Enfoque Kimball. ➢ Metodología de Kimball ➢Planificación del proyecto ➢Requerimientos del Negocio ➢Línea tecnológica ➢Línea de datos ➢Línea de aplicación del BI ➢Despliegue Agenda
  • 16. Enfoque Kimball • El modelo dimensional se inicia con tablas: – De hechos – De dimensiones • Los hechos contienen métricas • Las dimensiones contienen atributos – Puede contener grupos de datos repetidos • Los datos no están normalizados • Accesible al usuario final
  • 17. ➢ Antecedentes. ➢ Enfoque Inmon. ➢ Enfoque Kimball. ➢ Metodología de Kimball ➢Planificación del proyecto ➢Requerimientos del Negocio ➢Línea tecnológica ➢Línea de datos ➢Línea de aplicación del BI ➢Despliegue Agenda
  • 18. El Ciclo de Vida Kimball • Ilustra el flujo general de implementación de un DWH. • Identifica secuencia de tareas ordenadas y actividades principales que debe suceder concurrentemente. • Muchas necesidades deben ser acomodadas para lograr única necesidad de la organización. • No todos los detalles de las tareas del ciclo de vida deben ser ejecutados en todos los proyectos.
  • 19. Kimball LifeCycle El Ciclo de Vida Kimball
  • 20. Ciclos de vida SDLC, y DBLC DB Initial Study Ejecución Operación Mantenimiento DB Design Comprobación Planificación Análisis Diseño del Sistema detallado Ejecución Mantenimiento System Development Life Cycle Data Base Life Cycle
  • 21. ➢ Antecedentes. ➢ Enfoque Inmon. ➢ Enfoque Kimball. ➢ Metodología de Kimball. ➢Planificación del proyecto. ➢Requerimientos del Negocio ➢Línea tecnológica ➢Línea de datos ➢Línea de aplicación del BI ➢Despliegue Agenda
  • 22. Ciclo de Vida • Planificación del proyecto • Requerimientos del Negocio • Línea tecnológica – Arquitectura tecnológica – Selección e instalación de productos • Línea de datos – Modelo dimensional – Modelo físico – ETL • Línea de aplicación del BI – Diseño del BI – Desarrollo del BI • Despliegue – Despliegue – Crecimiento – Mantenimiento
  • 23. Planificación del programa/proyecto • Visión de programas y proyectos de Kimball – Proyecto, se refiere a una iteración simple del KLC Desde el lanzamiento hasta el despliegue. – Programa, se refiere a la amplia coordinación progresiva de recursos, infraestructura, tiempos y comunicación a través de múltiples proyectos Un programa contiene proyectos múltiples • En la realidad los programas no necesariamente inician antes del proyecto, aunque debería ser así.
  • 24. Planificación del programa/proyecto • Planificación de proyecto. – Definir el alcance ↔ Entender los requerimientos del negocio. – Identificar tareas – Programación de tareas – Planificar el uso de los recursos. – Asignar la carga de trabajo a los recursos – El documento final representa un plan del proyecto.
  • 25. Administración del programa/proyecto • Refuerza el plan del proyecto. • Actividades: – Monitoreo del estado de los procesos y actividades. – Rastreo de problemas – Desarrollo de un plan de comunicación comprensiva que direccione la empresa y las áreas de TI
  • 26. Línea de desarrollo • Luego de definir los requerimientos del negocio, enfocar el proyecto a tres líneas (tracks) concurrentes: – Tecnología – Datos – Aplicaciones de BI • El flujo de actividad de las líneas, se indican por las flechas • La dependencia entre tareas se indican por el alineamiento vertical de las tareas
  • 27. ➢ Antecedentes. ➢ Enfoque Inmon. ➢ Enfoque Kimball. ➢ Metodología de Kimball ➢Planificación del proyecto ➢Requerimientos del Negocio. ➢Línea tecnológica ➢Línea de datos ➢Línea de aplicación del BI ➢Despliegue Agenda
  • 28. Ciclo de Vida • Planificación del proyecto • Requerimientos del Negocio • Línea tecnológica – Arquitectura tecnológica – Selección e instalación de productos • Línea de datos – Modelo dimensional – Modelo físico – ETL • Línea de aplicación del BI – Diseño del BI – Desarrollo del BI • Despliegue – Despliegue – Crecimiento – Mantenimiento
  • 29. Definición de requerimientos del negocio • El éxito del proyecto depende de una comprensión sólida de las necesidades de negocio. • Comprender los factores claves que dirigen el negocio es crucial para traducir exitosamente las necesidades de negocio en las consideraciones de diseño
  • 30. Requerimientos del Negocio • Requerimientos de uso de información – Tipo de información que las personas necesitan. – Tipo de análisis. • Requerimiento de datos – Fuente de datos – Calidad de datos y limpieza de datos – Almacenamiento de datos – Carga de datos
  • 31. Proceso de definición de requerimientos Preparación Realizar entrevistas de negocios y de TI. Escribir resúmenes de las entrevistas con los temas analíticos. Identificar los procesos de negocios de los temas analíticos. Construir la matriz inicial del bus. Realizar la sesión de priorización de la dirección superior. Utilice el perfil de datos para investigar las fuentes de datos según sea necesario. Escribir el documento de definiciones de requisitos.
  • 32. Bus Matriz • Relaciona los procesos organizacionales a las entidades u objetos que participan en el proceso. • Cada fila es un proceso y cada columna una dimensión
  • 34. Recolección de Requerimientos • Quién va ha ir a recoger los requerimientos?. • Los usuarios pueden ser clasificados como: – Ejecutivos Senior – Administradores de departamentos clave – Analistas de negocio – DBA de sistemas operacionales – Personal de TI • Los ejecutivos senior le darán un sentido de dirección y alcance para su almacén de los datos.
  • 35. ➢ Antecedentes. ➢ Enfoque Inmon. ➢ Enfoque Kimball. ➢ Metodología de Kimball ➢Planificación del proyecto ➢Requerimientos del Negocio ➢Línea tecnológica. ➢Línea de datos ➢Línea de aplicación del BI ➢Despliegue Agenda
  • 36. Ciclo de Vida • Planificación del proyecto • Requerimientos del Negocio • Línea tecnológica – Arquitectura tecnológica – Selección e instalación de productos • Línea de datos – Modelo dimensional – Modelo físico – ETL • Línea de aplicación del BI – Diseño del BI – Desarrollo del BI • Despliegue – Despliegue – Crecimiento – Mantenimiento
  • 37. Diseño de la arquitectura tecnológica • Marco arquitectural completo del proyecto • Consideraciones a tomarse en cuenta: – Las necesidades de negocio – Medio ambiente tecnológico actual – Dirección técnica estratégica planeada.
  • 38. Selección de producto e instalación • Basado en la arquitectura técnica diseñada. • Evaluación y selección de – Plataforma de hardware – DBMS (base de datos) – Herramienta ETL – Herramientas de consultas (query tools) – Herramienta de reportes. • Instalación de productos/componentes/herramientas. • Prueba de productos instalados para garantizar la integración de extremo a extremo con el entorno del DWH.
  • 39. ➢ Antecedentes. ➢ Enfoque Inmon. ➢ Enfoque Kimball. ➢ Metodología de Kimball ➢Planificación del proyecto ➢Requerimientos del Negocio ➢Línea tecnológica ➢Línea de datos. ➢Línea de aplicación del BI ➢Despliegue Agenda
  • 40. Ciclo de Vida • Planificación del proyecto • Requerimientos del Negocio • Línea tecnológica – Arquitectura tecnológica – Selección e instalación de productos • Línea de datos – Modelo dimensional – Modelo físico – ETL • Línea de aplicación del BI – Diseño del BI – Desarrollo del BI • Despliegue – Despliegue – Crecimiento – Mantenimiento
  • 41. Línea de datos Diseño del modelo dimensional Diseño del modelo físico ETL
  • 42. Modelado dimensional • Análisis de los datos de un proceso de negocio para: – identificar la granularidad de las tablas de hechos – dimensiones y atributos asociados – hechos numéricos. • Contiene los mismos datos y relaciones que un modelo normalizado en la 3FN, pero estructurado de manera diferente. • Mejora el entendimiento y desempeño de consultas al DW • Las construcciones primarias son: – Tablas de hechos – Tablas de dimensiones
  • 43. Modelado dimensional – tabla de hechos • Contiene métricas derivadas de un proceso de negocio o un evento. – Ventas, contabilidad, logística, etc. • El MD debe ser estructurado alrededor de un proceso del negocio • Se diseña vistas similares y consistentes de los datos para toda la organización. • La granularidad de la tabla de hechos, debe ser el más atómico posible • Esto permite mayor flexibilidad y extensibilidad.
  • 44. Modelado dimensional – tabla de dimensiones • Contiene la descripción de atributos y características asociadas con medidas de eventos tangibles y específicos, tales como clientes, productos, representantes de ventas. • Los atributos de dimensión son usados por limitar, agrupar, o rotular una pregunta. • Las relaciones jerárquicas N:1 son desnormalizadas en tablas de dimensión simples.
  • 45. Esquema de estrella • Una tabla de hechos • Varias tablas de dimensiones. • Ejemplo: – Asuma este esquema para una cadena de venta al por menor. – El hecho puede ser el ingreso de dinero. Ventas Montos-Cantidad Productos Tiempo Clientes Canales Tabla de Dimensiones Tabla de Dimensiones Tabla de Hechos
  • 46. Esquema de copo de nieve • Es una variación del esquema de estrella. • Es un esquema más complejo que el esquema de estrella porque las tablas que describen las dimensiones están normalizadas. Ventas Montos-Cantidad Productos Tiempo Clientes Canales Tabla de Dimensiones Tabla de Dimensiones Tabla de Hechos Proveedores País
  • 47. Esquema de copo de nieve • Desventajas: – Las tablas de hecho ocupan +90% del almacenamiento, (el beneficio es poco). – Normalizar las tablas de dimensión pueda deteriorar la ejecución de un DWH. • Ventajas: – Es apropiado si se presenta alguna de las siguientes condiciones: • Una dimensión es esparcida • Una dimensión tiene una lista muy larga de atributos • En la práctica, muchos DWH normalizarán algunas dimensiones y otros no (usan una combinación de copo de nieve y de estrella)
  • 48. Diseño físico • Preparando el entorno de base de datos. • Preparando la seguridad apropiada. • Estrategia preliminar de afinamiento (tuning) de indexación y agregación. • Si son apropiadas las bases de datos OLAP que se diseñan durante este proceso.
  • 49. ETL Diseño y desarrollo • Es la fase más importante. – Corresponde al 70% del riesgo y esfuerzo de un proyecto de DWH. – Capacidades de sistema ETL: • Extracción • Limpieza y conformidad • Entrega y administración
  • 50. ETL • Los datos en bruto son extraídos de los sistemas operacionales y transformados en información significativa para el negocio • Los procesos ETL deben diseñados mucho antes que cualquier datos sea extraída de la fuente • Se verifica la calidad de los datos de entrada. • Las condiciones de calidad de datos se controlan continuamente
  • 51. ➢ Antecedentes. ➢ Enfoque Inmon. ➢ Enfoque Kimball. ➢ Metodología de Kimball ➢Planificación del proyecto ➢Requerimientos del Negocio ➢Línea tecnológica ➢Línea de datos. ➢Línea de aplicación del BI. ➢Despliegue Agenda
  • 52. Ciclo de Vida • Planificación del proyecto • Requerimientos del Negocio • Línea tecnológica – Arquitectura tecnológica – Selección e instalación de productos • Línea de datos – Modelo dimensional – Modelo físico – ETL • Línea de aplicación del BI – Diseño del BI – Desarrollo del BI • Despliegue – Despliegue – Crecimiento – Mantenimiento
  • 53. Aplicación del BI • Aplicaciones que consultan, analizan y presentan información desde el modelo dimensional. • Las aplicaciones BI entregan valor al negocio desde la solución DW/BI. • La meta es entregar capacidades al negocio para soportar y mejorar la toma de decisiones. 1. Diseño de Aplicaciones BI. 2. Desarrollo de aplicaciones BI.
  • 54. Aplicación del BI • Diseño de Aplicaciones BI. – Identifica las aplicaciones de BI candidatas y interfaces de navegación apropiadas – Orienta las necesidades de los usuarios. – Produce la especificación de las aplicaciones BI • Desarrollo de aplicaciones BI. – Configuración de la metadata del negocio y de la infraestructura de herramientas. – Construcción y validación de aplicaciones BI analíticas y operacionales y un portal de navegación.
  • 55. ➢ Antecedentes. ➢ Enfoque Inmon. ➢ Enfoque Kimball. ➢ Metodología de Kimball ➢Planificación del proyecto ➢Requerimientos del Negocio ➢Línea tecnológica ➢Línea de datos. ➢Línea de aplicación del BI ➢Despliegue Agenda
  • 56. Ciclo de Vida • Planificación del proyecto • Requerimientos del Negocio • Línea tecnológica – Arquitectura tecnológica – Selección e instalación de productos • Línea de datos – Modelo dimensional – Modelo físico – ETL • Línea de aplicación del BI – Diseño del BI – Desarrollo del BI • Despliegue – Despliegue – Crecimiento – Mantenimiento
  • 57. Despliegue • Si la planificación se ha ejecutado se puede asegurar: – Los resultados de las líneas de tecnología, datos y aplicación del BI. – Disponibilidad de la infraestructura de capacitación y apoyo. • El despliegue debe ser bien sincronizado. • El despliegue debe ser aplazado si todas las piezas, tales como entrenamiento, documentación, y validación de datos, no están listos para la liberación de producción.
  • 58. Mantenimiento • Cuando el sistema esta en producción • Incluye: – Tareas técnico operacionales que son necesarias para mantener el sistema operando óptimamente. • Monitorio del uso. • Tuning del desempeño. • Mantenimiento de la tabla de índices. • Backup del sistema. • Apoyo permanente, capacitación y comunicación con los usuarios finales
  • 59. Crecimiento • Los DWH tienden a expandirse (si son exitosos) • Es considerado como un signo de éxito. • Nuevos requerimientos deben ser priorizados. • Empezar el ciclo de nuevo – Construir sobre las bases ya establecidas. – Enfoque en los nuevos requerimientos