SlideShare una empresa de Scribd logo
1 de 38
Introducción alIntroducción al
DatawarehousingDatawarehousing
1
¿Qué es un data warehouse?
2
Datos (*)Datos (*)
 Son colecciones de
símbolos que se tienen
en una computadora.
 Cualquier interpretación
de los datos para
fines humanos se llama
información.
(*) Bertrand Meyer – Touch of Class
3
DatawarehouseDatawarehouse
 “Es un conjunto de datos
integrados y orientados a un
objetivo específico, que varían
con el tiempo (datos históricos)
y que no son transitorios.
Soportan el proceso de toma de
decisiones de la administración y
está orientada al manejo de
grandes volúmenes de datos
provenientes de diversas
fuentes…”
(Imhoff, 2003)
4
BI es un conjunto de procesos Tecnológicos que
transforman los datos en conocimiento
Conocimiento
Información
Datos
Datos + contexto
Información +
Know How
5Davenport, T. H., & Prusak, L. (2000)
Solución completa de BISolución completa de BI
ETLETL
CalidCalid
ad dead de
datosdatos
Tomador
de decisión
UsuariosUsuarios
InternosInternos
UsuariosUsuarios
ExternosExternos
AplicacionesAplicaciones
Arquitectura de datos
(Integración)
Data MartData Mart
Deptal.Deptal.
RapidRapid
MartsMarts
Acceso
Web
FinanzasFinanzas
I +DI +D
MercadeoMercadeo
VentasVentas
ServiciosServicios
PlaneaciòPlaneaciò
nn
OtrosOtros
OperacionesOperaciones
ConsultasConsultas
Ad hocAd hoc
IndicadoreIndicadore
ss
AnálisisAnálisis
(OLAP)(OLAP)
AnalíticasAnalíticas
por procesopor proceso
Minería deMinería de
DatosDatos
Aplicació
n
analítica
PlanningPlanning
PredictivaPredictiva
ss
ConsultasConsultas
predefinidaspredefinidas
InternasInternas
ERPERP
CRMCRM
OLSOLS
SCMSCM
NegocioNegocio
OtrosOtros
Fuentes de
datos
ExternasExternas
SociosSocios
MercadosMercados
CompetenciaCompetencia
EconomíaEconomía
IndustriaIndustria
OtrosOtros
ERPERP
CRMCRM
OLSOLS
SCMSCM
NegocioNegocio
OtrosOtros
ÁreaÁrea
TempoTempo
ralral
DataData
WarehouWarehou
sese
MetadatosMetadatos
6
Modelos Entidad-Relación vsModelos Entidad-Relación vs
Modelos DimensionalesModelos Dimensionales
Los modelos
relacionales se
normalizan buscando
eficiencia en términos
de la operación y el
almacenamiento.
Pueden incluir muchas
tablas.
Eficiencia en
actualización
Los modelos
analíticos se orientan
a COMPRENDER el
negocio.
Eficiencia en
consultas
7
Modelo Entidad – RelaciónModelo Entidad – Relación
Materia Cód.
Estudiante
Nombre
Estudiante
Ge
nero
Dirección
Estudiante
Teléfono Nota
Final
Derecho
Laboral
256490 Diana Torres F Calle 12 # 7-20 7601395 4.0
Derecho
Administrativ
o
256490 Diana Torres F Calle 12 # 7-20 7601395 4.3
Derecho
Laboral
256491 Camilo
Fernandez
M Diag 19 # 163-14 2127984 3.7
Derecho Penal 256491 Camilo
Fernandez
M Diag 19 # 163-14 2127984 3.9
8
Modelo Entidad – RelaciónModelo Entidad – Relación
(Normalización)(Normalización)
Cód.
Estudiante
Nombre
Estudiante
Genero Dirección
Estudiante
Teléfono
256490 Diana Torres F Calle 12 # 7-20 7601395
256491 Camilo Fernández M Diag 19 # 163-14 2127984
Cód.
Materia
Nombre
Materia
11001 Derecho Laboral
11002 Derecho Administrativo
11003 Derecho Penal
Cód.
Materia
Cód.
Estudiante
Nota
Final
11001 256490 4.0
11002 256490 4.3
11001 256491 3.7
11003 256491 3.9
Estudiantes
Materias
Notas
9
Modelo Entidad – RelaciónModelo Entidad – Relación (Ejemplo)(Ejemplo)
Tomado de [8]
10
Modelo Dimensional (Ejemplo)Modelo Dimensional (Ejemplo)
Tomado de [8]
11
Terminología DimensionalTerminología Dimensional
Tabla de Hechos:
◦ Es la tabla principal en un
datawarehouse.
◦ Almacena las medidas
numéricas de rendimiento
de los procesos
operacionales en relación
con diferentes perspectivas
de análisis.
12
Terminología DimensionalTerminología Dimensional
Tabla de Dimensiones:
◦ Contienen los
descriptores textuales
(atributos) del negocio.
◦ Permiten dar respuestas
de tipo ¿Por qué?
13
Terminología DimensionalTerminología Dimensional
Modelo Dimensional:
◦ Estructura que permite relacionar las tablas de hechos y
las tablas de dimensiones.
14
DatawarehouseDatawarehouse
Enfoque
◦ Operaciones del negocio
◦ Gerencia del negocio
◦ Inteligencia del negocio
15
DatamartDatamart
Se refiere a una área sujeto
del proceso de negocio
Bodegas de datos específicas
de un departamento o
dependencia de la empresa
Utilizados para almacenar
particularidades de un sector
o para optimizar las consultas
16
Enfoques del DatawarehouseEnfoques del Datawarehouse
Kimball (Bottom-Up) Inmon (Top-Down)
17
Enfoques del DatawarehouseEnfoques del Datawarehouse
Data MartData Mart
VentasVentas
Data MartData Mart
FinancieroFinanciero
Data MartData Mart
Servicio alServicio al
ClienteCliente
DataData
WarehouseWarehouseFuente 2Fuente 2Fuente 2Fuente 2
Fuente 1Fuente 1Fuente 1Fuente 1
Fuente 3Fuente 3Fuente 3Fuente 3
Top Down (Inmon)
18
Ventajas Desventajas
• Visión general del negocio
• No replica trabajo
• Unificación de modelos
• Tiempo de implementación
• Difícil distribución de trabajo y
esfuerzo
Enfoques del DatawarehouseEnfoques del Datawarehouse
DataData
WarehouseWarehouse
Data MartData Mart
Ventas
Data MartData Mart
Financiero
Data MartData Mart
Servicio al
Cliente
Fuente 2Fuente 2Fuente 2Fuente 2
Fuente 1Fuente 1Fuente 1Fuente 1
Fuente 3Fuente 3Fuente 3Fuente 3
Bottom-Up (Kimball)
19
Ventajas Desventajas
• Rápida implementación
• Fácil distribución de trabajo y esfuerzo
• Implementación por fases y áreas
• Posible replicación de trabajo
Metas del DatawarehouseMetas del Datawarehouse
El datawarehouse provee
acceso a los datos
corporativos
Debe servir como la base
para una toma de
decisiones mas informada
(con base en hechos).
Debe ser adaptativo y
resiliente al cambio
20
Metas del DatawarehouseMetas del Datawarehouse
Los datos en un
datawarehouse son
consistentes
La comunidad del negocio
debe aceptar al
datawarehouse como la
única verdad, si se piensa
ser exitoso.
21
Metas del DatawarehouseMetas del Datawarehouse
Los datos en un
datawarehouse pueden
ser separados y
combinados por cada
posible medida del
negocio (slice and dice)
Debe hacer que la
información sea
fácilmente accesible.
22
Metas del DatawarehouseMetas del Datawarehouse
La calidad de los datos
en el datawarehouse es
un conductor de la
reingeniería del negocio
Debe asegurar la
protección de la
información.
23
Metas del DatawarehouseMetas del Datawarehouse
El datawarehouse no es
solo datos, es un
conjunto de herramientas
para consultar, analizar y
presentar información.
24
Componentes de unComponentes de un
datawarehousedatawarehouse
Servicios:
Limpieza,
Combinación,
Estandarización,
Dimensiones comunes
Datos:
Archivos planos
Tablas relacionales
Procesamiento:
Ordenamiento
Procesamiento
secuencial
Data Mart #1
Dimensional
Nivel de detalle
Agregados
Basado en un solo
proceso de negocio
Data Mart #2
Consultas
“Ad Hoc”
Reporteadores
Aplicaciones
Analíticas
Modelos:
• Predicción
• Minería Datos
Extracción
Extracción
Extracción
Sistemas
Operacionales
Fuente
Area de preparación
de Datos (Staging)
Area de presentación
de Datos
Cargue
Cargue
Acceso
Acceso
Herramientas de
Acceso a los Datos
DW Bus:
Dimensiones
comunes y
Facts
25
Sistemas Operacionales FuenteSistemas Operacionales Fuente
Sistemas que capturan
y almacenan las
operaciones del
negocio.
Sus prioridades son
rendimiento y
disponibilidad.
Son sistemas
heterogéneos.
26
Área de preparación de datosÁrea de preparación de datos
(Staging)(Staging)
Es a la vez un área de
almacenamiento y un
conjunto de
procedimientos (ETL)
Esta fuera de los
limites de los usuarios
de negocio y no
provee servicios de
consulta ni de
presentación.
27
Área de presentación de datosÁrea de presentación de datos
 Lugar donde los datos
son organizados,
almacenados y
disponibles para consulta
directa por parte de los
usuarios y otras
aplicaciones.
 Constituido por una
serie de Data Marts que
en conjunto constituyen
la bodega de datos.
 Usa modelos
dimensionales.
28
Herramientas de Acceso a DatosHerramientas de Acceso a Datos
(Visualización)(Visualización)
El término
visualización, se
refiere al conjunto
de herramientas
que se proveen a
los usuarios para
facilitar el proceso
de análisis de
información para la
toma de decisiones.
29
Objetivo: el análisisObjetivo: el análisis
30
Modelo de EstrellaModelo de Estrella
Es muy utilizado.
Orientado a la
comprensión del
negocio
Reduce la
complejidad de
entendimiento y uso
Eficiente para
consultas.
31
Modelo de SnowflakeModelo de Snowflake
 Las dimensiones han sido
normalizadas.
 Las dimensiones en las cuales se
conforman jerarquías se pueden
descomponer en una estructura
de copo de nieve en la cual cada
relación muchos a uno se
manejan en tablas separadas.
 La razón que se expone para su
uso es el ahorro de espacio de
almacenamiento.
32
Modelo de SnowflakeModelo de Snowflake
Este modelo es una variante del
modelo estrella.
Puede parecer más complejo
para el usuario.
Recomendación: Tenga en
cuenta el impacto de tener el
modelo de “copo de nieve” en
dimensiones grandes. Puede ser
que comprometa rendimiento y
navegabilidad.
33
Errores comunes para prevenirErrores comunes para prevenir
Error 10: Permanecer
“enamorado” de la
tecnología y los datos
mas que de los
requerimientos y
metas del negocio
Error 9: No hacer
equipo con un
gerente visionario,
influyente, accesible y
razonable que sea el
patrocinador del
datawarehouse
(Sponsor)
34
Errores comunes para prevenirErrores comunes para prevenir
Error 8: Emprender un
proyecto “galáctico” y
“milenario” antes que
perseguir un proyecto
mas manejable que vaya
creciendo por
iteraciones.
Error 7: Asignar
energía para construir
un modelo de datos
normalizado, buscando
ahorrar recursos
físicos en vez de
preferir la facilidad de
uso para el usario final.
35
Errores comunes para prevenirErrores comunes para prevenir
Error 6: Poner más
atención en el
rendimiento
operacional y facilidad
de desarrollo del “back-
room” que en el
rendimiento y facilidad
de uso del “front-
room”
Error 5: Los
diseñadores de base
de datos que
prefieren la
complejidad,
posteriormente
gastarán mucho
tiempo dando
soporte a los
usuarios.
36
Errores comunes para prevenirErrores comunes para prevenir
Error 4: Crear modelos
dimensionales en forma
aislada sin considerar
una arquitectura de
datos que conectada,
utilizando dimensiones
compartidas.
(No aplicar arquitectura de
bus)
Error 3: Cargar
únicamente datos
sumarizados en el
área de presentación
(Profundidad de análisis)
37
Errores comunes para prevenirErrores comunes para prevenir
Error 2: Presumir que
el negocio, sus
requerimientos,
analíticas, datos
subyacentes y la
tecnología que lo
soportan, son estáticos
Error 1: No
reconocer que el
éxito del data
warehouse está
asociado
directamente a la
aceptación de los
usuarios.
38

Más contenido relacionado

La actualidad más candente

La actualidad más candente (20)

Modelado de Data Warehouse
Modelado de Data WarehouseModelado de Data Warehouse
Modelado de Data Warehouse
 
DATA WAREHOUSE
DATA WAREHOUSEDATA WAREHOUSE
DATA WAREHOUSE
 
Datawarehouse2
Datawarehouse2Datawarehouse2
Datawarehouse2
 
Almacenes de datos
Almacenes de datosAlmacenes de datos
Almacenes de datos
 
Datawarehouse1
Datawarehouse1Datawarehouse1
Datawarehouse1
 
On-Line Analytical Processing - DatawareHouse FISI - UNMSM
On-Line Analytical Processing - DatawareHouse FISI - UNMSMOn-Line Analytical Processing - DatawareHouse FISI - UNMSM
On-Line Analytical Processing - DatawareHouse FISI - UNMSM
 
Data warehouse
Data warehouseData warehouse
Data warehouse
 
Data warehouse
Data warehouseData warehouse
Data warehouse
 
Que Es Un Data Warehouse
Que Es Un Data WarehouseQue Es Un Data Warehouse
Que Es Un Data Warehouse
 
Diseño de almacen de datos
Diseño de almacen de datosDiseño de almacen de datos
Diseño de almacen de datos
 
Almacén de datos
Almacén de datosAlmacén de datos
Almacén de datos
 
Almacen de datos
Almacen de datosAlmacen de datos
Almacen de datos
 
BASE DE DATOS
BASE DE DATOSBASE DE DATOS
BASE DE DATOS
 
data warehouse
data warehousedata warehouse
data warehouse
 
Almacén de datos
Almacén de datosAlmacén de datos
Almacén de datos
 
Aplicaciones difusas manejo de grandes volúmenes de datos
Aplicaciones difusas manejo de grandes volúmenes de datosAplicaciones difusas manejo de grandes volúmenes de datos
Aplicaciones difusas manejo de grandes volúmenes de datos
 
Data warehouse
Data warehouseData warehouse
Data warehouse
 
Estrategia para la Implementación y Administración Inteligente de DataWarehouse
Estrategia para la Implementación y Administración Inteligente de DataWarehouseEstrategia para la Implementación y Administración Inteligente de DataWarehouse
Estrategia para la Implementación y Administración Inteligente de DataWarehouse
 
Data WareHouse. Introduccion
Data WareHouse. IntroduccionData WareHouse. Introduccion
Data WareHouse. Introduccion
 
Introducción a DataWarehouse e Inteligencia de Negocios
Introducción a DataWarehouse e Inteligencia de NegociosIntroducción a DataWarehouse e Inteligencia de Negocios
Introducción a DataWarehouse e Inteligencia de Negocios
 

Destacado

Control de asistencia
Control de asistenciaControl de asistencia
Control de asistenciaalgebragr5
 
Presente y futuro del mercado hipotecario
Presente y futuro del mercado hipotecario Presente y futuro del mercado hipotecario
Presente y futuro del mercado hipotecario Luis Pineda
 
En Defensa de Power Point
En Defensa de Power PointEn Defensa de Power Point
En Defensa de Power PointMiguel Bello
 
Actividades modulo 3 - tarea 4
Actividades    modulo 3 - tarea 4Actividades    modulo 3 - tarea 4
Actividades modulo 3 - tarea 41102669254
 
Trabajo todo el año
Trabajo todo el añoTrabajo todo el año
Trabajo todo el añoCande Sosa
 
Pruebas del-primer-bimestre-de-algebra-lineal
Pruebas del-primer-bimestre-de-algebra-linealPruebas del-primer-bimestre-de-algebra-lineal
Pruebas del-primer-bimestre-de-algebra-linealalgebragr5
 
Procesos cognitivos en la toma de decisiones del consumidor
Procesos cognitivos en la toma de decisiones del consumidorProcesos cognitivos en la toma de decisiones del consumidor
Procesos cognitivos en la toma de decisiones del consumidorAndrea Sanchez
 
Lista de los vestidos de partido para las mujeres
Lista de los vestidos de partido para las mujeresLista de los vestidos de partido para las mujeres
Lista de los vestidos de partido para las mujeresTatiana Dulce
 
Mi contexto de formación
Mi contexto de formaciónMi contexto de formación
Mi contexto de formaciónrosaurarv
 
mantenimiento
mantenimientomantenimiento
mantenimientoleydy159
 
Actividades modulo 3 - tarea 4
Actividades    modulo 3 - tarea 4Actividades    modulo 3 - tarea 4
Actividades modulo 3 - tarea 41102669254
 
Martín lutero
Martín luteroMartín lutero
Martín luterovalealvear
 
Adobe illustrator
Adobe illustratorAdobe illustrator
Adobe illustratorsofia590
 
Bachilerato digital num. 16 caltenco
Bachilerato digital num. 16 caltenco Bachilerato digital num. 16 caltenco
Bachilerato digital num. 16 caltenco Lety Ramirrez
 

Destacado (20)

Control de asistencia
Control de asistenciaControl de asistencia
Control de asistencia
 
Presente y futuro del mercado hipotecario
Presente y futuro del mercado hipotecario Presente y futuro del mercado hipotecario
Presente y futuro del mercado hipotecario
 
Las siete maravillas del mundo
Las siete maravillas del mundoLas siete maravillas del mundo
Las siete maravillas del mundo
 
En Defensa de Power Point
En Defensa de Power PointEn Defensa de Power Point
En Defensa de Power Point
 
Actividades modulo 3 - tarea 4
Actividades    modulo 3 - tarea 4Actividades    modulo 3 - tarea 4
Actividades modulo 3 - tarea 4
 
Trabajo todo el año
Trabajo todo el añoTrabajo todo el año
Trabajo todo el año
 
Pruebas del-primer-bimestre-de-algebra-lineal
Pruebas del-primer-bimestre-de-algebra-linealPruebas del-primer-bimestre-de-algebra-lineal
Pruebas del-primer-bimestre-de-algebra-lineal
 
Procesos cognitivos en la toma de decisiones del consumidor
Procesos cognitivos en la toma de decisiones del consumidorProcesos cognitivos en la toma de decisiones del consumidor
Procesos cognitivos en la toma de decisiones del consumidor
 
Andrea velasco
Andrea velascoAndrea velasco
Andrea velasco
 
Lista de los vestidos de partido para las mujeres
Lista de los vestidos de partido para las mujeresLista de los vestidos de partido para las mujeres
Lista de los vestidos de partido para las mujeres
 
Mi contexto de formación
Mi contexto de formaciónMi contexto de formación
Mi contexto de formación
 
mantenimiento
mantenimientomantenimiento
mantenimiento
 
Banco De España
Banco De España
Banco De España
Banco De España
 
Cs8 grupal
Cs8 grupalCs8 grupal
Cs8 grupal
 
Actividades modulo 3 - tarea 4
Actividades    modulo 3 - tarea 4Actividades    modulo 3 - tarea 4
Actividades modulo 3 - tarea 4
 
Ley de la estabilidad presupuestaria
Ley de la estabilidad presupuestariaLey de la estabilidad presupuestaria
Ley de la estabilidad presupuestaria
 
Martín lutero
Martín luteroMartín lutero
Martín lutero
 
Adobe illustrator
Adobe illustratorAdobe illustrator
Adobe illustrator
 
Bachilerato digital num. 16 caltenco
Bachilerato digital num. 16 caltenco Bachilerato digital num. 16 caltenco
Bachilerato digital num. 16 caltenco
 
Presentacion Ejecutiva BIOD
Presentacion Ejecutiva BIODPresentacion Ejecutiva BIOD
Presentacion Ejecutiva BIOD
 

Similar a Introducción al Datawarehousing

Minería de datos Presentación
Minería de datos PresentaciónMinería de datos Presentación
Minería de datos Presentaciónedmaga
 
Minera de-datos-presentacin-1205263710628735-3
Minera de-datos-presentacin-1205263710628735-3Minera de-datos-presentacin-1205263710628735-3
Minera de-datos-presentacin-1205263710628735-3Climanfef
 
Bussiness inteligence
Bussiness inteligenceBussiness inteligence
Bussiness inteligenceMaryy Aqua
 
Big Data - Desarrollando soluciones efectivas
Big Data - Desarrollando soluciones efectivasBig Data - Desarrollando soluciones efectivas
Big Data - Desarrollando soluciones efectivasJoseph Lopez
 
Aplicaciones DIfusas: Limpieza de datos, resolución de entidades, integración...
Aplicaciones DIfusas: Limpieza de datos, resolución de entidades, integración...Aplicaciones DIfusas: Limpieza de datos, resolución de entidades, integración...
Aplicaciones DIfusas: Limpieza de datos, resolución de entidades, integración...Luis Fernando Aguas Bucheli
 
Sql server analysis services 2008
Sql server analysis services 2008Sql server analysis services 2008
Sql server analysis services 2008Will Flores Soto
 
PLANTILLA INCEPERÚ Sesión 3.pdf-xxxxxxxx
PLANTILLA INCEPERÚ Sesión 3.pdf-xxxxxxxxPLANTILLA INCEPERÚ Sesión 3.pdf-xxxxxxxx
PLANTILLA INCEPERÚ Sesión 3.pdf-xxxxxxxxedwin520324
 
Que Es Un Data Warehouse
Que Es Un Data WarehouseQue Es Un Data Warehouse
Que Es Un Data Warehouseguest10616d
 
Data Warehouse.gestion de bases de datos
Data Warehouse.gestion de bases de datosData Warehouse.gestion de bases de datos
Data Warehouse.gestion de bases de datosssuser948499
 
Topicos de ingeneria_de_sistema_sii_calzada1
Topicos de ingeneria_de_sistema_sii_calzada1Topicos de ingeneria_de_sistema_sii_calzada1
Topicos de ingeneria_de_sistema_sii_calzada1Calzada Meza
 
Ensayo Omar Enrique Aguilar Aquino
Ensayo Omar Enrique Aguilar AquinoEnsayo Omar Enrique Aguilar Aquino
Ensayo Omar Enrique Aguilar Aquinocoprse aquino
 

Similar a Introducción al Datawarehousing (20)

Minería de datos Presentación
Minería de datos PresentaciónMinería de datos Presentación
Minería de datos Presentación
 
Minera de-datos-presentacin-1205263710628735-3
Minera de-datos-presentacin-1205263710628735-3Minera de-datos-presentacin-1205263710628735-3
Minera de-datos-presentacin-1205263710628735-3
 
Kdd fase1
Kdd fase1Kdd fase1
Kdd fase1
 
Data Warehouse
Data WarehouseData Warehouse
Data Warehouse
 
Curso : Inteligencia de Negocios - Dia1
Curso : Inteligencia de Negocios - Dia1Curso : Inteligencia de Negocios - Dia1
Curso : Inteligencia de Negocios - Dia1
 
Bussiness inteligence
Bussiness inteligenceBussiness inteligence
Bussiness inteligence
 
Big Data - Desarrollando soluciones efectivas
Big Data - Desarrollando soluciones efectivasBig Data - Desarrollando soluciones efectivas
Big Data - Desarrollando soluciones efectivas
 
Aplicaciones DIfusas: Limpieza de datos, resolución de entidades, integración...
Aplicaciones DIfusas: Limpieza de datos, resolución de entidades, integración...Aplicaciones DIfusas: Limpieza de datos, resolución de entidades, integración...
Aplicaciones DIfusas: Limpieza de datos, resolución de entidades, integración...
 
Sql server analysis services 2008
Sql server analysis services 2008Sql server analysis services 2008
Sql server analysis services 2008
 
Datawarehouse 1
Datawarehouse   1Datawarehouse   1
Datawarehouse 1
 
PLANTILLA INCEPERÚ Sesión 3.pdf-xxxxxxxx
PLANTILLA INCEPERÚ Sesión 3.pdf-xxxxxxxxPLANTILLA INCEPERÚ Sesión 3.pdf-xxxxxxxx
PLANTILLA INCEPERÚ Sesión 3.pdf-xxxxxxxx
 
Que Es Un Data Warehouse
Que Es Un Data WarehouseQue Es Un Data Warehouse
Que Es Un Data Warehouse
 
S15 bi v1-1
S15 bi v1-1S15 bi v1-1
S15 bi v1-1
 
Data warehouse
Data warehouseData warehouse
Data warehouse
 
Bases de datos
Bases de datosBases de datos
Bases de datos
 
Data Warehouse.gestion de bases de datos
Data Warehouse.gestion de bases de datosData Warehouse.gestion de bases de datos
Data Warehouse.gestion de bases de datos
 
ALMACEN DE DATOS.pptx
ALMACEN DE DATOS.pptxALMACEN DE DATOS.pptx
ALMACEN DE DATOS.pptx
 
Topicos de ingeneria_de_sistema_sii_calzada1
Topicos de ingeneria_de_sistema_sii_calzada1Topicos de ingeneria_de_sistema_sii_calzada1
Topicos de ingeneria_de_sistema_sii_calzada1
 
Ensayo Omar Enrique Aguilar Aquino
Ensayo Omar Enrique Aguilar AquinoEnsayo Omar Enrique Aguilar Aquino
Ensayo Omar Enrique Aguilar Aquino
 
Cuestiones de repaso_cap_31_utpl
Cuestiones de repaso_cap_31_utplCuestiones de repaso_cap_31_utpl
Cuestiones de repaso_cap_31_utpl
 

Más de Big Data Colombia

An introduction to deep reinforcement learning
An introduction to deep reinforcement learningAn introduction to deep reinforcement learning
An introduction to deep reinforcement learningBig Data Colombia
 
Machine learning applied in health
Machine learning applied in healthMachine learning applied in health
Machine learning applied in healthBig Data Colombia
 
Whose Balance Sheet is this? Neural Networks for Banks’ Pattern Recognition
Whose Balance Sheet is this? Neural Networks for Banks’ Pattern RecognitionWhose Balance Sheet is this? Neural Networks for Banks’ Pattern Recognition
Whose Balance Sheet is this? Neural Networks for Banks’ Pattern RecognitionBig Data Colombia
 
Analysis of your own Facebook friends’ data structure through graphs
Analysis of your own Facebook friends’ data structure through graphsAnalysis of your own Facebook friends’ data structure through graphs
Analysis of your own Facebook friends’ data structure through graphsBig Data Colombia
 
Lo datos cuentan su historia
Lo datos cuentan su historiaLo datos cuentan su historia
Lo datos cuentan su historiaBig Data Colombia
 
Entornos Naturalmente Inteligentes
Entornos Naturalmente InteligentesEntornos Naturalmente Inteligentes
Entornos Naturalmente InteligentesBig Data Colombia
 
Modelamiento predictivo y medicina
Modelamiento predictivo y medicinaModelamiento predictivo y medicina
Modelamiento predictivo y medicinaBig Data Colombia
 
Ayudando a los Viajeros usando 500 millones de Reseñas Hoteleras al Mes
Ayudando a los Viajeros usando 500 millones de Reseñas Hoteleras al MesAyudando a los Viajeros usando 500 millones de Reseñas Hoteleras al Mes
Ayudando a los Viajeros usando 500 millones de Reseñas Hoteleras al MesBig Data Colombia
 
Deep learning: el renacimiento de las redes neuronales
Deep learning: el renacimiento de las redes neuronalesDeep learning: el renacimiento de las redes neuronales
Deep learning: el renacimiento de las redes neuronalesBig Data Colombia
 
Cloud computing: Trends and Challenges
Cloud computing: Trends and ChallengesCloud computing: Trends and Challenges
Cloud computing: Trends and ChallengesBig Data Colombia
 
Kaggle: Coupon Purchase Prediction
Kaggle: Coupon Purchase PredictionKaggle: Coupon Purchase Prediction
Kaggle: Coupon Purchase PredictionBig Data Colombia
 
Análisis Explotatorio de Datos: Dejad que la data hable.
Análisis Explotatorio de Datos: Dejad que la data hable.Análisis Explotatorio de Datos: Dejad que la data hable.
Análisis Explotatorio de Datos: Dejad que la data hable.Big Data Colombia
 
Salud, dinero, amor y big data
Salud, dinero, amor y big dataSalud, dinero, amor y big data
Salud, dinero, amor y big dataBig Data Colombia
 
Business Analytics: ¡La culpa es del BIG data!
Business Analytics: ¡La culpa es del BIG data!Business Analytics: ¡La culpa es del BIG data!
Business Analytics: ¡La culpa es del BIG data!Big Data Colombia
 

Más de Big Data Colombia (19)

An introduction to deep reinforcement learning
An introduction to deep reinforcement learningAn introduction to deep reinforcement learning
An introduction to deep reinforcement learning
 
Machine learning applied in health
Machine learning applied in healthMachine learning applied in health
Machine learning applied in health
 
Whose Balance Sheet is this? Neural Networks for Banks’ Pattern Recognition
Whose Balance Sheet is this? Neural Networks for Banks’ Pattern RecognitionWhose Balance Sheet is this? Neural Networks for Banks’ Pattern Recognition
Whose Balance Sheet is this? Neural Networks for Banks’ Pattern Recognition
 
Analysis of your own Facebook friends’ data structure through graphs
Analysis of your own Facebook friends’ data structure through graphsAnalysis of your own Facebook friends’ data structure through graphs
Analysis of your own Facebook friends’ data structure through graphs
 
Lo datos cuentan su historia
Lo datos cuentan su historiaLo datos cuentan su historia
Lo datos cuentan su historia
 
Entornos Naturalmente Inteligentes
Entornos Naturalmente InteligentesEntornos Naturalmente Inteligentes
Entornos Naturalmente Inteligentes
 
Modelamiento predictivo y medicina
Modelamiento predictivo y medicinaModelamiento predictivo y medicina
Modelamiento predictivo y medicina
 
Ayudando a los Viajeros usando 500 millones de Reseñas Hoteleras al Mes
Ayudando a los Viajeros usando 500 millones de Reseñas Hoteleras al MesAyudando a los Viajeros usando 500 millones de Reseñas Hoteleras al Mes
Ayudando a los Viajeros usando 500 millones de Reseñas Hoteleras al Mes
 
Deep learning: el renacimiento de las redes neuronales
Deep learning: el renacimiento de las redes neuronalesDeep learning: el renacimiento de las redes neuronales
Deep learning: el renacimiento de las redes neuronales
 
IPython & Jupyter
IPython & JupyterIPython & Jupyter
IPython & Jupyter
 
Cloud computing: Trends and Challenges
Cloud computing: Trends and ChallengesCloud computing: Trends and Challenges
Cloud computing: Trends and Challenges
 
Kaggle: Coupon Purchase Prediction
Kaggle: Coupon Purchase PredictionKaggle: Coupon Purchase Prediction
Kaggle: Coupon Purchase Prediction
 
Machine learning y Kaggle
Machine learning y KaggleMachine learning y Kaggle
Machine learning y Kaggle
 
Fraud Analytics
Fraud AnalyticsFraud Analytics
Fraud Analytics
 
Data crunching con Spark
Data crunching con SparkData crunching con Spark
Data crunching con Spark
 
Análisis Explotatorio de Datos: Dejad que la data hable.
Análisis Explotatorio de Datos: Dejad que la data hable.Análisis Explotatorio de Datos: Dejad que la data hable.
Análisis Explotatorio de Datos: Dejad que la data hable.
 
Big Data para mortales
Big Data para mortalesBig Data para mortales
Big Data para mortales
 
Salud, dinero, amor y big data
Salud, dinero, amor y big dataSalud, dinero, amor y big data
Salud, dinero, amor y big data
 
Business Analytics: ¡La culpa es del BIG data!
Business Analytics: ¡La culpa es del BIG data!Business Analytics: ¡La culpa es del BIG data!
Business Analytics: ¡La culpa es del BIG data!
 

Último

Cuáles son las características biológicas que están marcadas en tu individual...
Cuáles son las características biológicas que están marcadas en tu individual...Cuáles son las características biológicas que están marcadas en tu individual...
Cuáles son las características biológicas que están marcadas en tu individual...israel garcia
 
Listas de Fundamentos de Programación 2024
Listas de Fundamentos de Programación 2024Listas de Fundamentos de Programación 2024
Listas de Fundamentos de Programación 2024AndrsReinosoSnchez1
 
Los_países_con_la_mayor_cantidad_de_rascacielos (2023).pdf
Los_países_con_la_mayor_cantidad_de_rascacielos (2023).pdfLos_países_con_la_mayor_cantidad_de_rascacielos (2023).pdf
Los_países_con_la_mayor_cantidad_de_rascacielos (2023).pdfJC Díaz Herrera
 
Industria musical de EUA vs Industria musical Corea del Sur (2024).pdf
Industria musical de EUA vs Industria musical Corea del Sur (2024).pdfIndustria musical de EUA vs Industria musical Corea del Sur (2024).pdf
Industria musical de EUA vs Industria musical Corea del Sur (2024).pdfJC Díaz Herrera
 
Los más ricos administradores de fondo de cobertura (1968-2024).pdf
Los más ricos administradores de fondo de cobertura (1968-2024).pdfLos más ricos administradores de fondo de cobertura (1968-2024).pdf
Los más ricos administradores de fondo de cobertura (1968-2024).pdfJC Díaz Herrera
 
PIB PERÚ datos y análisis de los últimos años
PIB PERÚ datos y análisis de los últimos añosPIB PERÚ datos y análisis de los últimos años
PIB PERÚ datos y análisis de los últimos añosEstefaniaRojas54
 
Evolución de la fortuna de la familia Slim (1994-2024).pdf
Evolución de la fortuna de la familia Slim (1994-2024).pdfEvolución de la fortuna de la familia Slim (1994-2024).pdf
Evolución de la fortuna de la familia Slim (1994-2024).pdfJC Díaz Herrera
 
Las mujeres más ricas del mundo (2024).pdf
Las mujeres más ricas del mundo (2024).pdfLas mujeres más ricas del mundo (2024).pdf
Las mujeres más ricas del mundo (2024).pdfJC Díaz Herrera
 
Posiciones_del_sionismo_en_los_imperios globales de la humanidad (2024).pdf
Posiciones_del_sionismo_en_los_imperios globales de la humanidad (2024).pdfPosiciones_del_sionismo_en_los_imperios globales de la humanidad (2024).pdf
Posiciones_del_sionismo_en_los_imperios globales de la humanidad (2024).pdfJC Díaz Herrera
 
Posiciones del IDH a nivel global en México (1982-2024).pdf
Posiciones del IDH a nivel global en México (1982-2024).pdfPosiciones del IDH a nivel global en México (1982-2024).pdf
Posiciones del IDH a nivel global en México (1982-2024).pdfJC Díaz Herrera
 
Presentacion-Prevencion-Incendios-Forestales.pdf
Presentacion-Prevencion-Incendios-Forestales.pdfPresentacion-Prevencion-Incendios-Forestales.pdf
Presentacion-Prevencion-Incendios-Forestales.pdfDodiAcuaArstica
 
CNEB-CURRICULO NACIONAL DE EDUCACION BASICA
CNEB-CURRICULO NACIONAL DE EDUCACION BASICACNEB-CURRICULO NACIONAL DE EDUCACION BASICA
CNEB-CURRICULO NACIONAL DE EDUCACION BASICAYOSHELINSARAIMAMANIS2
 
AA CUADRO DE TEORIA DEL CASO. (1) (1).docx
AA CUADRO DE TEORIA DEL CASO. (1) (1).docxAA CUADRO DE TEORIA DEL CASO. (1) (1).docx
AA CUADRO DE TEORIA DEL CASO. (1) (1).docxLuisAngelYomonaYomon
 
Novelas Turcas vs Series de EUA en audiencia (2024).pdf
Novelas Turcas vs Series de EUA en audiencia  (2024).pdfNovelas Turcas vs Series de EUA en audiencia  (2024).pdf
Novelas Turcas vs Series de EUA en audiencia (2024).pdfJC Díaz Herrera
 
Qué es un Histograma estadístico teoria y problema
Qué es un Histograma estadístico teoria y problemaQué es un Histograma estadístico teoria y problema
Qué es un Histograma estadístico teoria y problemaJoellyAlejandraRodrg
 
La importancia de las pruebas de producto para tu empresa
La importancia de las pruebas de producto para tu empresaLa importancia de las pruebas de producto para tu empresa
La importancia de las pruebas de producto para tu empresamerca6
 
Las familias más ricas del sionismo en el siglo XXI.pdf
Las familias más ricas del sionismo en el siglo XXI.pdfLas familias más ricas del sionismo en el siglo XXI.pdf
Las familias más ricas del sionismo en el siglo XXI.pdfJC Díaz Herrera
 
Panorama Sociodemográfico de México 2020: GUANAJUATO
Panorama Sociodemográfico de México 2020: GUANAJUATOPanorama Sociodemográfico de México 2020: GUANAJUATO
Panorama Sociodemográfico de México 2020: GUANAJUATOJuan Carlos Fonseca Mata
 
Reservas de divisas y oro en México en sexenio de AMLO (2018-2024).pdf
Reservas de divisas y oro en México en sexenio de AMLO (2018-2024).pdfReservas de divisas y oro en México en sexenio de AMLO (2018-2024).pdf
Reservas de divisas y oro en México en sexenio de AMLO (2018-2024).pdfJC Díaz Herrera
 
Técnica palatina baja, anestesiología dental
Técnica palatina baja, anestesiología dentalTécnica palatina baja, anestesiología dental
Técnica palatina baja, anestesiología dentalIngrid459352
 

Último (20)

Cuáles son las características biológicas que están marcadas en tu individual...
Cuáles son las características biológicas que están marcadas en tu individual...Cuáles son las características biológicas que están marcadas en tu individual...
Cuáles son las características biológicas que están marcadas en tu individual...
 
Listas de Fundamentos de Programación 2024
Listas de Fundamentos de Programación 2024Listas de Fundamentos de Programación 2024
Listas de Fundamentos de Programación 2024
 
Los_países_con_la_mayor_cantidad_de_rascacielos (2023).pdf
Los_países_con_la_mayor_cantidad_de_rascacielos (2023).pdfLos_países_con_la_mayor_cantidad_de_rascacielos (2023).pdf
Los_países_con_la_mayor_cantidad_de_rascacielos (2023).pdf
 
Industria musical de EUA vs Industria musical Corea del Sur (2024).pdf
Industria musical de EUA vs Industria musical Corea del Sur (2024).pdfIndustria musical de EUA vs Industria musical Corea del Sur (2024).pdf
Industria musical de EUA vs Industria musical Corea del Sur (2024).pdf
 
Los más ricos administradores de fondo de cobertura (1968-2024).pdf
Los más ricos administradores de fondo de cobertura (1968-2024).pdfLos más ricos administradores de fondo de cobertura (1968-2024).pdf
Los más ricos administradores de fondo de cobertura (1968-2024).pdf
 
PIB PERÚ datos y análisis de los últimos años
PIB PERÚ datos y análisis de los últimos añosPIB PERÚ datos y análisis de los últimos años
PIB PERÚ datos y análisis de los últimos años
 
Evolución de la fortuna de la familia Slim (1994-2024).pdf
Evolución de la fortuna de la familia Slim (1994-2024).pdfEvolución de la fortuna de la familia Slim (1994-2024).pdf
Evolución de la fortuna de la familia Slim (1994-2024).pdf
 
Las mujeres más ricas del mundo (2024).pdf
Las mujeres más ricas del mundo (2024).pdfLas mujeres más ricas del mundo (2024).pdf
Las mujeres más ricas del mundo (2024).pdf
 
Posiciones_del_sionismo_en_los_imperios globales de la humanidad (2024).pdf
Posiciones_del_sionismo_en_los_imperios globales de la humanidad (2024).pdfPosiciones_del_sionismo_en_los_imperios globales de la humanidad (2024).pdf
Posiciones_del_sionismo_en_los_imperios globales de la humanidad (2024).pdf
 
Posiciones del IDH a nivel global en México (1982-2024).pdf
Posiciones del IDH a nivel global en México (1982-2024).pdfPosiciones del IDH a nivel global en México (1982-2024).pdf
Posiciones del IDH a nivel global en México (1982-2024).pdf
 
Presentacion-Prevencion-Incendios-Forestales.pdf
Presentacion-Prevencion-Incendios-Forestales.pdfPresentacion-Prevencion-Incendios-Forestales.pdf
Presentacion-Prevencion-Incendios-Forestales.pdf
 
CNEB-CURRICULO NACIONAL DE EDUCACION BASICA
CNEB-CURRICULO NACIONAL DE EDUCACION BASICACNEB-CURRICULO NACIONAL DE EDUCACION BASICA
CNEB-CURRICULO NACIONAL DE EDUCACION BASICA
 
AA CUADRO DE TEORIA DEL CASO. (1) (1).docx
AA CUADRO DE TEORIA DEL CASO. (1) (1).docxAA CUADRO DE TEORIA DEL CASO. (1) (1).docx
AA CUADRO DE TEORIA DEL CASO. (1) (1).docx
 
Novelas Turcas vs Series de EUA en audiencia (2024).pdf
Novelas Turcas vs Series de EUA en audiencia  (2024).pdfNovelas Turcas vs Series de EUA en audiencia  (2024).pdf
Novelas Turcas vs Series de EUA en audiencia (2024).pdf
 
Qué es un Histograma estadístico teoria y problema
Qué es un Histograma estadístico teoria y problemaQué es un Histograma estadístico teoria y problema
Qué es un Histograma estadístico teoria y problema
 
La importancia de las pruebas de producto para tu empresa
La importancia de las pruebas de producto para tu empresaLa importancia de las pruebas de producto para tu empresa
La importancia de las pruebas de producto para tu empresa
 
Las familias más ricas del sionismo en el siglo XXI.pdf
Las familias más ricas del sionismo en el siglo XXI.pdfLas familias más ricas del sionismo en el siglo XXI.pdf
Las familias más ricas del sionismo en el siglo XXI.pdf
 
Panorama Sociodemográfico de México 2020: GUANAJUATO
Panorama Sociodemográfico de México 2020: GUANAJUATOPanorama Sociodemográfico de México 2020: GUANAJUATO
Panorama Sociodemográfico de México 2020: GUANAJUATO
 
Reservas de divisas y oro en México en sexenio de AMLO (2018-2024).pdf
Reservas de divisas y oro en México en sexenio de AMLO (2018-2024).pdfReservas de divisas y oro en México en sexenio de AMLO (2018-2024).pdf
Reservas de divisas y oro en México en sexenio de AMLO (2018-2024).pdf
 
Técnica palatina baja, anestesiología dental
Técnica palatina baja, anestesiología dentalTécnica palatina baja, anestesiología dental
Técnica palatina baja, anestesiología dental
 

Introducción al Datawarehousing

  • 2. ¿Qué es un data warehouse? 2
  • 3. Datos (*)Datos (*)  Son colecciones de símbolos que se tienen en una computadora.  Cualquier interpretación de los datos para fines humanos se llama información. (*) Bertrand Meyer – Touch of Class 3
  • 4. DatawarehouseDatawarehouse  “Es un conjunto de datos integrados y orientados a un objetivo específico, que varían con el tiempo (datos históricos) y que no son transitorios. Soportan el proceso de toma de decisiones de la administración y está orientada al manejo de grandes volúmenes de datos provenientes de diversas fuentes…” (Imhoff, 2003) 4
  • 5. BI es un conjunto de procesos Tecnológicos que transforman los datos en conocimiento Conocimiento Información Datos Datos + contexto Información + Know How 5Davenport, T. H., & Prusak, L. (2000)
  • 6. Solución completa de BISolución completa de BI ETLETL CalidCalid ad dead de datosdatos Tomador de decisión UsuariosUsuarios InternosInternos UsuariosUsuarios ExternosExternos AplicacionesAplicaciones Arquitectura de datos (Integración) Data MartData Mart Deptal.Deptal. RapidRapid MartsMarts Acceso Web FinanzasFinanzas I +DI +D MercadeoMercadeo VentasVentas ServiciosServicios PlaneaciòPlaneaciò nn OtrosOtros OperacionesOperaciones ConsultasConsultas Ad hocAd hoc IndicadoreIndicadore ss AnálisisAnálisis (OLAP)(OLAP) AnalíticasAnalíticas por procesopor proceso Minería deMinería de DatosDatos Aplicació n analítica PlanningPlanning PredictivaPredictiva ss ConsultasConsultas predefinidaspredefinidas InternasInternas ERPERP CRMCRM OLSOLS SCMSCM NegocioNegocio OtrosOtros Fuentes de datos ExternasExternas SociosSocios MercadosMercados CompetenciaCompetencia EconomíaEconomía IndustriaIndustria OtrosOtros ERPERP CRMCRM OLSOLS SCMSCM NegocioNegocio OtrosOtros ÁreaÁrea TempoTempo ralral DataData WarehouWarehou sese MetadatosMetadatos 6
  • 7. Modelos Entidad-Relación vsModelos Entidad-Relación vs Modelos DimensionalesModelos Dimensionales Los modelos relacionales se normalizan buscando eficiencia en términos de la operación y el almacenamiento. Pueden incluir muchas tablas. Eficiencia en actualización Los modelos analíticos se orientan a COMPRENDER el negocio. Eficiencia en consultas 7
  • 8. Modelo Entidad – RelaciónModelo Entidad – Relación Materia Cód. Estudiante Nombre Estudiante Ge nero Dirección Estudiante Teléfono Nota Final Derecho Laboral 256490 Diana Torres F Calle 12 # 7-20 7601395 4.0 Derecho Administrativ o 256490 Diana Torres F Calle 12 # 7-20 7601395 4.3 Derecho Laboral 256491 Camilo Fernandez M Diag 19 # 163-14 2127984 3.7 Derecho Penal 256491 Camilo Fernandez M Diag 19 # 163-14 2127984 3.9 8
  • 9. Modelo Entidad – RelaciónModelo Entidad – Relación (Normalización)(Normalización) Cód. Estudiante Nombre Estudiante Genero Dirección Estudiante Teléfono 256490 Diana Torres F Calle 12 # 7-20 7601395 256491 Camilo Fernández M Diag 19 # 163-14 2127984 Cód. Materia Nombre Materia 11001 Derecho Laboral 11002 Derecho Administrativo 11003 Derecho Penal Cód. Materia Cód. Estudiante Nota Final 11001 256490 4.0 11002 256490 4.3 11001 256491 3.7 11003 256491 3.9 Estudiantes Materias Notas 9
  • 10. Modelo Entidad – RelaciónModelo Entidad – Relación (Ejemplo)(Ejemplo) Tomado de [8] 10
  • 11. Modelo Dimensional (Ejemplo)Modelo Dimensional (Ejemplo) Tomado de [8] 11
  • 12. Terminología DimensionalTerminología Dimensional Tabla de Hechos: ◦ Es la tabla principal en un datawarehouse. ◦ Almacena las medidas numéricas de rendimiento de los procesos operacionales en relación con diferentes perspectivas de análisis. 12
  • 13. Terminología DimensionalTerminología Dimensional Tabla de Dimensiones: ◦ Contienen los descriptores textuales (atributos) del negocio. ◦ Permiten dar respuestas de tipo ¿Por qué? 13
  • 14. Terminología DimensionalTerminología Dimensional Modelo Dimensional: ◦ Estructura que permite relacionar las tablas de hechos y las tablas de dimensiones. 14
  • 15. DatawarehouseDatawarehouse Enfoque ◦ Operaciones del negocio ◦ Gerencia del negocio ◦ Inteligencia del negocio 15
  • 16. DatamartDatamart Se refiere a una área sujeto del proceso de negocio Bodegas de datos específicas de un departamento o dependencia de la empresa Utilizados para almacenar particularidades de un sector o para optimizar las consultas 16
  • 17. Enfoques del DatawarehouseEnfoques del Datawarehouse Kimball (Bottom-Up) Inmon (Top-Down) 17
  • 18. Enfoques del DatawarehouseEnfoques del Datawarehouse Data MartData Mart VentasVentas Data MartData Mart FinancieroFinanciero Data MartData Mart Servicio alServicio al ClienteCliente DataData WarehouseWarehouseFuente 2Fuente 2Fuente 2Fuente 2 Fuente 1Fuente 1Fuente 1Fuente 1 Fuente 3Fuente 3Fuente 3Fuente 3 Top Down (Inmon) 18 Ventajas Desventajas • Visión general del negocio • No replica trabajo • Unificación de modelos • Tiempo de implementación • Difícil distribución de trabajo y esfuerzo
  • 19. Enfoques del DatawarehouseEnfoques del Datawarehouse DataData WarehouseWarehouse Data MartData Mart Ventas Data MartData Mart Financiero Data MartData Mart Servicio al Cliente Fuente 2Fuente 2Fuente 2Fuente 2 Fuente 1Fuente 1Fuente 1Fuente 1 Fuente 3Fuente 3Fuente 3Fuente 3 Bottom-Up (Kimball) 19 Ventajas Desventajas • Rápida implementación • Fácil distribución de trabajo y esfuerzo • Implementación por fases y áreas • Posible replicación de trabajo
  • 20. Metas del DatawarehouseMetas del Datawarehouse El datawarehouse provee acceso a los datos corporativos Debe servir como la base para una toma de decisiones mas informada (con base en hechos). Debe ser adaptativo y resiliente al cambio 20
  • 21. Metas del DatawarehouseMetas del Datawarehouse Los datos en un datawarehouse son consistentes La comunidad del negocio debe aceptar al datawarehouse como la única verdad, si se piensa ser exitoso. 21
  • 22. Metas del DatawarehouseMetas del Datawarehouse Los datos en un datawarehouse pueden ser separados y combinados por cada posible medida del negocio (slice and dice) Debe hacer que la información sea fácilmente accesible. 22
  • 23. Metas del DatawarehouseMetas del Datawarehouse La calidad de los datos en el datawarehouse es un conductor de la reingeniería del negocio Debe asegurar la protección de la información. 23
  • 24. Metas del DatawarehouseMetas del Datawarehouse El datawarehouse no es solo datos, es un conjunto de herramientas para consultar, analizar y presentar información. 24
  • 25. Componentes de unComponentes de un datawarehousedatawarehouse Servicios: Limpieza, Combinación, Estandarización, Dimensiones comunes Datos: Archivos planos Tablas relacionales Procesamiento: Ordenamiento Procesamiento secuencial Data Mart #1 Dimensional Nivel de detalle Agregados Basado en un solo proceso de negocio Data Mart #2 Consultas “Ad Hoc” Reporteadores Aplicaciones Analíticas Modelos: • Predicción • Minería Datos Extracción Extracción Extracción Sistemas Operacionales Fuente Area de preparación de Datos (Staging) Area de presentación de Datos Cargue Cargue Acceso Acceso Herramientas de Acceso a los Datos DW Bus: Dimensiones comunes y Facts 25
  • 26. Sistemas Operacionales FuenteSistemas Operacionales Fuente Sistemas que capturan y almacenan las operaciones del negocio. Sus prioridades son rendimiento y disponibilidad. Son sistemas heterogéneos. 26
  • 27. Área de preparación de datosÁrea de preparación de datos (Staging)(Staging) Es a la vez un área de almacenamiento y un conjunto de procedimientos (ETL) Esta fuera de los limites de los usuarios de negocio y no provee servicios de consulta ni de presentación. 27
  • 28. Área de presentación de datosÁrea de presentación de datos  Lugar donde los datos son organizados, almacenados y disponibles para consulta directa por parte de los usuarios y otras aplicaciones.  Constituido por una serie de Data Marts que en conjunto constituyen la bodega de datos.  Usa modelos dimensionales. 28
  • 29. Herramientas de Acceso a DatosHerramientas de Acceso a Datos (Visualización)(Visualización) El término visualización, se refiere al conjunto de herramientas que se proveen a los usuarios para facilitar el proceso de análisis de información para la toma de decisiones. 29
  • 31. Modelo de EstrellaModelo de Estrella Es muy utilizado. Orientado a la comprensión del negocio Reduce la complejidad de entendimiento y uso Eficiente para consultas. 31
  • 32. Modelo de SnowflakeModelo de Snowflake  Las dimensiones han sido normalizadas.  Las dimensiones en las cuales se conforman jerarquías se pueden descomponer en una estructura de copo de nieve en la cual cada relación muchos a uno se manejan en tablas separadas.  La razón que se expone para su uso es el ahorro de espacio de almacenamiento. 32
  • 33. Modelo de SnowflakeModelo de Snowflake Este modelo es una variante del modelo estrella. Puede parecer más complejo para el usuario. Recomendación: Tenga en cuenta el impacto de tener el modelo de “copo de nieve” en dimensiones grandes. Puede ser que comprometa rendimiento y navegabilidad. 33
  • 34. Errores comunes para prevenirErrores comunes para prevenir Error 10: Permanecer “enamorado” de la tecnología y los datos mas que de los requerimientos y metas del negocio Error 9: No hacer equipo con un gerente visionario, influyente, accesible y razonable que sea el patrocinador del datawarehouse (Sponsor) 34
  • 35. Errores comunes para prevenirErrores comunes para prevenir Error 8: Emprender un proyecto “galáctico” y “milenario” antes que perseguir un proyecto mas manejable que vaya creciendo por iteraciones. Error 7: Asignar energía para construir un modelo de datos normalizado, buscando ahorrar recursos físicos en vez de preferir la facilidad de uso para el usario final. 35
  • 36. Errores comunes para prevenirErrores comunes para prevenir Error 6: Poner más atención en el rendimiento operacional y facilidad de desarrollo del “back- room” que en el rendimiento y facilidad de uso del “front- room” Error 5: Los diseñadores de base de datos que prefieren la complejidad, posteriormente gastarán mucho tiempo dando soporte a los usuarios. 36
  • 37. Errores comunes para prevenirErrores comunes para prevenir Error 4: Crear modelos dimensionales en forma aislada sin considerar una arquitectura de datos que conectada, utilizando dimensiones compartidas. (No aplicar arquitectura de bus) Error 3: Cargar únicamente datos sumarizados en el área de presentación (Profundidad de análisis) 37
  • 38. Errores comunes para prevenirErrores comunes para prevenir Error 2: Presumir que el negocio, sus requerimientos, analíticas, datos subyacentes y la tecnología que lo soportan, son estáticos Error 1: No reconocer que el éxito del data warehouse está asociado directamente a la aceptación de los usuarios. 38