SlideShare una empresa de Scribd logo
1 de 30
DATAWAREHOUSE
Almacenes y Minería de Datos 2
Definición
• Datawarehouse (Almacen de datos) se
define como una colección de datos que
verifican las siguientes propiedades:
– Está orientado (a un tema) a objetos
– Datos integrados
– No volátiles
– Variante en el tiempo
que surgieron como una herramienta de
soporte para la toma de decisiones a nivel
gerencial
Almacenes y Minería de Datos 3
Explicación de la definición
• Orientado hacia temas: los datos se
almacenan y agrupan por temas de interés.
Almacenes y Minería de Datos 4
Explicación de la definición
• Datos integrados: el almacén de datos
integra datos que provienen de varias
fuentes. Partimos de una base de datos
(operacional) y mediante un proceso de
carga de datos hacemos el Datawarehouse.
El proceso de carga es lo más complicado
por problemas de codificación, medidas de
los atributos… de las bases de datos.
BD
BD
BD
DW
CARGA
Almacenes y Minería de Datos 5
Explicación de la definición
• No volátiles: son estables, una vez
almacenados los datos no se modifican.
BD DWD
W
SELECT
INSERT
UPDATE
DELETE
REPORT
S
SELECT
CARGA
Almacenes y Minería de Datos 6
Explicación de la definición
• Variante en el tiempo: los datos contienen
información sobre la fecha de los mismos,
porque se hacen cargas de datos
continuamente. Cuando los datos van
cambiando, se actualizan los históricos y se
guardan en ficheros temporales. Siempre va
haber una variable tiempo.
TIEMPO
# id_tiempo
* periodo
Almacenes y Minería de Datos 7
Características
• Podemos resumir las características de
un Datawarehouse:
– Trabaja con datos de negocio
– Orientado a un sujeto
– Almacena datos actuales orientado a un
histórico (actual + histórico)
– Datos más bien resumidos (no información
detallada)
Almacenes y Minería de Datos 8
DIFERENCIAS
BD
OPERACIONAL
- Datos
operacionales
- Orientado a
aplicaciones
- Datos Actuales
- Datos Detallados
- Datos en continuo
cambio
DATAWAREHOUS
E
- Datos de negocio
- Orientado al sujeto
- Actuales +
Histórico
- Datos Resumidos
- Datos Estables
Almacenes y Minería de Datos 9
GESTOR
CARGA
ARQUITECTURA DW
GESTOR
ALMACENAMIENT
O
GESTOR
CONSULTAS
BD
operacional
Partimos de una BD operacional y se basa en 3 módulos
Almacenes y Minería de Datos 10
GESTOR DE CARGA
• Permite hacer la carga. Como dificultades
nos podemos encontrar:
– La integración de los datos
– Elección del momento de la carga
– El tiempo de carga sea el mínimo posible
– Buen diccionario de datos o METADATA (para
evitar cometer errores en la carga)
– Diseño de procedimientos PL/SQL
Almacenes y Minería de Datos 11
GESTOR DE ALMACENAMIENTO
• Se encarga del almacenamiento, de la
estructura,….
Existe una tabla llamada FACT (Hecho) y unas
tablas llamadas dimensiones o tablas
dimensionales.
Entre la tabla FACT y las tablas dimensionales
suele haber relaciones 1:N
Este modelo tiene forma de estrella por eso se
denomina MODELO STAR
Almacenes y Minería de Datos 12
MODELO STAR
FACT
DIM_1
DIM_2
DIM_TIEMPO
DIM_3
# PK4
# PK1
# PK2
# PK3
# PK1
# PK2
# PK3
# PK4
*campoA
*campoB
Almacenes y Minería de Datos 13
GESTOR DE CONSULTAS
• Las consultas se hacen sobre la tabla
FACT. También se encarga de los
perfiles, pues las consultas (reports)
serán diferentes dependiendo del
usuario y sus necesidades.
Almacenes y Minería de Datos 14
Ejemplo 1:
CATEGORIAS_PROF
# c_categoria
* descripción
* salario_min
* salario_max
USUARIOS
# c_usuario
* nombre
* apellido1
* apellido2
* c_categoria
* direccion
USU_OFERTAS
# c_categoria
# c_oferta
* salario_deseado
OFERTAS
# c_oferta
* descripción
* salario_min
* salario_max
* fx_alta
1
n
11
nn
Almacenes y Minería de Datos 15
Ejemplo 1:
# PK1CATEGORIAS_PR
OF
# c_categoria
* descripción
* salario_min
* salario_max
USUARIOS
# c_usuario
* nombre
* apellido1
* apellido2
* c_categoria
* direccion
OFERTAS
# c_oferta
* descripción
* salario_min
* salario_max
* fx_alta
TIEMPO
# c_tiempo
* descripcion
USU_OFERTAS
# c_usuario
# c_categoria
# c_oferta
* salario_deseado
Almacenes y Minería de Datos 16
REPORTS
• ¿Cuántos usuarios se han apuntado a las
ofertas de empleo del mes de enero?
SELECT count(*)
FROM USUARIOS_OFERTAS U, OFERTAS O
WHERE U.c_oferta=o.c_oferta
AND O.fx_alta BETWEEN (’01/01/07’,`31/01/07´)
17
Arquitectura de un Almacén de Datos
EJEMPLO
Organización: Cadena de supermercados.
Actividad objeto de análisis: ventas de productos.
Información registrada sobre una venta: “del producto “Tauritón
33cl” se han vendido en el almacén “Almacén nro.1” el día 17/7/2003, 5
unidades por un importe de 103,19 dolares.”
Para hacer el análisis no interesa la venta individual (ticket)
realizada a un cliente sino las ventas diarias de productos en
los distintos almacenes de la cadena.
18
Arquitectura de un Almacén de Datos
Ventasimporte
unidades
Almacén
Almacén
Ciudad
Región
Tipo
Producto
Departamento
Nro_producto
Categoría
Marca
Tipo
Descripción
Tiempo
Día
Mes
Semana
Año
Trimestre
19
Arquitectura de un Almacén de Datos
Ventasimporte
unidades
Departamento
Nro_producto
Categoría
Marca
Tipo
Día
Mes
Semana
Almacén
Ciudad
Región
Tipo
Año
Descripción
Actividad que es objeto de
análisis con los indicadores
que interesa analizar
Dimensiones (puntos de
vista) desde los que se
puede analizar la actividad.
Producto
TiempoAlmacén
Trimestre
20
Arquitectura de un Almacén de Datos
Modelo multidimensional:
 en un esquema multidimensional se representa una actividad
que es objeto de análisis (hecho) y las dimensiones que
caracterizan la actividad (dimensiones).
la información relevante sobre el hecho (actividad) se
representa por un conjunto de indicadores (medidas o atributos
de hecho).
la información descriptiva de cada dimensión se representa por
un conjunto de atributos (atributos de dimensión).
21
Arquitectura de un Almacén de Datos
Ventas
importe
unidades
Almacén
Almacén
Ciudad
Región
Tipo
Producto
Departamento
Nro_producto
Categoría
Marca
Tipo
Descripción
hecho
medidas
dimensión
atributos
Tiempo
Día
Mes
Semana
Año
Trimestre
22
Arquitectura de un Almacén de Datos
Entre los atributos de una dimensión se definen jerarquías
departamento
almacén
ciudad región
tipo
día mes año
Producto
Almacén
Tiempo
nro. producto categoría
trimestre
semana
23
Arquitectura de un Almacén de Datos
Este esquema multidimensional recibe varios nombres:
• estrella: si la jerarquía de dimensiones es lineal
• estrella jerárquica o copo de nieve: si la jerarquía no es lineal.
PERSONAL
VENTAS
tiempo
tiempo
producto
lugar
proyecto
equipo
24
Herramientas OLAP
una consulta a un almacén de datos consiste generalmente
en la obtención de medidas sobre los hechos parametrizadas
por atributos de las dimensiones y restringidas por
condiciones impuestas sobre las dimensiones
¿ “Importe total de las ventas durante este año de los productos
del departamento Bebidas, por trimestre y por categoría” ?.
Restricciones: productos del departamento Bebidas, ventas durante este año
medida hecho
Parámetros de la consulta: por categoría de producto y por trimestre
25
Herramientas OLAP
“2002”
“Bebidas”
Producto
Tiempo
Almacén
Ventas
importe
unidades
Departamento
Nro_producto
Categoría
Marca
Tipo
Día
Mes
Día de la
semana
Almacén
Ciudad
Región
Tipo
Año
“Importe total de ventas en
este año, del departamento
de “Bebidas”, por categoría y
trimestre”
Trimestre
26
Diseño de un Almacén de Datos
id_dim1
id_dim2
id_dim3
...
id_dim n
....
(hechos)
Dim3
Dim2
Dim1
tabla de
hechos
tabla
Dimensión 3
tabla
Dimensión 1
tabla
Dimensión 2 tabla
Dimensión nDimn
27
Diseño de un Almacén de Datos
producto
día
almacén
ventas
tiempo
almacén
producto
id_producto
id_fecha
id_almacén
.....
.....
......
tabla de
hechos
la clave primaria* está
formada por los
identificadores de las
dimensiones básicas.
datos (medidas) sobre
las ventas diarias de un
producto en un almacén.
* pueden existir excepciones a esta regla general
28
Diseño de un Almacén de Datos
id_establec
nro_establec
nombre
dirección
distrito
ciudad
país
tlfno
fax
superficie
tipo_almacén
...
Establecimiento
id_fecha
día
semana
mes
año
día_semana
día_mes
trimestre
festivo
....
Tiempo
id_producto
nro_producto
descripción
marca
subcategoría
categoría
departamento
peso
unidades_peso
tipo_envase
dietético
...
Producto
29
Diseño de un Almacén de Datos
id_fecha
id_producto
id_establec
...
...
...
Ventas
id_establec
nro_establec
nombre
dirección
distrito
ciudad
país
tlfno
fax
superficie
tipo_almacén
...
id_producto
nro_producto
descripción
marca
subcategoría
categoría
departamento
peso
unidades_peso
tipo_envase
dietético
...
Establecimiento
Producto
id_fecha
día
semana
mes
año
día_semana
día_mes
trimestre
festivo
....
Tiempo
30
Líneas de Investigación Abiertas
 Diseño de Almacenes de Datos: modelos conceptuales,
metodogías de diseño.
 Carga y ETL: recuperación de fallos durante la carga.
Planificación de cargas y refrescos.
 Limpieza y Transformación
 Mantenimiento de Almacenes de Datos: mantenimiento
de vistas materializadas.
 Implementación de Almacenes de Datos.
 Diseño Físico, optimizaciones para ROLAP, estructuras
para MOLAP.
 Repartición de tareas OLAP entre el cliente y el servidor.

Más contenido relacionado

La actualidad más candente

Data WareHouse. Introduccion
Data WareHouse. IntroduccionData WareHouse. Introduccion
Data WareHouse. IntroduccionRicardo Mendoza
 
05 exposicion data warehouse no. 5
05   exposicion data warehouse              no. 505   exposicion data warehouse              no. 5
05 exposicion data warehouse no. 5Gustavo Cuxum
 
DATA WAREHOUSE
DATA WAREHOUSEDATA WAREHOUSE
DATA WAREHOUSEGrupo Dos
 
Data warehouse
Data warehouseData warehouse
Data warehousemaggybe
 
Datawarehouse
DatawarehouseDatawarehouse
Datawarehouseshady85
 
Data mart-data-warehouse-data-mining
Data mart-data-warehouse-data-miningData mart-data-warehouse-data-mining
Data mart-data-warehouse-data-miningNintendo
 
Fundamentos de DataWareHouse - FISI - UNMSM - DataWareHouse
Fundamentos de DataWareHouse - FISI - UNMSM - DataWareHouseFundamentos de DataWareHouse - FISI - UNMSM - DataWareHouse
Fundamentos de DataWareHouse - FISI - UNMSM - DataWareHouseJulio Pari
 
Fundamentos de DataWarehouse
Fundamentos de DataWarehouseFundamentos de DataWarehouse
Fundamentos de DataWarehouseHermes Romero
 
Que Es Un Datawarehouse
Que Es Un DatawarehouseQue Es Un Datawarehouse
Que Es Un Datawarehouseguest10616d
 
Arquitectura de un dw
Arquitectura de un dwArquitectura de un dw
Arquitectura de un dwMax Santiago
 
Data mart-data-warehouse-data-mining
Data mart-data-warehouse-data-miningData mart-data-warehouse-data-mining
Data mart-data-warehouse-data-miningNintendo
 
Diseño de almacenes de datos
Diseño de almacenes de datosDiseño de almacenes de datos
Diseño de almacenes de datosUTPL UTPL
 

La actualidad más candente (20)

Data warehouse
Data warehouseData warehouse
Data warehouse
 
Data warehouse
Data warehouseData warehouse
Data warehouse
 
Almacen de datos
Almacen de datosAlmacen de datos
Almacen de datos
 
Data WareHouse. Introduccion
Data WareHouse. IntroduccionData WareHouse. Introduccion
Data WareHouse. Introduccion
 
05 exposicion data warehouse no. 5
05   exposicion data warehouse              no. 505   exposicion data warehouse              no. 5
05 exposicion data warehouse no. 5
 
DATA WAREHOUSE
DATA WAREHOUSEDATA WAREHOUSE
DATA WAREHOUSE
 
Data warehouse
Data warehouseData warehouse
Data warehouse
 
Datawarehouse
DatawarehouseDatawarehouse
Datawarehouse
 
Data mart-data-warehouse-data-mining
Data mart-data-warehouse-data-miningData mart-data-warehouse-data-mining
Data mart-data-warehouse-data-mining
 
Fundamentos de DataWareHouse - FISI - UNMSM - DataWareHouse
Fundamentos de DataWareHouse - FISI - UNMSM - DataWareHouseFundamentos de DataWareHouse - FISI - UNMSM - DataWareHouse
Fundamentos de DataWareHouse - FISI - UNMSM - DataWareHouse
 
Fundamentos de DataWarehouse
Fundamentos de DataWarehouseFundamentos de DataWarehouse
Fundamentos de DataWarehouse
 
Que Es Un Datawarehouse
Que Es Un DatawarehouseQue Es Un Datawarehouse
Que Es Un Datawarehouse
 
Almacén de datos
Almacén de datosAlmacén de datos
Almacén de datos
 
Almacenes de datos
Almacenes de datosAlmacenes de datos
Almacenes de datos
 
Arquitectura de un dw
Arquitectura de un dwArquitectura de un dw
Arquitectura de un dw
 
Data mart
Data martData mart
Data mart
 
Data mart-data-warehouse-data-mining
Data mart-data-warehouse-data-miningData mart-data-warehouse-data-mining
Data mart-data-warehouse-data-mining
 
Data warehouse
Data warehouseData warehouse
Data warehouse
 
Diseño de un Datamart
Diseño de un DatamartDiseño de un Datamart
Diseño de un Datamart
 
Diseño de almacenes de datos
Diseño de almacenes de datosDiseño de almacenes de datos
Diseño de almacenes de datos
 

Similar a Datawarehouse práctica 6

1 gestión de informacion
1 gestión de informacion1 gestión de informacion
1 gestión de informacionOscar Correa
 
BusinessIntelligence Introduction
BusinessIntelligence IntroductionBusinessIntelligence Introduction
BusinessIntelligence Introductionandres hurtado
 
2.1 fundamentos de data warehousing
2.1 fundamentos de data warehousing2.1 fundamentos de data warehousing
2.1 fundamentos de data warehousingLuis
 
2 Desa Sincrono 2 Caso Modelamiento.doc
2 Desa Sincrono 2 Caso Modelamiento.doc2 Desa Sincrono 2 Caso Modelamiento.doc
2 Desa Sincrono 2 Caso Modelamiento.docaldair441257
 
Fundamentos de Sistemas de Base de Datos (Capítulo 29 y 30)
Fundamentos de Sistemas de Base de Datos (Capítulo 29 y 30)Fundamentos de Sistemas de Base de Datos (Capítulo 29 y 30)
Fundamentos de Sistemas de Base de Datos (Capítulo 29 y 30)Karina Lucio
 
Unidad vii esp parte 3 clase de datawarehouse ( ing. doño)
Unidad vii esp parte 3 clase de datawarehouse ( ing. doño)Unidad vii esp parte 3 clase de datawarehouse ( ing. doño)
Unidad vii esp parte 3 clase de datawarehouse ( ing. doño)Titiushko Jazz
 
Unidad vii esp parte 3 clase de datawarehouse ( ing. doño)
Unidad vii esp parte 3 clase de datawarehouse ( ing. doño)Unidad vii esp parte 3 clase de datawarehouse ( ing. doño)
Unidad vii esp parte 3 clase de datawarehouse ( ing. doño)Titiushko Jazz
 
MINERIA DE DATOS
MINERIA DE DATOSMINERIA DE DATOS
MINERIA DE DATOSLosMorales
 
Data Warehouse en las empresas y negocios.pdf
Data Warehouse en las empresas y negocios.pdfData Warehouse en las empresas y negocios.pdf
Data Warehouse en las empresas y negocios.pdfexpertoleonelmartine
 
Clase 02 - Base de Datos Estratégica [Inteligencia de Negocios en las Organiz...
Clase 02 - Base de Datos Estratégica [Inteligencia de Negocios en las Organiz...Clase 02 - Base de Datos Estratégica [Inteligencia de Negocios en las Organiz...
Clase 02 - Base de Datos Estratégica [Inteligencia de Negocios en las Organiz...Julio Antonio Huaman Chuque
 
Mejores prácticas de Data Warehouse con SQL Server
Mejores prácticas de Data Warehouse con SQL ServerMejores prácticas de Data Warehouse con SQL Server
Mejores prácticas de Data Warehouse con SQL ServerSpanishPASSVC
 
Unidad vii esp parte 3 clase de inteligencia de negocios (datawarehouse)
Unidad vii esp parte 3 clase de inteligencia de negocios (datawarehouse)Unidad vii esp parte 3 clase de inteligencia de negocios (datawarehouse)
Unidad vii esp parte 3 clase de inteligencia de negocios (datawarehouse)Titiushko Jazz
 
Unidad vii esp parte 3 clase de inteligencia de negocios (datawarehouse)
Unidad vii esp parte 3 clase de inteligencia de negocios (datawarehouse)Unidad vii esp parte 3 clase de inteligencia de negocios (datawarehouse)
Unidad vii esp parte 3 clase de inteligencia de negocios (datawarehouse)Titiushko Jazz
 
IN Unidad 2: Infraestructuras y arquitecturas de inteligencia de negocios
IN Unidad 2: Infraestructuras y arquitecturas de inteligencia de negociosIN Unidad 2: Infraestructuras y arquitecturas de inteligencia de negocios
IN Unidad 2: Infraestructuras y arquitecturas de inteligencia de negociosFranklin Parrales Bravo
 

Similar a Datawarehouse práctica 6 (20)

1 gestión de informacion
1 gestión de informacion1 gestión de informacion
1 gestión de informacion
 
Lab 01 modelado
Lab 01   modeladoLab 01   modelado
Lab 01 modelado
 
Kdd fase1
Kdd fase1Kdd fase1
Kdd fase1
 
BusinessIntelligence Introduction
BusinessIntelligence IntroductionBusinessIntelligence Introduction
BusinessIntelligence Introduction
 
2.1 fundamentos de data warehousing
2.1 fundamentos de data warehousing2.1 fundamentos de data warehousing
2.1 fundamentos de data warehousing
 
Datawarehouse
DatawarehouseDatawarehouse
Datawarehouse
 
2 Desa Sincrono 2 Caso Modelamiento.doc
2 Desa Sincrono 2 Caso Modelamiento.doc2 Desa Sincrono 2 Caso Modelamiento.doc
2 Desa Sincrono 2 Caso Modelamiento.doc
 
Fundamentos de Sistemas de Base de Datos (Capítulo 29 y 30)
Fundamentos de Sistemas de Base de Datos (Capítulo 29 y 30)Fundamentos de Sistemas de Base de Datos (Capítulo 29 y 30)
Fundamentos de Sistemas de Base de Datos (Capítulo 29 y 30)
 
Unidad vii esp parte 3 clase de datawarehouse ( ing. doño)
Unidad vii esp parte 3 clase de datawarehouse ( ing. doño)Unidad vii esp parte 3 clase de datawarehouse ( ing. doño)
Unidad vii esp parte 3 clase de datawarehouse ( ing. doño)
 
Unidad vii esp parte 3 clase de datawarehouse ( ing. doño)
Unidad vii esp parte 3 clase de datawarehouse ( ing. doño)Unidad vii esp parte 3 clase de datawarehouse ( ing. doño)
Unidad vii esp parte 3 clase de datawarehouse ( ing. doño)
 
MINERIA DE DATOS
MINERIA DE DATOSMINERIA DE DATOS
MINERIA DE DATOS
 
Data ware house
Data ware houseData ware house
Data ware house
 
Data Warehouse en las empresas y negocios.pdf
Data Warehouse en las empresas y negocios.pdfData Warehouse en las empresas y negocios.pdf
Data Warehouse en las empresas y negocios.pdf
 
Clase 02 - Base de Datos Estratégica [Inteligencia de Negocios en las Organiz...
Clase 02 - Base de Datos Estratégica [Inteligencia de Negocios en las Organiz...Clase 02 - Base de Datos Estratégica [Inteligencia de Negocios en las Organiz...
Clase 02 - Base de Datos Estratégica [Inteligencia de Negocios en las Organiz...
 
Mejores prácticas de Data Warehouse con SQL Server
Mejores prácticas de Data Warehouse con SQL ServerMejores prácticas de Data Warehouse con SQL Server
Mejores prácticas de Data Warehouse con SQL Server
 
Unidad vii esp parte 3 clase de inteligencia de negocios (datawarehouse)
Unidad vii esp parte 3 clase de inteligencia de negocios (datawarehouse)Unidad vii esp parte 3 clase de inteligencia de negocios (datawarehouse)
Unidad vii esp parte 3 clase de inteligencia de negocios (datawarehouse)
 
Unidad vii esp parte 3 clase de inteligencia de negocios (datawarehouse)
Unidad vii esp parte 3 clase de inteligencia de negocios (datawarehouse)Unidad vii esp parte 3 clase de inteligencia de negocios (datawarehouse)
Unidad vii esp parte 3 clase de inteligencia de negocios (datawarehouse)
 
1DATA WAREHOUSE.ppt
1DATA WAREHOUSE.ppt1DATA WAREHOUSE.ppt
1DATA WAREHOUSE.ppt
 
Data warehouse
Data warehouseData warehouse
Data warehouse
 
IN Unidad 2: Infraestructuras y arquitecturas de inteligencia de negocios
IN Unidad 2: Infraestructuras y arquitecturas de inteligencia de negociosIN Unidad 2: Infraestructuras y arquitecturas de inteligencia de negocios
IN Unidad 2: Infraestructuras y arquitecturas de inteligencia de negocios
 

Último

Global Azure Lima 2024 - Integración de Datos con Microsoft Fabric
Global Azure Lima 2024 - Integración de Datos con Microsoft FabricGlobal Azure Lima 2024 - Integración de Datos con Microsoft Fabric
Global Azure Lima 2024 - Integración de Datos con Microsoft FabricKeyla Dolores Méndez
 
guía de registro de slideshare por Brayan Joseph
guía de registro de slideshare por Brayan Josephguía de registro de slideshare por Brayan Joseph
guía de registro de slideshare por Brayan JosephBRAYANJOSEPHPEREZGOM
 
Trabajo Mas Completo De Excel en clase tecnología
Trabajo Mas Completo De Excel en clase tecnologíaTrabajo Mas Completo De Excel en clase tecnología
Trabajo Mas Completo De Excel en clase tecnologíassuserf18419
 
9egb-lengua y Literatura.pdf_texto del estudiante
9egb-lengua y Literatura.pdf_texto del estudiante9egb-lengua y Literatura.pdf_texto del estudiante
9egb-lengua y Literatura.pdf_texto del estudianteAndreaHuertas24
 
Plan de aula informatica segundo periodo.docx
Plan de aula informatica segundo periodo.docxPlan de aula informatica segundo periodo.docx
Plan de aula informatica segundo periodo.docxpabonheidy28
 
Proyecto integrador. Las TIC en la sociedad S4.pptx
Proyecto integrador. Las TIC en la sociedad S4.pptxProyecto integrador. Las TIC en la sociedad S4.pptx
Proyecto integrador. Las TIC en la sociedad S4.pptx241521559
 
Redes direccionamiento y subredes ipv4 2024 .pdf
Redes direccionamiento y subredes ipv4 2024 .pdfRedes direccionamiento y subredes ipv4 2024 .pdf
Redes direccionamiento y subredes ipv4 2024 .pdfsoporteupcology
 
International Women's Day Sucre 2024 (IWD)
International Women's Day Sucre 2024 (IWD)International Women's Day Sucre 2024 (IWD)
International Women's Day Sucre 2024 (IWD)GDGSucre
 
La era de la educación digital y sus desafios
La era de la educación digital y sus desafiosLa era de la educación digital y sus desafios
La era de la educación digital y sus desafiosFundación YOD YOD
 
trabajotecologiaisabella-240424003133-8f126965.pdf
trabajotecologiaisabella-240424003133-8f126965.pdftrabajotecologiaisabella-240424003133-8f126965.pdf
trabajotecologiaisabella-240424003133-8f126965.pdfIsabellaMontaomurill
 
EPA-pdf resultado da prova presencial Uninove
EPA-pdf resultado da prova presencial UninoveEPA-pdf resultado da prova presencial Uninove
EPA-pdf resultado da prova presencial UninoveFagnerLisboa3
 
CLASE DE TECNOLOGIA E INFORMATICA PRIMARIA
CLASE  DE TECNOLOGIA E INFORMATICA PRIMARIACLASE  DE TECNOLOGIA E INFORMATICA PRIMARIA
CLASE DE TECNOLOGIA E INFORMATICA PRIMARIAWilbisVega
 
Hernandez_Hernandez_Practica web de la sesion 12.pptx
Hernandez_Hernandez_Practica web de la sesion 12.pptxHernandez_Hernandez_Practica web de la sesion 12.pptx
Hernandez_Hernandez_Practica web de la sesion 12.pptxJOSEMANUELHERNANDEZH11
 
Cortes-24-de-abril-Tungurahua-3 año 2024
Cortes-24-de-abril-Tungurahua-3 año 2024Cortes-24-de-abril-Tungurahua-3 año 2024
Cortes-24-de-abril-Tungurahua-3 año 2024GiovanniJavierHidalg
 
POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...
POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...
POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...silviayucra2
 
KELA Presentacion Costa Rica 2024 - evento Protégeles
KELA Presentacion Costa Rica 2024 - evento ProtégelesKELA Presentacion Costa Rica 2024 - evento Protégeles
KELA Presentacion Costa Rica 2024 - evento ProtégelesFundación YOD YOD
 

Último (16)

Global Azure Lima 2024 - Integración de Datos con Microsoft Fabric
Global Azure Lima 2024 - Integración de Datos con Microsoft FabricGlobal Azure Lima 2024 - Integración de Datos con Microsoft Fabric
Global Azure Lima 2024 - Integración de Datos con Microsoft Fabric
 
guía de registro de slideshare por Brayan Joseph
guía de registro de slideshare por Brayan Josephguía de registro de slideshare por Brayan Joseph
guía de registro de slideshare por Brayan Joseph
 
Trabajo Mas Completo De Excel en clase tecnología
Trabajo Mas Completo De Excel en clase tecnologíaTrabajo Mas Completo De Excel en clase tecnología
Trabajo Mas Completo De Excel en clase tecnología
 
9egb-lengua y Literatura.pdf_texto del estudiante
9egb-lengua y Literatura.pdf_texto del estudiante9egb-lengua y Literatura.pdf_texto del estudiante
9egb-lengua y Literatura.pdf_texto del estudiante
 
Plan de aula informatica segundo periodo.docx
Plan de aula informatica segundo periodo.docxPlan de aula informatica segundo periodo.docx
Plan de aula informatica segundo periodo.docx
 
Proyecto integrador. Las TIC en la sociedad S4.pptx
Proyecto integrador. Las TIC en la sociedad S4.pptxProyecto integrador. Las TIC en la sociedad S4.pptx
Proyecto integrador. Las TIC en la sociedad S4.pptx
 
Redes direccionamiento y subredes ipv4 2024 .pdf
Redes direccionamiento y subredes ipv4 2024 .pdfRedes direccionamiento y subredes ipv4 2024 .pdf
Redes direccionamiento y subredes ipv4 2024 .pdf
 
International Women's Day Sucre 2024 (IWD)
International Women's Day Sucre 2024 (IWD)International Women's Day Sucre 2024 (IWD)
International Women's Day Sucre 2024 (IWD)
 
La era de la educación digital y sus desafios
La era de la educación digital y sus desafiosLa era de la educación digital y sus desafios
La era de la educación digital y sus desafios
 
trabajotecologiaisabella-240424003133-8f126965.pdf
trabajotecologiaisabella-240424003133-8f126965.pdftrabajotecologiaisabella-240424003133-8f126965.pdf
trabajotecologiaisabella-240424003133-8f126965.pdf
 
EPA-pdf resultado da prova presencial Uninove
EPA-pdf resultado da prova presencial UninoveEPA-pdf resultado da prova presencial Uninove
EPA-pdf resultado da prova presencial Uninove
 
CLASE DE TECNOLOGIA E INFORMATICA PRIMARIA
CLASE  DE TECNOLOGIA E INFORMATICA PRIMARIACLASE  DE TECNOLOGIA E INFORMATICA PRIMARIA
CLASE DE TECNOLOGIA E INFORMATICA PRIMARIA
 
Hernandez_Hernandez_Practica web de la sesion 12.pptx
Hernandez_Hernandez_Practica web de la sesion 12.pptxHernandez_Hernandez_Practica web de la sesion 12.pptx
Hernandez_Hernandez_Practica web de la sesion 12.pptx
 
Cortes-24-de-abril-Tungurahua-3 año 2024
Cortes-24-de-abril-Tungurahua-3 año 2024Cortes-24-de-abril-Tungurahua-3 año 2024
Cortes-24-de-abril-Tungurahua-3 año 2024
 
POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...
POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...
POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...
 
KELA Presentacion Costa Rica 2024 - evento Protégeles
KELA Presentacion Costa Rica 2024 - evento ProtégelesKELA Presentacion Costa Rica 2024 - evento Protégeles
KELA Presentacion Costa Rica 2024 - evento Protégeles
 

Datawarehouse práctica 6

  • 2. Almacenes y Minería de Datos 2 Definición • Datawarehouse (Almacen de datos) se define como una colección de datos que verifican las siguientes propiedades: – Está orientado (a un tema) a objetos – Datos integrados – No volátiles – Variante en el tiempo que surgieron como una herramienta de soporte para la toma de decisiones a nivel gerencial
  • 3. Almacenes y Minería de Datos 3 Explicación de la definición • Orientado hacia temas: los datos se almacenan y agrupan por temas de interés.
  • 4. Almacenes y Minería de Datos 4 Explicación de la definición • Datos integrados: el almacén de datos integra datos que provienen de varias fuentes. Partimos de una base de datos (operacional) y mediante un proceso de carga de datos hacemos el Datawarehouse. El proceso de carga es lo más complicado por problemas de codificación, medidas de los atributos… de las bases de datos. BD BD BD DW CARGA
  • 5. Almacenes y Minería de Datos 5 Explicación de la definición • No volátiles: son estables, una vez almacenados los datos no se modifican. BD DWD W SELECT INSERT UPDATE DELETE REPORT S SELECT CARGA
  • 6. Almacenes y Minería de Datos 6 Explicación de la definición • Variante en el tiempo: los datos contienen información sobre la fecha de los mismos, porque se hacen cargas de datos continuamente. Cuando los datos van cambiando, se actualizan los históricos y se guardan en ficheros temporales. Siempre va haber una variable tiempo. TIEMPO # id_tiempo * periodo
  • 7. Almacenes y Minería de Datos 7 Características • Podemos resumir las características de un Datawarehouse: – Trabaja con datos de negocio – Orientado a un sujeto – Almacena datos actuales orientado a un histórico (actual + histórico) – Datos más bien resumidos (no información detallada)
  • 8. Almacenes y Minería de Datos 8 DIFERENCIAS BD OPERACIONAL - Datos operacionales - Orientado a aplicaciones - Datos Actuales - Datos Detallados - Datos en continuo cambio DATAWAREHOUS E - Datos de negocio - Orientado al sujeto - Actuales + Histórico - Datos Resumidos - Datos Estables
  • 9. Almacenes y Minería de Datos 9 GESTOR CARGA ARQUITECTURA DW GESTOR ALMACENAMIENT O GESTOR CONSULTAS BD operacional Partimos de una BD operacional y se basa en 3 módulos
  • 10. Almacenes y Minería de Datos 10 GESTOR DE CARGA • Permite hacer la carga. Como dificultades nos podemos encontrar: – La integración de los datos – Elección del momento de la carga – El tiempo de carga sea el mínimo posible – Buen diccionario de datos o METADATA (para evitar cometer errores en la carga) – Diseño de procedimientos PL/SQL
  • 11. Almacenes y Minería de Datos 11 GESTOR DE ALMACENAMIENTO • Se encarga del almacenamiento, de la estructura,…. Existe una tabla llamada FACT (Hecho) y unas tablas llamadas dimensiones o tablas dimensionales. Entre la tabla FACT y las tablas dimensionales suele haber relaciones 1:N Este modelo tiene forma de estrella por eso se denomina MODELO STAR
  • 12. Almacenes y Minería de Datos 12 MODELO STAR FACT DIM_1 DIM_2 DIM_TIEMPO DIM_3 # PK4 # PK1 # PK2 # PK3 # PK1 # PK2 # PK3 # PK4 *campoA *campoB
  • 13. Almacenes y Minería de Datos 13 GESTOR DE CONSULTAS • Las consultas se hacen sobre la tabla FACT. También se encarga de los perfiles, pues las consultas (reports) serán diferentes dependiendo del usuario y sus necesidades.
  • 14. Almacenes y Minería de Datos 14 Ejemplo 1: CATEGORIAS_PROF # c_categoria * descripción * salario_min * salario_max USUARIOS # c_usuario * nombre * apellido1 * apellido2 * c_categoria * direccion USU_OFERTAS # c_categoria # c_oferta * salario_deseado OFERTAS # c_oferta * descripción * salario_min * salario_max * fx_alta 1 n 11 nn
  • 15. Almacenes y Minería de Datos 15 Ejemplo 1: # PK1CATEGORIAS_PR OF # c_categoria * descripción * salario_min * salario_max USUARIOS # c_usuario * nombre * apellido1 * apellido2 * c_categoria * direccion OFERTAS # c_oferta * descripción * salario_min * salario_max * fx_alta TIEMPO # c_tiempo * descripcion USU_OFERTAS # c_usuario # c_categoria # c_oferta * salario_deseado
  • 16. Almacenes y Minería de Datos 16 REPORTS • ¿Cuántos usuarios se han apuntado a las ofertas de empleo del mes de enero? SELECT count(*) FROM USUARIOS_OFERTAS U, OFERTAS O WHERE U.c_oferta=o.c_oferta AND O.fx_alta BETWEEN (’01/01/07’,`31/01/07´)
  • 17. 17 Arquitectura de un Almacén de Datos EJEMPLO Organización: Cadena de supermercados. Actividad objeto de análisis: ventas de productos. Información registrada sobre una venta: “del producto “Tauritón 33cl” se han vendido en el almacén “Almacén nro.1” el día 17/7/2003, 5 unidades por un importe de 103,19 dolares.” Para hacer el análisis no interesa la venta individual (ticket) realizada a un cliente sino las ventas diarias de productos en los distintos almacenes de la cadena.
  • 18. 18 Arquitectura de un Almacén de Datos Ventasimporte unidades Almacén Almacén Ciudad Región Tipo Producto Departamento Nro_producto Categoría Marca Tipo Descripción Tiempo Día Mes Semana Año Trimestre
  • 19. 19 Arquitectura de un Almacén de Datos Ventasimporte unidades Departamento Nro_producto Categoría Marca Tipo Día Mes Semana Almacén Ciudad Región Tipo Año Descripción Actividad que es objeto de análisis con los indicadores que interesa analizar Dimensiones (puntos de vista) desde los que se puede analizar la actividad. Producto TiempoAlmacén Trimestre
  • 20. 20 Arquitectura de un Almacén de Datos Modelo multidimensional:  en un esquema multidimensional se representa una actividad que es objeto de análisis (hecho) y las dimensiones que caracterizan la actividad (dimensiones). la información relevante sobre el hecho (actividad) se representa por un conjunto de indicadores (medidas o atributos de hecho). la información descriptiva de cada dimensión se representa por un conjunto de atributos (atributos de dimensión).
  • 21. 21 Arquitectura de un Almacén de Datos Ventas importe unidades Almacén Almacén Ciudad Región Tipo Producto Departamento Nro_producto Categoría Marca Tipo Descripción hecho medidas dimensión atributos Tiempo Día Mes Semana Año Trimestre
  • 22. 22 Arquitectura de un Almacén de Datos Entre los atributos de una dimensión se definen jerarquías departamento almacén ciudad región tipo día mes año Producto Almacén Tiempo nro. producto categoría trimestre semana
  • 23. 23 Arquitectura de un Almacén de Datos Este esquema multidimensional recibe varios nombres: • estrella: si la jerarquía de dimensiones es lineal • estrella jerárquica o copo de nieve: si la jerarquía no es lineal. PERSONAL VENTAS tiempo tiempo producto lugar proyecto equipo
  • 24. 24 Herramientas OLAP una consulta a un almacén de datos consiste generalmente en la obtención de medidas sobre los hechos parametrizadas por atributos de las dimensiones y restringidas por condiciones impuestas sobre las dimensiones ¿ “Importe total de las ventas durante este año de los productos del departamento Bebidas, por trimestre y por categoría” ?. Restricciones: productos del departamento Bebidas, ventas durante este año medida hecho Parámetros de la consulta: por categoría de producto y por trimestre
  • 25. 25 Herramientas OLAP “2002” “Bebidas” Producto Tiempo Almacén Ventas importe unidades Departamento Nro_producto Categoría Marca Tipo Día Mes Día de la semana Almacén Ciudad Región Tipo Año “Importe total de ventas en este año, del departamento de “Bebidas”, por categoría y trimestre” Trimestre
  • 26. 26 Diseño de un Almacén de Datos id_dim1 id_dim2 id_dim3 ... id_dim n .... (hechos) Dim3 Dim2 Dim1 tabla de hechos tabla Dimensión 3 tabla Dimensión 1 tabla Dimensión 2 tabla Dimensión nDimn
  • 27. 27 Diseño de un Almacén de Datos producto día almacén ventas tiempo almacén producto id_producto id_fecha id_almacén ..... ..... ...... tabla de hechos la clave primaria* está formada por los identificadores de las dimensiones básicas. datos (medidas) sobre las ventas diarias de un producto en un almacén. * pueden existir excepciones a esta regla general
  • 28. 28 Diseño de un Almacén de Datos id_establec nro_establec nombre dirección distrito ciudad país tlfno fax superficie tipo_almacén ... Establecimiento id_fecha día semana mes año día_semana día_mes trimestre festivo .... Tiempo id_producto nro_producto descripción marca subcategoría categoría departamento peso unidades_peso tipo_envase dietético ... Producto
  • 29. 29 Diseño de un Almacén de Datos id_fecha id_producto id_establec ... ... ... Ventas id_establec nro_establec nombre dirección distrito ciudad país tlfno fax superficie tipo_almacén ... id_producto nro_producto descripción marca subcategoría categoría departamento peso unidades_peso tipo_envase dietético ... Establecimiento Producto id_fecha día semana mes año día_semana día_mes trimestre festivo .... Tiempo
  • 30. 30 Líneas de Investigación Abiertas  Diseño de Almacenes de Datos: modelos conceptuales, metodogías de diseño.  Carga y ETL: recuperación de fallos durante la carga. Planificación de cargas y refrescos.  Limpieza y Transformación  Mantenimiento de Almacenes de Datos: mantenimiento de vistas materializadas.  Implementación de Almacenes de Datos.  Diseño Físico, optimizaciones para ROLAP, estructuras para MOLAP.  Repartición de tareas OLAP entre el cliente y el servidor.