SlideShare una empresa de Scribd logo
DATAWAREHOUSE
Almacenes y Minería de Datos 2
Definición
• Datawarehouse (Almacen de datos) se
define como una colección de datos que
verifican las siguientes propiedades:
– Está orientado (a un tema) a objetos
– Datos integrados
– No volátiles
– Variante en el tiempo
que surgieron como una herramienta de
soporte para la toma de decisiones a nivel
gerencial
Almacenes y Minería de Datos 3
Explicación de la definición
• Orientado hacia temas: los datos se
almacenan y agrupan por temas de interés.
Almacenes y Minería de Datos 4
Explicación de la definición
• Datos integrados: el almacén de datos
integra datos que provienen de varias
fuentes. Partimos de una base de datos
(operacional) y mediante un proceso de
carga de datos hacemos el Datawarehouse.
El proceso de carga es lo más complicado
por problemas de codificación, medidas de
los atributos… de las bases de datos.
BD
BD
BD
DW
CARGA
Almacenes y Minería de Datos 5
Explicación de la definición
• No volátiles: son estables, una vez
almacenados los datos no se modifican.
BD DWD
W
SELECT
INSERT
UPDATE
DELETE
REPORT
S
SELECT
CARGA
Almacenes y Minería de Datos 6
Explicación de la definición
• Variante en el tiempo: los datos contienen
información sobre la fecha de los mismos,
porque se hacen cargas de datos
continuamente. Cuando los datos van
cambiando, se actualizan los históricos y se
guardan en ficheros temporales. Siempre va
haber una variable tiempo.
TIEMPO
# id_tiempo
* periodo
Almacenes y Minería de Datos 7
Características
• Podemos resumir las características de
un Datawarehouse:
– Trabaja con datos de negocio
– Orientado a un sujeto
– Almacena datos actuales orientado a un
histórico (actual + histórico)
– Datos más bien resumidos (no información
detallada)
Almacenes y Minería de Datos 8
DIFERENCIAS
BD
OPERACIONAL
- Datos
operacionales
- Orientado a
aplicaciones
- Datos Actuales
- Datos Detallados
- Datos en continuo
cambio
DATAWAREHOUS
E
- Datos de negocio
- Orientado al sujeto
- Actuales +
Histórico
- Datos Resumidos
- Datos Estables
Almacenes y Minería de Datos 9
GESTOR
CARGA
ARQUITECTURA DW
GESTOR
ALMACENAMIENT
O
GESTOR
CONSULTAS
BD
operacional
Partimos de una BD operacional y se basa en 3 módulos
Almacenes y Minería de Datos 10
GESTOR DE CARGA
• Permite hacer la carga. Como dificultades
nos podemos encontrar:
– La integración de los datos
– Elección del momento de la carga
– El tiempo de carga sea el mínimo posible
– Buen diccionario de datos o METADATA (para
evitar cometer errores en la carga)
– Diseño de procedimientos PL/SQL
Almacenes y Minería de Datos 11
GESTOR DE ALMACENAMIENTO
• Se encarga del almacenamiento, de la
estructura,….
Existe una tabla llamada FACT (Hecho) y unas
tablas llamadas dimensiones o tablas
dimensionales.
Entre la tabla FACT y las tablas dimensionales
suele haber relaciones 1:N
Este modelo tiene forma de estrella por eso se
denomina MODELO STAR
Almacenes y Minería de Datos 12
MODELO STAR
FACT
DIM_1
DIM_2
DIM_TIEMPO
DIM_3
# PK4
# PK1
# PK2
# PK3
# PK1
# PK2
# PK3
# PK4
*campoA
*campoB
Almacenes y Minería de Datos 13
GESTOR DE CONSULTAS
• Las consultas se hacen sobre la tabla
FACT. También se encarga de los
perfiles, pues las consultas (reports)
serán diferentes dependiendo del
usuario y sus necesidades.
Almacenes y Minería de Datos 14
Ejemplo 1:
CATEGORIAS_PROF
# c_categoria
* descripción
* salario_min
* salario_max
USUARIOS
# c_usuario
* nombre
* apellido1
* apellido2
* c_categoria
* direccion
USU_OFERTAS
# c_categoria
# c_oferta
* salario_deseado
OFERTAS
# c_oferta
* descripción
* salario_min
* salario_max
* fx_alta
1
n
11
nn
Almacenes y Minería de Datos 15
Ejemplo 1:
# PK1CATEGORIAS_PR
OF
# c_categoria
* descripción
* salario_min
* salario_max
USUARIOS
# c_usuario
* nombre
* apellido1
* apellido2
* c_categoria
* direccion
OFERTAS
# c_oferta
* descripción
* salario_min
* salario_max
* fx_alta
TIEMPO
# c_tiempo
* descripcion
USU_OFERTAS
# c_usuario
# c_categoria
# c_oferta
* salario_deseado
Almacenes y Minería de Datos 16
REPORTS
• ¿Cuántos usuarios se han apuntado a las
ofertas de empleo del mes de enero?
SELECT count(*)
FROM USUARIOS_OFERTAS U, OFERTAS O
WHERE U.c_oferta=o.c_oferta
AND O.fx_alta BETWEEN (’01/01/07’,`31/01/07´)
17
Arquitectura de un Almacén de Datos
EJEMPLO
Organización: Cadena de supermercados.
Actividad objeto de análisis: ventas de productos.
Información registrada sobre una venta: “del producto “Tauritón
33cl” se han vendido en el almacén “Almacén nro.1” el día 17/7/2003, 5
unidades por un importe de 103,19 dolares.”
Para hacer el análisis no interesa la venta individual (ticket)
realizada a un cliente sino las ventas diarias de productos en
los distintos almacenes de la cadena.
18
Arquitectura de un Almacén de Datos
Ventasimporte
unidades
Almacén
Almacén
Ciudad
Región
Tipo
Producto
Departamento
Nro_producto
Categoría
Marca
Tipo
Descripción
Tiempo
Día
Mes
Semana
Año
Trimestre
19
Arquitectura de un Almacén de Datos
Ventasimporte
unidades
Departamento
Nro_producto
Categoría
Marca
Tipo
Día
Mes
Semana
Almacén
Ciudad
Región
Tipo
Año
Descripción
Actividad que es objeto de
análisis con los indicadores
que interesa analizar
Dimensiones (puntos de
vista) desde los que se
puede analizar la actividad.
Producto
TiempoAlmacén
Trimestre
20
Arquitectura de un Almacén de Datos
Modelo multidimensional:
 en un esquema multidimensional se representa una actividad
que es objeto de análisis (hecho) y las dimensiones que
caracterizan la actividad (dimensiones).
la información relevante sobre el hecho (actividad) se
representa por un conjunto de indicadores (medidas o atributos
de hecho).
la información descriptiva de cada dimensión se representa por
un conjunto de atributos (atributos de dimensión).
21
Arquitectura de un Almacén de Datos
Ventas
importe
unidades
Almacén
Almacén
Ciudad
Región
Tipo
Producto
Departamento
Nro_producto
Categoría
Marca
Tipo
Descripción
hecho
medidas
dimensión
atributos
Tiempo
Día
Mes
Semana
Año
Trimestre
22
Arquitectura de un Almacén de Datos
Entre los atributos de una dimensión se definen jerarquías
departamento
almacén
ciudad región
tipo
día mes año
Producto
Almacén
Tiempo
nro. producto categoría
trimestre
semana
23
Arquitectura de un Almacén de Datos
Este esquema multidimensional recibe varios nombres:
• estrella: si la jerarquía de dimensiones es lineal
• estrella jerárquica o copo de nieve: si la jerarquía no es lineal.
PERSONAL
VENTAS
tiempo
tiempo
producto
lugar
proyecto
equipo
24
Herramientas OLAP
una consulta a un almacén de datos consiste generalmente
en la obtención de medidas sobre los hechos parametrizadas
por atributos de las dimensiones y restringidas por
condiciones impuestas sobre las dimensiones
¿ “Importe total de las ventas durante este año de los productos
del departamento Bebidas, por trimestre y por categoría” ?.
Restricciones: productos del departamento Bebidas, ventas durante este año
medida hecho
Parámetros de la consulta: por categoría de producto y por trimestre
25
Herramientas OLAP
“2002”
“Bebidas”
Producto
Tiempo
Almacén
Ventas
importe
unidades
Departamento
Nro_producto
Categoría
Marca
Tipo
Día
Mes
Día de la
semana
Almacén
Ciudad
Región
Tipo
Año
“Importe total de ventas en
este año, del departamento
de “Bebidas”, por categoría y
trimestre”
Trimestre
26
Diseño de un Almacén de Datos
id_dim1
id_dim2
id_dim3
...
id_dim n
....
(hechos)
Dim3
Dim2
Dim1
tabla de
hechos
tabla
Dimensión 3
tabla
Dimensión 1
tabla
Dimensión 2 tabla
Dimensión nDimn
27
Diseño de un Almacén de Datos
producto
día
almacén
ventas
tiempo
almacén
producto
id_producto
id_fecha
id_almacén
.....
.....
......
tabla de
hechos
la clave primaria* está
formada por los
identificadores de las
dimensiones básicas.
datos (medidas) sobre
las ventas diarias de un
producto en un almacén.
* pueden existir excepciones a esta regla general
28
Diseño de un Almacén de Datos
id_establec
nro_establec
nombre
dirección
distrito
ciudad
país
tlfno
fax
superficie
tipo_almacén
...
Establecimiento
id_fecha
día
semana
mes
año
día_semana
día_mes
trimestre
festivo
....
Tiempo
id_producto
nro_producto
descripción
marca
subcategoría
categoría
departamento
peso
unidades_peso
tipo_envase
dietético
...
Producto
29
Diseño de un Almacén de Datos
id_fecha
id_producto
id_establec
...
...
...
Ventas
id_establec
nro_establec
nombre
dirección
distrito
ciudad
país
tlfno
fax
superficie
tipo_almacén
...
id_producto
nro_producto
descripción
marca
subcategoría
categoría
departamento
peso
unidades_peso
tipo_envase
dietético
...
Establecimiento
Producto
id_fecha
día
semana
mes
año
día_semana
día_mes
trimestre
festivo
....
Tiempo
30
Líneas de Investigación Abiertas
 Diseño de Almacenes de Datos: modelos conceptuales,
metodogías de diseño.
 Carga y ETL: recuperación de fallos durante la carga.
Planificación de cargas y refrescos.
 Limpieza y Transformación
 Mantenimiento de Almacenes de Datos: mantenimiento
de vistas materializadas.
 Implementación de Almacenes de Datos.
 Diseño Físico, optimizaciones para ROLAP, estructuras
para MOLAP.
 Repartición de tareas OLAP entre el cliente y el servidor.

Más contenido relacionado

La actualidad más candente

Data warehouse
Data warehouseData warehouse
Data warehouse
Jose Sajajú
 
Data warehouse
Data warehouseData warehouse
Data warehouse
Anyeni Garay
 
Data WareHouse. Introduccion
Data WareHouse. IntroduccionData WareHouse. Introduccion
Data WareHouse. Introduccion
Ricardo Mendoza
 
05 exposicion data warehouse no. 5
05   exposicion data warehouse              no. 505   exposicion data warehouse              no. 5
05 exposicion data warehouse no. 5Gustavo Cuxum
 
DATA WAREHOUSE
DATA WAREHOUSEDATA WAREHOUSE
DATA WAREHOUSEGrupo Dos
 
Data warehouse
Data warehouseData warehouse
Data warehouse
maggybe
 
Datawarehouse
DatawarehouseDatawarehouse
Datawarehouseshady85
 
Data mart-data-warehouse-data-mining
Data mart-data-warehouse-data-miningData mart-data-warehouse-data-mining
Data mart-data-warehouse-data-miningNintendo
 
Fundamentos de DataWareHouse - FISI - UNMSM - DataWareHouse
Fundamentos de DataWareHouse - FISI - UNMSM - DataWareHouseFundamentos de DataWareHouse - FISI - UNMSM - DataWareHouse
Fundamentos de DataWareHouse - FISI - UNMSM - DataWareHouseJulio Pari
 
Fundamentos de DataWarehouse
Fundamentos de DataWarehouseFundamentos de DataWarehouse
Fundamentos de DataWarehouse
Hermes Romero
 
Que Es Un Datawarehouse
Que Es Un DatawarehouseQue Es Un Datawarehouse
Que Es Un Datawarehouseguest10616d
 
Arquitectura de un dw
Arquitectura de un dwArquitectura de un dw
Arquitectura de un dw
Max Santiago
 
Data mart
Data martData mart
Data mart
Gustavo Hdz
 
Data mart-data-warehouse-data-mining
Data mart-data-warehouse-data-miningData mart-data-warehouse-data-mining
Data mart-data-warehouse-data-miningNintendo
 
Data warehouse
Data warehouseData warehouse
Data warehouse
Juan Mishquero
 
Diseño de almacenes de datos
Diseño de almacenes de datosDiseño de almacenes de datos
Diseño de almacenes de datosUTPL UTPL
 

La actualidad más candente (20)

Data warehouse
Data warehouseData warehouse
Data warehouse
 
Data warehouse
Data warehouseData warehouse
Data warehouse
 
Almacen de datos
Almacen de datosAlmacen de datos
Almacen de datos
 
Data WareHouse. Introduccion
Data WareHouse. IntroduccionData WareHouse. Introduccion
Data WareHouse. Introduccion
 
05 exposicion data warehouse no. 5
05   exposicion data warehouse              no. 505   exposicion data warehouse              no. 5
05 exposicion data warehouse no. 5
 
DATA WAREHOUSE
DATA WAREHOUSEDATA WAREHOUSE
DATA WAREHOUSE
 
Data warehouse
Data warehouseData warehouse
Data warehouse
 
Datawarehouse
DatawarehouseDatawarehouse
Datawarehouse
 
Data mart-data-warehouse-data-mining
Data mart-data-warehouse-data-miningData mart-data-warehouse-data-mining
Data mart-data-warehouse-data-mining
 
Fundamentos de DataWareHouse - FISI - UNMSM - DataWareHouse
Fundamentos de DataWareHouse - FISI - UNMSM - DataWareHouseFundamentos de DataWareHouse - FISI - UNMSM - DataWareHouse
Fundamentos de DataWareHouse - FISI - UNMSM - DataWareHouse
 
Fundamentos de DataWarehouse
Fundamentos de DataWarehouseFundamentos de DataWarehouse
Fundamentos de DataWarehouse
 
Que Es Un Datawarehouse
Que Es Un DatawarehouseQue Es Un Datawarehouse
Que Es Un Datawarehouse
 
Almacén de datos
Almacén de datosAlmacén de datos
Almacén de datos
 
Almacenes de datos
Almacenes de datosAlmacenes de datos
Almacenes de datos
 
Arquitectura de un dw
Arquitectura de un dwArquitectura de un dw
Arquitectura de un dw
 
Data mart
Data martData mart
Data mart
 
Data mart-data-warehouse-data-mining
Data mart-data-warehouse-data-miningData mart-data-warehouse-data-mining
Data mart-data-warehouse-data-mining
 
Data warehouse
Data warehouseData warehouse
Data warehouse
 
Diseño de un Datamart
Diseño de un DatamartDiseño de un Datamart
Diseño de un Datamart
 
Diseño de almacenes de datos
Diseño de almacenes de datosDiseño de almacenes de datos
Diseño de almacenes de datos
 

Similar a Datawarehouse práctica 6

1 gestión de informacion
1 gestión de informacion1 gestión de informacion
1 gestión de informacion
Oscar Correa
 
Lab 01 modelado
Lab 01   modeladoLab 01   modelado
Lab 01 modelado
juan morales
 
BusinessIntelligence Introduction
BusinessIntelligence IntroductionBusinessIntelligence Introduction
BusinessIntelligence Introduction
andres hurtado
 
2.1 fundamentos de data warehousing
2.1 fundamentos de data warehousing2.1 fundamentos de data warehousing
2.1 fundamentos de data warehousing
Luis
 
Datawarehouse
DatawarehouseDatawarehouse
Datawarehouse
Anibal Mendez
 
2 Desa Sincrono 2 Caso Modelamiento.doc
2 Desa Sincrono 2 Caso Modelamiento.doc2 Desa Sincrono 2 Caso Modelamiento.doc
2 Desa Sincrono 2 Caso Modelamiento.doc
aldair441257
 
Fundamentos de Sistemas de Base de Datos (Capítulo 29 y 30)
Fundamentos de Sistemas de Base de Datos (Capítulo 29 y 30)Fundamentos de Sistemas de Base de Datos (Capítulo 29 y 30)
Fundamentos de Sistemas de Base de Datos (Capítulo 29 y 30)
Karina Lucio
 
Unidad vii esp parte 3 clase de datawarehouse ( ing. doño)
Unidad vii esp parte 3 clase de datawarehouse ( ing. doño)Unidad vii esp parte 3 clase de datawarehouse ( ing. doño)
Unidad vii esp parte 3 clase de datawarehouse ( ing. doño)Titiushko Jazz
 
Unidad vii esp parte 3 clase de datawarehouse ( ing. doño)
Unidad vii esp parte 3 clase de datawarehouse ( ing. doño)Unidad vii esp parte 3 clase de datawarehouse ( ing. doño)
Unidad vii esp parte 3 clase de datawarehouse ( ing. doño)Titiushko Jazz
 
MINERIA DE DATOS
MINERIA DE DATOSMINERIA DE DATOS
MINERIA DE DATOS
LosMorales
 
Data Warehouse en las empresas y negocios.pdf
Data Warehouse en las empresas y negocios.pdfData Warehouse en las empresas y negocios.pdf
Data Warehouse en las empresas y negocios.pdf
expertoleonelmartine
 
Clase 02 - Base de Datos Estratégica [Inteligencia de Negocios en las Organiz...
Clase 02 - Base de Datos Estratégica [Inteligencia de Negocios en las Organiz...Clase 02 - Base de Datos Estratégica [Inteligencia de Negocios en las Organiz...
Clase 02 - Base de Datos Estratégica [Inteligencia de Negocios en las Organiz...
Julio Antonio Huaman Chuque
 
Mejores prácticas de Data Warehouse con SQL Server
Mejores prácticas de Data Warehouse con SQL ServerMejores prácticas de Data Warehouse con SQL Server
Mejores prácticas de Data Warehouse con SQL Server
SpanishPASSVC
 
Unidad vii esp parte 3 clase de inteligencia de negocios (datawarehouse)
Unidad vii esp parte 3 clase de inteligencia de negocios (datawarehouse)Unidad vii esp parte 3 clase de inteligencia de negocios (datawarehouse)
Unidad vii esp parte 3 clase de inteligencia de negocios (datawarehouse)Titiushko Jazz
 
Unidad vii esp parte 3 clase de inteligencia de negocios (datawarehouse)
Unidad vii esp parte 3 clase de inteligencia de negocios (datawarehouse)Unidad vii esp parte 3 clase de inteligencia de negocios (datawarehouse)
Unidad vii esp parte 3 clase de inteligencia de negocios (datawarehouse)Titiushko Jazz
 
1DATA WAREHOUSE.ppt
1DATA WAREHOUSE.ppt1DATA WAREHOUSE.ppt
1DATA WAREHOUSE.ppt
HectorSebastianPedra1
 
GRUPO 3_DATA WAREHOUSE_PRESENTACION.pptx
GRUPO 3_DATA WAREHOUSE_PRESENTACION.pptxGRUPO 3_DATA WAREHOUSE_PRESENTACION.pptx
GRUPO 3_DATA WAREHOUSE_PRESENTACION.pptx
ChristianCuzquillo
 
Data warehouse
Data warehouseData warehouse
Data warehouse
Jose Sajajú
 

Similar a Datawarehouse práctica 6 (20)

1 gestión de informacion
1 gestión de informacion1 gestión de informacion
1 gestión de informacion
 
Lab 01 modelado
Lab 01   modeladoLab 01   modelado
Lab 01 modelado
 
Kdd fase1
Kdd fase1Kdd fase1
Kdd fase1
 
BusinessIntelligence Introduction
BusinessIntelligence IntroductionBusinessIntelligence Introduction
BusinessIntelligence Introduction
 
2.1 fundamentos de data warehousing
2.1 fundamentos de data warehousing2.1 fundamentos de data warehousing
2.1 fundamentos de data warehousing
 
Datawarehouse
DatawarehouseDatawarehouse
Datawarehouse
 
2 Desa Sincrono 2 Caso Modelamiento.doc
2 Desa Sincrono 2 Caso Modelamiento.doc2 Desa Sincrono 2 Caso Modelamiento.doc
2 Desa Sincrono 2 Caso Modelamiento.doc
 
Fundamentos de Sistemas de Base de Datos (Capítulo 29 y 30)
Fundamentos de Sistemas de Base de Datos (Capítulo 29 y 30)Fundamentos de Sistemas de Base de Datos (Capítulo 29 y 30)
Fundamentos de Sistemas de Base de Datos (Capítulo 29 y 30)
 
Unidad vii esp parte 3 clase de datawarehouse ( ing. doño)
Unidad vii esp parte 3 clase de datawarehouse ( ing. doño)Unidad vii esp parte 3 clase de datawarehouse ( ing. doño)
Unidad vii esp parte 3 clase de datawarehouse ( ing. doño)
 
Unidad vii esp parte 3 clase de datawarehouse ( ing. doño)
Unidad vii esp parte 3 clase de datawarehouse ( ing. doño)Unidad vii esp parte 3 clase de datawarehouse ( ing. doño)
Unidad vii esp parte 3 clase de datawarehouse ( ing. doño)
 
MINERIA DE DATOS
MINERIA DE DATOSMINERIA DE DATOS
MINERIA DE DATOS
 
Data ware house
Data ware houseData ware house
Data ware house
 
Data Warehouse en las empresas y negocios.pdf
Data Warehouse en las empresas y negocios.pdfData Warehouse en las empresas y negocios.pdf
Data Warehouse en las empresas y negocios.pdf
 
Clase 02 - Base de Datos Estratégica [Inteligencia de Negocios en las Organiz...
Clase 02 - Base de Datos Estratégica [Inteligencia de Negocios en las Organiz...Clase 02 - Base de Datos Estratégica [Inteligencia de Negocios en las Organiz...
Clase 02 - Base de Datos Estratégica [Inteligencia de Negocios en las Organiz...
 
Mejores prácticas de Data Warehouse con SQL Server
Mejores prácticas de Data Warehouse con SQL ServerMejores prácticas de Data Warehouse con SQL Server
Mejores prácticas de Data Warehouse con SQL Server
 
Unidad vii esp parte 3 clase de inteligencia de negocios (datawarehouse)
Unidad vii esp parte 3 clase de inteligencia de negocios (datawarehouse)Unidad vii esp parte 3 clase de inteligencia de negocios (datawarehouse)
Unidad vii esp parte 3 clase de inteligencia de negocios (datawarehouse)
 
Unidad vii esp parte 3 clase de inteligencia de negocios (datawarehouse)
Unidad vii esp parte 3 clase de inteligencia de negocios (datawarehouse)Unidad vii esp parte 3 clase de inteligencia de negocios (datawarehouse)
Unidad vii esp parte 3 clase de inteligencia de negocios (datawarehouse)
 
1DATA WAREHOUSE.ppt
1DATA WAREHOUSE.ppt1DATA WAREHOUSE.ppt
1DATA WAREHOUSE.ppt
 
GRUPO 3_DATA WAREHOUSE_PRESENTACION.pptx
GRUPO 3_DATA WAREHOUSE_PRESENTACION.pptxGRUPO 3_DATA WAREHOUSE_PRESENTACION.pptx
GRUPO 3_DATA WAREHOUSE_PRESENTACION.pptx
 
Data warehouse
Data warehouseData warehouse
Data warehouse
 

Último

HERRAMIENTAS WEB--------------------.pptx
HERRAMIENTAS WEB--------------------.pptxHERRAMIENTAS WEB--------------------.pptx
HERRAMIENTAS WEB--------------------.pptx
maralache30
 
Conceptos Básicos de Programación L.D 10-5
Conceptos Básicos de Programación L.D 10-5Conceptos Básicos de Programación L.D 10-5
Conceptos Básicos de Programación L.D 10-5
JulyMuoz18
 
Sitios web 3.0 funciones ventajas y desventajas
Sitios web 3.0 funciones ventajas y desventajasSitios web 3.0 funciones ventajas y desventajas
Sitios web 3.0 funciones ventajas y desventajas
paulroyal74
 
modelosdeteclados-230114024527-aa2c9553.pptx
modelosdeteclados-230114024527-aa2c9553.pptxmodelosdeteclados-230114024527-aa2c9553.pptx
modelosdeteclados-230114024527-aa2c9553.pptx
evelinglilibethpeafi
 
trabajo de tecnologia, segundo periodo 9-6f
trabajo de tecnologia, segundo periodo 9-6ftrabajo de tecnologia, segundo periodo 9-6f
trabajo de tecnologia, segundo periodo 9-6f
zoecaicedosalazar
 
Todo sobre Minirobotica. Revista Saber Electronica
Todo sobre  Minirobotica. Revista Saber ElectronicaTodo sobre  Minirobotica. Revista Saber Electronica
Todo sobre Minirobotica. Revista Saber Electronica
Carlos Carlosnoemi
 
Presentacion de Estado del Arte del The Clean
Presentacion de Estado del Arte del The CleanPresentacion de Estado del Arte del The Clean
Presentacion de Estado del Arte del The Clean
juanchogame18
 
absorcion de gases y practicas de laboratorios
absorcion de gases y practicas de laboratoriosabsorcion de gases y practicas de laboratorios
absorcion de gases y practicas de laboratorios
JuanAlvarez413513
 
Desarrollo de Habilidades de Pensamiento.
Desarrollo de Habilidades de Pensamiento.Desarrollo de Habilidades de Pensamiento.
Desarrollo de Habilidades de Pensamiento.
AlejandraCasallas7
 
Actividad Conceptos básicos de programación.pdf
Actividad Conceptos básicos de programación.pdfActividad Conceptos básicos de programación.pdf
Actividad Conceptos básicos de programación.pdf
NajwaNimri1
 
DESARROLO DE HABILIDADES DE PENSAMIENTO.pdf
DESARROLO DE HABILIDADES DE PENSAMIENTO.pdfDESARROLO DE HABILIDADES DE PENSAMIENTO.pdf
DESARROLO DE HABILIDADES DE PENSAMIENTO.pdf
marianabz2403
 
Catalogo Cajas Fuertes BTV Amado Salvador Distribuidor Oficial
Catalogo Cajas Fuertes BTV Amado Salvador Distribuidor OficialCatalogo Cajas Fuertes BTV Amado Salvador Distribuidor Oficial
Catalogo Cajas Fuertes BTV Amado Salvador Distribuidor Oficial
AMADO SALVADOR
 
Projecte Iniciativa TIC 2024 KAWARU CONSULTING. inCV.pdf
Projecte Iniciativa TIC 2024 KAWARU CONSULTING. inCV.pdfProjecte Iniciativa TIC 2024 KAWARU CONSULTING. inCV.pdf
Projecte Iniciativa TIC 2024 KAWARU CONSULTING. inCV.pdf
Festibity
 
Catalogo Refrigeracion Miele Distribuidor Oficial Amado Salvador Valencia
Catalogo Refrigeracion Miele Distribuidor Oficial Amado Salvador ValenciaCatalogo Refrigeracion Miele Distribuidor Oficial Amado Salvador Valencia
Catalogo Refrigeracion Miele Distribuidor Oficial Amado Salvador Valencia
AMADO SALVADOR
 
Informació Projecte Iniciativa TIC SOPRA STERIA.pdf
Informació Projecte Iniciativa TIC SOPRA STERIA.pdfInformació Projecte Iniciativa TIC SOPRA STERIA.pdf
Informació Projecte Iniciativa TIC SOPRA STERIA.pdf
Festibity
 
Conceptos básicos de programación 10-5.pdf
Conceptos básicos de programación 10-5.pdfConceptos básicos de programación 10-5.pdf
Conceptos básicos de programación 10-5.pdf
ValeriaAyala48
 
Estructuras Básicas_ Conceptos Basicos De Programacion.pdf
Estructuras Básicas_ Conceptos Basicos De Programacion.pdfEstructuras Básicas_ Conceptos Basicos De Programacion.pdf
Estructuras Básicas_ Conceptos Basicos De Programacion.pdf
IsabellaRubio6
 
Projecte Iniciativa TIC 2024 HPE. inCV.pdf
Projecte Iniciativa TIC 2024 HPE. inCV.pdfProjecte Iniciativa TIC 2024 HPE. inCV.pdf
Projecte Iniciativa TIC 2024 HPE. inCV.pdf
Festibity
 
Catalogo Buzones BTV Amado Salvador Distribuidor Oficial Valencia
Catalogo Buzones BTV Amado Salvador Distribuidor Oficial ValenciaCatalogo Buzones BTV Amado Salvador Distribuidor Oficial Valencia
Catalogo Buzones BTV Amado Salvador Distribuidor Oficial Valencia
AMADO SALVADOR
 
Catalogo General Electrodomesticos Teka Distribuidor Oficial Amado Salvador V...
Catalogo General Electrodomesticos Teka Distribuidor Oficial Amado Salvador V...Catalogo General Electrodomesticos Teka Distribuidor Oficial Amado Salvador V...
Catalogo General Electrodomesticos Teka Distribuidor Oficial Amado Salvador V...
AMADO SALVADOR
 

Último (20)

HERRAMIENTAS WEB--------------------.pptx
HERRAMIENTAS WEB--------------------.pptxHERRAMIENTAS WEB--------------------.pptx
HERRAMIENTAS WEB--------------------.pptx
 
Conceptos Básicos de Programación L.D 10-5
Conceptos Básicos de Programación L.D 10-5Conceptos Básicos de Programación L.D 10-5
Conceptos Básicos de Programación L.D 10-5
 
Sitios web 3.0 funciones ventajas y desventajas
Sitios web 3.0 funciones ventajas y desventajasSitios web 3.0 funciones ventajas y desventajas
Sitios web 3.0 funciones ventajas y desventajas
 
modelosdeteclados-230114024527-aa2c9553.pptx
modelosdeteclados-230114024527-aa2c9553.pptxmodelosdeteclados-230114024527-aa2c9553.pptx
modelosdeteclados-230114024527-aa2c9553.pptx
 
trabajo de tecnologia, segundo periodo 9-6f
trabajo de tecnologia, segundo periodo 9-6ftrabajo de tecnologia, segundo periodo 9-6f
trabajo de tecnologia, segundo periodo 9-6f
 
Todo sobre Minirobotica. Revista Saber Electronica
Todo sobre  Minirobotica. Revista Saber ElectronicaTodo sobre  Minirobotica. Revista Saber Electronica
Todo sobre Minirobotica. Revista Saber Electronica
 
Presentacion de Estado del Arte del The Clean
Presentacion de Estado del Arte del The CleanPresentacion de Estado del Arte del The Clean
Presentacion de Estado del Arte del The Clean
 
absorcion de gases y practicas de laboratorios
absorcion de gases y practicas de laboratoriosabsorcion de gases y practicas de laboratorios
absorcion de gases y practicas de laboratorios
 
Desarrollo de Habilidades de Pensamiento.
Desarrollo de Habilidades de Pensamiento.Desarrollo de Habilidades de Pensamiento.
Desarrollo de Habilidades de Pensamiento.
 
Actividad Conceptos básicos de programación.pdf
Actividad Conceptos básicos de programación.pdfActividad Conceptos básicos de programación.pdf
Actividad Conceptos básicos de programación.pdf
 
DESARROLO DE HABILIDADES DE PENSAMIENTO.pdf
DESARROLO DE HABILIDADES DE PENSAMIENTO.pdfDESARROLO DE HABILIDADES DE PENSAMIENTO.pdf
DESARROLO DE HABILIDADES DE PENSAMIENTO.pdf
 
Catalogo Cajas Fuertes BTV Amado Salvador Distribuidor Oficial
Catalogo Cajas Fuertes BTV Amado Salvador Distribuidor OficialCatalogo Cajas Fuertes BTV Amado Salvador Distribuidor Oficial
Catalogo Cajas Fuertes BTV Amado Salvador Distribuidor Oficial
 
Projecte Iniciativa TIC 2024 KAWARU CONSULTING. inCV.pdf
Projecte Iniciativa TIC 2024 KAWARU CONSULTING. inCV.pdfProjecte Iniciativa TIC 2024 KAWARU CONSULTING. inCV.pdf
Projecte Iniciativa TIC 2024 KAWARU CONSULTING. inCV.pdf
 
Catalogo Refrigeracion Miele Distribuidor Oficial Amado Salvador Valencia
Catalogo Refrigeracion Miele Distribuidor Oficial Amado Salvador ValenciaCatalogo Refrigeracion Miele Distribuidor Oficial Amado Salvador Valencia
Catalogo Refrigeracion Miele Distribuidor Oficial Amado Salvador Valencia
 
Informació Projecte Iniciativa TIC SOPRA STERIA.pdf
Informació Projecte Iniciativa TIC SOPRA STERIA.pdfInformació Projecte Iniciativa TIC SOPRA STERIA.pdf
Informació Projecte Iniciativa TIC SOPRA STERIA.pdf
 
Conceptos básicos de programación 10-5.pdf
Conceptos básicos de programación 10-5.pdfConceptos básicos de programación 10-5.pdf
Conceptos básicos de programación 10-5.pdf
 
Estructuras Básicas_ Conceptos Basicos De Programacion.pdf
Estructuras Básicas_ Conceptos Basicos De Programacion.pdfEstructuras Básicas_ Conceptos Basicos De Programacion.pdf
Estructuras Básicas_ Conceptos Basicos De Programacion.pdf
 
Projecte Iniciativa TIC 2024 HPE. inCV.pdf
Projecte Iniciativa TIC 2024 HPE. inCV.pdfProjecte Iniciativa TIC 2024 HPE. inCV.pdf
Projecte Iniciativa TIC 2024 HPE. inCV.pdf
 
Catalogo Buzones BTV Amado Salvador Distribuidor Oficial Valencia
Catalogo Buzones BTV Amado Salvador Distribuidor Oficial ValenciaCatalogo Buzones BTV Amado Salvador Distribuidor Oficial Valencia
Catalogo Buzones BTV Amado Salvador Distribuidor Oficial Valencia
 
Catalogo General Electrodomesticos Teka Distribuidor Oficial Amado Salvador V...
Catalogo General Electrodomesticos Teka Distribuidor Oficial Amado Salvador V...Catalogo General Electrodomesticos Teka Distribuidor Oficial Amado Salvador V...
Catalogo General Electrodomesticos Teka Distribuidor Oficial Amado Salvador V...
 

Datawarehouse práctica 6

  • 2. Almacenes y Minería de Datos 2 Definición • Datawarehouse (Almacen de datos) se define como una colección de datos que verifican las siguientes propiedades: – Está orientado (a un tema) a objetos – Datos integrados – No volátiles – Variante en el tiempo que surgieron como una herramienta de soporte para la toma de decisiones a nivel gerencial
  • 3. Almacenes y Minería de Datos 3 Explicación de la definición • Orientado hacia temas: los datos se almacenan y agrupan por temas de interés.
  • 4. Almacenes y Minería de Datos 4 Explicación de la definición • Datos integrados: el almacén de datos integra datos que provienen de varias fuentes. Partimos de una base de datos (operacional) y mediante un proceso de carga de datos hacemos el Datawarehouse. El proceso de carga es lo más complicado por problemas de codificación, medidas de los atributos… de las bases de datos. BD BD BD DW CARGA
  • 5. Almacenes y Minería de Datos 5 Explicación de la definición • No volátiles: son estables, una vez almacenados los datos no se modifican. BD DWD W SELECT INSERT UPDATE DELETE REPORT S SELECT CARGA
  • 6. Almacenes y Minería de Datos 6 Explicación de la definición • Variante en el tiempo: los datos contienen información sobre la fecha de los mismos, porque se hacen cargas de datos continuamente. Cuando los datos van cambiando, se actualizan los históricos y se guardan en ficheros temporales. Siempre va haber una variable tiempo. TIEMPO # id_tiempo * periodo
  • 7. Almacenes y Minería de Datos 7 Características • Podemos resumir las características de un Datawarehouse: – Trabaja con datos de negocio – Orientado a un sujeto – Almacena datos actuales orientado a un histórico (actual + histórico) – Datos más bien resumidos (no información detallada)
  • 8. Almacenes y Minería de Datos 8 DIFERENCIAS BD OPERACIONAL - Datos operacionales - Orientado a aplicaciones - Datos Actuales - Datos Detallados - Datos en continuo cambio DATAWAREHOUS E - Datos de negocio - Orientado al sujeto - Actuales + Histórico - Datos Resumidos - Datos Estables
  • 9. Almacenes y Minería de Datos 9 GESTOR CARGA ARQUITECTURA DW GESTOR ALMACENAMIENT O GESTOR CONSULTAS BD operacional Partimos de una BD operacional y se basa en 3 módulos
  • 10. Almacenes y Minería de Datos 10 GESTOR DE CARGA • Permite hacer la carga. Como dificultades nos podemos encontrar: – La integración de los datos – Elección del momento de la carga – El tiempo de carga sea el mínimo posible – Buen diccionario de datos o METADATA (para evitar cometer errores en la carga) – Diseño de procedimientos PL/SQL
  • 11. Almacenes y Minería de Datos 11 GESTOR DE ALMACENAMIENTO • Se encarga del almacenamiento, de la estructura,…. Existe una tabla llamada FACT (Hecho) y unas tablas llamadas dimensiones o tablas dimensionales. Entre la tabla FACT y las tablas dimensionales suele haber relaciones 1:N Este modelo tiene forma de estrella por eso se denomina MODELO STAR
  • 12. Almacenes y Minería de Datos 12 MODELO STAR FACT DIM_1 DIM_2 DIM_TIEMPO DIM_3 # PK4 # PK1 # PK2 # PK3 # PK1 # PK2 # PK3 # PK4 *campoA *campoB
  • 13. Almacenes y Minería de Datos 13 GESTOR DE CONSULTAS • Las consultas se hacen sobre la tabla FACT. También se encarga de los perfiles, pues las consultas (reports) serán diferentes dependiendo del usuario y sus necesidades.
  • 14. Almacenes y Minería de Datos 14 Ejemplo 1: CATEGORIAS_PROF # c_categoria * descripción * salario_min * salario_max USUARIOS # c_usuario * nombre * apellido1 * apellido2 * c_categoria * direccion USU_OFERTAS # c_categoria # c_oferta * salario_deseado OFERTAS # c_oferta * descripción * salario_min * salario_max * fx_alta 1 n 11 nn
  • 15. Almacenes y Minería de Datos 15 Ejemplo 1: # PK1CATEGORIAS_PR OF # c_categoria * descripción * salario_min * salario_max USUARIOS # c_usuario * nombre * apellido1 * apellido2 * c_categoria * direccion OFERTAS # c_oferta * descripción * salario_min * salario_max * fx_alta TIEMPO # c_tiempo * descripcion USU_OFERTAS # c_usuario # c_categoria # c_oferta * salario_deseado
  • 16. Almacenes y Minería de Datos 16 REPORTS • ¿Cuántos usuarios se han apuntado a las ofertas de empleo del mes de enero? SELECT count(*) FROM USUARIOS_OFERTAS U, OFERTAS O WHERE U.c_oferta=o.c_oferta AND O.fx_alta BETWEEN (’01/01/07’,`31/01/07´)
  • 17. 17 Arquitectura de un Almacén de Datos EJEMPLO Organización: Cadena de supermercados. Actividad objeto de análisis: ventas de productos. Información registrada sobre una venta: “del producto “Tauritón 33cl” se han vendido en el almacén “Almacén nro.1” el día 17/7/2003, 5 unidades por un importe de 103,19 dolares.” Para hacer el análisis no interesa la venta individual (ticket) realizada a un cliente sino las ventas diarias de productos en los distintos almacenes de la cadena.
  • 18. 18 Arquitectura de un Almacén de Datos Ventasimporte unidades Almacén Almacén Ciudad Región Tipo Producto Departamento Nro_producto Categoría Marca Tipo Descripción Tiempo Día Mes Semana Año Trimestre
  • 19. 19 Arquitectura de un Almacén de Datos Ventasimporte unidades Departamento Nro_producto Categoría Marca Tipo Día Mes Semana Almacén Ciudad Región Tipo Año Descripción Actividad que es objeto de análisis con los indicadores que interesa analizar Dimensiones (puntos de vista) desde los que se puede analizar la actividad. Producto TiempoAlmacén Trimestre
  • 20. 20 Arquitectura de un Almacén de Datos Modelo multidimensional:  en un esquema multidimensional se representa una actividad que es objeto de análisis (hecho) y las dimensiones que caracterizan la actividad (dimensiones). la información relevante sobre el hecho (actividad) se representa por un conjunto de indicadores (medidas o atributos de hecho). la información descriptiva de cada dimensión se representa por un conjunto de atributos (atributos de dimensión).
  • 21. 21 Arquitectura de un Almacén de Datos Ventas importe unidades Almacén Almacén Ciudad Región Tipo Producto Departamento Nro_producto Categoría Marca Tipo Descripción hecho medidas dimensión atributos Tiempo Día Mes Semana Año Trimestre
  • 22. 22 Arquitectura de un Almacén de Datos Entre los atributos de una dimensión se definen jerarquías departamento almacén ciudad región tipo día mes año Producto Almacén Tiempo nro. producto categoría trimestre semana
  • 23. 23 Arquitectura de un Almacén de Datos Este esquema multidimensional recibe varios nombres: • estrella: si la jerarquía de dimensiones es lineal • estrella jerárquica o copo de nieve: si la jerarquía no es lineal. PERSONAL VENTAS tiempo tiempo producto lugar proyecto equipo
  • 24. 24 Herramientas OLAP una consulta a un almacén de datos consiste generalmente en la obtención de medidas sobre los hechos parametrizadas por atributos de las dimensiones y restringidas por condiciones impuestas sobre las dimensiones ¿ “Importe total de las ventas durante este año de los productos del departamento Bebidas, por trimestre y por categoría” ?. Restricciones: productos del departamento Bebidas, ventas durante este año medida hecho Parámetros de la consulta: por categoría de producto y por trimestre
  • 25. 25 Herramientas OLAP “2002” “Bebidas” Producto Tiempo Almacén Ventas importe unidades Departamento Nro_producto Categoría Marca Tipo Día Mes Día de la semana Almacén Ciudad Región Tipo Año “Importe total de ventas en este año, del departamento de “Bebidas”, por categoría y trimestre” Trimestre
  • 26. 26 Diseño de un Almacén de Datos id_dim1 id_dim2 id_dim3 ... id_dim n .... (hechos) Dim3 Dim2 Dim1 tabla de hechos tabla Dimensión 3 tabla Dimensión 1 tabla Dimensión 2 tabla Dimensión nDimn
  • 27. 27 Diseño de un Almacén de Datos producto día almacén ventas tiempo almacén producto id_producto id_fecha id_almacén ..... ..... ...... tabla de hechos la clave primaria* está formada por los identificadores de las dimensiones básicas. datos (medidas) sobre las ventas diarias de un producto en un almacén. * pueden existir excepciones a esta regla general
  • 28. 28 Diseño de un Almacén de Datos id_establec nro_establec nombre dirección distrito ciudad país tlfno fax superficie tipo_almacén ... Establecimiento id_fecha día semana mes año día_semana día_mes trimestre festivo .... Tiempo id_producto nro_producto descripción marca subcategoría categoría departamento peso unidades_peso tipo_envase dietético ... Producto
  • 29. 29 Diseño de un Almacén de Datos id_fecha id_producto id_establec ... ... ... Ventas id_establec nro_establec nombre dirección distrito ciudad país tlfno fax superficie tipo_almacén ... id_producto nro_producto descripción marca subcategoría categoría departamento peso unidades_peso tipo_envase dietético ... Establecimiento Producto id_fecha día semana mes año día_semana día_mes trimestre festivo .... Tiempo
  • 30. 30 Líneas de Investigación Abiertas  Diseño de Almacenes de Datos: modelos conceptuales, metodogías de diseño.  Carga y ETL: recuperación de fallos durante la carga. Planificación de cargas y refrescos.  Limpieza y Transformación  Mantenimiento de Almacenes de Datos: mantenimiento de vistas materializadas.  Implementación de Almacenes de Datos.  Diseño Físico, optimizaciones para ROLAP, estructuras para MOLAP.  Repartición de tareas OLAP entre el cliente y el servidor.