SlideShare una empresa de Scribd logo
Marta Millan
millan@eisc.univalle.edu.co
www.eisc.univalle.edu.co/materias
Ejemplo
Hechos
Los hechos son transacciones que han ocurrido en
algún punto en el pasado, y que es muy poco
probable que cambien en el futuro
Los hechos se pueden analizar de diferentes
formas dependiendo de la información de
referencia
Los hechos suelen tener pocos atributos, puesto
que no tiene datos operacionales
Dimensiones
Sirven para representar cada uno de los factores por los
que se puede analizar un determinado área de negocio
Son tablas siempre más pequeñas
A menudo se desnormalizan
día mes
clave_día
clave_mesclave_mes
mes
día
clave_día
clave_mes
mes
Hechos y dimensiones
Ventas
July 2001
M T W T F S S
1
2 3 4 5 6 7 8
9 10 11 12 13 14 15
16 17 18 19 20 21 22
23 24 25 26 27 28 29
30 31
Pc
Portátil
Ratón
FaxTeléfono
Sucursales
Productos
Clientes
Fecha
Diagramas en estrella
Producto Cliente
Fecha Sucursal
Ventas Tabla de
hechos
Tablas de dimensión
Datos multidimensionales
Ventas totales de
television en T1.
Fecha
Producto
Tienda
suma
suma
TV
VCR
PC
1Qtr 2Qtr 3Qtr 4Qtr
T1
T2
T3
suma
Diseño STAR: pasos a seguir
De diagrama E/R surgen múltiples diagramas
en estrella
Separar en procesos discretos de negocio
(hechos) y modelar cada hecho
Seleccionar relaciones n:m con atributos
numéricos
Desnormalizar las tablas de dimensión
Diseño STAR: pasos a seguir
A BR
C
S
D
T E
R
A B
C Fecha
Diagrama E/R Diagrama en
estrella
Diseño de la tabla de hechos
Decidir la granularidad de la tabla de hechos
Establece lo que significa cada registro de la
tabla de hechos
Decidir las dimensiones
Decidir los hechos de la tabla de hechos
Deben ser específicos para la granularidad
seleccionada para la tabla de hechos
Diseño de la tabla de hechos
Identificar el periodo histórico significativo para los
distintos procesos y el grado de detalle requerido
Eliminar todas las columnas del hecho que no sean
requeridas para responder a preguntas de toma de
decisiones
Ajustar el tamaño de cada columna
Usar claves generadas
Claves primarias y extranjeras
Todas las claves que se utilicen en tablas del Data
Warehouse deben ser claves sin significado
Nunca se deben usar claves de producción
Facilitar los cambios
Situaciones “no lo se”, “desconocido”
Dimensiones que cambian en el tiempo
Aditividad
Siempre que sea posible, los hechos de la tabla de
hechos deberían elegirse para que sean
perfectamente aditivos (se pueden sumar por
cualquier dimensión)
Las medidas de actividad son generalmente
aditivas
Las medidas de intensidad no siempre lo son
(niveles de inventario, balance de cuentas...)
Análisis de aditividad
Cod_Fecha
Cod_Sucursal
Cod_Producto
Cod_Cliente
Unidades
Fecha
Cliente
Ventas
producto
Sucursal
Cantidad
aditiva
Fecha
producto
Almacén
Cod_Fecha
Cod_Almacén
Cod_Producto
Stock
Almacenes
Cantidad
NO aditiva
Diseño de las dimensiones
Son tablas más pequeñas
Desnormalizar si se acceden muy a menudo en las
consultas para acelerar el desempeño (Esquemas
estrella)
Establecer la política para dimensiones cambiantes
Actualizar los cambios
Atributos valor antiguo – valor nuevo
Generar un nuevo código para el nuevo valor
Normalización de dimensiones
Se dice que una dimensión está “snowflaked”
cuando los atributos de baja cardinalidad se llevan
a tablas separadas
Generalmente no se recomienda
A veces se usa para ahorrar espacio de
almacenamiento
No permite hacer uso de los índices de bitmap
Sin embargo existen situaciones (datos
demográficos) en las que son aconsejables
Diseñar las tablas dimensión
Producto
Clave_producto
SKU
Descripcion
Clave_marca_comercial
Clave_marca_financiera
Clave_tipo_embalaje
Tamaño
Clave_sabor
Altura
Cantidad_por_caja
Marketing
Clave_marca_comercial
Marca_comercial
Clave_categoria_comercial
Finanzas
Clave_marca_financiera
Marca_financiera
Clave_categoria_financiera
Embalajes
Clave_tipo_embalaje
Tipo_embalaje
Sabores
Clave_sabor
Sabor
Categorias comerciales
Clave_categoria_comercial
Categoria_comercial
Categorias financieras
Clave_categoria_financiera
Categoria_financiera
Diseñar las tablas dimensión
Producto
Clave_producto
SKU
Descripción
Clave_marca_comercial
Clave_marca_financiera
Clave_tipo_embalaje
Tamaño
Clave_sabor
Altura
Cantidad_por_caja
Categoria_comercial
Categoria_financiera
Marca_financiera
Marca_comercial
Tipo_embalaje
Sabor
Tabla de hechos
Clave_producto
Diseñar las tablas dimensión
Cliente
Clave cliente (PK)
ID_cliente
Nombre
Dirección
Ciudad
Departamento
Fecha primera compra
Score de compra
Score de crédito
Subdimensión demográfica
Departamento
Número de segmento
Nombre del segmeto
Contador del segmento
Porcentaje del segmento
Ranking del segmento
Ventas
Clave_cliente
Clave_producto
Un esquema en estrella
Ventas
Cod_Fecha
Clave_Cliente
Clave_Sucursal
Clave_Producto
unidades
precio_unidad
ticket
Fechas
Código
Sysdate
Día
Mes
día_semana
___
Sucursal
Clave
Dirección
Segmento
Descripción
Producto
Clave_producto
SKU
Descripción
Clave_marca_comercial
Clave_marca_financiera
Clave_tipo_embalaje
Tamaño
Clave_sabor
Altura
Cantidad_por_caja
Categoria_comercial
Categoria_financiera
Marca_financiera
Marca_comercial
Tipo_embalaje
Sabor
Cliente
Clave cliente (PK)
ID_cliente
Nombre
Dirección
Ciudad
Departamento
Fecha primera compra
Score de compra
Score de crédito
Subdimensión demográfica
Departamento
Número de segmento
Nombre del segmento
Contador del segmento
Porcentaje del segmento
Ranking del segmento
La importancia de los atributos
La calidad del Data Warehouse se mide por la
calidad de los atributos
Descriptivos
Completos (sin valores nulos)
Indexados
Palabras enteras
Documentados (metadatos)
Calidad asegurada
Tabla de fechas
Fecha
Codigo
Día
Día semana (numero)
Dia semana (nombre)
Festivo
Mes (numero)
Mes (nombre)
Fin de semana
Dia antes fin de semana
....
Sucesos climaticos
Codigo_Fecha
Codigo de suceso
Nombre de suceso
Fiestas nacionales
Codigo_Fecha
Codigo de fiesta
Nombre fiesta
Fiestas locales
Codigo_Fecha
Codigo de fiesta
Nombre fiesta
Sucesos politicos
Codigo_Fecha
Codigo de suceso
Nombre de suceso
Dimensión “degenerada”
La mayoría de los diseños multidimensionales están
alrededor de un documento de control: número de
pedido, factura, ticket, ...
Generalmente son contenedores de más de un
producto
Generalmente en estos casos la granularidad de la
tabla la marca este número
¿Qué se hace con los números?
Se ponen en las tablas pero no tienen una dimensión
con la que hacer “join”
Aplicación de dimensiones “degeneradas”
Ventas
Cod_Fecha
Cod_Cliente
Cod_Sucursal
Cod_Producto
unidades
precio_unidad
ticket
Cliente
Codigo
Nombre
Sexo
Cluster
___
Fechas
Codigo
Sysdate
Día
Mes
día_semana
___
Producto
Codigo
Descripción
tipo
sección
Sucursal
Codigo
Dirección
Segmento
Descripcion
Dimensión
degenerada
Dimensión “Cajón desastre”
En ocasiones se tienen atributos textuales y “flags” de
distinta naturaleza que no parecen organizarse de
manera coherente
La solución no parece sencilla
• Dejar los atributos en la tabla de hechos
• Hacer dimensiones separadas para cada atributo
• Quitar directamente estos atributos
La mejor solución es compactarlos todos en lo que se
denomina una “junk dimension”
Aplicación de dimensión “junk"
Gustos
Codigo
Niños
Ascensor
Almohada
Tipo_cama
___
Cliente
Codigo
Nombre
Fecha_nacimiento
Sexo
Tipo
___
Fecha
Codigo
Día
Día semana
Festivo
Mes
___
Sucesos
Codigo_Fecha
Suceso Politico
___
Reservas
Cod_Cliente
Cod_Habitacion
Cod_Fecha
Reserva
Gustos
días
coste
descuento
Habitacion
Codigo
Planta
Sección
Tamaño
Cajón desastre
Tablas de hechos sin hechos
Hay situaciones en las que se tiene en el
diseño final una tabla de hechos sin hechos
Son situaciones en las que interesa el
suceso en sí
Afluencia de público
Coberturas
Tablas de hechos sin hechos
Productos en promocion
Cod_Fecha
Cod_promocion
Cod_producto
"1"
Producto
Codigo
Nombre
Tipo
___
Fecha
Codigo
Día
Día semana
Festivo
Mes
___
Promocion
Codigo
Tipo
Dias
Descripcion
Ejercicio a resolver
Supónga un hospital en el se ha decidido construir
un Data Warehouse para analizar
Ocupación
Tratamientos
Diagnósticos
Pasos a seguir
Estudiar el problema
Determinar los hechos fundamentales a estudiar
Para cada hecho
Analizar la granularidad del hecho
Decidir las dimensiones
Diseñar las dimensiones
Ocupación de camas
July 2001
S M T W T F S
1 2 3 4 5 6 7
8 9 10 11 12 13 14
15 16 17 18 19 20 21
22 23 24 25 26 27 28
29 30 31
Ocupación
Pacientes
Camas
Fecha
Tratamientos
Tratamientos
July 2001
S M T W T F S
1 2 3 4 5 6 7
8 9 10 11 12 13 14
15 16 17 18 19 20 21
22 23 24 25 26 27 28
29 30 31
Pacientes
Médicos
Fecha
Tratamientos
Diagnósticos
July 2001
S M T W T F S
1 2 3 4 5 6 7
8 9 10 11 12 13 14
15 16 17 18 19 20 21
22 23 24 25 26 27 28
29 30 31
Pacientes
Doctores
Fecha
Diagnósticos
Diagnósticos
Tabla de ocupaciones
Ocupación
Cod_Fecha
Cod_cama
Cod_paciente
"1"
Paciente
Código
Nombre
Fecha_nacimiento
Sexo
Identificación
___
Fecha
Código
Día
Día semana
Festivo
Mes
___
Cama
Código
Planta
Sección
Especialidad
Sucesos
Código_Fecha
Epidemia
___
Datos médicod
Tabla de diagnósticos
Paciente
Código
Nombre
Fecha_nacimiento
Sexo
Fe
___
Médico
Código
Licencia
Nombre
Fecha_nacimiento
Especialidad
___
Diagnóstico
Código
Nombre
Especialidad
Tipo
Diagnósticos_realizados
Cod_Medico
Cod_Paciente
Cod_Diagnóstico
Cod_Fecha
Cod_Ingreso
Costo
Fecha
Código
Día
Día semana
Festivo
Mes
___
Sucesos
Código_Fecha
Epidemia
___
Sexo
Fecha de Grado...
Tabla de tratamientos
Tratamiento
Código
Nombre
Presentación
Laboratorio
Posología
Flags_efectos_secundarios
Código
Exito
Problemas gástricos
Insomnio
Alergia
___
Médico
Código
Licencia
Nombre
Fecha_nacimiento
Especialidad
___
Fecha
Código
Día
Día semana
Festivo
Mes
___
Sucesos
Código_Fecha
Epidemia
___
Tratamientos_realizados
Cod_Medico
Cod_Paciente
Cod_Fecha
Cod_Tratamiento
NIngreso
Costo
Número de días
Dosis diarias
Cod_Junk
Paciente
Código
Nombre
Fecha_nacimiento
Sexo
Fe
___

Más contenido relacionado

Similar a Datawarehouse

2 Desa Sincrono 2 Caso Modelamiento.doc
2 Desa Sincrono 2 Caso Modelamiento.doc2 Desa Sincrono 2 Caso Modelamiento.doc
2 Desa Sincrono 2 Caso Modelamiento.doc
aldair441257
 
Presentación.pdf
Presentación.pdfPresentación.pdf
Presentación.pdf
Walter246991
 
Diseño Dimensional
Diseño DimensionalDiseño Dimensional
Diseño Dimensional
Roberto Espinosa
 
Bussines Intelligence
Bussines IntelligenceBussines Intelligence
Bussines Intelligence
brobelo
 
10Guia2
10Guia210Guia2
10Guia2
Wilson
 
Entender-la-disminucion-de-visitas-a-tiendas-fisicas.pdf
Entender-la-disminucion-de-visitas-a-tiendas-fisicas.pdfEntender-la-disminucion-de-visitas-a-tiendas-fisicas.pdf
Entender-la-disminucion-de-visitas-a-tiendas-fisicas.pdf
Edgar Joel Leon Rosales
 
2018-06-11 DataviXon-ODHEOIFHPCLDMVC CC .pptx
2018-06-11 DataviXon-ODHEOIFHPCLDMVC CC .pptx2018-06-11 DataviXon-ODHEOIFHPCLDMVC CC .pptx
2018-06-11 DataviXon-ODHEOIFHPCLDMVC CC .pptx
Angel Tello
 
Actividad 1 modelo entidad relación- entregable
Actividad 1  modelo entidad relación- entregableActividad 1  modelo entidad relación- entregable
Actividad 1 modelo entidad relación- entregable
johnjanner
 
Mirol Información Gerencial
Mirol Información GerencialMirol Información Gerencial
Mirol Información Gerencial
Mirol SyS
 
Introduccion a las Bodegas de Datos
Introduccion a las Bodegas de DatosIntroduccion a las Bodegas de Datos
Introduccion a las Bodegas de Datos
Joseph Lopez
 
Modelamiento del Data Warehouse (caso práctico)
Modelamiento del Data Warehouse (caso práctico)Modelamiento del Data Warehouse (caso práctico)
Modelamiento del Data Warehouse (caso práctico)
LPI ONG
 
Diseño eficiente de un cubo para resolver problemas en las áreas de negocio
Diseño eficiente de un cubo para resolver problemas en las áreas de negocioDiseño eficiente de un cubo para resolver problemas en las áreas de negocio
Diseño eficiente de un cubo para resolver problemas en las áreas de negocio
Sebastian Rodriguez Robotham
 
Coffe Place.docx
Coffe Place.docxCoffe Place.docx
Coffe Place.docx
GarcaNolascoYamilIsm
 
Comercio electrónico el mercado
Comercio electrónico   el mercadoComercio electrónico   el mercado
Comercio electrónico el mercado
Duoc UC
 
2018-05-11 Presentación DataviXon (Predictivo Logístico).pptx
2018-05-11 Presentación DataviXon (Predictivo Logístico).pptx2018-05-11 Presentación DataviXon (Predictivo Logístico).pptx
2018-05-11 Presentación DataviXon (Predictivo Logístico).pptx
Angel Tello
 
Mercadotecnia detallista (tiendas de autoservicio)
Mercadotecnia detallista (tiendas de autoservicio)Mercadotecnia detallista (tiendas de autoservicio)
Mercadotecnia detallista (tiendas de autoservicio)
Enrico García Martínez
 
Multidimensional manager
Multidimensional managerMultidimensional manager
Multidimensional manager
troppoumano
 
Inteligencia de Negocios – Data Warehouse
Inteligencia de Negocios – Data WarehouseInteligencia de Negocios – Data Warehouse
Inteligencia de Negocios – Data Warehouse
JOSE AHIAS LOPEZ PORTILLO
 
Etl datamart multitienda
Etl datamart multitiendaEtl datamart multitienda
Etl datamart multitienda
GallinaSb
 
Minería de datos Presentación
Minería de datos PresentaciónMinería de datos Presentación
Minería de datos Presentación
edmaga
 

Similar a Datawarehouse (20)

2 Desa Sincrono 2 Caso Modelamiento.doc
2 Desa Sincrono 2 Caso Modelamiento.doc2 Desa Sincrono 2 Caso Modelamiento.doc
2 Desa Sincrono 2 Caso Modelamiento.doc
 
Presentación.pdf
Presentación.pdfPresentación.pdf
Presentación.pdf
 
Diseño Dimensional
Diseño DimensionalDiseño Dimensional
Diseño Dimensional
 
Bussines Intelligence
Bussines IntelligenceBussines Intelligence
Bussines Intelligence
 
10Guia2
10Guia210Guia2
10Guia2
 
Entender-la-disminucion-de-visitas-a-tiendas-fisicas.pdf
Entender-la-disminucion-de-visitas-a-tiendas-fisicas.pdfEntender-la-disminucion-de-visitas-a-tiendas-fisicas.pdf
Entender-la-disminucion-de-visitas-a-tiendas-fisicas.pdf
 
2018-06-11 DataviXon-ODHEOIFHPCLDMVC CC .pptx
2018-06-11 DataviXon-ODHEOIFHPCLDMVC CC .pptx2018-06-11 DataviXon-ODHEOIFHPCLDMVC CC .pptx
2018-06-11 DataviXon-ODHEOIFHPCLDMVC CC .pptx
 
Actividad 1 modelo entidad relación- entregable
Actividad 1  modelo entidad relación- entregableActividad 1  modelo entidad relación- entregable
Actividad 1 modelo entidad relación- entregable
 
Mirol Información Gerencial
Mirol Información GerencialMirol Información Gerencial
Mirol Información Gerencial
 
Introduccion a las Bodegas de Datos
Introduccion a las Bodegas de DatosIntroduccion a las Bodegas de Datos
Introduccion a las Bodegas de Datos
 
Modelamiento del Data Warehouse (caso práctico)
Modelamiento del Data Warehouse (caso práctico)Modelamiento del Data Warehouse (caso práctico)
Modelamiento del Data Warehouse (caso práctico)
 
Diseño eficiente de un cubo para resolver problemas en las áreas de negocio
Diseño eficiente de un cubo para resolver problemas en las áreas de negocioDiseño eficiente de un cubo para resolver problemas en las áreas de negocio
Diseño eficiente de un cubo para resolver problemas en las áreas de negocio
 
Coffe Place.docx
Coffe Place.docxCoffe Place.docx
Coffe Place.docx
 
Comercio electrónico el mercado
Comercio electrónico   el mercadoComercio electrónico   el mercado
Comercio electrónico el mercado
 
2018-05-11 Presentación DataviXon (Predictivo Logístico).pptx
2018-05-11 Presentación DataviXon (Predictivo Logístico).pptx2018-05-11 Presentación DataviXon (Predictivo Logístico).pptx
2018-05-11 Presentación DataviXon (Predictivo Logístico).pptx
 
Mercadotecnia detallista (tiendas de autoservicio)
Mercadotecnia detallista (tiendas de autoservicio)Mercadotecnia detallista (tiendas de autoservicio)
Mercadotecnia detallista (tiendas de autoservicio)
 
Multidimensional manager
Multidimensional managerMultidimensional manager
Multidimensional manager
 
Inteligencia de Negocios – Data Warehouse
Inteligencia de Negocios – Data WarehouseInteligencia de Negocios – Data Warehouse
Inteligencia de Negocios – Data Warehouse
 
Etl datamart multitienda
Etl datamart multitiendaEtl datamart multitienda
Etl datamart multitienda
 
Minería de datos Presentación
Minería de datos PresentaciónMinería de datos Presentación
Minería de datos Presentación
 

Último

FICHA TECNICA PRODUCTOS CONGELADOS EMBALAJE.pdf
FICHA TECNICA PRODUCTOS CONGELADOS EMBALAJE.pdfFICHA TECNICA PRODUCTOS CONGELADOS EMBALAJE.pdf
FICHA TECNICA PRODUCTOS CONGELADOS EMBALAJE.pdf
jesus869159
 
NOM-001-SEDE-2012.pdf instalación eléctrica
NOM-001-SEDE-2012.pdf instalación eléctricaNOM-001-SEDE-2012.pdf instalación eléctrica
NOM-001-SEDE-2012.pdf instalación eléctrica
gabyp22
 
DIAGRAMA SIPOC INGENIERIA INDUSTRIAL HERRAMIENTA
DIAGRAMA SIPOC INGENIERIA INDUSTRIAL HERRAMIENTADIAGRAMA SIPOC INGENIERIA INDUSTRIAL HERRAMIENTA
DIAGRAMA SIPOC INGENIERIA INDUSTRIAL HERRAMIENTA
MayDaniel2
 
Dosificacion de hormigon NCH 170 actualizada
Dosificacion de hormigon NCH 170 actualizadaDosificacion de hormigon NCH 170 actualizada
Dosificacion de hormigon NCH 170 actualizada
pipex55
 
Infografia - Hugo Hidalgo - Construcción
Infografia - Hugo Hidalgo - ConstrucciónInfografia - Hugo Hidalgo - Construcción
Infografia - Hugo Hidalgo - Construcción
MaraManuelaUrribarri
 
Infografía de operaciones básicas....pdf
Infografía de operaciones básicas....pdfInfografía de operaciones básicas....pdf
Infografía de operaciones básicas....pdf
jahirrtorresa
 
1. Introduccion a las excavaciones subterraneas (1).pdf
1. Introduccion a las excavaciones subterraneas (1).pdf1. Introduccion a las excavaciones subterraneas (1).pdf
1. Introduccion a las excavaciones subterraneas (1).pdf
raulnilton2018
 
muros de contencion, diseño y generalidades
muros de contencion, diseño y generalidadesmuros de contencion, diseño y generalidades
muros de contencion, diseño y generalidades
AlejandroArturoGutie1
 
Aletas de Transferencia de Calor o Superficies Extendidas.pdf
Aletas de Transferencia de Calor o Superficies Extendidas.pdfAletas de Transferencia de Calor o Superficies Extendidas.pdf
Aletas de Transferencia de Calor o Superficies Extendidas.pdf
JuanAlbertoLugoMadri
 
Medicion-Del-Agua-de-Riego-Aforo 2023.pptx
Medicion-Del-Agua-de-Riego-Aforo 2023.pptxMedicion-Del-Agua-de-Riego-Aforo 2023.pptx
Medicion-Del-Agua-de-Riego-Aforo 2023.pptx
MONICADELROCIOMUNZON1
 
DIAGRAMA ELECTRICOS y circuito electrónicos
DIAGRAMA ELECTRICOS y circuito electrónicosDIAGRAMA ELECTRICOS y circuito electrónicos
DIAGRAMA ELECTRICOS y circuito electrónicos
LuisAngelGuarnizoBet
 
Material magnetismo.pdf material del electromagnetismo con fórmulas
Material magnetismo.pdf material del electromagnetismo con fórmulasMaterial magnetismo.pdf material del electromagnetismo con fórmulas
Material magnetismo.pdf material del electromagnetismo con fórmulas
michiotes33
 
INGLES_LISTA_DE_VOCABULARIO una lista completa
INGLES_LISTA_DE_VOCABULARIO una lista completaINGLES_LISTA_DE_VOCABULARIO una lista completa
INGLES_LISTA_DE_VOCABULARIO una lista completa
JaimmsArthur
 
DIAPOSITIVA DE LA NORMA ISO 22000 EXPOSICI�N.pptx
DIAPOSITIVA DE LA NORMA ISO 22000 EXPOSICI�N.pptxDIAPOSITIVA DE LA NORMA ISO 22000 EXPOSICI�N.pptx
DIAPOSITIVA DE LA NORMA ISO 22000 EXPOSICI�N.pptx
KeylaArlethTorresOrt
 
Cálculo del espesor del conducto forzado
Cálculo del espesor del conducto forzadoCálculo del espesor del conducto forzado
Cálculo del espesor del conducto forzado
KristianSaavedra
 
INVENTARIO CEROO Y DINAMICAA FABRIL.pptx
INVENTARIO CEROO Y DINAMICAA FABRIL.pptxINVENTARIO CEROO Y DINAMICAA FABRIL.pptx
INVENTARIO CEROO Y DINAMICAA FABRIL.pptx
FernandoRodrigoEscal
 
Uso de equipos de protección personal.pptx
Uso de equipos de protección personal.pptxUso de equipos de protección personal.pptx
Uso de equipos de protección personal.pptx
OmarPadillaGarcia
 
Calculo-de-Camaras-Frigorificas.pdf para trabajos
Calculo-de-Camaras-Frigorificas.pdf para trabajosCalculo-de-Camaras-Frigorificas.pdf para trabajos
Calculo-de-Camaras-Frigorificas.pdf para trabajos
JuanCarlos695207
 
Metodología - Proyecto de ingeniería "Dispensador automático"
Metodología - Proyecto de ingeniería "Dispensador automático"Metodología - Proyecto de ingeniería "Dispensador automático"
Metodología - Proyecto de ingeniería "Dispensador automático"
cristiaansabi19
 
Equipo 4. Mezclado de Polímeros quimica de polimeros.pptx
Equipo 4. Mezclado de Polímeros quimica de polimeros.pptxEquipo 4. Mezclado de Polímeros quimica de polimeros.pptx
Equipo 4. Mezclado de Polímeros quimica de polimeros.pptx
angiepalacios6170
 

Último (20)

FICHA TECNICA PRODUCTOS CONGELADOS EMBALAJE.pdf
FICHA TECNICA PRODUCTOS CONGELADOS EMBALAJE.pdfFICHA TECNICA PRODUCTOS CONGELADOS EMBALAJE.pdf
FICHA TECNICA PRODUCTOS CONGELADOS EMBALAJE.pdf
 
NOM-001-SEDE-2012.pdf instalación eléctrica
NOM-001-SEDE-2012.pdf instalación eléctricaNOM-001-SEDE-2012.pdf instalación eléctrica
NOM-001-SEDE-2012.pdf instalación eléctrica
 
DIAGRAMA SIPOC INGENIERIA INDUSTRIAL HERRAMIENTA
DIAGRAMA SIPOC INGENIERIA INDUSTRIAL HERRAMIENTADIAGRAMA SIPOC INGENIERIA INDUSTRIAL HERRAMIENTA
DIAGRAMA SIPOC INGENIERIA INDUSTRIAL HERRAMIENTA
 
Dosificacion de hormigon NCH 170 actualizada
Dosificacion de hormigon NCH 170 actualizadaDosificacion de hormigon NCH 170 actualizada
Dosificacion de hormigon NCH 170 actualizada
 
Infografia - Hugo Hidalgo - Construcción
Infografia - Hugo Hidalgo - ConstrucciónInfografia - Hugo Hidalgo - Construcción
Infografia - Hugo Hidalgo - Construcción
 
Infografía de operaciones básicas....pdf
Infografía de operaciones básicas....pdfInfografía de operaciones básicas....pdf
Infografía de operaciones básicas....pdf
 
1. Introduccion a las excavaciones subterraneas (1).pdf
1. Introduccion a las excavaciones subterraneas (1).pdf1. Introduccion a las excavaciones subterraneas (1).pdf
1. Introduccion a las excavaciones subterraneas (1).pdf
 
muros de contencion, diseño y generalidades
muros de contencion, diseño y generalidadesmuros de contencion, diseño y generalidades
muros de contencion, diseño y generalidades
 
Aletas de Transferencia de Calor o Superficies Extendidas.pdf
Aletas de Transferencia de Calor o Superficies Extendidas.pdfAletas de Transferencia de Calor o Superficies Extendidas.pdf
Aletas de Transferencia de Calor o Superficies Extendidas.pdf
 
Medicion-Del-Agua-de-Riego-Aforo 2023.pptx
Medicion-Del-Agua-de-Riego-Aforo 2023.pptxMedicion-Del-Agua-de-Riego-Aforo 2023.pptx
Medicion-Del-Agua-de-Riego-Aforo 2023.pptx
 
DIAGRAMA ELECTRICOS y circuito electrónicos
DIAGRAMA ELECTRICOS y circuito electrónicosDIAGRAMA ELECTRICOS y circuito electrónicos
DIAGRAMA ELECTRICOS y circuito electrónicos
 
Material magnetismo.pdf material del electromagnetismo con fórmulas
Material magnetismo.pdf material del electromagnetismo con fórmulasMaterial magnetismo.pdf material del electromagnetismo con fórmulas
Material magnetismo.pdf material del electromagnetismo con fórmulas
 
INGLES_LISTA_DE_VOCABULARIO una lista completa
INGLES_LISTA_DE_VOCABULARIO una lista completaINGLES_LISTA_DE_VOCABULARIO una lista completa
INGLES_LISTA_DE_VOCABULARIO una lista completa
 
DIAPOSITIVA DE LA NORMA ISO 22000 EXPOSICI�N.pptx
DIAPOSITIVA DE LA NORMA ISO 22000 EXPOSICI�N.pptxDIAPOSITIVA DE LA NORMA ISO 22000 EXPOSICI�N.pptx
DIAPOSITIVA DE LA NORMA ISO 22000 EXPOSICI�N.pptx
 
Cálculo del espesor del conducto forzado
Cálculo del espesor del conducto forzadoCálculo del espesor del conducto forzado
Cálculo del espesor del conducto forzado
 
INVENTARIO CEROO Y DINAMICAA FABRIL.pptx
INVENTARIO CEROO Y DINAMICAA FABRIL.pptxINVENTARIO CEROO Y DINAMICAA FABRIL.pptx
INVENTARIO CEROO Y DINAMICAA FABRIL.pptx
 
Uso de equipos de protección personal.pptx
Uso de equipos de protección personal.pptxUso de equipos de protección personal.pptx
Uso de equipos de protección personal.pptx
 
Calculo-de-Camaras-Frigorificas.pdf para trabajos
Calculo-de-Camaras-Frigorificas.pdf para trabajosCalculo-de-Camaras-Frigorificas.pdf para trabajos
Calculo-de-Camaras-Frigorificas.pdf para trabajos
 
Metodología - Proyecto de ingeniería "Dispensador automático"
Metodología - Proyecto de ingeniería "Dispensador automático"Metodología - Proyecto de ingeniería "Dispensador automático"
Metodología - Proyecto de ingeniería "Dispensador automático"
 
Equipo 4. Mezclado de Polímeros quimica de polimeros.pptx
Equipo 4. Mezclado de Polímeros quimica de polimeros.pptxEquipo 4. Mezclado de Polímeros quimica de polimeros.pptx
Equipo 4. Mezclado de Polímeros quimica de polimeros.pptx
 

Datawarehouse

  • 2. Hechos Los hechos son transacciones que han ocurrido en algún punto en el pasado, y que es muy poco probable que cambien en el futuro Los hechos se pueden analizar de diferentes formas dependiendo de la información de referencia Los hechos suelen tener pocos atributos, puesto que no tiene datos operacionales
  • 3. Dimensiones Sirven para representar cada uno de los factores por los que se puede analizar un determinado área de negocio Son tablas siempre más pequeñas A menudo se desnormalizan día mes clave_día clave_mesclave_mes mes día clave_día clave_mes mes
  • 4. Hechos y dimensiones Ventas July 2001 M T W T F S S 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 Pc Portátil Ratón FaxTeléfono Sucursales Productos Clientes Fecha
  • 5. Diagramas en estrella Producto Cliente Fecha Sucursal Ventas Tabla de hechos Tablas de dimensión
  • 6. Datos multidimensionales Ventas totales de television en T1. Fecha Producto Tienda suma suma TV VCR PC 1Qtr 2Qtr 3Qtr 4Qtr T1 T2 T3 suma
  • 7. Diseño STAR: pasos a seguir De diagrama E/R surgen múltiples diagramas en estrella Separar en procesos discretos de negocio (hechos) y modelar cada hecho Seleccionar relaciones n:m con atributos numéricos Desnormalizar las tablas de dimensión
  • 8. Diseño STAR: pasos a seguir A BR C S D T E R A B C Fecha Diagrama E/R Diagrama en estrella
  • 9. Diseño de la tabla de hechos Decidir la granularidad de la tabla de hechos Establece lo que significa cada registro de la tabla de hechos Decidir las dimensiones Decidir los hechos de la tabla de hechos Deben ser específicos para la granularidad seleccionada para la tabla de hechos
  • 10. Diseño de la tabla de hechos Identificar el periodo histórico significativo para los distintos procesos y el grado de detalle requerido Eliminar todas las columnas del hecho que no sean requeridas para responder a preguntas de toma de decisiones Ajustar el tamaño de cada columna Usar claves generadas
  • 11. Claves primarias y extranjeras Todas las claves que se utilicen en tablas del Data Warehouse deben ser claves sin significado Nunca se deben usar claves de producción Facilitar los cambios Situaciones “no lo se”, “desconocido” Dimensiones que cambian en el tiempo
  • 12. Aditividad Siempre que sea posible, los hechos de la tabla de hechos deberían elegirse para que sean perfectamente aditivos (se pueden sumar por cualquier dimensión) Las medidas de actividad son generalmente aditivas Las medidas de intensidad no siempre lo son (niveles de inventario, balance de cuentas...)
  • 14. Diseño de las dimensiones Son tablas más pequeñas Desnormalizar si se acceden muy a menudo en las consultas para acelerar el desempeño (Esquemas estrella) Establecer la política para dimensiones cambiantes Actualizar los cambios Atributos valor antiguo – valor nuevo Generar un nuevo código para el nuevo valor
  • 15. Normalización de dimensiones Se dice que una dimensión está “snowflaked” cuando los atributos de baja cardinalidad se llevan a tablas separadas Generalmente no se recomienda A veces se usa para ahorrar espacio de almacenamiento No permite hacer uso de los índices de bitmap Sin embargo existen situaciones (datos demográficos) en las que son aconsejables
  • 16. Diseñar las tablas dimensión Producto Clave_producto SKU Descripcion Clave_marca_comercial Clave_marca_financiera Clave_tipo_embalaje Tamaño Clave_sabor Altura Cantidad_por_caja Marketing Clave_marca_comercial Marca_comercial Clave_categoria_comercial Finanzas Clave_marca_financiera Marca_financiera Clave_categoria_financiera Embalajes Clave_tipo_embalaje Tipo_embalaje Sabores Clave_sabor Sabor Categorias comerciales Clave_categoria_comercial Categoria_comercial Categorias financieras Clave_categoria_financiera Categoria_financiera
  • 17. Diseñar las tablas dimensión Producto Clave_producto SKU Descripción Clave_marca_comercial Clave_marca_financiera Clave_tipo_embalaje Tamaño Clave_sabor Altura Cantidad_por_caja Categoria_comercial Categoria_financiera Marca_financiera Marca_comercial Tipo_embalaje Sabor Tabla de hechos Clave_producto
  • 18. Diseñar las tablas dimensión Cliente Clave cliente (PK) ID_cliente Nombre Dirección Ciudad Departamento Fecha primera compra Score de compra Score de crédito Subdimensión demográfica Departamento Número de segmento Nombre del segmeto Contador del segmento Porcentaje del segmento Ranking del segmento Ventas Clave_cliente Clave_producto
  • 19. Un esquema en estrella Ventas Cod_Fecha Clave_Cliente Clave_Sucursal Clave_Producto unidades precio_unidad ticket Fechas Código Sysdate Día Mes día_semana ___ Sucursal Clave Dirección Segmento Descripción Producto Clave_producto SKU Descripción Clave_marca_comercial Clave_marca_financiera Clave_tipo_embalaje Tamaño Clave_sabor Altura Cantidad_por_caja Categoria_comercial Categoria_financiera Marca_financiera Marca_comercial Tipo_embalaje Sabor Cliente Clave cliente (PK) ID_cliente Nombre Dirección Ciudad Departamento Fecha primera compra Score de compra Score de crédito Subdimensión demográfica Departamento Número de segmento Nombre del segmento Contador del segmento Porcentaje del segmento Ranking del segmento
  • 20. La importancia de los atributos La calidad del Data Warehouse se mide por la calidad de los atributos Descriptivos Completos (sin valores nulos) Indexados Palabras enteras Documentados (metadatos) Calidad asegurada
  • 21. Tabla de fechas Fecha Codigo Día Día semana (numero) Dia semana (nombre) Festivo Mes (numero) Mes (nombre) Fin de semana Dia antes fin de semana .... Sucesos climaticos Codigo_Fecha Codigo de suceso Nombre de suceso Fiestas nacionales Codigo_Fecha Codigo de fiesta Nombre fiesta Fiestas locales Codigo_Fecha Codigo de fiesta Nombre fiesta Sucesos politicos Codigo_Fecha Codigo de suceso Nombre de suceso
  • 22. Dimensión “degenerada” La mayoría de los diseños multidimensionales están alrededor de un documento de control: número de pedido, factura, ticket, ... Generalmente son contenedores de más de un producto Generalmente en estos casos la granularidad de la tabla la marca este número ¿Qué se hace con los números? Se ponen en las tablas pero no tienen una dimensión con la que hacer “join”
  • 23. Aplicación de dimensiones “degeneradas” Ventas Cod_Fecha Cod_Cliente Cod_Sucursal Cod_Producto unidades precio_unidad ticket Cliente Codigo Nombre Sexo Cluster ___ Fechas Codigo Sysdate Día Mes día_semana ___ Producto Codigo Descripción tipo sección Sucursal Codigo Dirección Segmento Descripcion Dimensión degenerada
  • 24. Dimensión “Cajón desastre” En ocasiones se tienen atributos textuales y “flags” de distinta naturaleza que no parecen organizarse de manera coherente La solución no parece sencilla • Dejar los atributos en la tabla de hechos • Hacer dimensiones separadas para cada atributo • Quitar directamente estos atributos La mejor solución es compactarlos todos en lo que se denomina una “junk dimension”
  • 25. Aplicación de dimensión “junk" Gustos Codigo Niños Ascensor Almohada Tipo_cama ___ Cliente Codigo Nombre Fecha_nacimiento Sexo Tipo ___ Fecha Codigo Día Día semana Festivo Mes ___ Sucesos Codigo_Fecha Suceso Politico ___ Reservas Cod_Cliente Cod_Habitacion Cod_Fecha Reserva Gustos días coste descuento Habitacion Codigo Planta Sección Tamaño Cajón desastre
  • 26. Tablas de hechos sin hechos Hay situaciones en las que se tiene en el diseño final una tabla de hechos sin hechos Son situaciones en las que interesa el suceso en sí Afluencia de público Coberturas
  • 27. Tablas de hechos sin hechos Productos en promocion Cod_Fecha Cod_promocion Cod_producto "1" Producto Codigo Nombre Tipo ___ Fecha Codigo Día Día semana Festivo Mes ___ Promocion Codigo Tipo Dias Descripcion
  • 28. Ejercicio a resolver Supónga un hospital en el se ha decidido construir un Data Warehouse para analizar Ocupación Tratamientos Diagnósticos
  • 29. Pasos a seguir Estudiar el problema Determinar los hechos fundamentales a estudiar Para cada hecho Analizar la granularidad del hecho Decidir las dimensiones Diseñar las dimensiones
  • 30. Ocupación de camas July 2001 S M T W T F S 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 Ocupación Pacientes Camas Fecha
  • 31. Tratamientos Tratamientos July 2001 S M T W T F S 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 Pacientes Médicos Fecha Tratamientos
  • 32. Diagnósticos July 2001 S M T W T F S 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 Pacientes Doctores Fecha Diagnósticos Diagnósticos
  • 33. Tabla de ocupaciones Ocupación Cod_Fecha Cod_cama Cod_paciente "1" Paciente Código Nombre Fecha_nacimiento Sexo Identificación ___ Fecha Código Día Día semana Festivo Mes ___ Cama Código Planta Sección Especialidad Sucesos Código_Fecha Epidemia ___ Datos médicod
  • 35. Tabla de tratamientos Tratamiento Código Nombre Presentación Laboratorio Posología Flags_efectos_secundarios Código Exito Problemas gástricos Insomnio Alergia ___ Médico Código Licencia Nombre Fecha_nacimiento Especialidad ___ Fecha Código Día Día semana Festivo Mes ___ Sucesos Código_Fecha Epidemia ___ Tratamientos_realizados Cod_Medico Cod_Paciente Cod_Fecha Cod_Tratamiento NIngreso Costo Número de días Dosis diarias Cod_Junk Paciente Código Nombre Fecha_nacimiento Sexo Fe ___