c3.hu3.p1.p3.El ser humano como ser histórico.pptx
Análisis de las soluciones y herramientas tecnológicas disponibles parte 2
1. Etapas de construcción de un
datawarehouse
Captura o exhibición de los datos de las fuentes
seleccionadas
Se utilizan herramientas de extracción que
soportan múltiples formatos de
almacenamiento, para luego incorporarlos en el
datawarehouse.
2. Tratamiento, conversión y transformación de los
datos
Detectar y corregir errores
Eliminar duplicados
Detectar y eliminar datos sin sentidos
Analizar la consistencia en el uso de los valores
Codificar sexo
Utilizar mismas unidades de medidas
Formatos de fechas
Direcciones
3. Añadir la referencia temporal a los datos capturados
Tratamiento de la ausencia de los valores
Asignar valores por defecto a determinados campos
Eliminar campos no significativos
Reestructurar y añadir nuevos campos
Enriquecer los datos con mas información fundamental
Incorporar datos estadísticos de instituciones
Cualificar la base de datos por variables socio-
demográficos o información adicional sobre empresas.
4. Normalizar determinados campos
Normalización de nombre de clientes
Normalización de nombre de ciudades, países, etc.
Codificar campos para facilitar su tratamiento
estadístico
Convertir direcciones en códigos de area
Traducir fechas de nacimiento en intervalos de
edades
Codificar al actividad empresarial o profesional de los
clientes
5. Calculo de campos derivados
Calculo de subtotales y datos contables
Filtrado y depuración de registros
Depurar a clientes y clientes potenciales de acuerdo
con la relación que tienen ante la empresa
6. Carga en el sistema gestor de datos del
Datawarehouse
7. Administración
Data Warehouse
- Código de pedido.
- Código de cliente. Clientes.
- Fecha. Extracción, transf Productos.
- referencias de ormación y carga
Ventas.
productos, cantidades y Inventarios.
precios. Precio.
- Importe total.
Marketing
- Identificador del
cliente. Producción
- Perfil del cliente.
- Historial de quejas y -Referencia de producto.
reclamaciones. - Stock.
- Solicitudes de - Unidades producidas.
información. - Unidades
demandadas.
- Coste.
- Precio de venta.
8. Sistema Gestor de Datos en un
Datawarehouse
Capacidad para recibir o enviar datos.
Capacidad para gestionar varios volúmenes de
datos.
Registro de metadatos que faciliten la explotación
del sistema.
Registro de datos con varios niveles de detalle.
9. Utilización eficaz de gran cantidad de índices.
Optimización del espacio de almacenamiento
disponible.
Interfaz con multitud de herramientas y lenguajes
de consulta.
10. Tipos de sistemas de gestión de base de datos.
Base de datos relacional tradicional.
Base de datos relacional con un diseño en estrella.
Base de datos multidimensional.
11. Base de Datos Relacional tradicional.
Se usa para construir Datawarehouse de tamaño
relativamente pequeño.
Limitación al numero de índices creados en la base
de datos.
Datos no volátiles.
No es posible optimizar el almacenamiento físico
de los datos.
12. Base de datos relacional con un diseño en estrella.
Consiste básicamente en utilizar estructuras de
datos no normalizadas.
Esto ayuda a agilizar consultas y operaciones.
13. Base de Datos Multidimensional
Se almacenan los datos en cubos
multidimensionales.
Ocupan gran espacio.
14.
15. Explotación del Datawarehouse
Herramientas de generación de consultas
(“Queries and Reporting”)
Análisis Multidimensional (OLAP: On Line
Analytical Processing)
Herramientas de Datamining
16. Herramientas de generación de consultas
(“Queries and Reporting”)
Son las clásicas herramientas de generación de
consultas e informes de los sistemas de base de
datos.
17. Análisis Multidimensional (OLAP: On Line
Analytical Processing)
Son herramientas que facilitan el análisis de los
datos a través de dimensiones y de jerarquías.
18. Herramientas de Datamining
Son técnicas avanzadas que permiten detectar y modelizar
relaciones entre datos y obtener información no evidente.
19. Tecnología necesarias para los sistemas de
Datawarehousing
Requieren equipos de altas prestaciones para
poder manejar grandes volúmenes de datos con
rapidez y eficacia.
Existen 2 tipos de arquitecturas de servidores:
SMP (Symmetric Multiprocessing)
MPP (Massively Parallel)
22. Herramientas de análisis de datos OLAP
Dimensiones: grupos conceptuales que permiten
analizar o consolidad datos.
Medidas o indicadores: valores numéricos que se
guardan en la base da datos.
Jerarquía de dimensiones: distintos niveles de
agregación.
23. Herramientas de Datamining
Constituyen métodos avanzados para explorar y
modelizar relaciones en grandes volúmenes de
datos.
Muestreo.
Exploración.
Modificación.
Modelización del comportamiento.
Evaluación.
Presentación grafica de los resultados.