1. Almacenes,
minería y análisis
de datos
Unidad 3. Tecnologías de la información
Equipo 3
Calderón Juárez Edgar Jareth,
Camacho Castro Carina,
Fuentes Cruz Laura Josefina
González Arredondo Rosa Giovanna
Mancilla Ríos Omar
2. ¿Qué es?
por temas, integrada, variable en el tiempo y no volátil
Tecnología
de gestión y análisis de los datos.
Puede definirse como:
BD Transaccionales
INSERT
UPDATE
DELETE
Colección de datos clasificados
READ
READ
Se utiliza como ayuda al proceso de toma de decisiones
por parte de quienes dirigen una organización.
3. Carácteristicas
Integrado
Organizado por temas
Temático
Variable en el tiempo
Mismos tipos de datos en todos
los Depto. de la empresa
Los datos no se eliminan
Diferentes fuentes
Metadatos
No volátil
Datos actualizados para
fines de consulta
4. Funciones
Integración
Separación
Separación de datos según
su uso con propósitos de
análisis y toma de
decisiones
Integración de datos
recolectados de diferentes
sistemas operacionales de
la organización y o fuentes
externas
5. Ventajas
Mejorías notables al trabajar dentro de un proyecto:
Alto retorno de inversión
Ventajas competitivas derivadas de su utilización
Mayor productividad de los responsables de la toma de decisiones
6. Problemas
Problemas de los almacenes de datos
Subestimación de los recursos necesarios para la carga de datos.
Privacidad de los datos.
Altos costes de mantenimiento.
Proyectos de larga duración.
Complejidad de la integración.
7. Componentes
BD *Estaciones de trabajo*Internet
1.
Fuentes de Datos operacionales
2.
Repositorio de datos operacionales (ODS)
3.
Gestor de carga (ó componente de interfaz)
4.
Gestor del almacén de datos:
5.
Gestor de consultas (ó componente de servicio)
6.
Datos detallados
7.
Datos poco resumidos y muy resumidos
8.
Datos de archivo / copia de seguridad
9.
Metadatos
10.
Herramientas de acceso para usuarios finales
Datos actuales e integrados que se utilizan para el análisis.
Operaciones asociadas con la extracción y carga de los datos en el almacén.
Análisis de los datos para garantizar su coherencia, transformación y combinación de datos de origen, creación de índices y vistas.
Dirigir consultas hacia tablas apropiadas y planificar su ejecución.
Consulta y generación de informes
Desarrollo de aplicaciones
Procesamiento analítico en línea (OLAP)
Minería de Datos
9. Herramientas y tecnologías de
1. Herramientas de extracción, limpieza y transformación
2. Sistemas de Gestión de Bases de Datos para almacenes de datos
3. Metadatos de un almacén de datos
4. Herramientas de administración y gestión
10. Almacenes de datos
Un subconjunto de un almacén de datos que
soporta los requisitos de un departamento ó
área de negocios concreto.
Las principales características que diferencian
a los mercados de datos de los almacenes de
datos son:
un mercado de datos se centra únicamente en
los requisitos de los usuarios asociados con un
departamento ó área de negocio concreto;
los mercados de datos no contienen
normalmente datos operacionales detallados,
a diferencia de lo que sucede con los
almacenes de datos;
como los mercados de datos contienen menos
información que un almacén de datos, son más
fáciles de comprender y de utilizar.
13. ¿Qué es?
Minería de datos
La Minería de Datos es la extracción automática de información predictiva escondida desde bases de datos.
La Minería de Datos estudia métodos y algoritmos que permiten la extracción automática de información
sintetizada que permite caracterizar las relaciones escondidas.
14. La Minería de Datos y las Bases de Datos comerciales están
disponibles para resolver problemas de decisión de negocios.
La Minería de Datos es una tecnología que ayuda a enfocarse en la
información más importante en los almacenes de datos.
15. 1. Modelado predictivo
2. Segmentación de la Base de Datos
3. Análisis de enlaces
4. Detección de desviaciones
16. Comprensión del negocio: Se centra en comprender los
requisitos y objetivos del proyecto desde la perspectiva del
negocio.
Comprensión de los datos: Incluye la recopilación inicial de datos
y se preocupa por establecer sus principales características.
Preparación de los datos: Actividades para construir el conjunto
final de datos al que pueden aplicársele las herramientas de
modelado.
Modelado: Propiamente Minería. Implica seleccionar las técnicas
de modelado, los parámetros y evaluar el modelo.
Evaluación: Valida el modelo desde el punto de vista del análisis
de datos.
Implantación: El conocimiento obtenido y reflejado en el modelo
tiene que organizarse y presentarse de una manera comprensible
por parte de los usuarios.
18. 1. Preparación de los datos:
2. Selección de las operaciones (algoritmos) de
minería de datos:
3. Escalabilidad y prestaciones del producto:
4. Funcionalidades
para
comprender
los
resultados, proporcionadas mediante medidas
que describan la precisión y lo significativo de
los datos
20. Ejemplos
APLICACIÓN:VISUAL DATA MINING O MINERÍA DE DATOS VISUAL
Oracle o Microsoft (con SQLServer) tienen herramientas para hacer
minería de datos. También hay herramientas para la minería de datos en el ámbito del
software libre.