SlideShare una empresa de Scribd logo
1 de 13
1
2ª PARTE
2
Evolución
• 60’s: Informes batch:
• la información es difícil de encontrar y analizar, poco
flexible, se necesita reprogramar técnicamente cada
petición.
• 70’s: Primeros DSS (Decision Support Systems) y
EIS (Executive Information Systems):
• basados en terminal, no integrados con el resto de
herramientas.
• 80’s: Acceso a datos y herramientas de análisis
integradas (conocidas como business intelligent
tools):
• Herramientas de consultas e informes, hojas de cálculo,
interfaces gráficos e integrados, fáciles de usar.
• Acceden a las bases de datos operacionales.
• 90’s: Almacenes de Datos y herramientas OLAP.
• 00’s: Herramientas de Minería de Datos y Simulación.
3
Herramientas para la toma de Decisiones
• ¿Cuál es la diferencia entre EIS (Executive Information
System) y OLAP (On-Line Analyitical Processing)?
• ¿Cuál es la diferencia entre “informes avanzados”
y OLAP?
• ¿Cuál es la diferencia entre OLAP y Minería de
Datos?
• ¿Qué interrelaciones existen entre todas estas
herramientas?
Han aparecido diferentes herramientas de negocio o DSS
que coexisten: EIS, OLAP, consultas & informes, minería
de datos, ...
4
Herramientas para la toma de Decisiones
• Un EIS (Executive Information System) es un sistema de información y un
conjunto de herramientas asociadas:
• Proporciona a los directivos acceso a la información de estado y sus
actividades de gestión.
• Está especializado en analizar el estado diario de la organización (mediante
indicadores clave) para informar rápidamente sobre cambios a los
directivos.
• La información solicitada suele ser, en gran medida, numérica (ventas
semanales, nivel de stocks, balances parciales, etc.) y representada de
forma gráfica al estilo de las hojas de cálculo.
• Las herramientas OLAP (On-Line Analyitical Processing) son más
genéricas:
• Funcionan sobre un sistema de información (transaccional o almacén de
datos)
• Permiten realizar agregaciones y combinaciones de los datos de maneras
mucho más complejas y ambiciosas, con objetivos de análisis más
estratégicos.
¿Cuál es la diferencia entre EIS y OLAP?
5
Herramientas para la toma de Decisiones
• Los sistemas de informes o consultas avanzadas:
• están basados, generalmente, en sistemas relacionales u
objeto-relacionales,
• utilizan los operadores clásicos: concatenación, proyección,
selección, agrupamiento, … (en SQL y extensiones).
• el resultado se presenta de una manera tabular.
• Las herramientas OLAP
• Están basadas, generalmente, en sistemas o interfaces
multidimensionales,
• Utilizando operadores específicos (además de los clásicos):
drill, roll, pivot, slice & dice, …
• El resultado se presenta de una manera matricial o híbrida.
¿Cuál es la diferencia entre “informes avanzados” y
OLAP?
6
Herramientas para la toma de Decisiones
¿Cuál es la diferencia entre OLAP y minería de
datos?
• Las herramientas OLAP
• proporcionan facilidades para “manejar” y “transformar”
los datos.
• producen otros “datos” (más agregados, combinados).
• ayudan a analizar los datos porque producen diferentes
vistas de los mismos.
• Las herramientas de Minería de Datos:
• son muy variadas: permiten “extraer” patrones, modelos,
descubrir relaciones, regularidades, tendencias, etc.
• producen “reglas” o “patrones” (“conocimiento”).
7
Herramientas para la toma de Decisiones
• La aparición de algunas de ellas han hecho cambiar la
manera de trabajar de otras herramientas.
Interrelaciones entre todas estas herramientas?
Base de Datos
Transaccional
Fuentes
Internas
Fuentes
Externas
Fuente de
Datos
Fuente de
Datos 3
HTML
Fuente de
Datos 1
texto
Almacén
de Datos
ETL
Interfaz y
Operadores
Herramientas
de consultas e
informes
Herramientas
EIS
Herramientas
OLAP
Herramientas de
Minería de
Datos
8
Almacenes de Datos (Datawarehouses)
El Data warehouse es ahora el “sistema de
información central” en todo este proceso.
Un almacén de datos es una colección de datos:
• Orientada a un dominio (al tema)
• Integrada
• No volátil
• Variante en el tiempo
• Para ayudar en la toma de decisiones
9
Almacenes de Datos (Datawarehouses)
Actualmente,
• La tecnología OLAP generalmente se asocia a
los almacenes de datos, aunque:
• Podemos tener Almacenes de Datos sin OLAP y
viceversa.
Los almacenes de datos y las técnicas OLAP son
las maneras más efectivas y tecnológicamente
más avanzadas para integrar, transformar y
combinar los datos, para facilitar al usuario o a
otros sistemas el análisis de la información.
10
Minería de Datos (Dataminig)
La Minería de Datos es un conjunto de técnicas de
análisis de datos que permiten:
• Extraer patrones, tendencias y regularidades
para describir y comprender mejor los datos.
• Extraer patrones y tendencias para predecir
comportamientos futuros.
Debido al gran volumen de datos este análisis ya
no puede ser manual (ni incluso facilitado por
herramientas de almacenes de datos y OLAP) sino
que ha de ser (semi-)automático.
11
Minería de Datos (Dataminig)
La Minería de Datos se diferencia claramente del
resto de herramientas en el sentido de que:
• No transforma y Si facilita el acceso a la
información para que el usuario la analice más
fácilmente.
la minería de datos “analiza” los datos
12
Minería de Datos (Dataminig)
• La minería de datos es sólo una etapa del proceso de
extracción de conocimiento a partir de datos.
• Este proceso consta de varias fases:
• Preparación de Datos (selección, limpieza, y transformación),
Minería de Datos, Evaluación, Difusión y Uso de Modelos.
• Incorpora muy diferentes técnicas
• árboles de decisión, regresión lineal, redes neuronales
artificiales, técnicas bayesianas, máquinas de soporte
vectorial, etc.
• de campos diversos:
• aprendizaje automático e I.A., estadística, bases de datos, …
• aborda una tipología variada de problemas:
• clasificación, categorización, estimación/regresión,
agrupamiento, ...
13
Almacenes de Datos y Minería de Datos
• Los almacenes de datos no son imprescindibles
para hacer extracción de conocimiento a partir de
datos.
• se puede hacer minería de datos sobre un simple archivo
de datos.
• Las ventajas de organizar un almacén de datos para
realizar minería de datos se amortizan a medio y
largo plazo cuando:
• tenemos grandes volúmenes de datos, o
• éstos aumentan con el tiempo, o
• provienen de fuentes heterogéneas o
• se van a combinar de maneras arbitrarias y no
predefinidas.
¿Es necesario tener almacenes de datos para realizar
minería de datos?

Más contenido relacionado

La actualidad más candente

Que Es Un Data Warehouse
Que Es Un Data WarehouseQue Es Un Data Warehouse
Que Es Un Data Warehouse
guest10616d
 
Análisis y minería de datos
Análisis y minería de datosAnálisis y minería de datos
Análisis y minería de datos
Yovani Ziork
 
Diseño de almacenes de datos
Diseño de almacenes de datosDiseño de almacenes de datos
Diseño de almacenes de datos
UTPL UTPL
 
DATAWAREHOUSE, importancia del almacén de datos
DATAWAREHOUSE, importancia del almacén de datosDATAWAREHOUSE, importancia del almacén de datos
DATAWAREHOUSE, importancia del almacén de datos
María Isabel Bautista
 
Data mart-data-warehouse-data-mining
Data mart-data-warehouse-data-miningData mart-data-warehouse-data-mining
Data mart-data-warehouse-data-mining
Nintendo
 
Datawarehouse
DatawarehouseDatawarehouse
Datawarehouse
shady85
 
Fundamentos de DataWareHouse - FISI - UNMSM - DataWareHouse
Fundamentos de DataWareHouse - FISI - UNMSM - DataWareHouseFundamentos de DataWareHouse - FISI - UNMSM - DataWareHouse
Fundamentos de DataWareHouse - FISI - UNMSM - DataWareHouse
Julio Pari
 
Reporte bussines Intelligence
Reporte bussines IntelligenceReporte bussines Intelligence
Reporte bussines Intelligence
Flor de la Luz
 

La actualidad más candente (19)

Que Es Un Data Warehouse
Que Es Un Data WarehouseQue Es Un Data Warehouse
Que Es Un Data Warehouse
 
Análisis y minería de datos
Análisis y minería de datosAnálisis y minería de datos
Análisis y minería de datos
 
Diseño de almacenes de datos
Diseño de almacenes de datosDiseño de almacenes de datos
Diseño de almacenes de datos
 
DATAWAREHOUSE, importancia del almacén de datos
DATAWAREHOUSE, importancia del almacén de datosDATAWAREHOUSE, importancia del almacén de datos
DATAWAREHOUSE, importancia del almacén de datos
 
Data mart-data-warehouse-data-mining
Data mart-data-warehouse-data-miningData mart-data-warehouse-data-mining
Data mart-data-warehouse-data-mining
 
Desarrollo si y base datos
Desarrollo si y base datosDesarrollo si y base datos
Desarrollo si y base datos
 
Datawarehouse
DatawarehouseDatawarehouse
Datawarehouse
 
Datawarehouse
DatawarehouseDatawarehouse
Datawarehouse
 
Fundamentos de DataWareHouse - FISI - UNMSM - DataWareHouse
Fundamentos de DataWareHouse - FISI - UNMSM - DataWareHouseFundamentos de DataWareHouse - FISI - UNMSM - DataWareHouse
Fundamentos de DataWareHouse - FISI - UNMSM - DataWareHouse
 
Reporte bussines Intelligence
Reporte bussines IntelligenceReporte bussines Intelligence
Reporte bussines Intelligence
 
On-Line Analytical Processing - DatawareHouse FISI - UNMSM
On-Line Analytical Processing - DatawareHouse FISI - UNMSMOn-Line Analytical Processing - DatawareHouse FISI - UNMSM
On-Line Analytical Processing - DatawareHouse FISI - UNMSM
 
Diapositivas olap
Diapositivas olapDiapositivas olap
Diapositivas olap
 
Fuentes de datos
Fuentes de datosFuentes de datos
Fuentes de datos
 
Arquitectura de un dw
Arquitectura de un dwArquitectura de un dw
Arquitectura de un dw
 
Data warehouse
Data warehouseData warehouse
Data warehouse
 
Actividades iniciales
Actividades inicialesActividades iniciales
Actividades iniciales
 
Introduccion datawarehouse
Introduccion datawarehouseIntroduccion datawarehouse
Introduccion datawarehouse
 
Data warehouse
Data warehouseData warehouse
Data warehouse
 
Aplicaciones Difusas: Evolución de las Bases de Datos
Aplicaciones Difusas: Evolución de las Bases de DatosAplicaciones Difusas: Evolución de las Bases de Datos
Aplicaciones Difusas: Evolución de las Bases de Datos
 

Similar a Tema 2 parte ii datawarehouse y-datamining 2018

Manual Analysis Services
Manual Analysis ServicesManual Analysis Services
Manual Analysis Services
brobelo
 
Data mart-data-warehouse-data-mining
Data mart-data-warehouse-data-miningData mart-data-warehouse-data-mining
Data mart-data-warehouse-data-mining
Nintendo
 

Similar a Tema 2 parte ii datawarehouse y-datamining 2018 (20)

MINERIA DE DATOS
MINERIA DE DATOSMINERIA DE DATOS
MINERIA DE DATOS
 
Seminario BI CLEFormación
Seminario BI CLEFormaciónSeminario BI CLEFormación
Seminario BI CLEFormación
 
Sistemas
 Sistemas Sistemas
Sistemas
 
Manual Analysis Services
Manual Analysis ServicesManual Analysis Services
Manual Analysis Services
 
BI - Componentes de BI.pptx
BI - Componentes de BI.pptxBI - Componentes de BI.pptx
BI - Componentes de BI.pptx
 
Capitulo 2 introducción al business intelligence
Capitulo 2   introducción al business intelligenceCapitulo 2   introducción al business intelligence
Capitulo 2 introducción al business intelligence
 
Data warehouse in R
Data warehouse in RData warehouse in R
Data warehouse in R
 
Gestión de datos: 5 tendencias para lograr el cambio
Gestión de datos: 5 tendencias para lograr el cambioGestión de datos: 5 tendencias para lograr el cambio
Gestión de datos: 5 tendencias para lograr el cambio
 
Componentes de Business Intelligence
Componentes de Business IntelligenceComponentes de Business Intelligence
Componentes de Business Intelligence
 
Data mart-data-warehouse-data-mining
Data mart-data-warehouse-data-miningData mart-data-warehouse-data-mining
Data mart-data-warehouse-data-mining
 
sistema de información gerencial
sistema de información gerencial sistema de información gerencial
sistema de información gerencial
 
Sistemas de informacion diseño de si
Sistemas de informacion   diseño de siSistemas de informacion   diseño de si
Sistemas de informacion diseño de si
 
Fundamentos teóricos de los almacenes de datos. Metodologías y herramientas p...
Fundamentos teóricos de los almacenes de datos. Metodologías y herramientas p...Fundamentos teóricos de los almacenes de datos. Metodologías y herramientas p...
Fundamentos teóricos de los almacenes de datos. Metodologías y herramientas p...
 
ALMACEN DE DATOS.pptx
ALMACEN DE DATOS.pptxALMACEN DE DATOS.pptx
ALMACEN DE DATOS.pptx
 
Datawarehouse
DatawarehouseDatawarehouse
Datawarehouse
 
Almacenes de datos
Almacenes de datosAlmacenes de datos
Almacenes de datos
 
Grupo eGlu Bi
Grupo eGlu BiGrupo eGlu Bi
Grupo eGlu Bi
 
OLAP
OLAPOLAP
OLAP
 
Diapositivas olap
Diapositivas olapDiapositivas olap
Diapositivas olap
 
Proyecto: Herramientas de Informática I.
Proyecto: Herramientas de Informática I.Proyecto: Herramientas de Informática I.
Proyecto: Herramientas de Informática I.
 

Último

Proyecto de aprendizaje dia de la madre MINT.pdf
Proyecto de aprendizaje dia de la madre MINT.pdfProyecto de aprendizaje dia de la madre MINT.pdf
Proyecto de aprendizaje dia de la madre MINT.pdf
patriciaines1993
 

Último (20)

Linea del tiempo - Filosofos Cristianos.docx
Linea del tiempo - Filosofos Cristianos.docxLinea del tiempo - Filosofos Cristianos.docx
Linea del tiempo - Filosofos Cristianos.docx
 
Usos y desusos de la inteligencia artificial en revistas científicas
Usos y desusos de la inteligencia artificial en revistas científicasUsos y desusos de la inteligencia artificial en revistas científicas
Usos y desusos de la inteligencia artificial en revistas científicas
 
TIENDAS MASS MINIMARKET ESTUDIO DE MERCADO
TIENDAS MASS MINIMARKET ESTUDIO DE MERCADOTIENDAS MASS MINIMARKET ESTUDIO DE MERCADO
TIENDAS MASS MINIMARKET ESTUDIO DE MERCADO
 
Proyecto de aprendizaje dia de la madre MINT.pdf
Proyecto de aprendizaje dia de la madre MINT.pdfProyecto de aprendizaje dia de la madre MINT.pdf
Proyecto de aprendizaje dia de la madre MINT.pdf
 
ACERTIJO LA RUTA DEL MARATÓN OLÍMPICO DEL NÚMERO PI EN PARÍS. Por JAVIER SOL...
ACERTIJO LA RUTA DEL MARATÓN OLÍMPICO DEL NÚMERO PI EN  PARÍS. Por JAVIER SOL...ACERTIJO LA RUTA DEL MARATÓN OLÍMPICO DEL NÚMERO PI EN  PARÍS. Por JAVIER SOL...
ACERTIJO LA RUTA DEL MARATÓN OLÍMPICO DEL NÚMERO PI EN PARÍS. Por JAVIER SOL...
 
Biografía de Charles Coulomb física .pdf
Biografía de Charles Coulomb física .pdfBiografía de Charles Coulomb física .pdf
Biografía de Charles Coulomb física .pdf
 
Louis Jean François Lagrenée. Erotismo y sensualidad. El erotismo en la Hist...
Louis Jean François Lagrenée.  Erotismo y sensualidad. El erotismo en la Hist...Louis Jean François Lagrenée.  Erotismo y sensualidad. El erotismo en la Hist...
Louis Jean François Lagrenée. Erotismo y sensualidad. El erotismo en la Hist...
 
AEC 2. Aventura en el Antiguo Egipto.pptx
AEC 2. Aventura en el Antiguo Egipto.pptxAEC 2. Aventura en el Antiguo Egipto.pptx
AEC 2. Aventura en el Antiguo Egipto.pptx
 
PP_Comunicacion en Salud: Objetivación de signos y síntomas
PP_Comunicacion en Salud: Objetivación de signos y síntomasPP_Comunicacion en Salud: Objetivación de signos y síntomas
PP_Comunicacion en Salud: Objetivación de signos y síntomas
 
Sesión de clase APC: Los dos testigos.pdf
Sesión de clase APC: Los dos testigos.pdfSesión de clase APC: Los dos testigos.pdf
Sesión de clase APC: Los dos testigos.pdf
 
LA LITERATURA DEL BARROCO 2023-2024pptx.pptx
LA LITERATURA DEL BARROCO 2023-2024pptx.pptxLA LITERATURA DEL BARROCO 2023-2024pptx.pptx
LA LITERATURA DEL BARROCO 2023-2024pptx.pptx
 
Prueba libre de Geografía para obtención título Bachillerato - 2024
Prueba libre de Geografía para obtención título Bachillerato - 2024Prueba libre de Geografía para obtención título Bachillerato - 2024
Prueba libre de Geografía para obtención título Bachillerato - 2024
 
Feliz Día de la Madre - 5 de Mayo, 2024.pdf
Feliz Día de la Madre - 5 de Mayo, 2024.pdfFeliz Día de la Madre - 5 de Mayo, 2024.pdf
Feliz Día de la Madre - 5 de Mayo, 2024.pdf
 
SISTEMA RESPIRATORIO PARA NIÑOS PRIMARIA
SISTEMA RESPIRATORIO PARA NIÑOS PRIMARIASISTEMA RESPIRATORIO PARA NIÑOS PRIMARIA
SISTEMA RESPIRATORIO PARA NIÑOS PRIMARIA
 
Supuestos_prácticos_funciones.docx
Supuestos_prácticos_funciones.docxSupuestos_prácticos_funciones.docx
Supuestos_prácticos_funciones.docx
 
SESION DE PERSONAL SOCIAL. La convivencia en familia 22-04-24 -.doc
SESION DE PERSONAL SOCIAL.  La convivencia en familia 22-04-24  -.docSESION DE PERSONAL SOCIAL.  La convivencia en familia 22-04-24  -.doc
SESION DE PERSONAL SOCIAL. La convivencia en familia 22-04-24 -.doc
 
FUERZA Y MOVIMIENTO ciencias cuarto basico.ppt
FUERZA Y MOVIMIENTO ciencias cuarto basico.pptFUERZA Y MOVIMIENTO ciencias cuarto basico.ppt
FUERZA Y MOVIMIENTO ciencias cuarto basico.ppt
 
Revista Apuntes de Historia. Mayo 2024.pdf
Revista Apuntes de Historia. Mayo 2024.pdfRevista Apuntes de Historia. Mayo 2024.pdf
Revista Apuntes de Historia. Mayo 2024.pdf
 
Desarrollo y Aplicación de la Administración por Valores
Desarrollo y Aplicación de la Administración por ValoresDesarrollo y Aplicación de la Administración por Valores
Desarrollo y Aplicación de la Administración por Valores
 
Los avatares para el juego dramático en entornos virtuales
Los avatares para el juego dramático en entornos virtualesLos avatares para el juego dramático en entornos virtuales
Los avatares para el juego dramático en entornos virtuales
 

Tema 2 parte ii datawarehouse y-datamining 2018

  • 2. 2 Evolución • 60’s: Informes batch: • la información es difícil de encontrar y analizar, poco flexible, se necesita reprogramar técnicamente cada petición. • 70’s: Primeros DSS (Decision Support Systems) y EIS (Executive Information Systems): • basados en terminal, no integrados con el resto de herramientas. • 80’s: Acceso a datos y herramientas de análisis integradas (conocidas como business intelligent tools): • Herramientas de consultas e informes, hojas de cálculo, interfaces gráficos e integrados, fáciles de usar. • Acceden a las bases de datos operacionales. • 90’s: Almacenes de Datos y herramientas OLAP. • 00’s: Herramientas de Minería de Datos y Simulación.
  • 3. 3 Herramientas para la toma de Decisiones • ¿Cuál es la diferencia entre EIS (Executive Information System) y OLAP (On-Line Analyitical Processing)? • ¿Cuál es la diferencia entre “informes avanzados” y OLAP? • ¿Cuál es la diferencia entre OLAP y Minería de Datos? • ¿Qué interrelaciones existen entre todas estas herramientas? Han aparecido diferentes herramientas de negocio o DSS que coexisten: EIS, OLAP, consultas & informes, minería de datos, ...
  • 4. 4 Herramientas para la toma de Decisiones • Un EIS (Executive Information System) es un sistema de información y un conjunto de herramientas asociadas: • Proporciona a los directivos acceso a la información de estado y sus actividades de gestión. • Está especializado en analizar el estado diario de la organización (mediante indicadores clave) para informar rápidamente sobre cambios a los directivos. • La información solicitada suele ser, en gran medida, numérica (ventas semanales, nivel de stocks, balances parciales, etc.) y representada de forma gráfica al estilo de las hojas de cálculo. • Las herramientas OLAP (On-Line Analyitical Processing) son más genéricas: • Funcionan sobre un sistema de información (transaccional o almacén de datos) • Permiten realizar agregaciones y combinaciones de los datos de maneras mucho más complejas y ambiciosas, con objetivos de análisis más estratégicos. ¿Cuál es la diferencia entre EIS y OLAP?
  • 5. 5 Herramientas para la toma de Decisiones • Los sistemas de informes o consultas avanzadas: • están basados, generalmente, en sistemas relacionales u objeto-relacionales, • utilizan los operadores clásicos: concatenación, proyección, selección, agrupamiento, … (en SQL y extensiones). • el resultado se presenta de una manera tabular. • Las herramientas OLAP • Están basadas, generalmente, en sistemas o interfaces multidimensionales, • Utilizando operadores específicos (además de los clásicos): drill, roll, pivot, slice & dice, … • El resultado se presenta de una manera matricial o híbrida. ¿Cuál es la diferencia entre “informes avanzados” y OLAP?
  • 6. 6 Herramientas para la toma de Decisiones ¿Cuál es la diferencia entre OLAP y minería de datos? • Las herramientas OLAP • proporcionan facilidades para “manejar” y “transformar” los datos. • producen otros “datos” (más agregados, combinados). • ayudan a analizar los datos porque producen diferentes vistas de los mismos. • Las herramientas de Minería de Datos: • son muy variadas: permiten “extraer” patrones, modelos, descubrir relaciones, regularidades, tendencias, etc. • producen “reglas” o “patrones” (“conocimiento”).
  • 7. 7 Herramientas para la toma de Decisiones • La aparición de algunas de ellas han hecho cambiar la manera de trabajar de otras herramientas. Interrelaciones entre todas estas herramientas? Base de Datos Transaccional Fuentes Internas Fuentes Externas Fuente de Datos Fuente de Datos 3 HTML Fuente de Datos 1 texto Almacén de Datos ETL Interfaz y Operadores Herramientas de consultas e informes Herramientas EIS Herramientas OLAP Herramientas de Minería de Datos
  • 8. 8 Almacenes de Datos (Datawarehouses) El Data warehouse es ahora el “sistema de información central” en todo este proceso. Un almacén de datos es una colección de datos: • Orientada a un dominio (al tema) • Integrada • No volátil • Variante en el tiempo • Para ayudar en la toma de decisiones
  • 9. 9 Almacenes de Datos (Datawarehouses) Actualmente, • La tecnología OLAP generalmente se asocia a los almacenes de datos, aunque: • Podemos tener Almacenes de Datos sin OLAP y viceversa. Los almacenes de datos y las técnicas OLAP son las maneras más efectivas y tecnológicamente más avanzadas para integrar, transformar y combinar los datos, para facilitar al usuario o a otros sistemas el análisis de la información.
  • 10. 10 Minería de Datos (Dataminig) La Minería de Datos es un conjunto de técnicas de análisis de datos que permiten: • Extraer patrones, tendencias y regularidades para describir y comprender mejor los datos. • Extraer patrones y tendencias para predecir comportamientos futuros. Debido al gran volumen de datos este análisis ya no puede ser manual (ni incluso facilitado por herramientas de almacenes de datos y OLAP) sino que ha de ser (semi-)automático.
  • 11. 11 Minería de Datos (Dataminig) La Minería de Datos se diferencia claramente del resto de herramientas en el sentido de que: • No transforma y Si facilita el acceso a la información para que el usuario la analice más fácilmente. la minería de datos “analiza” los datos
  • 12. 12 Minería de Datos (Dataminig) • La minería de datos es sólo una etapa del proceso de extracción de conocimiento a partir de datos. • Este proceso consta de varias fases: • Preparación de Datos (selección, limpieza, y transformación), Minería de Datos, Evaluación, Difusión y Uso de Modelos. • Incorpora muy diferentes técnicas • árboles de decisión, regresión lineal, redes neuronales artificiales, técnicas bayesianas, máquinas de soporte vectorial, etc. • de campos diversos: • aprendizaje automático e I.A., estadística, bases de datos, … • aborda una tipología variada de problemas: • clasificación, categorización, estimación/regresión, agrupamiento, ...
  • 13. 13 Almacenes de Datos y Minería de Datos • Los almacenes de datos no son imprescindibles para hacer extracción de conocimiento a partir de datos. • se puede hacer minería de datos sobre un simple archivo de datos. • Las ventajas de organizar un almacén de datos para realizar minería de datos se amortizan a medio y largo plazo cuando: • tenemos grandes volúmenes de datos, o • éstos aumentan con el tiempo, o • provienen de fuentes heterogéneas o • se van a combinar de maneras arbitrarias y no predefinidas. ¿Es necesario tener almacenes de datos para realizar minería de datos?