Este documento describe varias técnicas de minería de datos, incluyendo métodos descriptivos como agrupamiento y reglas de asociación, y métodos predictivos como clasificación, regresión y detección de desviaciones. Explica que la minería de datos ayuda a encontrar patrones e información oculta en grandes conjuntos de datos. También cubre conceptos como árboles de decisión, redes neuronales y el estándar CRISP-DM para proyectos de minería de datos.
2. ¿Que es la
minería de
datos?
El data mining ayuda
a encontrar
información
escondida en los
datos que no siempre
resulta aparente ya
que dado un
gigantesco volumen
de datos existentes y
gran parte del mismo
nunca será analizado.
Provienen de la
inteligencia artificial
y de la propia
estadística.
Se trata de
algoritmos que se
aplican sobre un
conjunto de Datos
con el objetivo de
obtener resultados
3. Técnicas de
minerías de
Datos
Las técnicas de
minería de datos
tienen como ventaja
los siguientes:
Clasificar y
segmentar
datos
Formar
Hipótesis
4. TÉCNICAS DE
MINERÍA DE
DATOS
Las técnicas de
data mining
pueden ser de
dos tipos:
• Métodos Descriptivos
• Métodos Predictivos
• Las redes neuronales
6. Regresión
Lineal
Es una técnica muy utilizada para la formación de relaciones entre los datos
Es un sistema eficaz y rápido
DESVENTAJA
Tiene insuficiencias en los espacios multidisciplinario donde pueden
relacionarse mas de dos variables
7. Árboles de
Decisión
Es un modelo de
predicción que se utiliza
en el campo de la
inteligencia artificial a
partir de una base de
datos donde se
construyen los diagramas
de construcción lógicas.
Es similar a la predicción
Se basa en reglas que
sirven para la
representación de una
serie de condiciones .
9. Agrupamiento
Consiste en agrupar una serie de vectores según determinados
criterios que son a distancia.
Se trata de vectores de entrada que estén cercanos es decir
presenten características en común.
10. Redes
Neuronales
Es un paradigma de aprendizaje y procesamiento automatizado,
su estructura esta diseñada basándose en la forma en que
funciona el sistema nervioso.
Permite interconectar las neuronas en una red que colabora en la
producción de estímulos de salida.
EJEMPLO:
La perceptrón(tipo de red neuronal artificial)
La perceptrón multicapas
Los mapas auto organizados
12. Según el
objetivo los
algoritmos se
clasifican en:
Algoritmos
supervisados
(predicen un dato
desconocido a partir
de datos previos)
Algoritmos no
supervisados
(descubren patrones
y tendencias que
presentan los datos.)
14. Estándar del
Data Mining:
CRRISP-DM
Entender el área y usar data mining para definir
con claridad el problema.
Recolectar y entender los Datos
Preparación de los datos: crear tablas con los
campos deseados, eliminar datos necesarios
Selección de la técnica del modelado: construir
el modelo y probarlo.
Evaluación de los resultados y revisión del
proceso
Despliegue: implementación de un proceso de
data mining repetible.
15. CONCLUSIONES
No obstante, el uso de minería de datos en medicina e investigación es muy
diferente pues no busca, en principio, el beneficio privado sino el bien común.
En este sentido las técnicas de data mining han resultado ser de gran utilidad en
casos como el diagnóstico de enfermedades.
La cantidad de datos que se genera en el día a día ya sea en compras,
transacciones bancarias o navegando por internet. Varias empresas han
observado esta generación de estos se han realizado varios estudios en ellos.
Algunos tan curiosos como uno en el que una cadena de supermercados de
EEUU descubrió que la combinación más habitual de artículos en la cesta de la
compra eran pañales y cerveza (cosa que atribuyeron a los padres solteros). Tras
eso se decidieron a colocar la cerveza al lado de los pañales.