Técnicas más usadas en la mineria de datos

ESCUELA SUPERIOR POLITÉCNICA DE
CHIMBORAZO
ESTADÍSTICA COMPUTACIONAL
TÉCNICAS DE MINERIA DE DATOS
TÍTULO

Las técnicas más representativas que se
utilizan en la minería de datos son
Las técnicas de minería de datos provienen de la
inteligencia artificial y de la propia estadística.
Se trata de algoritmos que se aplican sobre un
conjunto de datos con el objetivo de obtener
resultados
• Redes neuronales
• Árboles de decisión
• Algoritmos genéticos
• Clustering (agrupamiento)
• Aprendizaje automático
• Regresión lineal
• Reglas de inducción
• Modelos estadísticos

Las predictivas y descriptivas se emplean para el
descubrimiento, mientras que las técnicas auxiliares se
emplean para la verificación.
Data Mining permite la entrega de información prospectiva y proactiva,
bajo el soporte de tres tecnologías que son:
• Recolección masiva de datos.
• Potentes computadoras.
• Algoritmos de Data Mining.

REDES NEURONALES
Esta técnica de inteligencia artificial, en los últimos años se ha convertido en uno de los instrumentos de uso
frecuente para detectar categorías comunes en los datos, debido a que son capaces de detectar y aprender
complejos patrones, y características de los datos.
Además esta técnica posee dos formas de aprendizaje:
supervisado y no supervisado.
Una de las principales características de
las redes neuronales, es que son capaces
de trabajar con datos incompletos e
incluso paradójicos, que dependiendo
del problema puede resultar una ventaja
o un inconveniente
Algunos ejemplos de red neuronal son:
• El perceptrón.
• El perceptrón multicapa.
• Los mapas autoorganizados, también conocidos
como redes de Kohonen.

ÁRBOLES DE DECISIÓN
Está técnica se encuentra dentro
de una metodología de
aprendizaje supervisado.
Su representación es en forma de
árbol en donde cada nodo es una
decisión, los cuales a su vez
generan reglas para la clasificación
de un conjunto de datos.
Los árboles de decisión son fáciles
de usar, admiten atributos
discretos y continuos, tratan bien
los atributos no significativos y los
valores faltantes.
Su principal ventaja es la facilidad
de interpretación
ÁRBOLES DE
DECISIÓN

ALGORITMOS GENÉTICOS
Además los algoritmos
genéticos son inspirados en
el principio de la
supervivencia de los más
aptos.
Los algoritmos genéticos
imitan la evolución de las
especies mediante la
mutación, reproducción y
selección, como también
proporcionan programas y
optimizaciones que pueden
ser usadas en la
construcción y
entrenamiento de otras
estructuras como es el caso
de las redes neuronales.

CLUSTERING (Agrupamiento)
Agrupan datos dentro de un número de clases preestablecidas
o no, partiendo de criterios de distancia o similitud, de manera
que las clases sean similares entre sí y distintas con las otras
clases.
Su utilización ha proporcionado significativos resultados en lo
que respecta a los clasificadores o reconocedores de patrones,
como en el modelado de sistemas.
Este método debido a su naturaleza flexible se puede combinar
fácilmente con otro tipo de técnica de minería de datos, dando
como resultado un sistema híbrido.

CLUSTERING (Agrupamiento)
Un problema relacionado con el análisis de cluster es la
selección de factores en tareas de clasificación, debido a que
no todas las variables tienen la misma importancia a la hora de
agrupar los objetos.
Otro problema de gran importancia y que actualmente
despierta un gran interés es la fusión de conocimiento, ya que
existen múltiples fuentes de información sobre un mismo
tema, los cuales no utilizan una categorización homogénea de
los objetos.
Para poder solucionar estos inconvenientes es necesario
fusionar la información a la hora de recopilar, comparar o
resumir los datos.

APRENDIZAJE AUTOMÁTICO
Esta técnica de inteligencia artificial es utilizada
para inferir conocimiento del resultado de la
aplicación de alguna de las otras técnicas antes
mencionadas.
LA REGRESIÓN LINEAL
Es una de las técnicas más utilizadas para la
formación de relaciones entre datos. Se trata de
un sistema rápido y eficaz pero que a su vez
cuenta con insuficiencias en los espacios
multidisciplinarios donde puedan relacionarse
más de 2 variables.

LOS MODELOS ESTADÍSTICOS
Consiste en la agrupación de una serie de vectores según
determinados criterios que habitualmente son a distancia. Se
trata de la disposición de los vectores de entrada de manera
que estén más cercanos a los que tengan características
comunes.
Se trata de una expresión simbólica
en forma de igualdad que es
empleada en los diseños
experimentales y en la regresión, con
la intención de identificar los factores
que modifican la variable de
respuesta
EL AGRUPAMIENTO

REGLA DE INDUCCIÓN
Consiste en derivar un conjunto de reglas para clasificar casos, generan
un conjunto de reglas independientes que permiten contrastar árboles
de decisión y patrones a partir de los datos de entrada.

REFERENCIAS BIBLIOGRÁFICAS
Recuperado de: https://gamoreno.wordpress.com/2007/10/03/tecnicas-mas-usadas-en-la-mineria-de-datos/
Recuperado de: https://blog.es.logicalis.com/analytics/modelos-de-data-mining-y-las-herramientas-mas-
usadas
Recuperado de: http://culturacrm.com/data-mining/tecnicas-aplicacion-data-mining/
Recuperado de: http://halweb.uc3m.es/esp/Personal/personas/jmmarin/esp/DM/introduccion-DM.pdf

Técnicas más usadas en la mineria de datos

Recomendados

Recomendados

Más contenido relacionado

La actualidad más candente

La actualidad más candente (20)

Similar a Técnicas más usadas en la mineria de datos

Similar a Técnicas más usadas en la mineria de datos (20)

Último

Último (20)

Técnicas más usadas en la mineria de datos