Se ha denunciado esta presentación.
Se está descargando tu SlideShare. ×

Técnicas más usadas en la mineria de datos

Anuncio
Anuncio
Anuncio
Anuncio
Anuncio
Anuncio
Anuncio
Anuncio
Anuncio
Anuncio
Anuncio
Anuncio
Próximo SlideShare
Técnicas mineria de datos
Técnicas mineria de datos
Cargando en…3
×

Eche un vistazo a continuación

1 de 12 Anuncio
Anuncio

Más Contenido Relacionado

Presentaciones para usted (19)

Similares a Técnicas más usadas en la mineria de datos (20)

Anuncio

Más reciente (20)

Técnicas más usadas en la mineria de datos

  1. 1. ESCUELA SUPERIOR POLITÉCNICA DE CHIMBORAZO ESTADÍSTICA COMPUTACIONAL TÉCNICAS DE MINERIA DE DATOS TÍTULO
  2. 2. Las técnicas más representativas que se utilizan en la minería de datos son TÉCNICAS DE MINERIA DE DATOS Las técnicas de minería de datos provienen de la inteligencia artificial y de la propia estadística. Se trata de algoritmos que se aplican sobre un conjunto de datos con el objetivo de obtener resultados • Redes neuronales • Árboles de decisión • Algoritmos genéticos • Clustering (agrupamiento) • Aprendizaje automático • Regresión lineal • Reglas de inducción • Modelos estadísticos
  3. 3. Las predictivas y descriptivas se emplean para el descubrimiento, mientras que las técnicas auxiliares se emplean para la verificación. TÉCNICAS DE MINERIA DE DATOS Data Mining permite la entrega de información prospectiva y proactiva, bajo el soporte de tres tecnologías que son: • Recolección masiva de datos. • Potentes computadoras. • Algoritmos de Data Mining.
  4. 4. TÉCNICAS DE MINERIA DE DATOS REDES NEURONALES Esta técnica de inteligencia artificial, en los últimos años se ha convertido en uno de los instrumentos de uso frecuente para detectar categorías comunes en los datos, debido a que son capaces de detectar y aprender complejos patrones, y características de los datos. Además esta técnica posee dos formas de aprendizaje: supervisado y no supervisado. Una de las principales características de las redes neuronales, es que son capaces de trabajar con datos incompletos e incluso paradójicos, que dependiendo del problema puede resultar una ventaja o un inconveniente Algunos ejemplos de red neuronal son: • El perceptrón. • El perceptrón multicapa. • Los mapas autoorganizados, también conocidos como redes de Kohonen.
  5. 5. ÁRBOLES DE DECISIÓN Está técnica se encuentra dentro de una metodología de aprendizaje supervisado. Su representación es en forma de árbol en donde cada nodo es una decisión, los cuales a su vez generan reglas para la clasificación de un conjunto de datos. Los árboles de decisión son fáciles de usar, admiten atributos discretos y continuos, tratan bien los atributos no significativos y los valores faltantes. Su principal ventaja es la facilidad de interpretación ÁRBOLES DE DECISIÓN
  6. 6. ALGORITMOS GENÉTICOS Además los algoritmos genéticos son inspirados en el principio de la supervivencia de los más aptos. Los algoritmos genéticos imitan la evolución de las especies mediante la mutación, reproducción y selección, como también proporcionan programas y optimizaciones que pueden ser usadas en la construcción y entrenamiento de otras estructuras como es el caso de las redes neuronales.
  7. 7. CLUSTERING (Agrupamiento) Agrupan datos dentro de un número de clases preestablecidas o no, partiendo de criterios de distancia o similitud, de manera que las clases sean similares entre sí y distintas con las otras clases. Su utilización ha proporcionado significativos resultados en lo que respecta a los clasificadores o reconocedores de patrones, como en el modelado de sistemas. Este método debido a su naturaleza flexible se puede combinar fácilmente con otro tipo de técnica de minería de datos, dando como resultado un sistema híbrido.
  8. 8. CLUSTERING (Agrupamiento) Un problema relacionado con el análisis de cluster es la selección de factores en tareas de clasificación, debido a que no todas las variables tienen la misma importancia a la hora de agrupar los objetos. Otro problema de gran importancia y que actualmente despierta un gran interés es la fusión de conocimiento, ya que existen múltiples fuentes de información sobre un mismo tema, los cuales no utilizan una categorización homogénea de los objetos. Para poder solucionar estos inconvenientes es necesario fusionar la información a la hora de recopilar, comparar o resumir los datos.
  9. 9. APRENDIZAJE AUTOMÁTICO Esta técnica de inteligencia artificial es utilizada para inferir conocimiento del resultado de la aplicación de alguna de las otras técnicas antes mencionadas. LA REGRESIÓN LINEAL Es una de las técnicas más utilizadas para la formación de relaciones entre datos. Se trata de un sistema rápido y eficaz pero que a su vez cuenta con insuficiencias en los espacios multidisciplinarios donde puedan relacionarse más de 2 variables.
  10. 10. LOS MODELOS ESTADÍSTICOS Consiste en la agrupación de una serie de vectores según determinados criterios que habitualmente son a distancia. Se trata de la disposición de los vectores de entrada de manera que estén más cercanos a los que tengan características comunes. Se trata de una expresión simbólica en forma de igualdad que es empleada en los diseños experimentales y en la regresión, con la intención de identificar los factores que modifican la variable de respuesta EL AGRUPAMIENTO
  11. 11. REGLA DE INDUCCIÓN Consiste en derivar un conjunto de reglas para clasificar casos, generan un conjunto de reglas independientes que permiten contrastar árboles de decisión y patrones a partir de los datos de entrada.
  12. 12. REFERENCIAS BIBLIOGRÁFICAS Recuperado de: https://gamoreno.wordpress.com/2007/10/03/tecnicas-mas-usadas-en-la-mineria-de-datos/ Recuperado de: https://blog.es.logicalis.com/analytics/modelos-de-data-mining-y-las-herramientas-mas- usadas Recuperado de: http://culturacrm.com/data-mining/tecnicas-aplicacion-data-mining/ Recuperado de: http://halweb.uc3m.es/esp/Personal/personas/jmmarin/esp/DM/introduccion-DM.pdf

×