SlideShare una empresa de Scribd logo
ESCUELA SUPERIOR POLITECNICA DE CHIMBORAZO
FACULTAD DE CIENCIAS
ESCUELA DE FÍSICA Y MATEMÁTICA
MINERÍA DE DATOS
TÉCNICAS DE MINERÍA DE DATOS
Las técnicas de minería de datos crean modelos que son
predictivos y/ o descriptivos.
Un modelo predictivo responde preguntas sobre datos futuros.
Un modelo descriptivo proporciona información sobre las
relaciones entre los datos y sus características.
MINERÍA DE DATOS
Predicción
Descubrimiento de
conocimiento
Regresión
Clasificación
Visualización
Detección de
Desviaciones
Clustering
Reglas de
Asociación
FORMAS DE APRENDIZAJE
Cuenta con un conocimiento a priori, al momento de clasificar un
objeto dentro de una categoría o clase contamos con modelos ya
clasificados (objetos agrupados que tienen características
comunes).
Podemos diferenciar dos fases dentro de este tipo de clasificación:
1. Tenemos un conjunto de entrenamiento o de aprendizaje
(para el diseño del clasificador) y otro llamado de test o de
validación (para clasificación), estos nos servirán para
construir un modelo o regla general para la clasificación.
2. El proceso en sí de clasificar los objetos o muestras de las
que se desconoce la clase a las que pertenecen.
SUPERVISADA
O también llamada de clustering. No se cuenta con
conocimiento a priori, por lo que tendremos un área de
entrenamiento disponible para la tarea de clasificación.
En este tipo de clasificación contamos con “objetos” o
muestras que tiene un conjunto de características, de las que
no sabemos a que clase o categoría pertenece.
NO SUPERVISADA
OBJETIVO:Es el descubrimiento de grupos de “objetos” cuyas
características afines nos permitan separar las diferentes
clases.
SUPERVISADAS NO SUPERVISADAS
Árboles de
decisión
Detección de desviaciones
Inducción
neuronal
Segmentación
Regresión Agrupamiento
Series temporales Reglas de asociación
Patrones secuenciales
REDES NEURONALES
Esta técnica de inteligencia artificial, en los últimos años se ha
convertido en uno de los instrumentos de uso frecuente para
detectar categorías comunes en los datos, debido a que son
capaces de detectar y aprender complejos patrones, y
características de los datos.
Una de las principales características de las redes neuronales,
es que son capaces de trabajar con datos incompletos e
incluso paradójicos, que dependiendo del problema puede
resultar una ventaja o un inconveniente. Además esta técnica
posee dos formas de aprendizaje: supervisado y no
supervisado.
ÁRBOLES DE DECISIÓN
Está técnica se encuentra dentro de una metodología de
aprendizaje supervisado. Su representación es en forma de
árbol en donde cada nodo es una decisión, los cuales a su vez
generan reglas para la clasificación de un conjunto de datos.
Los árboles de decisión son fáciles de usar, admiten atributos
discretos y continuos, tratan bien los atributos no
significativos y los valores faltantes. Su principal ventaja es la
facilidad de interpretación.
ALGORITMOS GÉNETICOS
Los algoritmos genéticos imitan la evolución de las especies
mediante la mutación, reproducción y selección, como
también proporcionan programas y optimizaciones que
pueden ser usadas en la construcción y entrenamiento de
otras estructuras como es el caso de las redes neuronales.
Además los algoritmos genéticos son inspirados en el principio
de la supervivencia de los más aptos.
CLUSTERING (Agrupamiento)
Agrupan datos dentro de un número de clases preestablecidas
o no, partiendo de criterios de distancia o similitud, de
manera que las clases sean similares entre sí y distintas con las
otras clases.
Su utilización ha proporcionado significativos resultados en lo
que respecta a los clasificadores o reconocedores de patrones,
como en el modelado de sistemas. Este método debido a su
naturaleza flexible se puede combinar fácilmente con otro tipo
de técnica de minería de datos, dando como resultado un
sistema híbrido.
Problemas en el análisis de cluster
Un problema relacionado con el análisis de cluster es la
selección de factores en tareas de clasificación, debido a que
no todas las variables tienen la misma importancia a la hora
de agrupar los objetos. Otro problema de gran importancia y
que actualmente despierta un gran interés es la fusión de
conocimiento, ya que existen múltiples fuentes de
información sobre un mismo tema, los cuales no utilizan una
categorización homogénea de los objetos. Para poder
solucionar estos inconvenientes es necesario fusionar la
información a la hora de recopilar, comparar o resumir los
datos.
APRENDIZAJE AUTOMÁTICO
Esta técnica de inteligencia artificial es utilizada para inferir
conocimiento del resultado de la aplicación de alguna de las
otras técnicas antes mencionadas.
Análisis de Enlace (Link Analysis)
El análisis de enlace es el proceso de crear redes de objetos
interconectados para explorar patrones y tendencias. Es parte
de una rama de la matemática llamada “teoría de graficas” -
Barry and Linoff, 1997 0 Cada objeto recibe el nombre de
nodo y el enlace se llama conexión. Relación entre artículos
comprados
Predicción
El análisis de predicción está relacionado con las técnicas de
regresión. La idea de este tipo de análisis es descubrir la
relación entre variables ya sean independientes o
dependientes. Por ejemplo, si las ventas son una variable
independiente, entonces el beneficio puede ser una variable
dependiente. Mediante el uso de datos históricos de ambas
ventas y beneficios, las técnicas lineales o no lineales de
regresión pueden producir una curva que permita la
predicción de beneficios en el futuro.
Patrones secuenciales
Estos realizan un análisis que permite encontrar patrones
similares en los datos de transacciones durante un período de
negocio. Los analistas pueden usar estos patrones para
identificar relaciones entre los datos. Los modelos
matemáticos son patrones secuenciales detrás de la lógica
normativa, la lógica difusa u otras. En la fase de minería de
datos, es posible estudiar varias secuencias similares para
identificar las tendencias futuras en el desarrollo de
transacciones. Este enfoque es útil en el tratamiento de bases
de datos con características de series de tiempo.
Naive Bayes
Se trata de una técnica que combina la clasificación y
predicción, con el fin de construir modelos para predecir
posibles resultados a partir de asociaciones en los datos
históricos.
Series de tiempo
Las series de tiempo en la minería de datos permiten buscar
patrones a partir de grandes cantidades de datos. Algunas de
sus variables están en función del tiempo. Esta técnica se
utiliza a partir del comportamiento histórico de los datos, que
permite modelar los componentes básicos de la serie, y así se
logra hacer predicciones.
BIBLIOGRAFÍA:
https://advancedtech.wordpress.com/2008/04/14/clasificacion-supervisada-y-no-supervisada/
Moreno, G. (2007). Técnica más usadas en la minería de datos. Obtenido de:
https://gamoreno.wordpress.com/2007/10/03/tecnicas-mas-usadas-en-la-mineria-de-datos/
Dueñas, M. (2009). Minería de datos espaciales en búsqueda de la verdadera información.
Scielo. Obtenido de: http://www.scielo.org.co/scielo.php?script=sci_arttext&pid=S0123-
21262009000100007
Sánchez, J. (2011). Breve paseo por la Minería de Datos. SlideShare. Obtenido de:
https://es.slideshare.net/jculacio/brevepaseoporla-mineradedatos
Beltrán, B. Minería de datos. Obtenido de: http://bbeltran.cs.buap.mx/NotasMD.pdf

Más contenido relacionado

La actualidad más candente

Aprendizaje no supervisado
Aprendizaje no supervisadoAprendizaje no supervisado
Aprendizaje no supervisado
Jairo Acosta Solano
 
Tareas del mundo real
Tareas del mundo realTareas del mundo real
Tareas del mundo real
Karlos Flores Salinas
 
Sistemas expertos
Sistemas expertosSistemas expertos
Sistemas expertosguest0d7e01
 
Machine learning
Machine learningMachine learning
Machine learning
Enmer Genaro Leandro Ricra
 
Presentacion mineria
Presentacion mineriaPresentacion mineria
Presentacion mineriaviktor93
 
ingenieria del conocimiento
ingenieria del conocimientoingenieria del conocimiento
ingenieria del conocimiento
Facultad de Ciencias y Sistemas
 
Sistemas y Modelos
Sistemas y ModelosSistemas y Modelos
Sistemas y Modelos
AliniuZiz Rguez T
 
Sistemas y Modelos (Teoria)
Sistemas y Modelos (Teoria)Sistemas y Modelos (Teoria)
Sistemas y Modelos (Teoria)
AliniuZiz Rguez T
 
Componentes de un Sistema Experto
Componentes de un Sistema ExpertoComponentes de un Sistema Experto
Componentes de un Sistema ExpertoAnita Vardom
 
Control procesos con redes neuronales
Control procesos con redes neuronalesControl procesos con redes neuronales
Control procesos con redes neuronalesMarcos Diocaretz
 
Clasificación Automática de Documentos
Clasificación Automática de DocumentosClasificación Automática de Documentos
Clasificación Automática de Documentos
nando85
 
Ejmplo para 3ro en blanco
Ejmplo para 3ro en blancoEjmplo para 3ro en blanco
Ejmplo para 3ro en blanco
Victor Manuel Nieto Calderón
 
Modelos de Sistemas
Modelos de SistemasModelos de Sistemas
Modelos de Sistemasjmpov441
 
Metodologia omt
Metodologia omtMetodologia omt
Metodologia omt
Wilfredy Inciarte
 
Teoria fundamentada
Teoria fundamentadaTeoria fundamentada
Teoria fundamentada
Eliana Aguirre Cervantes
 
Proceso de análisis
Proceso de análisisProceso de análisis
Proceso de análisisJesus Peralta
 

La actualidad más candente (18)

Aprendizaje no supervisado
Aprendizaje no supervisadoAprendizaje no supervisado
Aprendizaje no supervisado
 
Tareas del mundo real
Tareas del mundo realTareas del mundo real
Tareas del mundo real
 
Sistemas expertos
Sistemas expertosSistemas expertos
Sistemas expertos
 
Machine learning
Machine learningMachine learning
Machine learning
 
Presentacion mineria
Presentacion mineriaPresentacion mineria
Presentacion mineria
 
ingenieria del conocimiento
ingenieria del conocimientoingenieria del conocimiento
ingenieria del conocimiento
 
Sistemas y Modelos
Sistemas y ModelosSistemas y Modelos
Sistemas y Modelos
 
Sistemas y Modelos (Teoria)
Sistemas y Modelos (Teoria)Sistemas y Modelos (Teoria)
Sistemas y Modelos (Teoria)
 
Componentes de un Sistema Experto
Componentes de un Sistema ExpertoComponentes de un Sistema Experto
Componentes de un Sistema Experto
 
Control procesos con redes neuronales
Control procesos con redes neuronalesControl procesos con redes neuronales
Control procesos con redes neuronales
 
Proceso de análisis
Proceso de análisisProceso de análisis
Proceso de análisis
 
Clasificación Automática de Documentos
Clasificación Automática de DocumentosClasificación Automática de Documentos
Clasificación Automática de Documentos
 
Ejmplo para 3ro en blanco
Ejmplo para 3ro en blancoEjmplo para 3ro en blanco
Ejmplo para 3ro en blanco
 
Modelos de Sistemas
Modelos de SistemasModelos de Sistemas
Modelos de Sistemas
 
Metodologia omt
Metodologia omtMetodologia omt
Metodologia omt
 
TE
TETE
TE
 
Teoria fundamentada
Teoria fundamentadaTeoria fundamentada
Teoria fundamentada
 
Proceso de análisis
Proceso de análisisProceso de análisis
Proceso de análisis
 

Similar a Técnicas de minería de datos

Métodos predictivos y Descriptivos - MINERÍA DE DATOS
Métodos predictivos y Descriptivos - MINERÍA DE DATOSMétodos predictivos y Descriptivos - MINERÍA DE DATOS
Métodos predictivos y Descriptivos - MINERÍA DE DATOS
lalopg
 
Minería de datos
Minería de datosMinería de datos
Minería de datos
anag catal
 
Electiva iii parcial 2 - 02-minería de datos
Electiva iii   parcial 2 - 02-minería de datosElectiva iii   parcial 2 - 02-minería de datos
Electiva iii parcial 2 - 02-minería de datos
Arlin11
 
Data mining
Data miningData mining
Data mining
Checho Fonseca
 
Data mining
Data miningData mining
Data mining
contaduria1234
 
Data mining
Data miningData mining
Data mining
Data miningData mining
Data mining
Karol Pardo
 
Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
Jhon Danny Castro Condor
 
Clasificacion Supervisada Y Algoritmos Evolutivos
Clasificacion Supervisada Y Algoritmos EvolutivosClasificacion Supervisada Y Algoritmos Evolutivos
Clasificacion Supervisada Y Algoritmos Evolutivos
ALONSO UCHIHA
 
Mineria de datos ok
Mineria de datos okMineria de datos ok
Mineria de datos ok
Armando Romani
 
Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
Anyeni Garay
 
Estructura del Análisis
Estructura del AnálisisEstructura del Análisis
Estructura del Análisis
Dra Letty Rangel
 
Mineria de Datos Dialnet.pdf
Mineria de Datos Dialnet.pdfMineria de Datos Dialnet.pdf
Mineria de Datos Dialnet.pdf
VAOC1984
 
Introduccion-de-Machine-Learning-Con-Python (2).pptx
Introduccion-de-Machine-Learning-Con-Python (2).pptxIntroduccion-de-Machine-Learning-Con-Python (2).pptx
Introduccion-de-Machine-Learning-Con-Python (2).pptx
Jorge293
 
Técnicas de minería de datos.
Técnicas de minería de datos. Técnicas de minería de datos.
Técnicas de minería de datos.
Tania Sanchez
 
Unidad 3 paradigmas de la ingeniería del software
Unidad 3 paradigmas de la ingeniería del softwareUnidad 3 paradigmas de la ingeniería del software
Unidad 3 paradigmas de la ingeniería del software
Andhy H Palma
 

Similar a Técnicas de minería de datos (20)

Métodos predictivos y Descriptivos - MINERÍA DE DATOS
Métodos predictivos y Descriptivos - MINERÍA DE DATOSMétodos predictivos y Descriptivos - MINERÍA DE DATOS
Métodos predictivos y Descriptivos - MINERÍA DE DATOS
 
Minería de datos
Minería de datosMinería de datos
Minería de datos
 
Electiva iii parcial 2 - 02-minería de datos
Electiva iii   parcial 2 - 02-minería de datosElectiva iii   parcial 2 - 02-minería de datos
Electiva iii parcial 2 - 02-minería de datos
 
Data mining
Data miningData mining
Data mining
 
Data mining
Data miningData mining
Data mining
 
Data mining
Data miningData mining
Data mining
 
Data mining
Data miningData mining
Data mining
 
Data mining
Data miningData mining
Data mining
 
Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
 
Clasificacion Supervisada Y Algoritmos Evolutivos
Clasificacion Supervisada Y Algoritmos EvolutivosClasificacion Supervisada Y Algoritmos Evolutivos
Clasificacion Supervisada Y Algoritmos Evolutivos
 
Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
 
Mineria de datos ok
Mineria de datos okMineria de datos ok
Mineria de datos ok
 
Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
 
Estructura del Análisis
Estructura del AnálisisEstructura del Análisis
Estructura del Análisis
 
Tema 9 Análisis de datos cualitativos
Tema 9 Análisis de datos cualitativosTema 9 Análisis de datos cualitativos
Tema 9 Análisis de datos cualitativos
 
Instituto universitario politécnico
Instituto universitario politécnicoInstituto universitario politécnico
Instituto universitario politécnico
 
Mineria de Datos Dialnet.pdf
Mineria de Datos Dialnet.pdfMineria de Datos Dialnet.pdf
Mineria de Datos Dialnet.pdf
 
Introduccion-de-Machine-Learning-Con-Python (2).pptx
Introduccion-de-Machine-Learning-Con-Python (2).pptxIntroduccion-de-Machine-Learning-Con-Python (2).pptx
Introduccion-de-Machine-Learning-Con-Python (2).pptx
 
Técnicas de minería de datos.
Técnicas de minería de datos. Técnicas de minería de datos.
Técnicas de minería de datos.
 
Unidad 3 paradigmas de la ingeniería del software
Unidad 3 paradigmas de la ingeniería del softwareUnidad 3 paradigmas de la ingeniería del software
Unidad 3 paradigmas de la ingeniería del software
 

Último

Presentación sobre la geometría, aplicaciones y ramas
Presentación sobre la geometría, aplicaciones y ramasPresentación sobre la geometría, aplicaciones y ramas
Presentación sobre la geometría, aplicaciones y ramas
JosMuoz943377
 
3-Modelamiento de Procesos usando BPMN.ppt
3-Modelamiento de Procesos usando BPMN.ppt3-Modelamiento de Procesos usando BPMN.ppt
3-Modelamiento de Procesos usando BPMN.ppt
nahumrondanurbano
 
Informe de violencia mayo 2024 - Multigremial Mayo.pdf
Informe de violencia mayo 2024 - Multigremial Mayo.pdfInforme de violencia mayo 2024 - Multigremial Mayo.pdf
Informe de violencia mayo 2024 - Multigremial Mayo.pdf
Emisor Digital
 
Instituciones financieras globales por efectivo disponible (2024).pdf
Instituciones financieras globales por efectivo disponible (2024).pdfInstituciones financieras globales por efectivo disponible (2024).pdf
Instituciones financieras globales por efectivo disponible (2024).pdf
JC Díaz Herrera
 
LINEA DE TIEMPO Y PERIODO INTERTESTAMENTARIO
LINEA DE TIEMPO Y PERIODO INTERTESTAMENTARIOLINEA DE TIEMPO Y PERIODO INTERTESTAMENTARIO
LINEA DE TIEMPO Y PERIODO INTERTESTAMENTARIO
AaronPleitez
 
Comunidades virtuales de aprendizaje o educativas E-LEARNING.pdf
Comunidades virtuales de aprendizaje  o educativas E-LEARNING.pdfComunidades virtuales de aprendizaje  o educativas E-LEARNING.pdf
Comunidades virtuales de aprendizaje o educativas E-LEARNING.pdf
brayansangar73
 
Claves Ipsos numero 29 --- Mayo 2024.pdf
Claves Ipsos numero 29 --- Mayo 2024.pdfClaves Ipsos numero 29 --- Mayo 2024.pdf
Claves Ipsos numero 29 --- Mayo 2024.pdf
Emisor Digital
 
DEFENSA NACIONAL.ppt muy fácil de entender
DEFENSA NACIONAL.ppt muy fácil de entenderDEFENSA NACIONAL.ppt muy fácil de entender
DEFENSA NACIONAL.ppt muy fácil de entender
mvargasleveau
 
PPT Interes-Simple-pptx.pptx-ejercicios.
PPT Interes-Simple-pptx.pptx-ejercicios.PPT Interes-Simple-pptx.pptx-ejercicios.
PPT Interes-Simple-pptx.pptx-ejercicios.
MELANYANELKACRUZLEON
 
ACOMPAÑAMIENTO INTEGRAL DE VALORES .pptx
ACOMPAÑAMIENTO INTEGRAL DE VALORES .pptxACOMPAÑAMIENTO INTEGRAL DE VALORES .pptx
ACOMPAÑAMIENTO INTEGRAL DE VALORES .pptx
MelanieYuksselleCarr
 
Países_por_participacion_porcentual_en_el PNB global (2024) .pdf
Países_por_participacion_porcentual_en_el PNB global (2024) .pdfPaíses_por_participacion_porcentual_en_el PNB global (2024) .pdf
Países_por_participacion_porcentual_en_el PNB global (2024) .pdf
JC Díaz Herrera
 
contraguerrilla.pdf sobre anti emboscadas
contraguerrilla.pdf sobre anti emboscadascontraguerrilla.pdf sobre anti emboscadas
contraguerrilla.pdf sobre anti emboscadas
DieguinhoSalazar
 
mapa conceptual y mental para niños de primaria y secundaria
mapa conceptual y mental para niños de primaria y secundariamapa conceptual y mental para niños de primaria y secundaria
mapa conceptual y mental para niños de primaria y secundaria
ManuelAlbertoHeredia1
 
sistema paralingüística fhdjsjsbsnnssnnsbs
sistema paralingüística fhdjsjsbsnnssnnsbssistema paralingüística fhdjsjsbsnnssnnsbs
sistema paralingüística fhdjsjsbsnnssnnsbs
SantiagoMejia99
 
e learning^.pptxdieguearmandozuñiga. Comhot
e learning^.pptxdieguearmandozuñiga. Comhote learning^.pptxdieguearmandozuñiga. Comhot
e learning^.pptxdieguearmandozuñiga. Comhot
diegozuniga768
 
MINEDUC-MINEDUC-2023-00075-A Comité de Padres y Representantes.pdf
MINEDUC-MINEDUC-2023-00075-A Comité de Padres y Representantes.pdfMINEDUC-MINEDUC-2023-00075-A Comité de Padres y Representantes.pdf
MINEDUC-MINEDUC-2023-00075-A Comité de Padres y Representantes.pdf
RicardoNacevilla1
 
Desarrollo de habilidades de pensamiento
Desarrollo de habilidades de pensamientoDesarrollo de habilidades de pensamiento
Desarrollo de habilidades de pensamiento
ManuelaReina3
 
10 colonias - Análisis socio-demográfico 2024.pdf
10 colonias - Análisis socio-demográfico 2024.pdf10 colonias - Análisis socio-demográfico 2024.pdf
10 colonias - Análisis socio-demográfico 2024.pdf
IrapuatoCmovamos
 
REPORTE DE HOMICIDIO DOLOSO-MAYO 2024.pdf
REPORTE DE HOMICIDIO DOLOSO-MAYO 2024.pdfREPORTE DE HOMICIDIO DOLOSO-MAYO 2024.pdf
REPORTE DE HOMICIDIO DOLOSO-MAYO 2024.pdf
IrapuatoCmovamos
 

Último (19)

Presentación sobre la geometría, aplicaciones y ramas
Presentación sobre la geometría, aplicaciones y ramasPresentación sobre la geometría, aplicaciones y ramas
Presentación sobre la geometría, aplicaciones y ramas
 
3-Modelamiento de Procesos usando BPMN.ppt
3-Modelamiento de Procesos usando BPMN.ppt3-Modelamiento de Procesos usando BPMN.ppt
3-Modelamiento de Procesos usando BPMN.ppt
 
Informe de violencia mayo 2024 - Multigremial Mayo.pdf
Informe de violencia mayo 2024 - Multigremial Mayo.pdfInforme de violencia mayo 2024 - Multigremial Mayo.pdf
Informe de violencia mayo 2024 - Multigremial Mayo.pdf
 
Instituciones financieras globales por efectivo disponible (2024).pdf
Instituciones financieras globales por efectivo disponible (2024).pdfInstituciones financieras globales por efectivo disponible (2024).pdf
Instituciones financieras globales por efectivo disponible (2024).pdf
 
LINEA DE TIEMPO Y PERIODO INTERTESTAMENTARIO
LINEA DE TIEMPO Y PERIODO INTERTESTAMENTARIOLINEA DE TIEMPO Y PERIODO INTERTESTAMENTARIO
LINEA DE TIEMPO Y PERIODO INTERTESTAMENTARIO
 
Comunidades virtuales de aprendizaje o educativas E-LEARNING.pdf
Comunidades virtuales de aprendizaje  o educativas E-LEARNING.pdfComunidades virtuales de aprendizaje  o educativas E-LEARNING.pdf
Comunidades virtuales de aprendizaje o educativas E-LEARNING.pdf
 
Claves Ipsos numero 29 --- Mayo 2024.pdf
Claves Ipsos numero 29 --- Mayo 2024.pdfClaves Ipsos numero 29 --- Mayo 2024.pdf
Claves Ipsos numero 29 --- Mayo 2024.pdf
 
DEFENSA NACIONAL.ppt muy fácil de entender
DEFENSA NACIONAL.ppt muy fácil de entenderDEFENSA NACIONAL.ppt muy fácil de entender
DEFENSA NACIONAL.ppt muy fácil de entender
 
PPT Interes-Simple-pptx.pptx-ejercicios.
PPT Interes-Simple-pptx.pptx-ejercicios.PPT Interes-Simple-pptx.pptx-ejercicios.
PPT Interes-Simple-pptx.pptx-ejercicios.
 
ACOMPAÑAMIENTO INTEGRAL DE VALORES .pptx
ACOMPAÑAMIENTO INTEGRAL DE VALORES .pptxACOMPAÑAMIENTO INTEGRAL DE VALORES .pptx
ACOMPAÑAMIENTO INTEGRAL DE VALORES .pptx
 
Países_por_participacion_porcentual_en_el PNB global (2024) .pdf
Países_por_participacion_porcentual_en_el PNB global (2024) .pdfPaíses_por_participacion_porcentual_en_el PNB global (2024) .pdf
Países_por_participacion_porcentual_en_el PNB global (2024) .pdf
 
contraguerrilla.pdf sobre anti emboscadas
contraguerrilla.pdf sobre anti emboscadascontraguerrilla.pdf sobre anti emboscadas
contraguerrilla.pdf sobre anti emboscadas
 
mapa conceptual y mental para niños de primaria y secundaria
mapa conceptual y mental para niños de primaria y secundariamapa conceptual y mental para niños de primaria y secundaria
mapa conceptual y mental para niños de primaria y secundaria
 
sistema paralingüística fhdjsjsbsnnssnnsbs
sistema paralingüística fhdjsjsbsnnssnnsbssistema paralingüística fhdjsjsbsnnssnnsbs
sistema paralingüística fhdjsjsbsnnssnnsbs
 
e learning^.pptxdieguearmandozuñiga. Comhot
e learning^.pptxdieguearmandozuñiga. Comhote learning^.pptxdieguearmandozuñiga. Comhot
e learning^.pptxdieguearmandozuñiga. Comhot
 
MINEDUC-MINEDUC-2023-00075-A Comité de Padres y Representantes.pdf
MINEDUC-MINEDUC-2023-00075-A Comité de Padres y Representantes.pdfMINEDUC-MINEDUC-2023-00075-A Comité de Padres y Representantes.pdf
MINEDUC-MINEDUC-2023-00075-A Comité de Padres y Representantes.pdf
 
Desarrollo de habilidades de pensamiento
Desarrollo de habilidades de pensamientoDesarrollo de habilidades de pensamiento
Desarrollo de habilidades de pensamiento
 
10 colonias - Análisis socio-demográfico 2024.pdf
10 colonias - Análisis socio-demográfico 2024.pdf10 colonias - Análisis socio-demográfico 2024.pdf
10 colonias - Análisis socio-demográfico 2024.pdf
 
REPORTE DE HOMICIDIO DOLOSO-MAYO 2024.pdf
REPORTE DE HOMICIDIO DOLOSO-MAYO 2024.pdfREPORTE DE HOMICIDIO DOLOSO-MAYO 2024.pdf
REPORTE DE HOMICIDIO DOLOSO-MAYO 2024.pdf
 

Técnicas de minería de datos

  • 1. ESCUELA SUPERIOR POLITECNICA DE CHIMBORAZO FACULTAD DE CIENCIAS ESCUELA DE FÍSICA Y MATEMÁTICA MINERÍA DE DATOS
  • 2.
  • 3. TÉCNICAS DE MINERÍA DE DATOS Las técnicas de minería de datos crean modelos que son predictivos y/ o descriptivos. Un modelo predictivo responde preguntas sobre datos futuros. Un modelo descriptivo proporciona información sobre las relaciones entre los datos y sus características.
  • 4. MINERÍA DE DATOS Predicción Descubrimiento de conocimiento Regresión Clasificación Visualización Detección de Desviaciones Clustering Reglas de Asociación
  • 5. FORMAS DE APRENDIZAJE Cuenta con un conocimiento a priori, al momento de clasificar un objeto dentro de una categoría o clase contamos con modelos ya clasificados (objetos agrupados que tienen características comunes). Podemos diferenciar dos fases dentro de este tipo de clasificación: 1. Tenemos un conjunto de entrenamiento o de aprendizaje (para el diseño del clasificador) y otro llamado de test o de validación (para clasificación), estos nos servirán para construir un modelo o regla general para la clasificación. 2. El proceso en sí de clasificar los objetos o muestras de las que se desconoce la clase a las que pertenecen. SUPERVISADA
  • 6. O también llamada de clustering. No se cuenta con conocimiento a priori, por lo que tendremos un área de entrenamiento disponible para la tarea de clasificación. En este tipo de clasificación contamos con “objetos” o muestras que tiene un conjunto de características, de las que no sabemos a que clase o categoría pertenece. NO SUPERVISADA OBJETIVO:Es el descubrimiento de grupos de “objetos” cuyas características afines nos permitan separar las diferentes clases.
  • 7. SUPERVISADAS NO SUPERVISADAS Árboles de decisión Detección de desviaciones Inducción neuronal Segmentación Regresión Agrupamiento Series temporales Reglas de asociación Patrones secuenciales
  • 8. REDES NEURONALES Esta técnica de inteligencia artificial, en los últimos años se ha convertido en uno de los instrumentos de uso frecuente para detectar categorías comunes en los datos, debido a que son capaces de detectar y aprender complejos patrones, y características de los datos. Una de las principales características de las redes neuronales, es que son capaces de trabajar con datos incompletos e incluso paradójicos, que dependiendo del problema puede resultar una ventaja o un inconveniente. Además esta técnica posee dos formas de aprendizaje: supervisado y no supervisado.
  • 9. ÁRBOLES DE DECISIÓN Está técnica se encuentra dentro de una metodología de aprendizaje supervisado. Su representación es en forma de árbol en donde cada nodo es una decisión, los cuales a su vez generan reglas para la clasificación de un conjunto de datos. Los árboles de decisión son fáciles de usar, admiten atributos discretos y continuos, tratan bien los atributos no significativos y los valores faltantes. Su principal ventaja es la facilidad de interpretación.
  • 10. ALGORITMOS GÉNETICOS Los algoritmos genéticos imitan la evolución de las especies mediante la mutación, reproducción y selección, como también proporcionan programas y optimizaciones que pueden ser usadas en la construcción y entrenamiento de otras estructuras como es el caso de las redes neuronales. Además los algoritmos genéticos son inspirados en el principio de la supervivencia de los más aptos.
  • 11. CLUSTERING (Agrupamiento) Agrupan datos dentro de un número de clases preestablecidas o no, partiendo de criterios de distancia o similitud, de manera que las clases sean similares entre sí y distintas con las otras clases. Su utilización ha proporcionado significativos resultados en lo que respecta a los clasificadores o reconocedores de patrones, como en el modelado de sistemas. Este método debido a su naturaleza flexible se puede combinar fácilmente con otro tipo de técnica de minería de datos, dando como resultado un sistema híbrido.
  • 12. Problemas en el análisis de cluster Un problema relacionado con el análisis de cluster es la selección de factores en tareas de clasificación, debido a que no todas las variables tienen la misma importancia a la hora de agrupar los objetos. Otro problema de gran importancia y que actualmente despierta un gran interés es la fusión de conocimiento, ya que existen múltiples fuentes de información sobre un mismo tema, los cuales no utilizan una categorización homogénea de los objetos. Para poder solucionar estos inconvenientes es necesario fusionar la información a la hora de recopilar, comparar o resumir los datos.
  • 13. APRENDIZAJE AUTOMÁTICO Esta técnica de inteligencia artificial es utilizada para inferir conocimiento del resultado de la aplicación de alguna de las otras técnicas antes mencionadas.
  • 14. Análisis de Enlace (Link Analysis) El análisis de enlace es el proceso de crear redes de objetos interconectados para explorar patrones y tendencias. Es parte de una rama de la matemática llamada “teoría de graficas” - Barry and Linoff, 1997 0 Cada objeto recibe el nombre de nodo y el enlace se llama conexión. Relación entre artículos comprados
  • 15. Predicción El análisis de predicción está relacionado con las técnicas de regresión. La idea de este tipo de análisis es descubrir la relación entre variables ya sean independientes o dependientes. Por ejemplo, si las ventas son una variable independiente, entonces el beneficio puede ser una variable dependiente. Mediante el uso de datos históricos de ambas ventas y beneficios, las técnicas lineales o no lineales de regresión pueden producir una curva que permita la predicción de beneficios en el futuro.
  • 16. Patrones secuenciales Estos realizan un análisis que permite encontrar patrones similares en los datos de transacciones durante un período de negocio. Los analistas pueden usar estos patrones para identificar relaciones entre los datos. Los modelos matemáticos son patrones secuenciales detrás de la lógica normativa, la lógica difusa u otras. En la fase de minería de datos, es posible estudiar varias secuencias similares para identificar las tendencias futuras en el desarrollo de transacciones. Este enfoque es útil en el tratamiento de bases de datos con características de series de tiempo.
  • 17. Naive Bayes Se trata de una técnica que combina la clasificación y predicción, con el fin de construir modelos para predecir posibles resultados a partir de asociaciones en los datos históricos.
  • 18. Series de tiempo Las series de tiempo en la minería de datos permiten buscar patrones a partir de grandes cantidades de datos. Algunas de sus variables están en función del tiempo. Esta técnica se utiliza a partir del comportamiento histórico de los datos, que permite modelar los componentes básicos de la serie, y así se logra hacer predicciones.
  • 19. BIBLIOGRAFÍA: https://advancedtech.wordpress.com/2008/04/14/clasificacion-supervisada-y-no-supervisada/ Moreno, G. (2007). Técnica más usadas en la minería de datos. Obtenido de: https://gamoreno.wordpress.com/2007/10/03/tecnicas-mas-usadas-en-la-mineria-de-datos/ Dueñas, M. (2009). Minería de datos espaciales en búsqueda de la verdadera información. Scielo. Obtenido de: http://www.scielo.org.co/scielo.php?script=sci_arttext&pid=S0123- 21262009000100007 Sánchez, J. (2011). Breve paseo por la Minería de Datos. SlideShare. Obtenido de: https://es.slideshare.net/jculacio/brevepaseoporla-mineradedatos Beltrán, B. Minería de datos. Obtenido de: http://bbeltran.cs.buap.mx/NotasMD.pdf