SlideShare una empresa de Scribd logo
1 de 11
CLASIFICACIÓN ANALISIS DE CLUSTER: CLUSTERING
Autor: Tania Solano Zecua
UNIVERSIDAD POLITÉCNICA DE
TLAXCALA
MINERIA DE DATOS
Análisis de Clusters.
El análisis del clúster o clustering, es una colección de métodos estadísticos que
permiten agrupar casos sobre los cuales se miden diferentes variables o características.
Uno de los problemas mas comunes en el análisis de cluster es que no hay una
definición de que es un cluster, lo que a originado a la realización de una gran cantidad
de métodos.
Análisis de Cluster.
Los dos mas grandes grupos de métodos son los jerárquicos y los no jerárquicos
(particionales).
Los métodos jerárquicos se refieren a una dependencia de grupos en un nivel de
jerarquía condiciona la pertenencia a grupos de un nivel superior.
Los métodos no jerárquicos obtienen una sola partición de los datos mediante la
optimización de alguna función adecuada.
Análisis de Cluster.
Clustering (agrupamiento ) : proceso de dividir un conjunto de datos en grupos de tal
manera que cada miembro del grupo quede lo mas cercano a otro y los grupos
diferentes estén lo mas lejano posible a otros donde la distancia este medida con
respecto a las otras variables.
Resumen: Reducir el tamaño de los grandes conjuntos de datos.
Analisis de Cluster.
Los métodos también se conocen como métodos de optimización, otro problema que
estudia el análisis de cluster en la asignación de variables.
Los métodos no jerárquicos utilizan una matriz de datos mientras que los jerárquicos
parten de una matriz de distancias o similaridades
Agrupamiento Clustering.
LOS METODOS NO SUPERVISADOS SE USAN CUANDO:
Recopilar y clasificar manualmente es costoso
La caracterización de los patrones cambia con el tiempo
Permite encontrar caracterizaciones útiles para construir clasificaciones
El descubrimiento de grupos y subgrupos que revele la naturaleza de la estructura del
problema.
Objetivos de Clustering.
El objetivo de este método es obtener conjuntos entre los elementos, de tal manera
que los elementos asignados al conjunto sean similares
Lo importante de agrupar los elementos mediante la clasificación es que son
precisamente los grupos y su pertenencia lo que se requiere determinar (no se sabe ni
como son los grupos ni cuantos son)
Aplicaciones.
Robótica: Utiliza un conjuntos de técnicas y conceptos teóricos comunes, como la
estimación bayesiana técnicas de regresión y clustering para el aprendizaje.
Minería de datos: Utiliza la transformación de los datos al formato requerido.
Investigaciones Espaciales: Para poder clasificar los objetos en estrellas, planetas ,
sistemas, galaxias etc. Con una alta confiabilidad.
Conclusiones.
El clustering es una técnica muy útil para el acceso secuencial de grandes cantidades
de datos.
El clustering se obtiene definiendo un índice clustering para una tabla, el cual determina
el orden secuencial físico en el que se almacenan las filas en los conjuntos de datos.
Esta técnica es importante porque mejora drásticamente el rendimiento del acceso
secuencial, y este tipo de acceso es el mas usado en el procesamiento OLAP.
REFERENCIAS BIBLIOGRAFICAS
Araujo, B. S. (2006). Aprendizaje Automático: Conceptos Básicos y Avanzados.
Obtenido de www.Aspectos prácticos utilizando el software weka.
Orallo, J. H. (2004). Minería de Datos.
Obtenido de www.introduccion a la minería de datos.com

Más contenido relacionado

La actualidad más candente

Expo Simscript
Expo SimscriptExpo Simscript
Expo SimscriptAdaluisa
 
APRENDIZAJE SUPERVISADO Y APRENDIZAJE NO SUPERVISADO
APRENDIZAJE SUPERVISADO Y APRENDIZAJE NO SUPERVISADOAPRENDIZAJE SUPERVISADO Y APRENDIZAJE NO SUPERVISADO
APRENDIZAJE SUPERVISADO Y APRENDIZAJE NO SUPERVISADOsystemprisoners
 
Clases y funciones en java
Clases y funciones en javaClases y funciones en java
Clases y funciones en javaGuille Villaf
 
Herencia y Polimorfismo
Herencia y PolimorfismoHerencia y Polimorfismo
Herencia y Polimorfismonestor_moren
 
Factores que inhiben el facultamiento
Factores que inhiben el facultamientoFactores que inhiben el facultamiento
Factores que inhiben el facultamientojulya29
 
Metricas de Codigo Fuente y Metricas de Prueba
Metricas de Codigo Fuente y Metricas de PruebaMetricas de Codigo Fuente y Metricas de Prueba
Metricas de Codigo Fuente y Metricas de PruebaKevin Castillo
 
Cuadro comparativo de los modelos de proceso del software (1)
Cuadro comparativo  de los modelos de proceso del software (1)Cuadro comparativo  de los modelos de proceso del software (1)
Cuadro comparativo de los modelos de proceso del software (1)Erik Emanuel Amador Saldaña
 
Numeros Pseudo-aleatorios y variables aleatorias
Numeros Pseudo-aleatorios y variables aleatoriasNumeros Pseudo-aleatorios y variables aleatorias
Numeros Pseudo-aleatorios y variables aleatoriasAlberto Carranza Garcia
 
Prueba de huecos o de distancia
Prueba de huecos o de distanciaPrueba de huecos o de distancia
Prueba de huecos o de distanciaalejandro02912010
 
Tipos de datos en MySQL
Tipos de datos en MySQLTipos de datos en MySQL
Tipos de datos en MySQLTotus Muertos
 
Técnicas mineria de datos
Técnicas mineria de datosTécnicas mineria de datos
Técnicas mineria de datoslalopg
 
Tm01 el modelado en el desarrollo de software
Tm01 el modelado en el desarrollo de softwareTm01 el modelado en el desarrollo de software
Tm01 el modelado en el desarrollo de softwareJulio Pari
 
Procesos de software Unidad 2 - Software Enginnering - Ian sommerville
Procesos de software  Unidad 2 - Software Enginnering - Ian sommervilleProcesos de software  Unidad 2 - Software Enginnering - Ian sommerville
Procesos de software Unidad 2 - Software Enginnering - Ian sommervilleMatias Gonzalo Acosta
 

La actualidad más candente (20)

Expo Simscript
Expo SimscriptExpo Simscript
Expo Simscript
 
Metodo Montecarlo
Metodo MontecarloMetodo Montecarlo
Metodo Montecarlo
 
5. Métodos de Prueba de Software
5. Métodos de Prueba de Software5. Métodos de Prueba de Software
5. Métodos de Prueba de Software
 
APRENDIZAJE SUPERVISADO Y APRENDIZAJE NO SUPERVISADO
APRENDIZAJE SUPERVISADO Y APRENDIZAJE NO SUPERVISADOAPRENDIZAJE SUPERVISADO Y APRENDIZAJE NO SUPERVISADO
APRENDIZAJE SUPERVISADO Y APRENDIZAJE NO SUPERVISADO
 
NORMA ISO 90003
NORMA ISO 90003NORMA ISO 90003
NORMA ISO 90003
 
Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
 
Clases y funciones en java
Clases y funciones en javaClases y funciones en java
Clases y funciones en java
 
Simulación - Unidad 2 numeros pseudoaleatorios
Simulación - Unidad 2 numeros pseudoaleatoriosSimulación - Unidad 2 numeros pseudoaleatorios
Simulación - Unidad 2 numeros pseudoaleatorios
 
Herencia y Polimorfismo
Herencia y PolimorfismoHerencia y Polimorfismo
Herencia y Polimorfismo
 
Factores que inhiben el facultamiento
Factores que inhiben el facultamientoFactores que inhiben el facultamiento
Factores que inhiben el facultamiento
 
Metricas de Codigo Fuente y Metricas de Prueba
Metricas de Codigo Fuente y Metricas de PruebaMetricas de Codigo Fuente y Metricas de Prueba
Metricas de Codigo Fuente y Metricas de Prueba
 
Cuadro comparativo de los modelos de proceso del software (1)
Cuadro comparativo  de los modelos de proceso del software (1)Cuadro comparativo  de los modelos de proceso del software (1)
Cuadro comparativo de los modelos de proceso del software (1)
 
Modelos de pronosticos e inventarios
Modelos de pronosticos e inventariosModelos de pronosticos e inventarios
Modelos de pronosticos e inventarios
 
Numeros Pseudo-aleatorios y variables aleatorias
Numeros Pseudo-aleatorios y variables aleatoriasNumeros Pseudo-aleatorios y variables aleatorias
Numeros Pseudo-aleatorios y variables aleatorias
 
Prueba de huecos o de distancia
Prueba de huecos o de distanciaPrueba de huecos o de distancia
Prueba de huecos o de distancia
 
Tipos de datos en MySQL
Tipos de datos en MySQLTipos de datos en MySQL
Tipos de datos en MySQL
 
Técnicas mineria de datos
Técnicas mineria de datosTécnicas mineria de datos
Técnicas mineria de datos
 
Tm01 el modelado en el desarrollo de software
Tm01 el modelado en el desarrollo de softwareTm01 el modelado en el desarrollo de software
Tm01 el modelado en el desarrollo de software
 
Presentacion MSF
Presentacion MSFPresentacion MSF
Presentacion MSF
 
Procesos de software Unidad 2 - Software Enginnering - Ian sommerville
Procesos de software  Unidad 2 - Software Enginnering - Ian sommervilleProcesos de software  Unidad 2 - Software Enginnering - Ian sommerville
Procesos de software Unidad 2 - Software Enginnering - Ian sommerville
 

Similar a Análisis Clustering Métodos Agrupamiento

Similar a Análisis Clustering Métodos Agrupamiento (20)

Aprendizaje no supervisado
Aprendizaje no supervisadoAprendizaje no supervisado
Aprendizaje no supervisado
 
Técnicas de minería de datos
Técnicas de minería de datosTécnicas de minería de datos
Técnicas de minería de datos
 
Estructura del Análisis
Estructura del AnálisisEstructura del Análisis
Estructura del Análisis
 
Técnicas más usadas en la mineria de datos
Técnicas más usadas en la mineria de datosTécnicas más usadas en la mineria de datos
Técnicas más usadas en la mineria de datos
 
Análisis de Datos
Análisis de DatosAnálisis de Datos
Análisis de Datos
 
Estructura del análisis
Estructura del análisis Estructura del análisis
Estructura del análisis
 
628893
628893628893
628893
 
Cluster
ClusterCluster
Cluster
 
Clasificacion Supervisada Y Algoritmos Evolutivos
Clasificacion Supervisada Y Algoritmos EvolutivosClasificacion Supervisada Y Algoritmos Evolutivos
Clasificacion Supervisada Y Algoritmos Evolutivos
 
Técnicas de minería de datos
Técnicas de minería de datosTécnicas de minería de datos
Técnicas de minería de datos
 
Algoritmos de Clasificación
Algoritmos de ClasificaciónAlgoritmos de Clasificación
Algoritmos de Clasificación
 
FUNDAMENTOS Y MÉTODOS DE ANÁLISIS DE REQUERIMIENTOS
FUNDAMENTOS Y MÉTODOS DE ANÁLISIS DE REQUERIMIENTOSFUNDAMENTOS Y MÉTODOS DE ANÁLISIS DE REQUERIMIENTOS
FUNDAMENTOS Y MÉTODOS DE ANÁLISIS DE REQUERIMIENTOS
 
Tecnicas de Agrupamiento
Tecnicas de AgrupamientoTecnicas de Agrupamiento
Tecnicas de Agrupamiento
 
Analisis de los datos
Analisis de los datosAnalisis de los datos
Analisis de los datos
 
Teoría Fundamentada.
Teoría Fundamentada.Teoría Fundamentada.
Teoría Fundamentada.
 
Teoría Fundamentada.
Teoría Fundamentada.Teoría Fundamentada.
Teoría Fundamentada.
 
Metodología Investigación C2
Metodología Investigación C2Metodología Investigación C2
Metodología Investigación C2
 
8. Curso_Proyectos-Adminisitración FGE5 S08.pdf
8. Curso_Proyectos-Adminisitración FGE5 S08.pdf8. Curso_Proyectos-Adminisitración FGE5 S08.pdf
8. Curso_Proyectos-Adminisitración FGE5 S08.pdf
 
Minería de datos
Minería de datosMinería de datos
Minería de datos
 
Clustering Jerarquico
Clustering JerarquicoClustering Jerarquico
Clustering Jerarquico
 

Último

CFRD simplified sequence for Mazar Hydroelectric Project
CFRD simplified sequence for Mazar Hydroelectric ProjectCFRD simplified sequence for Mazar Hydroelectric Project
CFRD simplified sequence for Mazar Hydroelectric ProjectCarlos Delgado
 
4.3 Subestaciones eléctricas componentes principales .pptx
4.3 Subestaciones eléctricas componentes principales .pptx4.3 Subestaciones eléctricas componentes principales .pptx
4.3 Subestaciones eléctricas componentes principales .pptxEfrain Yungan
 
Esmerling de la Cruz (Proyecto de Programación)
Esmerling de la Cruz (Proyecto de Programación)Esmerling de la Cruz (Proyecto de Programación)
Esmerling de la Cruz (Proyecto de Programación)esmerling14
 
LABORATORIO CALIFICADO 01 CONTENIDO DE HUMEDAD MÉTODO DE SECADO AL HORNO.pdf
LABORATORIO CALIFICADO 01 CONTENIDO DE HUMEDAD MÉTODO DE SECADO AL HORNO.pdfLABORATORIO CALIFICADO 01 CONTENIDO DE HUMEDAD MÉTODO DE SECADO AL HORNO.pdf
LABORATORIO CALIFICADO 01 CONTENIDO DE HUMEDAD MÉTODO DE SECADO AL HORNO.pdfPeraltaFrank
 
Proyecto de Base de Datos de César Guzmán
Proyecto de Base de Datos de César GuzmánProyecto de Base de Datos de César Guzmán
Proyecto de Base de Datos de César Guzmáncesarguzmansierra751
 
Historia de la Arquitectura II, 1era actividad..pdf
Historia de la Arquitectura II, 1era actividad..pdfHistoria de la Arquitectura II, 1era actividad..pdf
Historia de la Arquitectura II, 1era actividad..pdfIsbelRodrguez
 
PRIMER Y SEGUNDO TEOREMA DE CASTIGLIANO.pdf
PRIMER Y SEGUNDO TEOREMA DE CASTIGLIANO.pdfPRIMER Y SEGUNDO TEOREMA DE CASTIGLIANO.pdf
PRIMER Y SEGUNDO TEOREMA DE CASTIGLIANO.pdfAuraGabriela2
 
Mano de obra.pdf Curso Costos SENA Colombia
Mano de obra.pdf Curso Costos SENA ColombiaMano de obra.pdf Curso Costos SENA Colombia
Mano de obra.pdf Curso Costos SENA ColombiaCulturaGeneral1
 
Sistema de Base de Datos para renta de trajes
Sistema de Base de Datos para renta de trajesSistema de Base de Datos para renta de trajes
Sistema de Base de Datos para renta de trajesjohannyrmnatejeda
 
5. MATERIAL COMPLEMENTARIO - PPT de la Sesión 02.pptx
5. MATERIAL COMPLEMENTARIO - PPT  de la Sesión 02.pptx5. MATERIAL COMPLEMENTARIO - PPT  de la Sesión 02.pptx
5. MATERIAL COMPLEMENTARIO - PPT de la Sesión 02.pptxJOSLUISCALLATAENRIQU
 
ESTUDIO TÉCNICO DEL PROYECTO DE CREACION DE SOFTWARE PARA MANTENIMIENTO
ESTUDIO TÉCNICO DEL PROYECTO DE CREACION DE SOFTWARE PARA MANTENIMIENTOESTUDIO TÉCNICO DEL PROYECTO DE CREACION DE SOFTWARE PARA MANTENIMIENTO
ESTUDIO TÉCNICO DEL PROYECTO DE CREACION DE SOFTWARE PARA MANTENIMIENTOCamiloSaavedra30
 
La mineralogia y minerales, clasificacion
La mineralogia y minerales, clasificacionLa mineralogia y minerales, clasificacion
La mineralogia y minerales, clasificacionnewspotify528
 
trabajos en altura 2024, sistemas de contencion anticaidas
trabajos en altura 2024, sistemas de contencion anticaidastrabajos en altura 2024, sistemas de contencion anticaidas
trabajos en altura 2024, sistemas de contencion anticaidasNelsonQuispeQuispitu
 
209530529 Licuacion-de-Suelos-en-Arequipa.pdf
209530529 Licuacion-de-Suelos-en-Arequipa.pdf209530529 Licuacion-de-Suelos-en-Arequipa.pdf
209530529 Licuacion-de-Suelos-en-Arequipa.pdfnurix_15
 
LICENCIA DE CONSTRUCCION, Y EDIFICACIONES RESPECTO A LA LEY 29090.pptx
LICENCIA DE CONSTRUCCION, Y EDIFICACIONES RESPECTO A LA LEY 29090.pptxLICENCIA DE CONSTRUCCION, Y EDIFICACIONES RESPECTO A LA LEY 29090.pptx
LICENCIA DE CONSTRUCCION, Y EDIFICACIONES RESPECTO A LA LEY 29090.pptxLucindaMy
 
5.1 MATERIAL COMPLEMENTARIO Sesión 02.pptx
5.1 MATERIAL COMPLEMENTARIO Sesión 02.pptx5.1 MATERIAL COMPLEMENTARIO Sesión 02.pptx
5.1 MATERIAL COMPLEMENTARIO Sesión 02.pptxNayeliZarzosa1
 
01 COSTOS UNITARIOS Y PRESUPUESTO DE OBRA-EXPEDIENTE TECNICO DE OBRA.pptx
01 COSTOS UNITARIOS Y PRESUPUESTO DE OBRA-EXPEDIENTE TECNICO DE OBRA.pptx01 COSTOS UNITARIOS Y PRESUPUESTO DE OBRA-EXPEDIENTE TECNICO DE OBRA.pptx
01 COSTOS UNITARIOS Y PRESUPUESTO DE OBRA-EXPEDIENTE TECNICO DE OBRA.pptxluiscisnerosayala23
 
Centro Integral del Transporte de Metro de Madrid (CIT). Premio COAM 2023
Centro Integral del Transporte de Metro de Madrid (CIT). Premio COAM 2023Centro Integral del Transporte de Metro de Madrid (CIT). Premio COAM 2023
Centro Integral del Transporte de Metro de Madrid (CIT). Premio COAM 2023ANDECE
 
JimyPomalaza vivienda rural huancavelica .pdf
JimyPomalaza vivienda rural huancavelica .pdfJimyPomalaza vivienda rural huancavelica .pdf
JimyPomalaza vivienda rural huancavelica .pdfJimyPomalaza
 
Categorización de las industrias mas relevantes del ecuador.pdf
Categorización de las industrias mas relevantes del ecuador.pdfCategorización de las industrias mas relevantes del ecuador.pdf
Categorización de las industrias mas relevantes del ecuador.pdfAnthony Gualpa
 

Último (20)

CFRD simplified sequence for Mazar Hydroelectric Project
CFRD simplified sequence for Mazar Hydroelectric ProjectCFRD simplified sequence for Mazar Hydroelectric Project
CFRD simplified sequence for Mazar Hydroelectric Project
 
4.3 Subestaciones eléctricas componentes principales .pptx
4.3 Subestaciones eléctricas componentes principales .pptx4.3 Subestaciones eléctricas componentes principales .pptx
4.3 Subestaciones eléctricas componentes principales .pptx
 
Esmerling de la Cruz (Proyecto de Programación)
Esmerling de la Cruz (Proyecto de Programación)Esmerling de la Cruz (Proyecto de Programación)
Esmerling de la Cruz (Proyecto de Programación)
 
LABORATORIO CALIFICADO 01 CONTENIDO DE HUMEDAD MÉTODO DE SECADO AL HORNO.pdf
LABORATORIO CALIFICADO 01 CONTENIDO DE HUMEDAD MÉTODO DE SECADO AL HORNO.pdfLABORATORIO CALIFICADO 01 CONTENIDO DE HUMEDAD MÉTODO DE SECADO AL HORNO.pdf
LABORATORIO CALIFICADO 01 CONTENIDO DE HUMEDAD MÉTODO DE SECADO AL HORNO.pdf
 
Proyecto de Base de Datos de César Guzmán
Proyecto de Base de Datos de César GuzmánProyecto de Base de Datos de César Guzmán
Proyecto de Base de Datos de César Guzmán
 
Historia de la Arquitectura II, 1era actividad..pdf
Historia de la Arquitectura II, 1era actividad..pdfHistoria de la Arquitectura II, 1era actividad..pdf
Historia de la Arquitectura II, 1era actividad..pdf
 
PRIMER Y SEGUNDO TEOREMA DE CASTIGLIANO.pdf
PRIMER Y SEGUNDO TEOREMA DE CASTIGLIANO.pdfPRIMER Y SEGUNDO TEOREMA DE CASTIGLIANO.pdf
PRIMER Y SEGUNDO TEOREMA DE CASTIGLIANO.pdf
 
Mano de obra.pdf Curso Costos SENA Colombia
Mano de obra.pdf Curso Costos SENA ColombiaMano de obra.pdf Curso Costos SENA Colombia
Mano de obra.pdf Curso Costos SENA Colombia
 
Sistema de Base de Datos para renta de trajes
Sistema de Base de Datos para renta de trajesSistema de Base de Datos para renta de trajes
Sistema de Base de Datos para renta de trajes
 
5. MATERIAL COMPLEMENTARIO - PPT de la Sesión 02.pptx
5. MATERIAL COMPLEMENTARIO - PPT  de la Sesión 02.pptx5. MATERIAL COMPLEMENTARIO - PPT  de la Sesión 02.pptx
5. MATERIAL COMPLEMENTARIO - PPT de la Sesión 02.pptx
 
ESTUDIO TÉCNICO DEL PROYECTO DE CREACION DE SOFTWARE PARA MANTENIMIENTO
ESTUDIO TÉCNICO DEL PROYECTO DE CREACION DE SOFTWARE PARA MANTENIMIENTOESTUDIO TÉCNICO DEL PROYECTO DE CREACION DE SOFTWARE PARA MANTENIMIENTO
ESTUDIO TÉCNICO DEL PROYECTO DE CREACION DE SOFTWARE PARA MANTENIMIENTO
 
La mineralogia y minerales, clasificacion
La mineralogia y minerales, clasificacionLa mineralogia y minerales, clasificacion
La mineralogia y minerales, clasificacion
 
trabajos en altura 2024, sistemas de contencion anticaidas
trabajos en altura 2024, sistemas de contencion anticaidastrabajos en altura 2024, sistemas de contencion anticaidas
trabajos en altura 2024, sistemas de contencion anticaidas
 
209530529 Licuacion-de-Suelos-en-Arequipa.pdf
209530529 Licuacion-de-Suelos-en-Arequipa.pdf209530529 Licuacion-de-Suelos-en-Arequipa.pdf
209530529 Licuacion-de-Suelos-en-Arequipa.pdf
 
LICENCIA DE CONSTRUCCION, Y EDIFICACIONES RESPECTO A LA LEY 29090.pptx
LICENCIA DE CONSTRUCCION, Y EDIFICACIONES RESPECTO A LA LEY 29090.pptxLICENCIA DE CONSTRUCCION, Y EDIFICACIONES RESPECTO A LA LEY 29090.pptx
LICENCIA DE CONSTRUCCION, Y EDIFICACIONES RESPECTO A LA LEY 29090.pptx
 
5.1 MATERIAL COMPLEMENTARIO Sesión 02.pptx
5.1 MATERIAL COMPLEMENTARIO Sesión 02.pptx5.1 MATERIAL COMPLEMENTARIO Sesión 02.pptx
5.1 MATERIAL COMPLEMENTARIO Sesión 02.pptx
 
01 COSTOS UNITARIOS Y PRESUPUESTO DE OBRA-EXPEDIENTE TECNICO DE OBRA.pptx
01 COSTOS UNITARIOS Y PRESUPUESTO DE OBRA-EXPEDIENTE TECNICO DE OBRA.pptx01 COSTOS UNITARIOS Y PRESUPUESTO DE OBRA-EXPEDIENTE TECNICO DE OBRA.pptx
01 COSTOS UNITARIOS Y PRESUPUESTO DE OBRA-EXPEDIENTE TECNICO DE OBRA.pptx
 
Centro Integral del Transporte de Metro de Madrid (CIT). Premio COAM 2023
Centro Integral del Transporte de Metro de Madrid (CIT). Premio COAM 2023Centro Integral del Transporte de Metro de Madrid (CIT). Premio COAM 2023
Centro Integral del Transporte de Metro de Madrid (CIT). Premio COAM 2023
 
JimyPomalaza vivienda rural huancavelica .pdf
JimyPomalaza vivienda rural huancavelica .pdfJimyPomalaza vivienda rural huancavelica .pdf
JimyPomalaza vivienda rural huancavelica .pdf
 
Categorización de las industrias mas relevantes del ecuador.pdf
Categorización de las industrias mas relevantes del ecuador.pdfCategorización de las industrias mas relevantes del ecuador.pdf
Categorización de las industrias mas relevantes del ecuador.pdf
 

Análisis Clustering Métodos Agrupamiento

  • 1. CLASIFICACIÓN ANALISIS DE CLUSTER: CLUSTERING Autor: Tania Solano Zecua UNIVERSIDAD POLITÉCNICA DE TLAXCALA MINERIA DE DATOS
  • 2. Análisis de Clusters. El análisis del clúster o clustering, es una colección de métodos estadísticos que permiten agrupar casos sobre los cuales se miden diferentes variables o características. Uno de los problemas mas comunes en el análisis de cluster es que no hay una definición de que es un cluster, lo que a originado a la realización de una gran cantidad de métodos.
  • 3. Análisis de Cluster. Los dos mas grandes grupos de métodos son los jerárquicos y los no jerárquicos (particionales). Los métodos jerárquicos se refieren a una dependencia de grupos en un nivel de jerarquía condiciona la pertenencia a grupos de un nivel superior. Los métodos no jerárquicos obtienen una sola partición de los datos mediante la optimización de alguna función adecuada.
  • 4. Análisis de Cluster. Clustering (agrupamiento ) : proceso de dividir un conjunto de datos en grupos de tal manera que cada miembro del grupo quede lo mas cercano a otro y los grupos diferentes estén lo mas lejano posible a otros donde la distancia este medida con respecto a las otras variables. Resumen: Reducir el tamaño de los grandes conjuntos de datos.
  • 5. Analisis de Cluster. Los métodos también se conocen como métodos de optimización, otro problema que estudia el análisis de cluster en la asignación de variables. Los métodos no jerárquicos utilizan una matriz de datos mientras que los jerárquicos parten de una matriz de distancias o similaridades
  • 6.
  • 7. Agrupamiento Clustering. LOS METODOS NO SUPERVISADOS SE USAN CUANDO: Recopilar y clasificar manualmente es costoso La caracterización de los patrones cambia con el tiempo Permite encontrar caracterizaciones útiles para construir clasificaciones El descubrimiento de grupos y subgrupos que revele la naturaleza de la estructura del problema.
  • 8. Objetivos de Clustering. El objetivo de este método es obtener conjuntos entre los elementos, de tal manera que los elementos asignados al conjunto sean similares Lo importante de agrupar los elementos mediante la clasificación es que son precisamente los grupos y su pertenencia lo que se requiere determinar (no se sabe ni como son los grupos ni cuantos son)
  • 9. Aplicaciones. Robótica: Utiliza un conjuntos de técnicas y conceptos teóricos comunes, como la estimación bayesiana técnicas de regresión y clustering para el aprendizaje. Minería de datos: Utiliza la transformación de los datos al formato requerido. Investigaciones Espaciales: Para poder clasificar los objetos en estrellas, planetas , sistemas, galaxias etc. Con una alta confiabilidad.
  • 10. Conclusiones. El clustering es una técnica muy útil para el acceso secuencial de grandes cantidades de datos. El clustering se obtiene definiendo un índice clustering para una tabla, el cual determina el orden secuencial físico en el que se almacenan las filas en los conjuntos de datos. Esta técnica es importante porque mejora drásticamente el rendimiento del acceso secuencial, y este tipo de acceso es el mas usado en el procesamiento OLAP.
  • 11. REFERENCIAS BIBLIOGRAFICAS Araujo, B. S. (2006). Aprendizaje Automático: Conceptos Básicos y Avanzados. Obtenido de www.Aspectos prácticos utilizando el software weka. Orallo, J. H. (2004). Minería de Datos. Obtenido de www.introduccion a la minería de datos.com