El análisis de cluster es un método estadístico que agrupa casos con características similares. Existen dos tipos principales de métodos: jerárquicos y no jerárquicos. Los métodos jerárquicos crean una jerarquía de grupos, mientras que los no jerárquicos obtienen una sola partición optimizando una función. El objetivo del clustering es agrupar elementos similares y determinar los grupos y su pertenencia.
JM HIDROGENO VERDE- OXI-HIDROGENO en calderas - julio 17 del 2023.pdf
Clasificacion analisis de cluster (clustering)
1. CLASIFICACIÓN ANALISIS DE CLUSTER: CLUSTERING
Autor: Tania Solano Zecua
UNIVERSIDAD POLITÉCNICA DE
TLAXCALA
MINERIA DE DATOS
2. Análisis de Clusters.
El análisis del clúster o clustering, es una colección de métodos estadísticos que
permiten agrupar casos sobre los cuales se miden diferentes variables o características.
Uno de los problemas mas comunes en el análisis de cluster es que no hay una
definición de que es un cluster, lo que a originado a la realización de una gran cantidad
de métodos.
3. Análisis de Cluster.
Los dos mas grandes grupos de métodos son los jerárquicos y los no jerárquicos
(particionales).
Los métodos jerárquicos se refieren a una dependencia de grupos en un nivel de
jerarquía condiciona la pertenencia a grupos de un nivel superior.
Los métodos no jerárquicos obtienen una sola partición de los datos mediante la
optimización de alguna función adecuada.
4. Análisis de Cluster.
Clustering (agrupamiento ) : proceso de dividir un conjunto de datos en grupos de tal
manera que cada miembro del grupo quede lo mas cercano a otro y los grupos
diferentes estén lo mas lejano posible a otros donde la distancia este medida con
respecto a las otras variables.
Resumen: Reducir el tamaño de los grandes conjuntos de datos.
5. Analisis de Cluster.
Los métodos también se conocen como métodos de optimización, otro problema que
estudia el análisis de cluster en la asignación de variables.
Los métodos no jerárquicos utilizan una matriz de datos mientras que los jerárquicos
parten de una matriz de distancias o similaridades
6.
7. Agrupamiento Clustering.
LOS METODOS NO SUPERVISADOS SE USAN CUANDO:
Recopilar y clasificar manualmente es costoso
La caracterización de los patrones cambia con el tiempo
Permite encontrar caracterizaciones útiles para construir clasificaciones
El descubrimiento de grupos y subgrupos que revele la naturaleza de la estructura del
problema.
8. Objetivos de Clustering.
El objetivo de este método es obtener conjuntos entre los elementos, de tal manera
que los elementos asignados al conjunto sean similares
Lo importante de agrupar los elementos mediante la clasificación es que son
precisamente los grupos y su pertenencia lo que se requiere determinar (no se sabe ni
como son los grupos ni cuantos son)
9. Aplicaciones.
Robótica: Utiliza un conjuntos de técnicas y conceptos teóricos comunes, como la
estimación bayesiana técnicas de regresión y clustering para el aprendizaje.
Minería de datos: Utiliza la transformación de los datos al formato requerido.
Investigaciones Espaciales: Para poder clasificar los objetos en estrellas, planetas ,
sistemas, galaxias etc. Con una alta confiabilidad.
10. Conclusiones.
El clustering es una técnica muy útil para el acceso secuencial de grandes cantidades
de datos.
El clustering se obtiene definiendo un índice clustering para una tabla, el cual determina
el orden secuencial físico en el que se almacenan las filas en los conjuntos de datos.
Esta técnica es importante porque mejora drásticamente el rendimiento del acceso
secuencial, y este tipo de acceso es el mas usado en el procesamiento OLAP.
11. REFERENCIAS BIBLIOGRAFICAS
Araujo, B. S. (2006). Aprendizaje Automático: Conceptos Básicos y Avanzados.
Obtenido de www.Aspectos prácticos utilizando el software weka.
Orallo, J. H. (2004). Minería de Datos.
Obtenido de www.introduccion a la minería de datos.com