El análisis de conglomerados jerárquico permite agrupar casos o variables de forma gradual hasta formar un único conglomerado. Comienza calculando las distancias entre todos los elementos y fusionando los más cercanos, creando conglomerados cada vez mayores. Muestra el proceso de fusión paso a paso y los resultados pueden usarse para identificar el número óptimo de grupos en los datos.
El documento describe el procedimiento de análisis de conglomerados de K medias en SPSS. Explica que este método agrupa casos basándose en su similitud en variables seleccionadas. Requiere que el usuario especifique previamente el número K de conglomerados deseados. Asigna cada caso al conglomerado cuyo centroide es más cercano, iterando hasta ubicar los centroides de forma óptima.
El documento discute las diferentes fuentes de incertidumbre que deben considerarse al realizar cálculos de incertidumbre en análisis químico. Explica que la incertidumbre depende de factores como la repetibilidad, calibración, derivas instrumentales, personal, materiales y magnitudes de influencia. También cubre diferentes tipos de estimaciones de incertidumbre (tipo A y tipo B) y cómo componer las contribuciones de múltiples fuentes.
Este documento presenta los objetivos y materiales de laboratorio necesarios para la Práctica 1 de Química. Los objetivos incluyen identificar material de laboratorio, preparar disoluciones, medir densidades y crear una recta de calibrado. Se describen varios instrumentos de laboratorio como balanzas, matraces y mecheros y sus funciones. La práctica involucra preparar disoluciones de sacarosa, medir sus densidades, crear una recta de calibrado y usarla para determinar las concentraciones de disoluciones problema.
Este documento describe diferentes métodos analíticos instrumentales como cromatografía de gases, espectrometría de absorción atómica y espectrometría de masas. Explica la importancia de utilizar patrones de calibración con concentraciones conocidas para establecer la relación entre la señal instrumental y la concentración del analito y poder determinar concentraciones desconocidas en muestras. También destaca la necesidad de que los patrones tengan matrices similares a las muestras para evitar interferencias.
En esta experiencia se conoció el uso del
material volumétrico y la balanza analítica;
también se aprendió a calibrar cada uno de
ellos, utilizando un volumen de agua y
repitiendo cada una de las pesadas, en el caso
de la balanza utilizamos diferentes monedas
para aprender a utilizarla. Posteriormente se
recogieron los datos y se procedió a calcular el
promedio, desviación estándar y coeficiente de
variación. Mediante el cálculo de estos
verificamos los errores que se cometieron
durante la medición de cada uno de los
instrumentos.
Este documento establece dos métodos para determinar el oxígeno disuelto en aguas naturales y residuales. Describe los principios del método electrométrico y del método de azida modificada, incluyendo los reactivos necesarios para cada método. También define varios términos técnicos relacionados con el análisis químico del agua como calibración, precisión, trazabilidad y parámetros.
Este documento establece dos métodos para determinar el oxígeno disuelto en aguas naturales y residuales: el método electrométrico que utiliza electrodos sensibles al oxígeno, y el método yodométrico que involucra la titulación de yodo producido por la reacción del oxígeno disuelto. También define varios términos relacionados con el análisis de agua y describe los reactivos necesarios para ambos métodos, incluyendo disoluciones estándar de tiosulfato de sodio y biy
El documento describe diferentes técnicas de análisis químico multivariante. Explica que la quimiometría utiliza métodos matemáticos y estadísticos para diseñar experimentos óptimos y extraer la máxima información de los datos químicos. Luego describe técnicas univariantes para un solo analito y bivariantes para dos variables. Finalmente, se enfoca en técnicas multivariantes como análisis factorial, regresión y redes neuronales para reducir dimensiones de conjuntos de datos complejos con múltiples variables.
El documento describe el procedimiento de análisis de conglomerados de K medias en SPSS. Explica que este método agrupa casos basándose en su similitud en variables seleccionadas. Requiere que el usuario especifique previamente el número K de conglomerados deseados. Asigna cada caso al conglomerado cuyo centroide es más cercano, iterando hasta ubicar los centroides de forma óptima.
El documento discute las diferentes fuentes de incertidumbre que deben considerarse al realizar cálculos de incertidumbre en análisis químico. Explica que la incertidumbre depende de factores como la repetibilidad, calibración, derivas instrumentales, personal, materiales y magnitudes de influencia. También cubre diferentes tipos de estimaciones de incertidumbre (tipo A y tipo B) y cómo componer las contribuciones de múltiples fuentes.
Este documento presenta los objetivos y materiales de laboratorio necesarios para la Práctica 1 de Química. Los objetivos incluyen identificar material de laboratorio, preparar disoluciones, medir densidades y crear una recta de calibrado. Se describen varios instrumentos de laboratorio como balanzas, matraces y mecheros y sus funciones. La práctica involucra preparar disoluciones de sacarosa, medir sus densidades, crear una recta de calibrado y usarla para determinar las concentraciones de disoluciones problema.
Este documento describe diferentes métodos analíticos instrumentales como cromatografía de gases, espectrometría de absorción atómica y espectrometría de masas. Explica la importancia de utilizar patrones de calibración con concentraciones conocidas para establecer la relación entre la señal instrumental y la concentración del analito y poder determinar concentraciones desconocidas en muestras. También destaca la necesidad de que los patrones tengan matrices similares a las muestras para evitar interferencias.
En esta experiencia se conoció el uso del
material volumétrico y la balanza analítica;
también se aprendió a calibrar cada uno de
ellos, utilizando un volumen de agua y
repitiendo cada una de las pesadas, en el caso
de la balanza utilizamos diferentes monedas
para aprender a utilizarla. Posteriormente se
recogieron los datos y se procedió a calcular el
promedio, desviación estándar y coeficiente de
variación. Mediante el cálculo de estos
verificamos los errores que se cometieron
durante la medición de cada uno de los
instrumentos.
Este documento establece dos métodos para determinar el oxígeno disuelto en aguas naturales y residuales. Describe los principios del método electrométrico y del método de azida modificada, incluyendo los reactivos necesarios para cada método. También define varios términos técnicos relacionados con el análisis químico del agua como calibración, precisión, trazabilidad y parámetros.
Este documento establece dos métodos para determinar el oxígeno disuelto en aguas naturales y residuales: el método electrométrico que utiliza electrodos sensibles al oxígeno, y el método yodométrico que involucra la titulación de yodo producido por la reacción del oxígeno disuelto. También define varios términos relacionados con el análisis de agua y describe los reactivos necesarios para ambos métodos, incluyendo disoluciones estándar de tiosulfato de sodio y biy
El documento describe diferentes técnicas de análisis químico multivariante. Explica que la quimiometría utiliza métodos matemáticos y estadísticos para diseñar experimentos óptimos y extraer la máxima información de los datos químicos. Luego describe técnicas univariantes para un solo analito y bivariantes para dos variables. Finalmente, se enfoca en técnicas multivariantes como análisis factorial, regresión y redes neuronales para reducir dimensiones de conjuntos de datos complejos con múltiples variables.
Este documento trata sobre la metrología en el laboratorio enológico. Explica los conceptos básicos de medición cualitativa y cuantitativa, unidades de medida, magnitudes y unidades básicas del Sistema Internacional. También describe los principios y procedimientos de medida, así como los tipos de errores y cómo reducir la incertidumbre a través de la calibración, trazabilidad y especificidad del método.
El documento describe los parámetros requeridos para la validación de métodos analíticos según la Organización Mundial de la Salud y la Farmacopea de los Estados Unidos. Explica características como la exactitud, precisión, especificidad, límites de detección y cuantificación. Además, cubre temas como la transferencia de métodos, linealidad, robustez y la relación entre la exactitud y precisión.
Composición cuantitativa de las sustancias y reacciones químicas entre las mi...Carlos Murillo
El documento describe conceptos fundamentales de la composición cuantitativa de sustancias y reacciones químicas. Explica que el mol es la unidad de cantidad de sustancia y equivale a 6,022x1023 unidades, como átomos. También define la masa molar como la masa en gramos de un mol de una sustancia, y la composición porcentual como el porcentaje de masa de cada elemento en un compuesto.
El documento describe el procedimiento para calibrar una balanza analítica utilizando pesas patrones de 25 a 300 gramos. Incluye limpiar y preparar la balanza y pesas, realizar múltiples mediciones con cada peso y registrar los resultados, y calcular valores como la media, desviación estándar y corrección. El objetivo es ajustar la balanza para análisis de control de calidad.
El documento describe los procedimientos para calibrar una balanza analítica utilizando pesas patrones de 25 a 300 gramos. Explica cómo limpiar y nivelar la balanza, realizar múltiples lecturas con cada pesa, calcular valores estadísticos y correcciones, e incluir los resultados en un certificado de calibración.
El documento describe la calibración de materiales volumétricos y balanzas analíticas realizada en un laboratorio. Se calibró una balanza analítica, un balón aforado de 25 mL y una pipeta de 10 mL para determinar factores de corrección. La balanza, el balón y la pipeta tuvieron correcciones de ±0,04, ±0,03 y ±0,013 respectivamente. Los resultados permiten incrementar la precisión de los instrumentos para su uso futuro en prácticas de laboratorio.
Tema12 calibrado de intrumentos de laboratorioVanesa Agudo
Este documento trata sobre la calibración de materiales de laboratorio como pipetas, buretas y matraces aforados. Explica la importancia de la calibración para lograr precisión y exactitud en los ensayos químicos. También describe conceptos como precisión, exactitud, errores absolutos y relativos, y los criterios y métodos para calibrar correctamente este tipo de material de laboratorio.
El documento describe los fundamentos de la viscosidad y los diferentes equipos para medirla, incluyendo el viscosímetro Brookfield disponible en la universidad. Explica que la viscosidad mide la resistencia interna de los líquidos al flujo y depende de la temperatura y la presión. Luego resume el funcionamiento y uso del viscosímetro Brookfield, el cual mide el par de torsión necesario para hacer girar un husillo en la muestra a una velocidad constante.
Este documento proporciona una introducción a los métodos volumétricos de análisis químico cuantitativo. Explica conceptos clave como valoraciones, reactivos primarios y secundarios, y clasificaciones de valoraciones. También describe los requisitos de las reacciones volumétricas, incluida la estequiometría, y los métodos para detectar el punto final, como indicadores visuales y métodos eléctricos.
Este documento describe el uso de balanzas analíticas y técnicas para pesar sustancias como sal y agua. Explica las características y usos de cada tipo de balanza, así como los procedimientos para su uso correcto y preciso. Se detallan los pasos para determinar el peso de las sustancias mediante el uso de ambas balanzas y comparar los resultados obtenidos.
Este documento propone un método compuesto de cinco fases para validar técnicas volumétricas. La primera fase implica análisis realizados por un único operador. La segunda fase implica análisis de muestras preparadas por otro operador. La tercera fase implica análisis de matrices reales. La cuarta fase determina la robustez del método ante pequeñas variaciones. La quinta fase implica ensayos de colaboración con otros laboratorios. El método busca eliminar errores sistemáticos y valid
Este documento presenta los resultados de una práctica de laboratorio sobre medidas de peso y volumen. Los estudiantes pesaron varios objetos utilizando una balanza y midieron volúmenes con probetas y pipetas. Aprendieron sobre la importancia de la precisión al medir y sobre el funcionamiento de los instrumentos de laboratorio. Los resultados mostraron que la balanza analítica es más precisa que la granataria y que es necesario tarar el peso del recipiente antes de pesar una sustancia.
Este documento describe la calibración de una balanza analítica mediante la medición de monedas colombianas de diferentes denominaciones y años. Se realizaron pesadas directas e indirectas de las monedas y se analizaron los resultados estadísticamente para determinar la precisión y exactitud de cada método. Adicionalmente, se midió la masa de un picnómetro vacío y lleno de agua para evaluar la calibración de la balanza.
Este documento describe el proceso de calibración de un matraz volumétrico de 25 mL y de pipetas volumétricas de 1 mL y 5 mL. Se realizaron pesadas repetidas de los instrumentos vacíos y llenos para determinar sus volúmenes reales. Los datos se analizaron estadísticamente para calcular valores como el promedio, desviación estándar y error relativo, con el fin de evaluar la precisión de las mediciones. Los resultados mostraron que los instrumentos fueron calibrados con éxito para su uso en análisis químic
Control del Proceso en la Disolucion de la Muetsra por VHmeryrosas
El documento proporciona información sobre el control del proceso de disolución de muestras por vía húmeda. Explica conceptos clave como toma de muestra, tratamiento de muestra, medida y tratamiento de datos. También clasifica los métodos analíticos y describe etapas como la introducción, puesta en disolución y preparación de la muestra para su análisis.
Este documento describe diferentes tipos de sensores de nivel utilizados en la industria. Explica que los sensores de nivel miden la altura de un líquido o sólido en un tanque y que existen sensores que miden directamente el nivel, la presión hidrostática, el desplazamiento de un flotador, o que aprovechan las propiedades eléctricas del material. Luego describe en detalle varios tipos específicos de sensores, incluyendo sensores de sonda, cristal, manométricos, de burbujeo
Este documento describe los pasos para realizar un análisis de conglomerados jerárquicos y un análisis de k-medias en SPSS. Explica cómo seleccionar las variables, elegir los métodos de agregación y distancia, y generar dendogramas y perfiles de medias para interpretar los resultados. También muestra cómo crear nuevas variables que asignen cada sujeto a un conglomerado para soluciones con diferentes números de grupos.
Se trata del análisis factorial, en el anpalisis psicométrico de insteumentos de investigación, lo cual es util para lograr una correcta recolecion de datos paraser analizados posteriormente
Este documento describe el procedimiento de análisis factorial, una técnica de reducción de datos que busca encontrar grupos homogéneos de variables a partir de un conjunto numeroso de variables. El análisis factorial consta de cuatro fases: cálculo de una matriz de variabilidad conjunta, extracción del número óptimo de factores, rotación de la solución y estimación de puntuaciones de sujetos en las nuevas dimensiones. El documento explica cómo ejecutar un análisis factorial en SPSS y analiza los resultados de un ejemplo con variables laborales.
El documento describe el procedimiento de análisis factorial, una técnica de reducción de datos que busca grupos homogéneos de variables y reducir el número de dimensiones necesarias para explicar los datos. El análisis factorial consta de cuatro fases: cálculo de una matriz de varianzas-covarianzas, extracción de factores, rotación de la solución y estimación de puntuaciones factoriales. Se provee un ejemplo utilizando variables laborales para comprobar si es posible resumir la información en factores.
Análisis estadístico de acumulación de tolerancias.bryansk7
Este documento resume diferentes métodos para el análisis de acumulación de tolerancias como el método Montecarlo y el método RSS. Explica cómo calcular las tolerancias de los componentes dados los requerimientos de tolerancia del ensamblaje final usando fórmulas como la fórmula RSS de asignación de parte. También describe el método Montecarlo y diferencia entre sujetadores flotantes y fijos.
El documento describe el análisis de conglomerados (cluster analysis), incluyendo las etapas del proceso, diferentes algoritmos como el agrupamiento jerárquico y k-medias, y ejemplos de su aplicación en investigación de mercados. El análisis de conglomerados agrupa casos basados en variables para identificar grupos homogéneos. Se utiliza comúnmente para segmentar mercados de consumidores con comportamientos similares.
Este documento trata sobre la metrología en el laboratorio enológico. Explica los conceptos básicos de medición cualitativa y cuantitativa, unidades de medida, magnitudes y unidades básicas del Sistema Internacional. También describe los principios y procedimientos de medida, así como los tipos de errores y cómo reducir la incertidumbre a través de la calibración, trazabilidad y especificidad del método.
El documento describe los parámetros requeridos para la validación de métodos analíticos según la Organización Mundial de la Salud y la Farmacopea de los Estados Unidos. Explica características como la exactitud, precisión, especificidad, límites de detección y cuantificación. Además, cubre temas como la transferencia de métodos, linealidad, robustez y la relación entre la exactitud y precisión.
Composición cuantitativa de las sustancias y reacciones químicas entre las mi...Carlos Murillo
El documento describe conceptos fundamentales de la composición cuantitativa de sustancias y reacciones químicas. Explica que el mol es la unidad de cantidad de sustancia y equivale a 6,022x1023 unidades, como átomos. También define la masa molar como la masa en gramos de un mol de una sustancia, y la composición porcentual como el porcentaje de masa de cada elemento en un compuesto.
El documento describe el procedimiento para calibrar una balanza analítica utilizando pesas patrones de 25 a 300 gramos. Incluye limpiar y preparar la balanza y pesas, realizar múltiples mediciones con cada peso y registrar los resultados, y calcular valores como la media, desviación estándar y corrección. El objetivo es ajustar la balanza para análisis de control de calidad.
El documento describe los procedimientos para calibrar una balanza analítica utilizando pesas patrones de 25 a 300 gramos. Explica cómo limpiar y nivelar la balanza, realizar múltiples lecturas con cada pesa, calcular valores estadísticos y correcciones, e incluir los resultados en un certificado de calibración.
El documento describe la calibración de materiales volumétricos y balanzas analíticas realizada en un laboratorio. Se calibró una balanza analítica, un balón aforado de 25 mL y una pipeta de 10 mL para determinar factores de corrección. La balanza, el balón y la pipeta tuvieron correcciones de ±0,04, ±0,03 y ±0,013 respectivamente. Los resultados permiten incrementar la precisión de los instrumentos para su uso futuro en prácticas de laboratorio.
Tema12 calibrado de intrumentos de laboratorioVanesa Agudo
Este documento trata sobre la calibración de materiales de laboratorio como pipetas, buretas y matraces aforados. Explica la importancia de la calibración para lograr precisión y exactitud en los ensayos químicos. También describe conceptos como precisión, exactitud, errores absolutos y relativos, y los criterios y métodos para calibrar correctamente este tipo de material de laboratorio.
El documento describe los fundamentos de la viscosidad y los diferentes equipos para medirla, incluyendo el viscosímetro Brookfield disponible en la universidad. Explica que la viscosidad mide la resistencia interna de los líquidos al flujo y depende de la temperatura y la presión. Luego resume el funcionamiento y uso del viscosímetro Brookfield, el cual mide el par de torsión necesario para hacer girar un husillo en la muestra a una velocidad constante.
Este documento proporciona una introducción a los métodos volumétricos de análisis químico cuantitativo. Explica conceptos clave como valoraciones, reactivos primarios y secundarios, y clasificaciones de valoraciones. También describe los requisitos de las reacciones volumétricas, incluida la estequiometría, y los métodos para detectar el punto final, como indicadores visuales y métodos eléctricos.
Este documento describe el uso de balanzas analíticas y técnicas para pesar sustancias como sal y agua. Explica las características y usos de cada tipo de balanza, así como los procedimientos para su uso correcto y preciso. Se detallan los pasos para determinar el peso de las sustancias mediante el uso de ambas balanzas y comparar los resultados obtenidos.
Este documento propone un método compuesto de cinco fases para validar técnicas volumétricas. La primera fase implica análisis realizados por un único operador. La segunda fase implica análisis de muestras preparadas por otro operador. La tercera fase implica análisis de matrices reales. La cuarta fase determina la robustez del método ante pequeñas variaciones. La quinta fase implica ensayos de colaboración con otros laboratorios. El método busca eliminar errores sistemáticos y valid
Este documento presenta los resultados de una práctica de laboratorio sobre medidas de peso y volumen. Los estudiantes pesaron varios objetos utilizando una balanza y midieron volúmenes con probetas y pipetas. Aprendieron sobre la importancia de la precisión al medir y sobre el funcionamiento de los instrumentos de laboratorio. Los resultados mostraron que la balanza analítica es más precisa que la granataria y que es necesario tarar el peso del recipiente antes de pesar una sustancia.
Este documento describe la calibración de una balanza analítica mediante la medición de monedas colombianas de diferentes denominaciones y años. Se realizaron pesadas directas e indirectas de las monedas y se analizaron los resultados estadísticamente para determinar la precisión y exactitud de cada método. Adicionalmente, se midió la masa de un picnómetro vacío y lleno de agua para evaluar la calibración de la balanza.
Este documento describe el proceso de calibración de un matraz volumétrico de 25 mL y de pipetas volumétricas de 1 mL y 5 mL. Se realizaron pesadas repetidas de los instrumentos vacíos y llenos para determinar sus volúmenes reales. Los datos se analizaron estadísticamente para calcular valores como el promedio, desviación estándar y error relativo, con el fin de evaluar la precisión de las mediciones. Los resultados mostraron que los instrumentos fueron calibrados con éxito para su uso en análisis químic
Control del Proceso en la Disolucion de la Muetsra por VHmeryrosas
El documento proporciona información sobre el control del proceso de disolución de muestras por vía húmeda. Explica conceptos clave como toma de muestra, tratamiento de muestra, medida y tratamiento de datos. También clasifica los métodos analíticos y describe etapas como la introducción, puesta en disolución y preparación de la muestra para su análisis.
Este documento describe diferentes tipos de sensores de nivel utilizados en la industria. Explica que los sensores de nivel miden la altura de un líquido o sólido en un tanque y que existen sensores que miden directamente el nivel, la presión hidrostática, el desplazamiento de un flotador, o que aprovechan las propiedades eléctricas del material. Luego describe en detalle varios tipos específicos de sensores, incluyendo sensores de sonda, cristal, manométricos, de burbujeo
Este documento describe los pasos para realizar un análisis de conglomerados jerárquicos y un análisis de k-medias en SPSS. Explica cómo seleccionar las variables, elegir los métodos de agregación y distancia, y generar dendogramas y perfiles de medias para interpretar los resultados. También muestra cómo crear nuevas variables que asignen cada sujeto a un conglomerado para soluciones con diferentes números de grupos.
Se trata del análisis factorial, en el anpalisis psicométrico de insteumentos de investigación, lo cual es util para lograr una correcta recolecion de datos paraser analizados posteriormente
Este documento describe el procedimiento de análisis factorial, una técnica de reducción de datos que busca encontrar grupos homogéneos de variables a partir de un conjunto numeroso de variables. El análisis factorial consta de cuatro fases: cálculo de una matriz de variabilidad conjunta, extracción del número óptimo de factores, rotación de la solución y estimación de puntuaciones de sujetos en las nuevas dimensiones. El documento explica cómo ejecutar un análisis factorial en SPSS y analiza los resultados de un ejemplo con variables laborales.
El documento describe el procedimiento de análisis factorial, una técnica de reducción de datos que busca grupos homogéneos de variables y reducir el número de dimensiones necesarias para explicar los datos. El análisis factorial consta de cuatro fases: cálculo de una matriz de varianzas-covarianzas, extracción de factores, rotación de la solución y estimación de puntuaciones factoriales. Se provee un ejemplo utilizando variables laborales para comprobar si es posible resumir la información en factores.
Análisis estadístico de acumulación de tolerancias.bryansk7
Este documento resume diferentes métodos para el análisis de acumulación de tolerancias como el método Montecarlo y el método RSS. Explica cómo calcular las tolerancias de los componentes dados los requerimientos de tolerancia del ensamblaje final usando fórmulas como la fórmula RSS de asignación de parte. También describe el método Montecarlo y diferencia entre sujetadores flotantes y fijos.
El documento describe el análisis de conglomerados (cluster analysis), incluyendo las etapas del proceso, diferentes algoritmos como el agrupamiento jerárquico y k-medias, y ejemplos de su aplicación en investigación de mercados. El análisis de conglomerados agrupa casos basados en variables para identificar grupos homogéneos. Se utiliza comúnmente para segmentar mercados de consumidores con comportamientos similares.
Este informe presenta los resultados del análisis granulométrico de dos agregados (grueso y fino) realizado en el laboratorio. Se incluyen tablas con datos, cálculos y resultados de las pruebas, así como gráficas de las curvas granulométricas. El análisis encontró que el agregado grueso no cumple con ningún parámetro mínimo, mientras que el agregado fino cumple la mayoría excepto por exceder los máximos en algunas mallas. Se concluye que ambos agregados requieren mejor
Este documento describe el diseño e implementación de un gráfico de control X-R para monitorear la calidad de circuitos impresos fabricados en condiciones de alta temperatura. Se recopilaron datos de resistividad de 100 circuitos tomados en grupos de 5. Tras eliminar los grupos fuera de control, se construyó el gráfico de control y se analizaron sus propiedades, incluida la curva característica de operaciones para determinar la probabilidad de detección de cambios en el proceso.
Diseño de bloques completamente aleatorio (dbca) 7Carmelo Perez
Este documento presenta los aspectos teóricos y metodológicos del diseño de bloque completamente aleatorizado (DBCA) para experimentos agrícolas. Explica que el DBCA divide la muestra en bloques homogéneos para controlar variación ajena y asigna tratamientos aleatoriamente dentro de cada bloque. Incluye fórmulas para el análisis de varianza (ANOVA) y un ejemplo numérico para ilustrar el proceso de DBCA.
Abstracto
El estudio influyente de Porter en la ventaja competitiva de naciones inspiró un metódico y extenso trabajo en los datos austriacos. En contraste con el análisis de Porter, la competitividad está determinada endógenamente por medio de técnicas estadísticas cluster. Evitando su enfoque cortado, buenas o malas prácticas industriales son el objeto de estudio. El cluster central resultante constituye el típico patrón de competitividad para los indicadores seleccionados, mientras que las clasificaciones producen un mapa de las prácticas industriales austriacas. Los resultados de lejos muestran que: 1) industrias clusterizadas generalmente son raras en el caso de Austria, 2) algunos de ellos están localizados en sectores en declive y sacudidos por la crisis, y 3) competitividad hunde la importancia de las relaciones trasnacionales (como opuesto a los limites angostos) para la formación de industrias exitosas.
Este documento describe los diseños factoriales, los cuales permiten estudiar los efectos de dos o más factores en un experimento. Explica que en los diseños factoriales se investigan todas las combinaciones posibles de los niveles de los factores. Además, clasifica los diseños factoriales según la cantidad de niveles por factor, la cantidad de combinaciones de tratamientos realizadas y el grado de control de variables extrañas. Por último, detalla el diseño factorial 2x2 como ejemplo.
Este documento describe los diseños factoriales, los cuales permiten estudiar los efectos de dos o más factores en un experimento. Explica que en los diseños factoriales se investigan todas las combinaciones posibles de los niveles de los factores. Luego clasifica los diseños factoriales según la cantidad de niveles por factor, la cantidad de combinaciones de tratamientos realizadas, y el grado de control de variables extrañas. Finalmente, presenta un ejemplo de un diseño factorial 2x2 completamente al azar y su análisis de varianza correspondiente.
Breve reseña de acumulación de tolerancias mecánicas Alan Hinojoz
Este documento resume varios conceptos relacionados con el análisis y acumulación de tolerancias mecánicas. Explica métodos como el análisis en el peor de los casos y el análisis estadístico. También describe diferentes tipos de tolerancias como las tolerancias geométricas, de forma y de posición, así como cómo convertirlas a tolerancias equivalentes. Finalmente, cubre temas como el cambio de ensamblaje, las condiciones de material y la aplicación correcta de tolerancias.
Breve reseña de acumulación de tolerancias mecánicas Alan Hinojoz
Este documento contiene información sobre diferentes métodos para analizar la acumulación de tolerancias mecánicas, incluidos el análisis en el peor de los casos, el análisis estadístico y el uso de dimensiones y tolerancias geométricas. Explica conceptos como la cadena de dimensiones y tolerancias, el cambio de ensamblaje y el papel de suponer tolerancias. También cubre temas como tolerancias de forma, revolución, concentricidad y simetría, así como la conversión entre tolerancias geomé
Este documento presenta el diseño de un observador de estados para un convertidor Buck. Primero introduce los conceptos de observadores de estado y su aplicación al diagnóstico de fallas. Luego, describe el diseño de un observador de orden completo para el convertidor Buck usando la fórmula de Ackerman. Finalmente, presenta los resultados de la simulación del observador diseñado en MatLab.
Este documento describe el uso de gráficos de control y índices de capacidad para monitorear y mejorar un proceso de llenado de botellas. Inicialmente, se analizan 20 muestras para estimar los parámetros del proceso bajo control y eliminar las muestras fuera de control. Luego, se calculan índices de capacidad usando especificaciones de tolerancia dadas. Finalmente, se implementa un control en línea tomando muestras cada 20 minutos para detectar cambios en el proceso.
Este documento proporciona instrucciones detalladas sobre cómo utilizar la herramienta Solver de Excel para resolver problemas de optimización lineal y no lineal. Explica cómo configurar los parámetros de Solver, agregar restricciones, resolver problemas y generar informes. También incluye un ejemplo completo de cómo modelar y resolver un problema de minimización de costos de alimentación de ganado usando Solver.
Este documento presenta la prueba de suma de rangos de Wilcoxon, una prueba no paramétrica para comparar el rango medio de dos muestras relacionadas. Explica que la prueba consiste en sumar los rangos de signo frecuente sin una fórmula específica. Luego aplica la prueba a un ejemplo de datos de contenido de nicotina en cigarrillos para determinar si las medianas son iguales o diferentes entre dos marcas. El resultado es que no se rechaza la hipótesis nula de que las medianas son
Este documento describe el análisis de varianza (ANOVA), un método estadístico para comparar más de dos medias. Explica que el ANOVA compara las varianzas entre grupos y dentro de grupos para determinar si los tratamientos afectan la variable de respuesta. También detalla los supuestos del ANOVA, incluyendo la independencia de observaciones, distribución normal y homogeneidad de varianzas.
Este documento describe y compara varios algoritmos para resolver sistemas de ecuaciones lineales, incluyendo el algoritmo de eliminación gaussiana, el algoritmo de Gauss-Jordan y el método de montante. Explica los conceptos clave de matriz escalonada y escalonada reducida, y describe los pasos de cada algoritmo. También analiza la complejidad computacional de los diferentes métodos.
El documento introduce el protocolo TCP, explicando las conexiones virtuales punto a punto que establece en lugar de conexiones físicas. Describe las diferencias clave entre TCP y UDP, incluyendo que TCP es orientado a conexión y ofrece fiabilidad en la transmisión mediante confirmaciones de recepción. Finalmente, explica cómo funcionan las conexiones bidireccionales a través del intercambio de paquetes de datos y confirmaciones.
Este documento describe los conceptos básicos de red e Internet, así como los principales servicios de la Web 1.0. Explica conceptos como red, protocolo, dirección IP, nombre de dominio y URL. También describe servicios iniciales como el correo electrónico, FTP, chat y grupos de noticias, así como la evolución hacia servicios interactivos de la Web 2.0 como blogs, wikis y redes sociales.
Este documento proporciona instrucciones para hacer cables de red RJ-45. Explica que se debe usar cable UTP flexible de 8 conductores trenzados de colores específicos. Luego detalla los 5 pasos para pelar el cable, colocar los conductores en el conector, insertarlos en el conector, crimpearlos y repetir en el otro extremo. También brinda consejos sobre la distribución del cableado en un aula.
Este documento describe dos normas de cableado para cables de red con conectores RJ45: la norma 568-B para cables normales o paralelos que conectan PCs con switches, y la norma 568-A para cables cruzados que conectan dos PCs o switches entre sí. Cada norma especifica los colores de los cables que deben corresponderse en cada pin de los conectores RJ45 en ambos extremos del cable.
El documento describe los conceptos básicos de la capa física del modelo OSI, incluyendo los servicios y protocolos de la capa física, la señalización y codificación, y las características y usos de diferentes medios de red como el cableado de cobre, fibra óptica e inalámbrico. Explica cómo la capa física transporta bits a través de los medios y los estándares que rigen los componentes de hardware relacionados con esta capa.
Este documento describe la función de la capa física del modelo OSI. La capa física codifica los bits de datos en señales para su transmisión a través de los medios físicos como cables de cobre, fibra óptica o medios inalámbricos. Explica cómo la capa física representa los bits mediante diferentes métodos de señalización y codificación, y cómo garantiza la sincronización entre el transmisor y el receptor. También cubre los estándares y organizaciones que definen las especificaciones de la capa física.
El documento describe diferentes tipos de cables de red, incluidos cables de par trenzado, coaxiales y de fibra óptica. Los cables de par trenzado, como el UTP y STP, se usan comúnmente en redes Ethernet y se clasifican por categoría según su capacidad. El cable coaxial se usaba anteriormente para redes, mientras que el cable de fibra óptica es más caro pero también más rápido y con mayor capacidad, transmitiendo datos como pulsos de luz.
El documento describe los conceptos básicos del cableado estructurado para edificios. Explica que el cableado estructurado permite interconectar equipos de diferentes tecnologías para integrar servicios como datos, telefonía y control. Se compone de cableado de campus, vertical, horizontal y de usuario. También presenta las normas y componentes clave como parches, racks y categorías de cableado.
Este documento proporciona instrucciones paso a paso para conectar un cable de red UTP con conectores RJ45. Explica los 11 pasos requeridos, que incluyen cortar el aislamiento del cable, separar y ordenar los pares de cables, insertar los cables en los conectores RJ45, y crimpear los conectores en ambos extremos del cable. El proceso toma aproximadamente 10 minutos y es de dificultad media.
Este documento explica cómo hacer cables UTP rectos y cruzados, detallando los materiales necesarios y el orden de los colores en los conectores RJ45 para cada tipo de cable. Explica que un cable recto se usa para conectar una PC a un router u otro dispositivo de red, mientras que un cable cruzado permite conectar dos PCs directamente sin necesidad de un concentrador. Además, enfatiza la importancia de una buena puesta a tierra eléctrica para proteger los equipos de descargas.
This document provides an overview and summary of the book "Upgrading and Repairing Laptops, Second Edition" by Scott Mueller. The book is a 912-page guide for upgrading, maintaining, and repairing laptop computers. It covers topics such as laptop components, installation and maintenance, troubleshooting issues, and includes a DVD with video content showing the internal components of laptops. The second edition has been updated with the latest processors, motherboards, memory standards, and other changes. The book aims to equip laptop owners with the information needed to upgrade their laptops themselves or know what repairs should be left to manufacturers.
Este documento presenta una introducción a la lógica para informáticos. Brevemente describe cómo la lógica se ha establecido como fundamento de las matemáticas y la informática desde finales del siglo XIX. Explica que la lógica proporcionó las bases para resolver el problema planteado por Hilbert sobre la decidibilidad algorítmica, lo que llevó al desarrollo de la teoría de la computabilidad en los años 1930 con las contribuciones de Gödel, Turing, Church y Kleene. El documento también incluye un índ
This document contains a list of 76 bibliographic references from 1990 to 1977 related to statistical analysis methods. Some of the key references included are about categorical data analysis by Agresti from 1990, cluster analysis by Anderberg from 1973, multivariate analysis techniques by Bartlett from 1947, and experimental design procedures by Kirk from 1982. The majority of the references are from statistical and methodology journals from the 20th century and cover topics like hypothesis testing, ANOVA, regression, multivariate analysis, and other statistical techniques.
Este documento proporciona instrucciones para usar la Guía para el análisis de datos con SPSS que se incluye en el CD-ROM. Explica que se necesita el programa Acrobat Reader para ver la guía y cómo instalarlo si es necesario. Además, detalla que la guía está disponible en dos formatos, uno optimizado para ver en pantalla y otro para imprimir, e indica cómo acceder a cada uno.
Este documento proporciona una guía para el análisis de datos que incluye instrucciones, un índice de contenidos y una tabla de datos con cantidades de frutas por trimestre y otra tabla con coordenadas espaciales.
Este documento presenta el índice de contenidos de una guía para el análisis de datos con el software SPSS. El índice incluye 19 capítulos que cubren la introducción al SPSS, cómo usar la ayuda, trabajar con archivos de datos y resultados, y realizar diferentes tipos de análisis estadísticos como análisis descriptivo, de variables categóricas, contrastes sobre medias, análisis de varianza y regresión lineal entre otros.
Este documento presenta el índice de contenidos de una guía para el análisis de datos con SPSS. El índice incluye 19 capítulos que cubren la introducción a SPSS, cómo usar la ayuda de SPSS, trabajar con archivos de datos, el editor de datos, transformar datos, modificar archivos de datos, archivos de resultados, editar tablas de resultados, archivos de sintaxis y diferentes técnicas de análisis estadístico como análisis descriptivo, de variables categóricas, contrastes sobre medias, análisis
Este documento introduce el análisis discriminante, una técnica estadística que identifica las características que diferencian dos o más grupos y crea una función para clasificar casos en uno de los grupos. Explica que el análisis discriminante encuentra la combinación lineal de variables independientes que maximiza la distancia entre los grupos. Finalmente, describe los pasos básicos para realizar un análisis discriminante en SPSS.
Ofrecemos herramientas y metodologías para que las personas con ideas de negocio desarrollen un prototipo que pueda ser probado en un entorno real.
Cada miembro puede crear su perfil de acuerdo a sus intereses, habilidades y así montar sus proyectos de ideas de negocio, para recibir mentorías .
Business Plan -rAIces - Agro Business Techjohnyamg20
Innovación y transparencia se unen en un nuevo modelo de negocio para transformar la economia popular agraria en una agroindustria. Facilitamos el acceso a recursos crediticios, mejoramos la calidad de los productos y cultivamos un futuro agrícola eficiente y sostenible con tecnología inteligente.
Examen de Selectividad. Geografía junio 2024 (Convocatoria Ordinaria). UCLMJuan Martín Martín
Examen de Selectividad de la EvAU de Geografía de junio de 2023 en Castilla La Mancha. UCLM . (Convocatoria ordinaria)
Más información en el Blog de Geografía de Juan Martín Martín
http://blogdegeografiadejuan.blogspot.com/
Este documento presenta un examen de geografía para el Acceso a la universidad (EVAU). Consta de cuatro secciones. La primera sección ofrece tres ejercicios prácticos sobre paisajes, mapas o hábitats. La segunda sección contiene preguntas teóricas sobre unidades de relieve, transporte o demografía. La tercera sección pide definir conceptos geográficos. La cuarta sección implica identificar elementos geográficos en un mapa. El examen evalúa conocimientos fundamentales de geografía.
1. Capítulo 22
Análisis de conglomerados (II):
El procedimiento Conglomerados jerárquicos
Análisis de conglomerados jerárquico
A diferencia de lo que ocurre con el procedimiento Análisis de conglomerados de K medias,
el procedimiento Análisis de conglomerados jerárquico permite aglomerar tanto casos como
variables y elegir entre una gran variedad de métodos de aglomeración y medidas de distancia.
Pero la diferencia fundamental entre ambos procedimientos está en que en el segundo de ellos
se procede de forma jerárquica.
El análisis deconglomeradosjerárquicocomienzaconelcálculo de la matriz de distancias
entre los elementos de la muestra (casos o variables). Esa matriz contiene las distancias exis-
tentes entre cada elemento y todos los restantes de la muestra. A continuación se buscan los dos
elementos más próximos (es decir, los dos más similares en términos de distancia) y se agrupan
en un conglomerado. El conglomerado resultante es indivisible a partir de ese momento: de ahí
el nombre de jerárquico asignado al procedimiento. De esta manera, se van agrupando los ele-
mentos en conglomerados cada vez más grandes y más heterogéneos hasta llegar al último
paso, en el que todos los elementos muestrales quedan agrupados en un único conglomerado
global. En cada paso del proceso pueden agruparse casos individuales, conglomerados previa-
mente formados o un caso individual con un conglomerado previamente formado. El análisis
de conglomerados jerárquico es, por tanto, una técnica aglomerativa: partiendo de los elemen-
tos muestrales individualmente considerados, va creando grupos hasta llegar a la formación de
un único grupo o conglomerado constituido por todos los elementos de la muestra.
2. Capítulo 22. Análisis de conglomerados jerárquico 2
El procedimiento Conglomerados jerárquicos del SPSS informa de todos los pasos rea-
lizados en el análisis, por lo que resulta fácil apreciar qué elementos o conglomerados se han
fundido en cada paso y a qué distancia se encontraban cuando se han fundido. Esto permite va-
lorar la heterogeneidad de los conglomerados que se van fundiendo en cada etapa del análisis
y decidir en cuál de ellas la fusión de elementos incrementa excesivamente la heterogeneidad
de los conglomerados. Aunque el análisis termina cuando se ha conseguido agrupar a todos los
casos en un único conglomerado, el objetivo del analista será el de descubrir la existencia de
grupos homogéneos "naturales" que puedan existir en el archivo de datos.
La versatilidad del análisis de conglomeradosjerárquico radicaenlaposibilidad de utilizar
distintos tipos de medidas para estimar la distancia existente entre los casos o las variables, la
posibilidad de transformar la métrica original de las variables y la posibilidad de seleccionar
de entre una gran variedad de métodos de aglomeración. Pero no existe ninguna combinación
de estas posibilidades que optimice la solución obtenida. En general, será conveniente valorar
distintas soluciones para elegir la más consistente.
Para realizar un análisis de conglomerados jerárquico:
| Seleccionar la opción Clasificar > Conglomerados jerárquicos del menú Analizar para
acceder al cuadro Análisis de conglomerados jerárquico que muestra la figura 22.1.
Figura 22.1. Cuadro de diálogo Análisis de conglomerados jerárquico.
3. Capítulo 22. Análisis de conglomerados jerárquico 3
La lista de variables de del archivo de datos contiene todas las variables del archivo, incluidas
las variables de cadena (si bien estas últimas sólo pueden utilizarse para etiquetar los casos).
Para obtener un análisis de conglomerados jerárquico:
| Seleccionar las variables numéricas que se desea utilizar para diferenciar los casos y
formar los conglomerados, y trasladarlas a la lista Variables.
| Opcionalmente, seleccionar una variable para identificar los casos en las tablas de
resultados y en los gráficos y trasladarla al cuadro Etiquetar los casos mediante.
Conglomerar. Las opciones de este apartado permiten decidir qué elementos del archivo de
datos se desea agrupar:
F Casos. Se agrupan los casos a partir de sus puntuaciones en las variables seleccio-
nadas. Es la opción por defecto.
F Variables. Se agrupan las variables seleccionadas en la lista Variables a partir de las
puntuaciones de los casos válidos del archivo de datos. Esta opción exige incluir en
el análisis al menos tres variables. Al seleccionar esta opción se desactiva el botón
Guardar.
Mostrar. Las opciones de este apartado permiten controlar el tipo de resultados que mostrará
el Visor (ambas opciones están seleccionadas por defecto):
G Estadísticos. El Visor sólo muestra las tablas de resultados. Desactivando esta opción
se anula el acceso al botón Estadísticos.
G Gráficos. El Visor sólo muestra los gráficos. Desactivando esta opción se anula el
acceso al botón Gráficos.
4. Capítulo 22. Análisis de conglomerados jerárquico 4
Ejemplo (Análisis de conglomerados jerárquico)
Este ejemplo muestra cómo obtener un análisis de conglomerados jerárquico con las
especificaciones que el procedimiento tiene establecidas por defecto. Seguiremos utilizando
el archivo de datos Coches.sav que se encuentra en la misma carpeta en la que se ha instalado
el SPSS.
Por motivos didácticos, vamos a trabajar únicamente con 15 vehículos seleccionados al
azar del archivo Coches.sav. Para seleccionar los casos:
| En la ventana del Editor de datos, seleccionar la opción Seleccionar casos... del menú
Datos para acceder al cuadro de diálogo Seleccionar casos.
| En el cuadro de diálogo Seleccionar casos, marcar la Muestra aleatoria de casos del
apartado Seleccionar y pulsar en el botón Muestra... para acceder al subcuadro de
diálogo Seleccionar casos: Muestra aleatoria.
| En el apartado Tamaño de la muestra, marcar la opción Exactamente __ casos de
los primeros __ casos e introducir los valores 15 y 406 en los respectivos cuadros de
texto. Pulsar en el botón Continuar.
Aceptando estas selecciones, el archivo de datos queda filtrado, dejando disponibles sólo 15
de los 406 casos existentes.
Para llevar a cabo el análisis de conglomerados jerárquico:
| En el cuadro de diálogo Análisis de conglomerados jerárquico (ver figura 22.1),
seleccionar las variables motor (cilindrada en cc) y cv (potencia) y trasladarlas a la
lista Variables.
Aceptando estas selecciones, el Visor ofrece los resultados que muestran las tablas 22.1 a la
22.3 y la figura 22.2.
5. Capítulo 22. Análisis de conglomerados jerárquico 5
15 100.0 0 .0 15 100.0
N Porcentaje N Porcentaje N Porcentaje
Válidos Perdidos Total
Casosa,b
Distancia euclídea al cuadrado.a.
Vinculación promedio (Inter-grupos).b.
La tabla 22.1 muestra un resumen de los casos procesados: el número y porcentaje de casos
válidos analizados, el número y porcentaje de casos con valores perdidos en alguna de las
variables incluidas en el análisis, y el tamaño total de la muestra, que no es otra cosa que la su-
ma de los casos válidos y los perdidos. En dos notas a pie de tabla se indica el nombre de la
medida utilizada para obtener la matriz de distancias (Distancia euclídea al cuadrado) y el
método de conglomeración utilizado (Vinculación promedio). La solución obtenida puede
depender en gran medida de la combinación de: el tipo de medida de las distancias y el método
de conglomeración.
Tabla 22.1. Resumen de los casos procesados.
La tabla 22.2 muestra el historial del proceso de conglomeración, etapa por etapa. En cada eta-
pa se unen dos elementos. Como la muestra analizada tiene 15 casos, sólo se realizan 14 etapas
de fusión.
La columna Conglomerado que se combina informa sobre los conglomerados (o casos)
fundidos en cada etapa. En la primera etapa se han fundido los casos 72 y 146 del archivo de
datos. Como el análisis se inicia con todos los casos separados en conglomerados individuales,
la primera etapa siempre se refiere a casos individuales. A partir de ese momento, estos dos
casos constituyen el conglomerado «72» y son indivisibles en las etapas posteriores.
La columna (Coeficientes) ofrece el valor de la distancia a la que se encuentran los casos
antes de la fusión. En la primera etapa, la distancia de fusión entre los casos 72 y 146 vale 0,
lo que significa que se trata de casos con idénticas puntuaciones en cilindrada y potencia.
La columna Etapa en la que el conglomerado aparece por primera vez recoge la etapa en
la que se han formado los conglomerados que se están fundiendo en cada momento. El valor
0 indica que el conglomerado correspondiente es un caso individual. Un valor mayor que 0 in-
dica el número de etapa en la que se formó el conglomerado. En nuestro ejemplo, en la etapa
2 se funden el elemento 72 y el 231. Inspeccionando las columnas correspondientes a la
6. Capítulo 22. Análisis de conglomerados jerárquico 6
72 146 .000 0 0 2
72 231 25.000 1 0 7
117 178 36.000 0 0 5
126 181 2885.000 0 0 8
117 336 9874.000 3 0 6
117 275 19873.000 5 0 8
72 174 69023.336 2 0 10
117 126 141724.500 6 4 11
171 209 168325.000 0 0 12
72 145 360497.500 7 0 12
117 333 519727.344 8 0 14
72 171 1990572.750 10 9 13
20 72 7131117.500 0 12 14
20 117 10964185.000 13 11 0
Etapa
1
2
3
4
5
6
7
8
9
10
11
12
13
14
Conglomerado
1
Conglomerado
2
Conglomerado que se combina
Coeficientes
Conglomerado
1
Conglomerado
2
Etapa en la que el conglomerado
aparece por primera vez
Próxima
etapa
primera aparición de estos elementos encontramos un 1 y un 0, lo que significa que el elemento
72 ya apareció en la etapa 1 y es un conglomerado (el 72-146), y que el elemento 231 es un
caso individual.
La columna Próxima etapa indica la etapa en la que el conglomerado que se acaba de
formar volverá a fundirse con otros elementos. Por ejemplo, el conglomerado 72-146-231 que
se ha formado en la etapa 2, vuelve a fundirse con otros elementos en la etapa 7.
Tabla 22.2. Historial de conglomeración.
7. Capítulo 22. Análisis de conglomerados jerárquico 7
X X X X X X X X X X X X X X X X X X X X X X X X X X X X X
X X X X X X X X X X X X X X X X X X X X X X X X X X X X
X X X X X X X X X X X X X X X X X X X X X X X X X X X
X X X X X X X X X X X X X X X X X X X X X X X X X X
X X X X X X X X X X X X X X X X X X X X X X X X X
X X X X X X X X X X X X X X X X X X X X X X X X
X X X X X X X X X X X X X X X X X X X X X X X
X X X X X X X X X X X X X X X X X X X X X X
X X X X X X X X X X X X X X X X X X X X X
X X X X X X X X X X X X X X X X X X X X
X X X X X X X X X X X X X X X X X X X
X X X X X X X X X X X X X X X X X X
X X X X X X X X X X X X X X X X X
X X X X X X X X X X X X X X X X
Número
de
congl.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
333
181
126
275
336
178
117
209
171
145
174
231
146
72
20
Caso
El diagrama de témpanos de la figura 22.2 resume el proceso de fusión de manera gráfica. En
las cabeceras de las columnas se encuentran los números de los casos individuales (cada co-
lumna etiquetada con un número representa un caso) y en las de las filas el número de conglo-
merados formados en cada etapa (cada fila representa una etapa del proceso de fusión). Las eta-
pas comienzan en la parte inferior del diagrama y van progresando hacia arriba.
Inicialmente, se parte de 15 conglomerados individuales (es decir, tantos como casos ana-
lizados). En la primera etapa se funden dos casos individuales, quedando 14 conglomerados
(13 individuales y 1 doble). Los casos fundidos en la primera etapa son el 72 y el 146, lo cual
está representado con una marca que une las columnas correspondientes a esos dos casos. La
información de la segunda etapa se encuentra una fila más arriba, momento en el que se funden
el caso 231 y el conglomerado 72-146. En la tercera etapa (la fila de 12 conglomerados), se
funden los casos individuales 117 y 178. En la cuarta etapa se funden el caso 336 y el con-
glomerado 117-178. Y así sucesivamente.
Figura 22.2. Diagrama de témpanos vertical.
En la penúltima etapa (segunda fila del diagrama), se funde el caso individual 20 con un gran
conglomerado formado por los casos 209-171-145-174-231-146-72. En la última etapa, todos
los casos se funden en un único conglomerado. Obviamente, el caso 20 debe ser un caso atípico
de la muestra, muy distante de los demás casos, por lo que la solución de dos conglomerados
muy probablemente no será satisfactoria (a menos que el propósito del análisis haya sido
8. Capítulo 22. Análisis de conglomerados jerárquico 8
detectar el caso atípico). Y, dado que las sucesivas soluciones del análisis son jerárquicas, no
podemos optar por la solución que separa los dos grandes conglomerados de la antepenúltima
etapa sin mantener aislado el caso 22. Posiblemente la solución que mejor resuma la estructura
de los datos sea la de tres conglomerados (ver figura 22.3). El diagrama de témpanos es de gran
utilidad para identificar los elementos que constituyen cada una de las soluciones del análisis
y cuáles han sido las formaciones previa y posterior a cada solución específica. Sin embargo,
presenta el gran inconveniente de no informar en modo alguno de la distancia existente entre
los conglomerados fundidos en cada etapa.
Cuando se intenta clasificar una muestra muy numerosa, el tamaño del diagrama es excesi-
vamente ancho, lo que dificulta enormemente una inspección cómoda del mismo. En esos ca-
sos, existe la posibilidad de representar el diagrama en sentido horizontal.
ElprocedimientodeConglomeradosjerárquicosno ofreceningunatabladeresultadoscon
los valores promedio de los conglomerados formados (los centroides) ya que su finalidad es
permitir tomar una decisión sobre cuál es el número idóneo de conglomerados para representar
la estructura interna de los datos. No obstante, es posible crear fácilmente la tabla de centroides
a partir de las variables que el procedimiento permite crear en el archivo de datos (ver más
abajo el apartado Guardar).
9. Capítulo 22. Análisis de conglomerados jerárquico 9
Cilindrada en cc
80007000600050004000300020001000
Potencia(cv)
300
200
100
0
Conglomerados
3
2
1
La figura 22.3 representa el diagrama de dispersión de los casos respecto a las dos variables
de clasificación utilizadas: motor (cilindrada en cc) y cv (potencia). Los casos están marcados
según el conglomerado al que han sido asignados al solicitar una solución de tres conglome-
rados (el diagrama se ha creado utilizando la información guardada por el procedimiento
Análisisdeconglomeradosjerárquico).Lasolucióndetresconglomeradosparecesatisfactoria:
refleja la organización de los datos en las dos variables de clasificación. Y no parece que una
soluciónconunmayornúmero de conglomerados pueda resumir mejorlasdistanciasexistentes
entre los casos.
Figura 22.3. Diagrama de dispersión de las variables de agrupación.
10. Capítulo 22. Análisis de conglomerados jerárquico 10
Estadísticos
Las opciones del subcuadro de diálogo estadísticos permiten solicitar estadísticos adicionales
y anular la presentación del historial de conglomeración. Para acceder a estas opciones:
| Pulsar en el botón Estadísticos... del cuadro de diálogo Análisis de conglomerados jerár-
quico (ver figura 22.1) para acceder al subcuadro de diálogo Análisis de conglomerados
jerárquico: Estadísticos que muestra la figura 22.4.
Figura 22.4. Cuadro de diálogo Análisis de conglomerados jerárquico: Estadísticos.
G Historial de conglomeración. Muestra una tabla que informa sobre los elementos (casos
o variables) que son fundidos en cada etapa, sobre la distancia a la que se encuentran
cuando son fundidos, y sobre las etapas previas y posteriores en las que aparecen los
elementos implicados en cada etapa (ver tabla 22.2). Esta opción se encuentra activa por
defecto; desactivándola se anula la presentación del historial de conglomeración.
11. Capítulo 22. Análisis de conglomerados jerárquico 11
5045650 26669652 30880524 2967466 5045650 14222261 6294265
5045650 8514973 10961725 274576 0 2325601 69085
26669652 8514973 154458 11846565 8514973 1940978 7052274
30880524 10961725 154458 14705181 10961725 3190196 9293220
2967466 274576 11846565 14705181 274576 4197329 618237
5045650 0 8514973 10961725 274576 2325601 69085
14222261 2325601 1940978 3190196 4197329 2325601 1593800
6294265 69085 7052274 9293220 618237 69085 1593800
Caso
20
72
117
126
145
146
171
174
20 72 117 126 145 146 171 174
distancia euclídea al cuadrado
Esta es una matriz de disimilaridades
G Matriz de distancias. Permite obtener la matriz de distancias entre los elementos anali-
zados.Estasdistanciaspuedencalcularse(vermásabajo el apartadoMedidasdedistancia)
utilizando una medida de similaridad (grado de cercanía) o de disimilaridad (grado de
lejanía). El tipo de matriz obtenida (de similaridades o de disimilaridades) depende de la
medida seleccionada en el subcuadro de diálogo Método (ver más abajo el apartado Mé-
todos de conglomeración).
Si el análisis contiene un gran número de elementos, la tabla puede llegar a ser muy
voluminosa. La tabla 22.3 muestra la matriz de distancias para los 8 primeros casos de
nuestro ejemplo. La tabla indica, en la cabecera de las columnas, que la medida utilizada
es la distancia euclídea al cuadrado y, a pie de tabla, que se trata de una matriz de disimi-
laridades.
Tabla 22.3. Matriz de distancias entre los casos.
12. Capítulo 22. Análisis de conglomerados jerárquico 12
1
2
3
3
2
2
2
2
3
3
2
2
3
3
3
Caso
20
72
117
126
145
146
171
174
178
181
209
231
275
333
336
3
conglomerados
Conglomerado de pertenencia. Las opciones de este apartado permiten controlar la presen-
tación de la tabla del conglomerado de pertenencia. Esta tabla ofrece un listado de todos los
casos analizados con indicación del conglomerado al que han sido asignados en cada etapa del
análisis. Los casos aparecen listados en el mismo orden en el que se encuentran en el archivo
de datos.
F Ninguno. Esta opción, que se encuentra activa por defecto, impide que el Visor muest-
re la tabla del conglomerado de pertenencia.
F Solución única: __ grupos. Permite obtener la tabla del conglomerado de
pertenencia con la información correspondiente a una única solución: la establecida
por el usuario. Para establecer el número de conglomerados de la solución que se
desea obtener hay que introducir en el cuadro de texto un entero mayor que 1. La
tabla 22.4 muestra la tabla del conglomerado de pertenencia con indicación del
conglomerado al que pertenece cada caso al solicitar una solución de tres
conglomerados.
Tabla 22.4. Conglomerado de pertenencia (solución de 3 conglomerados).
13. Capítulo 22. Análisis de conglomerados jerárquico 13
1 1 1
2 2 1
3 3 2
3 3 2
2 2 1
2 2 1
4 2 1
2 2 1
3 3 2
3 3 2
4 2 1
2 2 1
3 3 2
3 3 2
3 3 2
Caso
20
72
117
126
145
146
171
174
178
181
209
231
275
333
336
4
conglomerados
3
conglomerados
2
conglomerados
F Rango de soluciones: Desde __ hasta __ grupos. Permite obtener la tabla del con-
glomerado de pertenencia con la información correspondiente a varias soluciones (un
rango de soluciones). Para establecer el número mínimo y máximo de conglomerados
del rango de soluciones que se desea obtener hay que introducir, en el primer cuadro
de texto, el número de conglomerados de la primera solución (la de menor número de
conglomerados) y, en el segundo cuadro de texto, el número de conglomerados de la
última solución (la de mayor número de conglomerados). Ambos valores deben ser
enteros mayores que 1 y el primer valor debe ser menor que el segundo. La tabla 22.5
muestra la tabla del conglomerado de pertenencia con indicación del conglomerado
al que pertenece cada caso en el rango de soluciones que van de 2 a 4 conglomerados.
Tabla 22.5. Tabla del conglomerado de pertenencia (soluciones de 2, 3 y 4 conglomerados).
14. Capítulo 22. Análisis de conglomerados jerárquico 14
Gráficos
Las opciones del subcuadro de diálogo Gráficos permiten decidir qué tipos de gráficos se desea
obtener. Para obtener esta información:
| Pulsar en el botón Gráficos... del cuadro de diálogo Análisis de conglomerado jerárquico
(ver figura 22.1) para acceder al subcuadro de diálogo Análisis de conglomerados jerár-
quico: Gráficos que muestra la figura 22.5.
Figura 22.5. Cuadro de diálogo Análisis de conglomerados jerárquicos: Gráficos.
G Dendrograma. Muestra el dendrograma. Un dendrograma es un gráfico que combina la
información del diagrama de témpanos y la del historial de conglomeración. En él, los
conglomerados están representados mediante trazos horizontales y las etapas de la fusión
mediante trazos verticales. La separación entre las etapas de la fusión es proporcional a la
distancia a la que se están fundiendo los elementos en esa etapa (en una escala estandari-
zada de 25 puntos), por lo que fusiones de elementos muy próximos pueden no ser aprecia-
bles y confundirse bajo un único trazo vertical. Este gráfico es de gran utilidad para eva-
luar la homogeneidad de los conglomerados y facilita enormemente la decisión sobre el
número óptimo de conglomerados.
15. Capítulo 22. Análisis de conglomerados jerárquico 15
Témpanos. Las opciones de este apartado permiten controlar algunos aspectos relacionados
con el diagrama de témpanos:
F Todos los conglomerados. Esta opción, que se encuentra activa por defecto, ofrece
una representación de los conglomerados de todas las etapas del análisis, es decir, una
representación de todas las soluciones posibles (ver figura 22.2).
F Rango especifico de conglomerados. Permite seleccionar la representación de un
subconjunto (rango) de soluciones. Para definir el rango de soluciones que se desea
representar es necesario introducir tres valores. Iniciar: indica la solución con el me-
nor número de conglomerados. Parar: indica la solución con el mayor número de con-
glomerados. Por: indica la cadencia (o incremento) con la se deben representar las
soluciones del rango definido (manipular la cadencia de las soluciones representadas
es especialmente interesante cuando el diagrama es muy extenso).
F Ninguno. Impide que el Visor muestre el diagrama de témpanos.
Orientación. Las opciones de este apartado permiten controlar la orientación del diagrama de
témpanos:
F Vertical. Los casos se representan en las columnas y las etapas de la fusión en las
filas. Esta opción se encuentra activa por defecto.
F Horizontal. Los casos se representan en las filas y las etapas de la fusión las colum-
nas. Es el más apropiado para representar un gran número de elementos.
16. Capítulo 22. Análisis de conglomerados jerárquico 16
X X X X X X X X X X X X X X X X X X X X X X X X X X X X X
X X X X X X X X X X X X X X X X X X X X X X X X X X X X
X X X X X X X X X X X X X X X X X X X X X X X X X X X
X X X X X X X X X X X X X X X X X X X X X X X X X X
Número
de
congl.
1
2
3
4
333
181
126
275
336
178
117
209
171
145
174
231
146
72
20
Caso
Ejemplo (Análisis de conglomerados jerárquico > Gráficos)
Este ejemplo muestra cómo obtener e interpretar los gráficos del análisis de conglomerados
jerárquico. Para solicitar estos gráficos:
| En el cuadro de diálogo Análisis de conglomerados jerárquico (ver figura 22.1),
seleccionar las variables motor y cv y trasladarlas a la lista Variables.
| Pulsar en el botón Gráficos... para acceder al subcuadro de diálogo Análisis de
conglomerados jerárquico: Gráficos que muestra en la figura 22.5.
| Marcar la opción Dendrograma.
| En el apartado Témpanos, marcar la opción Rango especificado de conglomerados
e introducir el valor 4 en el cuadro de texto Parar.
Aceptando estas selecciones, el Visor construye los gráficos que muestran las figuras 22.6 y
22.7.
La figura 22.6 ofrece el diagrama de témpanos vertical referido a las soluciones del rango
establecido (1-4). La solución de un sólo conglomerado carece de interés y sólo se utiliza co-
mo puntodereferencia(cualquieranálisisdeconglomeradosjerárquicodesembocaenesasolu-
ción, pero agrupar los casos en un único conglomerado es lo miso que no realizar el análisis).
Figura 22.6. Diagrama de témpanos del rango de soluciones 1 a 4.
La solución de 2 conglomerados muestra un conglomerado formado por los casos 20-72-146-
231-174-145-171-209 y otro conglomerado formado por todos los casos restantes. La solución
de 3 conglomerados muestra un conglomerado formado por el caso 20, otro formado por los
casos 72-146-231-174-145-171-209(elconglomerado«72»)yotroformado por los casos 117-
178-336-275-126-181-333 (elconglomerado«117»).Lasoluciónde4 conglomeradoscoincide
con la de 3 excepto en lo referente al conglomerado «72», que ahora está dividido en dos: los
casos 72-146-231-174-145 (conglomerado «72») por un lado, y los casos 171-209 (conglom-
17. Capítulo 22. Análisis de conglomerados jerárquico 17
erado «171») por otro. Exactamente esta misma información es la que ofrece la tabla del
conglomerado de pertenencia (ver tabla 22.5).
La diferencia entre las soluciones con 3 y 4 conglomerados radica en la división del
conglomerado «72» en dos conglomerados: el «72» y el «171». Ahora bien, puesto que
desconocemos la distancia entre estos dos últimos conglomerados, resulta difícil valorar la
pertinencia de efectuar o no esa división. No obstante, en el dendrograma de la figura 22.7
podemos encontrar información adicional.
La figura 22.7 muestra el dendrograma de los 15 vehículos de nuestro ejemplo. En un dendro-
grama, además de estar representadas las etapas del proceso de fusión, también lo están las dis-
tancias existentes entre los elementos fundidos. Pero las distancias no están representadas en
su escala original sino en una escala estandarizada de 25 puntos. Las líneas verticales iden-
tifican elementos fundidos (conglomerados); y la posición de las líneas verticales indica la dis-
tancia existente entre los elementos fundidos.
Figura 22.7. Dendrograma.
Dendrogram using Average Linkage (Between Groups)
Rescaled Distance Cluster Combine
C A S E 0 5 10 15 20 25
Label Num +---------+---------+---------+---------+---------+
72 òø
146 òú
231 òú
174 òôòòòòòòòø
145 ò÷ ùòòòòòòòòòòòòòòòòòòòòòòòø
171 òûòòòòòòò÷ ùòòòòòòòòòòòòòòòø
209 ò÷ ó ó
20 òòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòò÷ ó
126 òø ó
181 òú ó
117 òôòø ó
178 òú ó ó
336 òú ùòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòò÷
275 ò÷ ó
333 òòò÷
18. Capítulo 22. Análisis de conglomerados jerárquico 18
Por la tabla del historial de conglomeración (tabla 22.2) sabemos ya que la mayor distancia
entre conglomerados vale 10.964.185,00 (entre el conglomerado «20 y el «117») y la menor
0,00 (entre el vehículo 72 y el 146); Pues bien, puesto que las distancias representadas en el
dendrograma están reescaladas, a la distancia mayor (10.964.185,00) le corresponde un valor
de 25 y a la menor (0,00) un valor de 1.
No obstante, el dendrograma suele asignar también una distancia de 1 a las fusiones de las
primeras etapas (pues en ellas las distancias suelen ser muy pequeñas en comparación con las
distancias de las etapas finales), lo cual impide averiguar el orden en el que se han producido
las primeras fusiones (para ello hay que recurrir a la tabla del historial de conglomeración).
El dendrograma de la figura 22.7, por ejemplo, asigna una distancia de 1 a los elementos
fundidos en las 10 primeras etapas (a pesar de que el proceso de fusión consta de 14 etapas,
sólo hay 4 líneas verticales con valor distinto de 1, lo cual puede dar una idea de la precisión
con la que el dendrograma representa las distancias). Así pues, puesto que en la parte baja
(izquierda) de la escala no es posible distinguir el orden de fusión de los conglomerados,
conviene señalar que, en esa zona, el dendrograma está produciendo una falsa impresión. Dado
que el proceso de aglomeración se realiza siempre de manera binaria (fundiendo dos elementos
en cada etapa), si pudiéramos utilizar una lupa para aumentar la resolución de la zona baja de
la escala, los tamos verticales aparecerían escalonados en distintas posiciones de la escala de
25 puntos.
La primera etapa de la fusión se representa en el extremo izquierdo del dendrograma; la
última etapa, en el extremo derecho. En el dendrograma de la figura 22.7 puede observarse que
el caso 20 se encuentra muy distante del resto de los casos, pues la primera fusión en la que
interviene se produce a una distancia de 17 puntos (la distancia que va desde el origen de la
escala hasta el punto 17). Por el contrario, los conglomerados «72» y «171» se funden a una
distancia de 5 puntos (la distancia que va desde el origen de la escala hasta el punto 5). Los
valores exactos de las distancias entre estos elementos se encuentran en la tabla del historial
de conglomeración (ver tabla 22.2): la distancia del caso 20 al conglomerado «72» vale
7.131.117,50, y la distancia entre los conglomerados «72» y «171» vale 1.990.572,75.
Podemos comprobar que la escala estandarizada del dendrograma refleja con suficiente
precisión la proporcionalidad existente entre las distancias originales.
Las fusiones que se producen cerca del origen de la escala (izquierda) indican que el
conglomerado formado es bastante homogéneo. Por el contrario, La fusiones que se producen
en la zona final de la escala (derecha) indican que el conglomerado formado es bastante
heterogéneo. Para tomar una decisión sobre cuál ha de ser el número de conglomerados idóneo
puede recorrerse el dendrograma de derecha a izquierda y detener la atención allí donde las
19. Capítulo 22. Análisis de conglomerados jerárquico 19
líneas verticales están unidas al origen de la escala con trazos horizontales cortos (o no
demasiado largos). Tras esto, bastará con seguir cada línea horizontal hacia la izquierda para
identificar los casos que componen cada conglomerado.
En el dendrograma de nuestro ejemplo (figura 22.7)parecerazonable adoptar una solución
de 3 conglomerados:
Conglomerado 1: 20
Conglomerado 2: 72-146-231-174-145-171-209
Conglomerado 3: 126-181-117-178-336-275-333
Los números asignados a estos tres conglomerados se corresponden con los asignados por el
propio procedimiento (ver, por ejemplo, las tablas 22.4 y 22.5).
Por supuesto, si se desea obtener un número preestablecido de conglomerados, bastará con
partir el dendrograma verticalmente por donde se encuentre ese número de líneas verticales y
seguir cada línea horizontal hacia la izquierda para identificar los casos que componen cada
conglomerado.
20. Capítulo 22. Análisis de conglomerados jerárquico 20
Método
Las opciones del cuadro de diálogo Método permiten seleccionar un método de conglomera-
ción y el tipo de medida que se desea utilizar para evaluar las distancias entre los elementos.
También permiten transformar las puntuaciones originales y las medidas de distancia resul-
tantes. Las selecciones de este cuadro de diálogo determinan la solución obtenida. Distintas
combinaciones de opciones pueden dar como resultado soluciones muy distintas. Para perso-
nalizar estas opciones:
| Pulsar en el botón Método... del cuadro de diálogo Análisis de conglomerados jerárquico
(ver figura 22.1) para acceder al subcuadro de diálogo Análisis de conglomerados jerár-
quico: Método que muestra la figura 22.8.
Figura 22.8. Cuadro de diálogo Análisis de conglomerados jerárquico: Método.
21. Capítulo 22. Análisis de conglomerados jerárquico 21
Método de conglomeración
La primera opción del cuadro de diálogo permite seleccionar un método de conglomeración.
Según hemos señalado ya, el análisis de conglomerados jerárquico siempre evoluciona paso
a paso, uniendo en cada paso los dos elementos de la matriz de distancias que se encuentran
más próximos entre sí. En cada paso se funden dos elementos o grupos de elementos.
Una vez calculada la matriz de distancias, los dos elementos más próximos (los más simi-
lares o menos distantes) son fundidos en un mismo conglomerado. Estos dos casos que consti-
tuyen el primer conglomerado (en este momento son sólo dos casos por tratarse del primer paso
del procedimiento) constituyen una unidad que, como tal, posee su propia distancia respecto
al resto de los elementos de la matriz de distancias. La matriz inicial de los nxn sujetos (o pxp
variables) cambia (pues dos de sus filas –y dos de sus columnas– han sido fundidas en una)
transformándose en una matriz (n–1)(n–1). Tras recalcular las distancias, en la siguiente etapa
del análisis se vuelven a seleccionar los dos elementos de la matriz más próximos entre sí y son
fundidos en un nuevo conglomerado. Por supuesto, los dos elementos fundidos en esta segunda
etapa pueden ser dos casos individuales o un caso individual y el conglomerado ya formado
en la primera etapa. En este momento, la matriz de distancias de dimensiones (n–1)x(n-1) se
transforma en una matriz de distancias de dimensiones (n–2)x(n–2), lo que exige volver a
calcular las distancias del nuevo conglomerado respecto al resto de elementos de la matriz. El
proceso continua paso a paso hasta que, finalmente, se consigue fundir en un único conglome-
rado a todos los elementos de la matriz de distancias (de dimensiones finales 2x2). En ese
punto termina el análisis. Pues bien, los métodos de conglomeración son los procedimientos
mediante los cuales es posible volver a calcular las distancias entre los nuevos elementos en
cada etapa del proceso de fusión.
Lógicamente, en todo este proceso de fusión no existe una solución única, sino tantas como
pasos daelproceso.La decisión sobre qué solución se considera más satisfactoria puede tomar-
se en cualquier etapa del proceso, pero lo más lógico y habitual es postergar esta decisión hasta
el momento en que el análisis ha concluido.
Conviene señalar que el método de conglomeración utilizado para recalcular las distancias
en cada etapa del proceso de fusión puede determinar de manera sustantiva la calidad de la so-
lución alcanzada. La idoneidad y eficacia del método de conglomeración seleccionado depen-
derá en gran medida de la propia estructura de los datos y de la forma multivariante de la nube
de puntos.
22. Capítulo 22. Análisis de conglomerados jerárquico 22
Método de vinculación por el vecino más próximo
El método de vinculación simple, enlace simple, o por el vecino más próximo, comienza
seleccionando y fundiendo los dos elementos de la matriz de distancias que se encuentran más
próximos. La distancia de este nuevo conglomerado respecto a los restantes elementos de la
matriz se calcula como la menor de las distancias entre cada elemento del conglomerado y el
resto de elementos de la matriz. En los pasos sucesivos, la distancia entre dos conglomerados
se calcula como la distancia entre sus dos elementos más próximos. Así, la distancia dAB entre
los conglomerados A y B se calcula mediante:
donde dij es la distancia entre los elementos i y j, el primero perteneciente al conglomerado A
y el segundo al conglomerado B.
Método de vinculación por el vecino más lejano
El método de vinculación completa, enlace completo, o por el vecino más lejano, se comporta
de manera opuesta al anterior. La distancia entre dos conglomerados se calcula como la distan-
cia entre sus dos elementos más alejados. Es decir, la distancia entre dos conglomerados A y
B se calcula como:
23. Capítulo 22. Análisis de conglomerados jerárquico 23
Método de vinculación inter-grupos
El método de vinculación promedio, o de vinculación inter-grupo, presenta la ventaja sobre
los dos métodos anteriores de aprovechar la información de todos los miembros de los dos
conglomerados que se comparan. La distancia entre dos conglomerados se calcula como la dis-
tancia promedio existente entre todos los pares de elementos de ambos conglomerados:
Tanto este método como el de Ward son sensibles a posibles transformaciones monótonas de
los datos.
Método de Ward
Este método fue propuesto por Ward (1963), quien argumentó que los conglomerados debían
constituirse de tal manera que, al fundirse dos elementos, la pérdida de información resultante
de la fusión fuera mínima. En este contexto, la cantidad de información se cuantifica como la
suma de las distancias al cuadrado de cada elemento respecto al centroide del conglomerado
al que pertenece (SCE = Suma de Cuadrados Error). Para ello, se comienza calculando, en ca-
daconglomerado,elvectorde medias de todas la variables, es decir, elcentroidemultivariante.
A continuación, se calculan las distancias euclídeas al cuadrado entre cada elemento y los cen-
troides (vector de medias) de todos los conglomerados. Por último, se suman las distancias
correspondientes a todos los elementos.
En cada paso se unen aquellos conglomerados (o elementos) que dan lugar a un menor
incremento de la SCE, es decir, de la suma de cuadrados de las distancias intra-conglomerado.
La SCE se define como:
24. Capítulo 22. Análisis de conglomerados jerárquico 24
Método de agrupación de centroides
El método de agrupación de centroides calcula la distancia entre dos conglomerados como la
distancia entre sus vectores de medias. Con este método, la matriz de distancias original sólo
se utiliza en la primera etapa. En las etapas sucesivas se utiliza la matriz de distancias actuali-
zada en la etapa previa. En cada etapa, el algoritmo utiliza la información de los dos conglome-
rados (o elementos) fundidos en la etapa previa y el conglomerado (o elemento) que se intenta-
rá fundir en esa etapa. La distancia entre el conglomerado AB y el elemento C se calcula como:
Una desventaja de este método es que la distancia entre dos conglomerados puede disminuir
a medida que progresa el análisis, ya que los conglomerados fundidos en los últimos pasos son
más diferentes entre sí que los que se funden en las primeras etapas.
En este método, el centroide de un conglomerado es la combinación ponderada de los dos
centroides de sus dos últimos elementos (o conglomerados), siendo las ponderaciones propor-
cionales a los tamaños de los conglomerados.
Método de agrupación de medianas
En el método de agrupación de medianas, los dos conglomerados (o elementos) que se combi-
nan reciben idéntica ponderación en el cálculo del nuevo centroide combinado, independien-
temente del tamaño de cada uno de los conglomerados (o elementos). Esto permite que, a la
hora de caracterizar a los conglomerados resultantes, los conglomerados pequeños tengan la
misma importancia que los conglomerados grandes. Dado un conglomerado AB y un elemento
C, la nueva distancia del conglomerado al elemento se calcula como:
Al igual que en el procedimiento anterior, la matriz de distancias utilizada en cada etapa para
los cálculos es la matriz del paso previo. Para una discusión más detallada de los métodos de
aglomeración puede consultarse Anderberg (1973).
25. Capítulo 22. Análisis de conglomerados jerárquico 25
Medidas de distancia
Uno de los aspectos clave del análisis de conglomerados es la elección de la medida que se
desea utilizar para cuantificar la distancia entre los elementos. El procedimiento Análisis de
conglomerados jerárquico permite elegir entre un gran número de medidas de distancia que
se diferencian por el tipo de datos para el que han sido diseñadas: cuantitativos, categóricos,
dicotómicos.
Estas medidas también se diferencian por el tipo de distancia evaluada: similaridad o disi-
milaridad. Las medidas de similaridad evalúan el grado de parecido o proximidad existente en-
tre dos elementos. Los valores más altos indican mayor parecido o proximidad entre los ele-
mentos comparados: cuando dos elementos se encuentran juntos, el valor de las medidas es má-
ximo. El coeficiente de correlación de Pearson es, quizá, la medida de similaridad más amplia-
mente utilizada.
Las medidas de disimilaridad ponen el énfasis sobre el grado de diferencia o lejanía exis-
tente entre dos elementos. Los valores más altos indican mayor diferencia o lejanía entre los
elementos comparados: cuando dos elementos se encuentran juntos, la distancia es nula. Las
medidas de disimilaridad son las que han pasado al vocabulario común con la acepción de
medidas de distancia. La distancia euclídea (la longitud del segmento lineal que une dos ele-
mentos) es, quizá, la medida de disimilaridad más conocida.
Las opciones del apartado Medida (ver figura 22.8) permiten seleccionar la medida que
se desea utilizar para evaluar la distancia entre los elementos. Las medidas se encuentran agru-
padas en función del tipo de datos para el que son pertinentes (todas las variables seleccionadas
para el análisis deben compartir el mismo tipo de nivel de medida). Conviene no olvidar que
las elecciones que se hagan en este apartado afectarán al cálculo de la matriz de distancias y,
consecuentemente, pueden condicionar de forma importante las soluciones alcanzadas.
En el listado que se ofrece a continuación, las fórmulas reciben el mismo nombre que les
asigna la sintaxis del SPSS.
26. Capítulo 22. Análisis de conglomerados jerárquico 26
Intervalo
Esta opción incluye medidas de similaridad y disimilaridad para datos cuantitativos obtenidos
con una escala de medida de intervalo o razón.
• Distancia euclídea. Medida de disimilaridad utilizada por defecto para datos de intervalo.
Raíz cuadrada de la suma de los cuadrados de las diferencias entre los valores de las va-
riables:
• Distancia euclídea al cuadrado. Medida de disimilaridad. Suma de los cuadrados de las
diferencias entre los valores de las variables:
• Coseno. Medida de similaridad. Medida estrechamente relacionada con el coeficiente de
correlación de Pearson. Es elcoseno delángulo formado por dos vectores de puntuaciones.
Tiene un máximo de 1 y un mínimo de -1:
• Correlación de Pearson. Medida de similaridad angular con las variables en escala
tipificada. Se trata de una medida típica de relación lineal entre variables. Toma valores
entre –1 y 1:
27. Capítulo 22. Análisis de conglomerados jerárquico 27
donde n es el tamaño de la muestra y zx y zy son las puntuaciones tipificadas del sujeto i en
las variables X e Y, que son las variables entre las que se calcula la distancia.
• Chebychev. Medida de disimilaridad. Diferencia más grande en valor absoluto entre los
valores de dos variables:
• Bloques. Medida de disimilaridad. También llamada distancia absoluta, distancia de
ciudad, de Manhatan, y del taxista. Es la suma de los valores absolutos de las diferencias
entre los valores de dos variables:
• Minkowsky. Medida de disimilaridad basada en la distancia euclídea. Raíz de orden p de
la suma de las potencias de orden p de los valores absolutos de las diferencias entre los
valores de dos variables:
donde p es cualquier número entero positivo.
• Personalizada. Medida de disimilaridad basada en la distancia euclídea. Raíz de orden r
de la suma de las potencias de orden p de los valores absolutos de las diferencias entre los
valores de dos variables:
donde p y r son dos números enteros positivos cualesquiera.
28. Capítulo 22. Análisis de conglomerados jerárquico 28
Frecuencias
Esta opción incluye dos medidas de disimilaridad para datos categóricos. Ambas se basan en
el estadístico chi-cuadrado de independencia para tablas de contingencia bidimensionales.
• Chi-cuadrado. Medida de disimilaridad utilizada por defecto para datos categóricos. Se
basa en las divergencias existentes entre las frecuencias observadas y el modelo de
independencia. La magnitud de esta medida depende del tamaño muestral. Los valores
esperados se obtienen asumiendo independencia entre las variables:
• Phi-cuadrado. Medida de disimilaridad. La medida chi-cuadrado normalizada por la raíz
cuadrada del número de casos. Su valor no depende del tamaño muestral:
29. Capítulo 22. Análisis de conglomerados jerárquico 29
Binaria
Las medidas para datos binarios se utilizan con variables dicotómicas, es decir, con variables
cuyos valores reflejan la presencia o ausencia de la característica medida. Generalmente, la
presencia de la característica se codifica con el valor 1 y la ausencia con el valor 0. La tabla
22.6 muestra una tabla de contingencia 2x2 con la notación utilizada al resumir los datos
referidos a dos variables dicotómicas.
Tabla 22.6. Tabla de contingencia con dos variables dicotómicas.
Variable Yi
1 0
Variable Xi
1 a b a + b
0 c d c + d
a + c b + d n
En la tabla, n se refiere al número total de casos, a se refiere al número de casos que comparten
la presencia de ambas características, d se refiere al número de casos que comparten la ausencia
de ambas características (a y d son las concordancias), y b y c se refieren el número de casos
que presentan una característica y no la otra (las discordancias).
Existe un gran número de medidas para calcular la distancia entre los elementos de una
tabladecontingenciade estas características. Estas medidas difieren, básicamente, enlaimpor-
tancia que conceden a cada casilla de la tabla. Se considera que dos elementos son tanto más
similares entre sí cuanto mayor número de presencias o ausencias comparten. Pero las presen-
cias y las ausencias no tienen por qué tener la misma importancia al valorar la similaridad. Si
dos sujetos responden sí a la pregunta “¿Ha padecido alguna enfermedad grave en los últimos
tres meses?”, esa concordancia posee mucho mayor valor informativo que si ambos sujetos
responden no. Sin embargo, si dos sujetos responden sí a la pregunta “¿Ha ido alguna vez a la
playa en verano?”, esa concordancia posee mucho menor valor informativo que si ambos su-
jetos responden no.
Por esta razón, algunas medidas no tienen en cuenta las ausencias conjuntas (d); otras con-
ceden más importancia a las concordancias que a las discordancias, o al revés; otras sólo tienen
30. Capítulo 22. Análisis de conglomerados jerárquico 30
en cuenta las presencias conjuntas; otras, las ausencias; etc. Puesto que cada una de ellas pone
el énfasis en un aspecto concreto de la tabla, la decisión sobre qué medida conviene utilizar no
es una cuestión trivial. Sobre todo si tenemos en cuenta que muchas de ellas no arrojan resul-
tados equivalentes (no son monótonas entre sí, pudiendo darse inversiones de valores en los
elementos comparados) yque el cambio de codificación de las presencias-ausencias (el cambio
de ceros por unos y de unos por ceros) también puede hacer variar el resultado.
Las fórmulas que se ofrecen a continuación están diseñadas para evaluar la distancia entre
dos variables a partir de un cierto número de casos. No obstante, intercambiando en la tabla
22.6 las variables X e Y por los casos i y j, las fórmulas que se ofrecen pueden utilizarse para
calcular la distancia entre dos casos a partir de un cierto número de variables.
• Distancia euclídea . Medida de disimilaridad. Versión binaria de la distancia euclídea. Su
valor mínimo es 0, pero no tiene máximo:
• Distancia euclídea al cuadrado. Medida de disimilaridad. Su valor mínimo es 0, pero no
tiene máximo:
• Diferencia de tamaño. Medida de disimilaridad. Su valor mínimo es 0, pero no tiene
máximo:
• Diferencia de configuración. Medida de disimilaridad. Toma valores entre 0 y 1:
31. Capítulo 22. Análisis de conglomerados jerárquico 31
• Varianza. Medida de disimilaridad. Su valor mínimo es 0, pero no tiene máximo:
• Dispersión. Medida de similaridad. Toma valores entre 0 y 1:
• Forma. Medida de disimilaridad. No tiene límite inferior ni superior:
• Concordancia simple o emparejamiento simple. Medida de similaridad. Es el cociente
entre el número de concordancias y el número total de características:
• Coeficiente Phi (de cuatro puntos). Medida de similaridad. Versión binaria de coeficiente
de correlación de Pearson. Es la medida de asociación más utilizada para datos binarios.
Toma valores entre 0 y 1:
32. Capítulo 22. Análisis de conglomerados jerárquico 32
• Lambda de Goodman y Kruskal. Medida de similaridad. Evalúa el grado en que el estado
de una característica en una variable (presente o ausente) puede predecirse a partir del
estado de esa característica en la otra variable. En concreto, lambda mide la reducción
proporcional del error de predicción que se consigue al utilizar una variable como
predictora de la otra cuando las direcciones de la predicción son de igual importancia.
Lambda toma valores entre 0 y 1:
donde:
• D de Andemberg. Medida de similaridad. Al igual que lambda, evalúa la capacidad
predictiva de una variable sobre otra. Y, al igual que lambda, mide la reducción en la
probabilidad del error de predicción cuando una de las variables es utilizada para predecir
la otra. Toma valores entre 0 y 1:
donde t1 y t2 se definen de la misma manera que en la medida lambda de Goodman y
Kruskal.
• Dice. Medida de similaridad. También conocida como medida de Czekanowski o de
Sorenson. No tiene en cuenta las ausencias conjuntas, pero concede valor doble a las
presencias conjuntas:
33. Capítulo 22. Análisis de conglomerados jerárquico 33
• Hamann. Medida de similaridad. Probabilidad de que la característica medida se
encuentre en el mismo estado en las dos variables (presente o ausente en ambas), menos
la probabilidad de que la característica se encuentre en distinto estado en ambas variables
(presente en una y ausente en otra). Toma valores entre –1 y 1:
• Jaccard. Medida de similaridad. Medida conocida también como tasa de similaridad. No
tiene en cuenta las ausencias conjuntas (d) y pondera por igual las concordancias y las
discordancias:
• Kulczynski 1. Medida de similaridad. Excluye las ausencias conjuntas del numerador y las
concordancias del denominador. Esta medida tiene un límite inferior de 0, pero no tiene
límite superior. Y no es posible calcularla si no existen discordancias (es decir, si b = c =
0). En ese caso, el procedimiento asigna un valor arbitrario de 9999,999 como límite
superior tanto si no hay discordancias como si el valor de la medida excede de ese valor:
• Kulczynski 2. Medida de similaridad. Probabilidad condicional de que la característica
medida esté presente en una variable dado que lo está en la otra. La medida final es el
promedio de las dos medidas posibles: P(X|Y) y P(Y|X). Toma valores entre 0 y 1:
34. Capítulo 22. Análisis de conglomerados jerárquico 34
• Lance y Williams. Medida de disimilaridad. También se conoce como el coeficiente no
métrico de Bray-Curtis. Toma valores entre 0 y 1:
• Ochiai. Medida de similaridad. Versión binaria del coseno. Toma valores entre 0 y 1:
• Rogers y Tanimoto. Medida de similaridad. Incluye las ausencias conjuntas tanto en el
numerador como en el denominador y concede doble valor a las disimilaridades:
• Russel y Rao. Medida de similaridad. Es el producto escalar binario:
• Sokal y Sneath 1. Medida de similaridad. Incluye las ausencias conjuntas tanto en el
numerador como en el denominador y concede doble valor a las similaridades:
35. Capítulo 22. Análisis de conglomerados jerárquico 35
• Sokal y Sneath 2. Medida de similaridad. Excluye las ausencias conjuntas yconcede doble
valor a las disimilaridades:
• Sokal y Sneath 3. Medida de similaridad. Excluye las concordancias del denominador.
Esta medida tiene un límite inferior de 0, pero no tiene límite superior. Y no es posible
calcularla si no existen discordancias (es decir, si b = c = 0). En ese caso, el programa
asigna un valor arbitrario de 9999,999 como límite superior tanto si no hay discordancias
como si el valor de la medida excede de ese valor:
• SokalySneath4.Medida de similaridad. Probabilidad condicional de que la característica
medida se encuentre en el mismo estado (presente o ausente) en las dos variables. La
medida final es el promedio de las dos medidas posibles: P(X|Y) y P(Y|X). Toma valores
entre 0 y 1:
• Sokal y Sneath 5. Medida de similaridad. Toma valores entre 0 y 1:
• Y de Yule. Medida de similaridad. El coeficiente de coligación Y de Yule es una función
de los productos cruzados en una tabla 2x2. Toma valores entre –1 y 1:
36. Capítulo 22. Análisis de conglomerados jerárquico 36
• Q de Yule. Medida de similaridad. Versión para tablas 2x2 de la medida ordinal gamma
de Goodman y Kruskal. También es una función de los productos cruzados. Toma valores
entre –1 y 1:
Para una descripción más detallada de todas estas as medidas de distancia puede consultarse
Anderberg (1973) o Romesburg (1984).
37. Capítulo 22. Análisis de conglomerados jerárquico 37
Transformar valores
Muchas de las medidas de distancia (por ejemplo, la distancia euclídea y el resto de medidas
derivadas de ella) no son invariantes respecto a la métrica de los datos, ya que las diferencias
existentes entre las variables con puntuaciones muy altas pueden anular las diferencias existen-
tes entre las variables con puntuaciones bajas. En el archivo Coches.sav que venimos utilizan-
do, la variable motor (cilindrada en cc) adopta valores comprendidos entre 66 y 7456; por el
contrario, la variable cilindr (número de cilindros) adopta valores comprendidos entre 3 y 8.
Lógicamente, al calcular la distancia entre dos vehículos, la diferencia en las cilindradas tendrá
mucha más presencia que la diferencia en el número de cilindros.
Para resolver este problema suele recomendarse no utilizar las puntuaciones directas de
las variables (los datos en bruto) sino las puntuaciones transformadas a escalas del mismo ran-
go (escala 0-1, escala típica, etc.).
Las opciones del apartado Transformar valores (ver figura 22.8) permiten elegir entre
distintos tipos de transformación, así como si la transformación se desea hacer tomando como
referencia los casos o las variables. La transformación elegida se aplica a todos los elementos
del análisis. Estas opciones no están disponibles cuando se selecciona una medida de distancia
binaria. En todos los casos es posible seleccionar loselementos (casos o variables) que se desea
transformar. Las opciones de transformación son:
• Ninguno. No se aplica ningún método de transformación.
• Puntuaciones Z. A cada valor se le resta la media del elemento y esa diferencia se
divide por la desviación típica del elemento. Se obtienen valores estandarizados con
media 0 y desviación típica 1. Si la desviación típica vale 0, se asigna un 0 a todos los
valores.
• Rango -1 a 1. Cada valor se divide por el rango o amplitud del elemento. Se obtienen
valores estandarizados con amplitud 2 en una escala cuya unidad de medida es el ran-
go o amplitud del elemento. Si el rango o amplitud vale cero, no se efectúa la transfor-
mación.
• Rango 0 a 1. A cada valor se le resta el valor más pequeño del elemento y esa diferen-
cia se divide entre el rango o amplitud del elemento. Se obtienen valores estandariza-
dos comprendidos entre 0 y 1. Si el rango vale 0, se asigna un 0,5 a todos los valores.
38. Capítulo 22. Análisis de conglomerados jerárquico 38
• Magnitud máxima de 1. Cada valor se divide por el valor más grande del elemento.
Se obtienen valores estandarizados con un máximo de 1 y un mínimo variable pero
nunca menor de 0. Si el valor más grande vale 0, se divide por el valor absoluto del
valor más pequeño y se suma 1.
• Media 1. Divide cada valor por la media del elemento. Se obtienen valores estanda-
rizados con media igual a 1, y en una escala cuya unidad de medida es la media del
elemento. Si la media vale 0, se suma un 1 a todos los valores.
• Desviación típica 1. Divide cada valor por la desviación típica del elemento. Se
obtienen valores estandarizados con desviación típica igual a 1 y en una escala cuya
unidad de medida es la desviación típica media del elemento. Si la desviación típica
vale 0, no se efectúa la transformación.
39. Capítulo 22. Análisis de conglomerados jerárquico 39
Transformar medidas
Las opciones del apartado Transformar medidas (ver figura 22.8) permiten transformar los
valores de lamatrizdedistancias.Sise selecciona más de una transformación, el procedimiento
las realiza en el siguiente orden:
F Valores absolutos. Valor absoluto de las distancias calculadas.
F Cambiar el signo. Cambia el signo de las distancias calculadas, transformando las
medidas de similaridad en medidas de disimilaridad y viceversa.
F Cambiar escala al rango 0-1. Se resta a todos los valores de la matriz de distancias
la distancia más pequeña y cada nueva distancia se divide por el rango o amplitud de
todas las distancias. Se obtienen así valores que oscilan entre 0 y 1.
40. Capítulo 22. Análisis de conglomerados jerárquico 40
391 96.3% 15 3.7% 406 100.0%
N Porcentaje N Porcentaje N Porcentaje
Valid Perdidos Total
Casos
a
Distancia euclídea al cuadradoa.
Ejemplo (Análisis de conglomerados > Método)
Este ejemplo muestra cómo llevar a cabo un análisis de conglomerados jerárquico de variables
y se discute la influencia del método de conglomeración y de la medida de distancia utilizados
sobre el resultado del análisis.
| En el cuadro de diálogo Análisis de conglomerados jerárquicos (ver figura 22.1), tras-
ladarlasvariablesconsumo,motor(cilindrada),cv(potencia),peso,acel(aceleración)
y cilindr (nº de cilindros) a la lista Variables.
| Seleccionar la opción Variables del apartado Conglomerar.
| Pulsar en el botón Estadísticos... para acceder al subcuadro de diálogo Análisis de
conglomerados jerárquico: Estadísticos (ver figura 22.4).
| Marcar la opción Matriz de distancias. Pulsar el botón Continuar.
| Pulsar en el botón Gráficos... para acceder al subcuadro de diálogo Análisis de
conglomerados jerárquico: Gráficos (ver figura 22.5).
| Marcar la opción Dendrograma. Pulsar el botón Continuar.
Aceptando estas selecciones, el Visor ofrece los resultados que muestran las tablas 22.7 a 22.9
y las figuras 22.9 y 22.10.
La tabla 22.7 muestra un resumen de los casos procesados. Los 15 casos con valor perdido
en alguna de las variables no intervienen en el cálculo de las distancias. En una nota a pie de
tabla se indica el nombre de la medida utilizada para obtener la matriz de distancias: la distan-
cia euclídea al cuadrado (esta es la medida de distancia que el programa utiliza por defecto).
Tabla 22.7. Resumen de los casos procesados.
41. Capítulo 22. Análisis de conglomerados jerárquico 41
5071082496 3860925 405358240 20133 1657506 15669
5071082496 4803001344 2701554176 5066977280 4918516224 5087751680
3860925 4803001344 331556096 3709066 933811 4344718
405358240 2701554176 331556096 403080160 358392640 410201696
20133 5066977280 3709066 403080160 1435214 45607
1657506 4918516224 933811 358392640 1435214 1953059
15669 5087751680 4344718 410201696 45607 1953059
Caso
Consumo (l/100Km)
Cilindrada en cc
Potencia (CV)
Peso total (kg)
Aceleración 0 a 100 km/h
Año del modelo
Número de cilindros
Consumo
(l/100Km)
Cilindrada
en cc
Potencia
(CV)
Peso total
(kg)
Aceleración
0 a 100
Año del
modelo
Número de
cilindros
Archivo matricial de entrada
1 7 15669.000 0 0 2
1 5 32869.949 1 0 4
3 6 933811.000 0 0 4
1 3 2826748.000 2 3 5
1 4 381717760.000 4 0 6
1 2 4608146944.000 5 0 0
Etapa
1
2
3
4
5
6
Conglomerado
1
Conglomerado
2
Conglomerado que se combina
Coeficientes
Conglomerado
1
Conglomerado
2
Etapa en la que el conglomerado
aparece por primera vez
Próxima
etapa
La tabla 22.8 muestra la matriz de las distancias entre los elementos procesados. Puesto que
hemos decidido conglomerar variables, la matriz de distancias muestra las distancias entre las
variables. (Aunque la diagonal está blanqueada, en realidad todas las casillas contienen ceros,
es decir, el valor de la distancia euclídea mínima posible).
Tabla 22.8. Matriz de distancias.
La tabla 22.9 muestra el historial de conglomeración. Puede observarse que las distancias de
fusión (columna Coeficientes) aumentan rápidamente conforme avanzan las etapas. El titular
que precede al historial de conglomeración en el Visor indica que se ha utilizado el método de
conglomeración vinculación promedio inter-grupos.
Tabla 22.9. Historial de conglomeración.
42. Capítulo 22. Análisis de conglomerados jerárquico 42
X X X X X X X X X X X X X
X X X X X X X X X X X X
X X X X X X X X X X X
X X X X X X X X X X
X X X X X X X X X
X X X X X X X X
Número de
conglomerados
1
2
3
4
5
6
Cilindrada
Peso
Añodelmodelo
Potencia
Aceleración
Nºdecilindros
Consumo
La figura 22.9 ofrece el diagrama de témpanos. El diagrama hace evidente que el proceso de
fusión de elementos se realiza paso a paso, fundiendo únicamente dos elementos en cada paso.
Figura 22.9. Diagrama de témpanos.
43. Capítulo 22. Análisis de conglomerados jerárquico 43
La figura 22.10 muestra el dendrograma. Según veremos más adelante, este dendrograma
resulta bastante engañoso. Por ejemplo, la variable motor parece ser la única que se diferencia
del resto, pues se une a ellas sólo en la etapa final y a distancia muy superior al resto de las dis-
tancias de fusión. Además, la gran distancia a la que esta variable se incorpora al conglomerado
final está enmascarando las distancias de fusión del resto de variables: sabemos, por el dia-
grama de témpanos y por el historial de conglomeración, que las variables consumo, acelera-
ción y número de cilindros se funden muy pronto, y que las variables potencia y año del mode-
lo podrían formar un conglomerado separado. Sin embargo, la solución no parece demasiado
clara.
Figura 22.10. Dendrograma.
Dendrogram using Average Linkage (Between Groups)
Rescaled Distance Cluster Combine
C A S E 0 5 10 15 20 25
Label Num +---------+---------+---------+---------+---------+
CONSUMO 1 òø
CILINDR 7 òú
ACEL 5 òôòòòø
CV 3 òú ùòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòø
AÑO 6 ò÷ ó ó
PESO 4 òòòòò÷ ó
MOTOR 2 òòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòò÷
El motivo por el que la solución ha resultado tan poco ilustrativa de las relaciones existentes
entre las variables hay que buscarlo en la medida de distancia utilizada. La distancia euclídea
al cuadrado es una medida muy afectada por las diferencias de métrica existentes entre las va-
riables.
44. Capítulo 22. Análisis de conglomerados jerárquico 44
398 21 5 26 11.23 3.95
406 7390 66 7456 3179.73 1724.01
400 184 46 230 104.83 38.52
406 1469 244 1713 989.51 283.28
406 17 8 25 15.50 2.82
406 82 0 82 75.75 5.31
405 5 3 8 5.47 1.71
391
Consumo (l/100Km)
Cilindrada en cc
Potencia (CV)
Peso total (kg)
Aceleración 0 a 100 km/h
Año del modelo
Número de cilindros
N válido (según lista)
N Rango Mínimo Máximo Media Desv. típ.
Latabla22.10 muestraalgunosestadísticosdescriptivosdelasvariablesutilizadasenelanálisis
(esta tabla se ha obtenido con el procedimiento Estadísticos descriptivos > Descriptivos del
menú Analizar). Puede apreciarse con claridad que la métrica de las variables motor (cilindra-
da en cc) y peso es muy diferente de la métrica del resto de variables. El rango de la cilindrada
es, por ejemplo, 358 veces mayor que el del consumo, y 1478 veces mayor que el del número
de cilindros.
Tabla 22.10. Estadísticos descriptivos.
Si la métrica original de las variables fuera relevante para el análisis (como, por ejemplo,
cuando las puntuaciones representan un coste económico: saldos medios de distintos tipos de
cuentas bancarias, etc.), sería conveniente y apropiado realizar el análisis utilizando la métrica
original de las variables.
Sin embargo, si el interés del estudio se centra en las relaciones existentes entre las varia-
bles, es necesario homogeneizar la métrica de las variables antes de iniciar el análisis para que
las diferencias de métrica no constituyan un problema.
45. Capítulo 22. Análisis de conglomerados jerárquico 45
Vamos a repetir el mismo análisis, pero transformando los valores originales en puntuaciones
típicas. Para ello:
| Recuperar el cuadro de diálogo Análisis de conglomerados jerárquicos (ver figura
22.1), trasladar las variables consumo, motor (cilindrada), cv (potencia), peso, acel
(aceleración) y cilindr (nº de cilindros) a la lista Variables, y seleccionar la opción
Variables del apartado Conglomerar.
| Pulsar en el botón Estadísticos... para acceder al subcuadro de diálogo Análisis de
conglomerados jerárquico: Estadísticos (ver figura 22.4) y marcar la opción Matriz
de distancias. Pulsar el botón Continuar.
| Pulsar en el botón Gráficos... para acceder al subcuadro de diálogo Análisis de
conglomerados jerárquico: Gráficos (ver figura 22.5) y marcar la opción
Dendrograma. Pulsar el botón Continuar.
| Pulsar en el botón Método... para acceder al subcuadro de diálogo Análisis de
conglomerados jerárquicos: Método (ver figura 22.8) y en el apartado Transformar
valores, seleccionar la opción Puntuaciones Z de la lista Estandarizar. Pulsar el
botón Continuar.
Aceptando estas selecciones, el Visor ofrece, entre otros, los resultados que muestran la tabla
22.11 y las figuras 22.11 y 22.12.
46. Capítulo 22. Análisis de conglomerados jerárquico 46
99.38 113.66 89.62 1152.97 1210.38 123.16
99.38 79.21 51.57 1207.64 1066.48 38.33
113.66 79.21 106.94 1327.03 1100.55 122.98
89.62 51.57 106.94 1111.85 1016.44 80.24
1152.97 1207.64 1327.03 1111.85 548.95 1178.54
1210.38 1066.48 1100.55 1016.44 548.95 1046.44
123.16 38.33 122.98 80.24 1178.54 1046.44
Caso
Consumo (l/100Km)
Cilindrada en cc
Potencia (CV)
Peso total (kg)
Aceleración 0 a 100 km/h
Año del modelo
Número de cilindros
Consumo
(l/100Km)
Cilindrada
en cc
Potencia
(CV)
Peso total
(kg)
Aceleración
0 a 100 km/h
Año del
modelo
Número de
cilindros
Archivo matricial de entrada
X X X X X X X X X X X X X
X X X X X X X X X X X X
X X X X X X X X X X X
X X X X X X X X X X
X X X X X X X X X
X X X X X X X X
Número de
conglomerados
1
2
3
4
5
6
Añodelmodelo
Aceleración
Potencia
Peso
Nºdecilindros
Cilindrada
Consumo)
Comparando la nueva matriz de distancias (tabla 22.11) con la matriz de distancias anterior
(tabla 22.8) puede comprobarse que los valores de la matriz son ahora mucho más homo-
géneos. Ya no es la variable motor (potencia) la que posee las distancias más grandes con el
resto de elementos, sino la variable acel (aceleración). Es evidente que algo ha cambiado al
tipificar los valores originales.
Tabla 22.11. Matriz de distancias.
La figura 22.11 muestra el diagrama de témpanos del nuevo análisis. Las dos variables que pri-
mero se funden son el número de cilindros y la cilindrada, que a su vez se funden con el peso
en la segunda etapa. Esta solución es claramente distinta de la obtenida anteriormente, en la que
la variable cilindrada (debido, sin duda, a su métrica) se mantenía muy distante de las demás
variables, a las que sólo se unía en el conglomerado final.
Figura 22.11. Diagrama de témpanos.
47. Capítulo 22. Análisis de conglomerados jerárquico 47
El dendrograma del nuevo conjunto de soluciones (figura 22.12) muestra un conglomerado de
tres variables muy próximas, la cilindrada (motor), el número de cilindros y el peso. A este
conglomerado se une la potencia (cv) y posteriormente el consumo (para apreciar el orden en
que se funden estas últimas es necesario consultar el diagrama de témpanos). Por otro lado, la
aceleración se une al año del modelo con una distancia de fusión mucho mayor que las dis-
tancias de fusión de las primeras etapas. Por fin, este último conglomerado se funde con el resto
de variables en la última etapa.
El dendrograma sugiere que la mejor solución es la de tres conglomerados. Uno formado
por las variables relativas al tamaño del vehículo: cilindrada (motor), número de cilindros (ci-
lindr), peso, potencia (cv) y consumo; otro formado por la variable aceleración (acel); y otro
más formado por la variable año del modelo.
Figura 22.12. Dendrograma.
Dendrogram using Average Linkage (Between Groups)
Rescaled Distance Cluster Combine
C A S E 0 5 10 15 20 25
Label Num +---------+---------+---------+---------+---------+
MOTOR 2 òø
CILINDR 7 òôòø
PESO 4 ò÷ ó
CV 3 òòòüòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòø
CONSUMO 1 òòò÷ ó
ACEL 5 òòòòòòòòòòòòòòòòòòòòòòòûòòòòòòòòòòòòòòòòòòòòòòòòò÷
AÑO 6 òòòòòòòòòòòòòòòòòòòòòòò÷
Si dudamos de cuál es el número óptimo de conglomerados, podemos utilizar el procedimiento
Análisis factorial para validar la solución obtenida. Esto es posible hacerlo siempre y cuando
pueda utilizarse el coeficiente de correlación de Pearson para cuantificar las distancias entre
lasvariables.Silasvariables analizadas son categóricas u ordinales no esrecomendableutilizar
el análisis factorial como método de validación.
48. Capítulo 22. Análisis de conglomerados jerárquico 48
.962 .146 -.103
.925 .287 -.150
.916 .247 -.127
.850 .192 -.401
.798 .501 -.206
-.279 -.947 .128
-.190 -.126 .970
Peso total (kg)
Cilindrada en cc
Número de cilindros
Consumo (l/100Km)
Potencia (CV)
Aceleración 0 a 100 km/h
Año del modelo
1 2 3
Componente
Método de extracción: Análisis de componentes principales.
Método de rotación: Normalización Varimax con Kaiser.
La tabla 22.12 muestra el resultado del análisis factorial con la solución rotada mediante el
método Varimax. Puede comprobarse que la solución obtenida es idéntica a la alcanzada con
el análisis de conglomerados jerárquico. En el primer factor saturan las variables relativas al
tamaño delvehículo (peso,cilindrada,número decilindros,consumo ypotencia);enelsegundo
factor satura, fundamentalmente, la variable aceleración; y en el tercer factor, la variable año
del modelo.
Esto esexactamentelo que hemos encontrado con el análisis de conglomerados jerárquico.
Sin embargo, la solución del análisis factorial es más flexible en un sentido: permite que las va-
riables saturen en varios factores de manera simultánea. Así, podemos apreciar, por ejemplo,
que la aceleración se encuentra positivamente relacionada con la potencia, o que los coches
más antiguos consumen más. Esto no es posible apreciarlo en el análisis de conglomerados por-
que, una vez que se ha formado un conglomerado en una etapa, ya es indivisible en las etapas
posteriores.
Tabla 22.12. Matriz factorial de los componentes rotados.
Cuando laestructuradeloselementosanalizadoses clara, cualquiera de los métodos de conglo-
meración dará lugar a datos similares. El dendrograma resultante utilizando, por ejemplo, el
método de la mediana o el del vecino más próximo es muy similar al dendrograma de la figura
22.12.
49. Capítulo 22. Análisis de conglomerados jerárquico 49
Guardar
Las opciones del cuadro de diálogo Guardar permiten crear en el Editor de datos variables
nuevas basadas en los resultados del análisis. Para crear estas variables:
| Pulsar en el botón Guardar... del cuadro de diálogo Análisis de conglomerado jerárquico
(ver figura 22.1) para acceder al subcuadro de diálogo Análisis de conglomerados: Guar-
dar variables nuevas que muestra la figura 22.13.
Figura 22.13. Cuadro de diálogo Análisis de conglomerados jerárquicos: Guardar variables nuevas.
Conglomerado de pertenencia. Las opciones de este apartado permiten crear y guardar una
o más variables con valores indicando el conglomerado al que ha sido asignado cada caso. Es-
tas variables pueden emplearse posteriormente en otros análisis para, por ejemplo, explorar
diferencias entre los grupos.
Estas opciones sólo están disponibles si se ha seleccionado la opción Casos del apartado Con-
glomerar en el cuadro de diálogo principal (ver figura 22.1):
F Ninguno. No crea ninguna variable. Es la opción por defecto.
F Solución única. Guarda una única variable cuyos valores indican el conglomerado al
que ha sido asignado cada caso en la solución de k conglomerados. El cuadro de texto
k grupos permite introducir el número de conglomerados de la solución que se desea
obtener.
50. Capítulo 22. Análisis de conglomerados jerárquico 50
F Rango de soluciones. Guarda un conjunto de variables cuyos valores indican el con-
glomerado al que ha sido asignado cada caso en las distintas soluciones del rango se-
leccionado.
Los cuadros de texto Desde k hasta p grupos permiten definir el rango de solu-
ciones que se desea obtener. Para ello, hay que introducir para k un número entero que
indique el número de conglomerados de la solución con menos conglomerados; y para
p, un número entero que indique el número de conglomerados de la solución con más
conglomerados.
51. Capítulo 22. Análisis de conglomerados jerárquico 51
Ejemplo (Análisis de conglomerados jerárquico > Guardar)
Este ejemplo muestra cómo guardar algunas variables basadas en los resultados del análisis de
conglomerados jerárquico y cómo utilizar esas variables con otras técnicas de análisis
estadístico. Para facilitar la representación de los resultados utilizaremos una muestra aleatoria
de 40 casos. Para seleccionar los casos:
| En la ventana del Editor de datos, seleccionar la opción Seleccionar casos del menú
Datos para acceder al cuadro de diálogo Seleccionar casos.
| Marcar la opción Muestra aleatoria de casos del apartado Seleccionar y pulsar el
botón Muestra... para acceder al subcuadro de diálogo Seleccionar casos: Muestra
aleatoria.
| EnelapartadoTamaño dela muestra,seleccionarlaexpresiónExactamente ncasos
de los primeros N casos e introducir los valores n = 40 y N = 406 en los
correspondientes cuadros de texto. Pulsar en el botón Continuar para volver al cuadro
de diálogo principal.
Aceptando estas selecciones, el archivo de datos queda filtrado, dejando disponibles sólo 40
de los 406 casos existentes.
52. Capítulo 22. Análisis de conglomerados jerárquico 52
Para llevar a cabo el análisis de conglomerados jerárquico y guardar los resultados del análisis
como nuevas variables del archivo de datos:
| En el cuadro de diálogo Análisis de conglomerados jerárquicos (ver figura 22.1) se-
leccionar las variables consumo, motor, cv, peso, acel, año y cilindr y trasladarlas a
la lista Variables.
| Marcar la opción Casos del apartado Conglomerar.
| Desactivar la opción Estadísticos del apartado Mostrar para que el Visor sólo mues-
tre los gráficos.
| Pulsar en el botón Gráficos... para acceder al subcuadro de diálogo Análisis de con-
glomerados jerárquico: Gráficos (ver figura 22.4).
| Marcar la opciónDendrograma yla opción Ninguno del apartado Témpanos. Pulsar
el botón Continuar para volver al cuadro de diálogo principal.
| Pulsar el botónMétodo... para acceder al subcuadro de diálogo Análisis de conglome-
rados jerárquico: Método (ver figura 22.8).
| En el apartado Transformar valores, seleccionar la opción Puntuaciones Z de la
lista desplegable Estandarizar. Pulsar el botón Continuar para volver al cuadro de
diálogo principal.
| Pulsar en el botón Guardar... para acceder al subcuadro de diálogo Análisis de con-
glomerados jerárquico: Guardar variables nuevas (ver figura 22.13).
| EnelapartadoConglomeradodepertenencia,seleccionarlaopciónSoluciónúnica:
__ grupos e introducir el valor 3 en el cuadro de texto.
Aceptando estas selecciones, el Visor ofrece el dendrograma que muestra la figura 22.14 y crea
en el Editor de datos una nueva variable a la que asigna el nombre clu3_1.
53. Capítulo 22. Análisis de conglomerados jerárquico 53
El dendrograma de la figura 22.14 ayuda a tomar la decisión sobre el número óptimo de con-
glomerados. La figura permite apreciar la existencia de dos conglomerados claros. Pero tam-
bién podría ser apropiada una solución de tres conglomerados, manteniendo los casos 9, 30 y
32 en un conglomerado separado.
En el archivo de datos se ha almacenado una variable que contiene el conglomerado al que
pertenece cada caso, para la solución de 3 conglomerados. Esta nueva variable, denominada
clu3_1, puede ser utilizadaconotrosprocedimientosdeanálisis.El nombre asignado a la nueva
variable, clu3_1, tiene este significado: clu = cluster (conglomerado en inglés); 3 = clasifica-
ción correspondiente a la solución de 3 conglomerados; _1 = primera variable creada con el
nombre clu3 en la sesión actual).
54. Capítulo 22. Análisis de conglomerados jerárquico 54
Figura 22.14. Dendrograma para el método de Vinculación inter-grupos.
Rescaled Distance Cluster Combine
CASE 0 5 10 15 20 25
Label Num +---------+---------+---------+---------+---------+
Case 175 20 òø
Case 180 23 òú
Case 159 16 òú
Case 138 12 òôòø
Case 181 24 òú ó
Case 126 11 òú ùòø
Case 156 15 ò÷ ó ó
Case 60 6 òòò÷ ùòø
Case 117 10 òûòòòø ó
Case 178 21 ò÷ ó ùòø
Case 29 3 òòòòò÷ ó ó
Case 79 8 òòòòòòò÷ ó
Case 275 30 òûòø ùòòòòòòòòòø
Case 316 32 ò÷ ùòòòø ó ó
Case 179 22 òûò÷ ó ó ó
Case 251 28 ò÷ ó ó ó
Case 357 37 òûòø ùò÷ ó
Case 388 39 ò÷ ó ó ùòø
Case 256 29 òø ó ó ó ó
Case 287 31 òôòüòòò÷ ó ó
Case 246 27 ò÷ ó ó ùòòòòòòòòòòòòòòòòòòòòòòòòòòòø
Case 337 35 òòò÷ ó ó ó
Case 341 36 òûòòòòòòòòòòòòòòòòò÷ ó ó
Case 370 38 ò÷ ó ó
Case 333 33 òòòòòûòòòòòòòòòòòòòòò÷ ó
Case 336 34 òòòòò÷ ó
Case 171 17 òòòûòòòø ó
Case 209 25 òòò÷ ùòòòòòø ó
Case 43 5 òòòòòòò÷ ó ó
Case 145 13 òûòø ùòòòòòòòòòòòòòòòø ó
Case 146 14 ò÷ ó ó ó ó
Case 72 7 òûòüòòòø ó ó ó
Case 97 9 ò÷ ó ùòòòòò÷ ó ó
Case 231 26 òòò÷ ó ùòòòòòòòòòòòòòòòòòòò÷
Case 173 18 òòòòòûò÷ ó
Case 174 19 òòòòò÷ ó
Case 9 1 òòòòòûòòòòòòòòòø ó
Case 20 2 òòòòò÷ ùòòòòòòòòòòòòò÷
Case 32 4 òòòòòòòòòòòòòòò÷
55. Capítulo 22. Análisis de conglomerados jerárquico 55
19.33 8.46 15.20 11.03
3 26 10 39
6937.00 1839.77 4770.20 2983.26
3 26 10 39
221.67 81.85 128.90 104.67
3 26 10 39
1347.00 784.35 1278.20 954.26
3 26 10 39
11.33 15.88 14.39 15.15
3 26 10 39
70.00 76.42 74.20 75.36
3 26 10 39
8.00 4.08 7.40 5.23
3 26 10 39
Media
N
Media
N
Media
N
Media
N
Media
N
Media
N
Media
N
Consumo (l/100Km)
Cilindrada en cc
Potencia (CV)
Peso total (kg)
Aceleración 0 a 100 km/h
Año del modelo
Número de cilindros
1 2 3 Total
Conglomerados
Las tablas 22.13 y 22.14 muestran las medias de cada una de las variables utilizadas en cada
uno de los conglomerados del análisis. La tabla 22.13 se basa en las puntuaciones originales.
La tabla 22.14, en las puntuaciones tipificadas. Estas tablas se han obtenido con el procedi-
mientoCompararmedias> MediasdelmenúAnalizar,tomando comodependienteslassiete
variables incluidas en el análisis y como independiente la variable clu3_1. (La tabla basada en
las puntuaciones originales es similar a la ofrecida como opción en el procedimiento Análisis
de conglomerados de K medias.
En las columnas se encuentran los vectores de medias de los conglomerados (vectores a
los que ya nos hemos referido como centroides). Los centroides son de utilidad para conocer
cuáles son las variables en las que más se diferencian los conglomerados; por tanto, ayudan a
conocer la constitución interna de los conglomerados y a interpretar la solución. Esta informa-
ción puede resultar especialmente interesante debido a que el análisis de conglomerados no
utiliza selectivamente las variables con mejores propiedades estadísticas, sino que utiliza todas
las variables designadas por el usuario.
Tabla 22.13. Centroides de los conglomerados en puntuaciones directas.
Los centroides indican (tanto los originales como los tipificados), por ejemplo, que el conglo-
merado 1 está más cerca del 3 que del 2 en todas las variables exceptuando la aceleración y el
año del modelo (de hecho, los conglomerados 1 y 3 son los que se funden en la solución de 2
conglomerados). El conglomerado 1 está constituido por los 3 vehículos de mayor tamaño del
motor (es decir, los tres vehículos con mayores consumo, cilindrada, potencia, peso y número
de cilindros), aceleración rápida y mucha antigüedad . El conglomerado 2 está formado por los
56. Capítulo 22. Análisis de conglomerados jerárquico 56
1.934 -.597 .972 .000
3 26 10 39
2.119 -.661 .937 -.038
3 26 10 39
2.589 -.545 .509 -.034
3 26 10 39
1.332 -.629 1.092 -.037
3 26 10 39
-1.368 .302 -.245 .034
3 26 10 39
-1.510 .346 -.296 .039
3 26 10 39
1.477 -.669 1.148 -.038
3 26 10 39
Media
N
Media
N
Media
N
Media
N
Media
N
Media
N
Media
N
Puntuaciones típicas
Consumo (l/100Km)
Cilindrada en cc
Potencia (CV)
Peso total (kg)
Aceleración 0 a 100 km/h
Año del modelo
Número de cilindros
1 2 3 Total
Conglomerados
26 vehículos con menor tamaño del motor, aceleración lenta y poca antigüedad. El conglome-
rado 3 consta de 10 vehículos con gran tamaño del motor (aunque no tanto como los del con-
glomerado 1), pero con aceleración lenta y poca antigüedad.
Figura 22.14. Centroides de los conglomerados en puntuaciones típicas.
57. Capítulo 22. Análisis de conglomerados jerárquico 57
552.246 2 276.123 66.836 .000
148.728 36 4.131
700.974 38
112824575.221 2 56412287.610 187.318 .000
10841696.215 36 301158.228
123666271.436 38
60479.715 2 30239.858 80.230 .000
13568.951 36 376.915
74048.667 38
2262743.951 2 1131371.976 52.811 .000
771223.485 36 21422.875
3033967.436 38
63.361 2 31.681 5.362 .009
212.696 36 5.908
276.057 38
129.028 2 64.514 7.493 .002
309.946 36 8.610
438.974 38
104.677 2 52.338 103.265 .000
18.246 36 .507
122.923 38
Inter-grupos
Intra-grupos
Total
Inter-grupos
Intra-grupos
Total
Inter-grupos
Intra-grupos
Total
Inter-grupos
Intra-grupos
Total
Inter-grupos
Intra-grupos
Total
Inter-grupos
Intra-grupos
Total
Inter-grupos
Intra-grupos
Total
Consumo (l/100Km)
Cilindrada en cc
Potencia (CV)
Peso total (kg)
Aceleración 0 a 100 km/h
Año del modelo
Número de cilindros
Suma de
cuadrados gl
Media
cuadrática F Sig.
Otra cosa interesante que puede hacerse con la variable del conglomerado de pertenencia es
comprobar si existen diferencias significativas entre los conglomerados obtenidos. Para ello,
podemos utilizar el análisis de varianza de un factor tomando como variable independiente
o factor la variable que contiene información sobre el conglomerado al que pertenece cada su-
jeto (clus3_1) y como variables dependientes cada una de las variables incluidas en el análisis.
(Podemos obtener un ANOVA de un factor con el mismo procedimiento utilizado para obtener
la tabla de medias (Comparar medias > Medias), o con el procedimiento Comparar medias
> ANOVA de un factor).
La tabla 22.15 muestra un resumen con los resultados del análisis de varianza. Esta tabla
es equivalente a la tabla resumen del ANOVA que ofrece el procedimiento Análisis de conglo-
merados de K medias. Los niveles críticos (Sig.) asociados a cada estadístico de contraste son
orientativos, pues están calculados sin efectuar ningún tipo de control sobre la tasa de error (es
decir, sobre la probabilidad de cometer errores tipo I). Por otro lado, los sujetos no han sido
asignados aleatoriamente a los distintos conglomerados, como asume el análisis de varianza.
No obstante, los resultados de la tabla ayudan a valorar si los conglomerados son diferentes
entre sí y qué variables contribuyen a hacerlos diferentes.
Tabla 22.15. Tabal resumen del ANOVA.
58. Capítulo 22. Análisis de conglomerados jerárquico 58
En nuestro ejemplo, todos los estadísticos F de la tabla tienen asociados niveles críticos muy
pequeños, por lo que podemos pensar que todas las variables incluidas en el análisis son útiles
desde el punto de vista de la clasificación de los casos. Si alguna de las variables tuviera aso-
ciado un nivel crítico alto (por encima de 0,05) deberíamos sospechar que esa variable carece
de relevancia para efectuar la conglomeración.
Cuando la solución del análisis de conglomerados contiene más de dos conglomerados,
pueden realizarse comparaciones múltiples entre las medias de los conglomerados (compara-
ciones post-hoc) para averiguar qué conglomerados difieren entre sí en cada una de las varia-
bles.
59. Capítulo 22. Análisis de conglomerados jerárquico 59
Función 1
1086420-2-4-6
Función2
10
8
6
4
2
0
-2
-4
-6
Vinculación promedio
Centroides de grupo
Casos no agrupados
3
2
1
3
2
1
Otro análisis interesante que podemos hacer con la variable del conglomerado de pertenencia
es un análisis discriminante. Utilizando como variable de clasificación el conglomerado de
pertenencia podemos facilitar la interpretación de las diferencias existentes entre los conglo-
merados, ya que las variables independientes se encuentran muy relacionadas entre sí.
La figura 22.15 muestra la distribución de los casos en el espacio definido por las dos fun-
ciones discriminantes. Los casos del conglomerado 1 obtienen puntuaciones altas en las dos
funciones.Loscasosdelsegundo conglomerado obtienenpuntuacionesbajasenlaprimerafun-
ción ypuntuaciones medias en la segunda. Los casos del tercer conglomerado obtienen puntua-
ciones medias-altas en la primera función y puntuaciones medias-bajas en la segunda. El
diagrama de dispersión muestra con claridad que los casos de un conglomerado se encuentran
bien diferenciados de los casos de los restantes conglomerados.
El diagrama también muestra la ubicación concreta de los tres centroides en las funciones
discriminantes.
Figura 22.15. Diagrama de dispersión de las funciones discriminantes.
60. Capítulo 22. Análisis de conglomerados jerárquico 60
.499 -.170
.908 .192
-.192 2.173
-.181 -1.191
.209 1.091
-.142 .175
.256 -.814
Consumo (l/100Km)
Cilindrada en cc
Potencia (CV)
Peso total (kg)
Aceleración 0 a 100 km/h
Año del modelo
Número de cilindros
1 2
Función
.850 .095
.624 -.189
.522 .355
.509 .015
.445 -.151
-.160 -.104
-.134 -.095
Cilindrada en cc
Número de cilindros
Potencia (CV)
Consumo (l/100Km)
Peso total (kg)
Año del modelo
Aceleración 0 a 100 km/h
1 2
Función
La tabla 22.16 muestra la matriz de los coeficientes estandarizados de las dos funciones discri-
minantes obtenidas. La primera función atribuye mayor importancia a la cilindrada y al consu-
mo; la segunda atribuye mayor importancia a la potencia, a la aceleración y al peso.
Podemos pensar que los casos del primer conglomerado son coches de gran consumo y
cilindrada, poco peso y gran potencia (puntuaciones altas en ambas funciones), digamos que
son coches potentes. El segundo conglomerado está constituido por coches de reducida
cilindrada y poco consumo (función 1) y potencia y aceleración medias (función 2). El tercer
conglomerado esta compuesto por coches de cilindrada y consumo medio-alto (función 1),
poca potencia y mucho peso (función 2).
Tabla 22.16. Coeficientes estandarizados del análisis discriminante.
La tabla 22.17 recoge las correlaciones entre las variables de agrupación y las funciones discri-
minantes.Laprimera función contiene información sobre el tamaño del motor yla segundafun-
ción información sobre la potencia del motor.
Tabla 22.17. Matriz de estructura del análisis discriminante.
< Fin del capítulo 22 >