Este documento describe la técnica de análisis de escalamiento multidimensional (MDS) y la compara con otras técnicas multivariantes como el análisis factorial y el análisis cluster. El MDS mapea objetos en un espacio geométrico de pocas dimensiones basado en su similitud, permitiendo visualizar las relaciones perceptuales entre ellos. El documento explica los modelos métrico y no métrico de MDS, y cómo minimizar el estrés para obtener la mejor solución. Finalmente, aplica estas técnicas al análisis
Este documento resume el modelo de Unfolding desde su origen en 1950 hasta desarrollos recientes. El Unfolding es un caso especial de escalamiento multidimensional para datos de preferencia que representa individuos e ítems en un mismo espacio. Sin embargo, los algoritmos de MDS no siempre producen soluciones óptimas para datos de preferencia debido a soluciones triviales y degeneradas. Se han propuesto métodos como el Stress-2 y algoritmos como ALSCAL para evitar estas soluciones no interpretables. El documento también revisa software disponible para cálculo de soluciones de Unfold
RESOLUCIÓN EXACTA DEL MODELO DEL MÁXIMO PROMEDIO PARA EL PROBLEMA DE LA DISPE...Fernandoss2
Este documento presenta modelos matemáticos para resolver el problema de dispersión máxima. Se describen cinco modelos: MAXSUM, MAXMIN, MINDIFF, MAXMEAN y MAXMINSUM. El modelo MAXMEAN busca maximizar el promedio de distancias entre nodos seleccionados, siendo el número de nodos una variable de decisión. Se formulan los modelos como problemas de programación matemática y se resuelven usando solvers como CPLEX y CONOPT3. Se generan instancias aleatorias para probar los modelos, variando el tamaño del problema y la distribución
El documento describe la historia y conceptos fundamentales del escalamiento multidimensional. Comenzó con el trabajo de Torgerson en 1952 y ha evolucionado desde entonces con nuevos enfoques y algoritmos. El objetivo es representar datos a través de una configuración de puntos que respete las relaciones de proximidad entre objetos, basándose en una matriz de similitudes. Existen diferentes técnicas métricas y no métricas dependiendo de si la matriz es simétrica u asimétrica.
El documento presenta conceptos básicos de estadística descriptiva como medidas de tendencia central (media, moda y mediana) y cómo calcularlas. Explica que la media es el promedio de los datos, la moda es el valor más frecuente y la mediana divide los datos en dos partes iguales. Proporciona ejemplos numéricos para ilustrar el cálculo de cada medida y sus características. Finalmente, plantea problemas estadísticos sobre rendimiento de autos y puntualidad de vuelos para que los estudiantes practiquen el cál
Este documento presenta varias medidas estadísticas para describir distribuciones, incluyendo medidas de centralización como la media, mediana y moda, y medidas de dispersión como la varianza y desviación estándar. Explica cómo calcular estas medidas y sus propiedades, como que la media es una operación lineal y la varianza es invariante ante traslaciones. El objetivo es que los estudiantes aprendan a comparar distribuciones y a normalizarlas para hacerlas comparables.
Este documento describe medidas de tendencia central y dispersión utilizadas para resumir y analizar datos estadísticos. Explica que las medidas de tendencia central como la media, mediana y moda identifican el punto central de los datos, mientras que las medidas de dispersión como la varianza, desviación estándar y rango indican qué tan dispersos están los valores. Proporciona fórmulas y ejemplos para calcular cada medida.
Este documento resume el modelo de Unfolding desde su origen en 1950 hasta desarrollos recientes. El Unfolding es un caso especial de escalamiento multidimensional para datos de preferencia que representa individuos e ítems en un mismo espacio. Sin embargo, los algoritmos de MDS no siempre producen soluciones óptimas para datos de preferencia debido a soluciones triviales y degeneradas. Se han propuesto métodos como el Stress-2 y algoritmos como ALSCAL para evitar estas soluciones no interpretables. El documento también revisa software disponible para cálculo de soluciones de Unfold
RESOLUCIÓN EXACTA DEL MODELO DEL MÁXIMO PROMEDIO PARA EL PROBLEMA DE LA DISPE...Fernandoss2
Este documento presenta modelos matemáticos para resolver el problema de dispersión máxima. Se describen cinco modelos: MAXSUM, MAXMIN, MINDIFF, MAXMEAN y MAXMINSUM. El modelo MAXMEAN busca maximizar el promedio de distancias entre nodos seleccionados, siendo el número de nodos una variable de decisión. Se formulan los modelos como problemas de programación matemática y se resuelven usando solvers como CPLEX y CONOPT3. Se generan instancias aleatorias para probar los modelos, variando el tamaño del problema y la distribución
El documento describe la historia y conceptos fundamentales del escalamiento multidimensional. Comenzó con el trabajo de Torgerson en 1952 y ha evolucionado desde entonces con nuevos enfoques y algoritmos. El objetivo es representar datos a través de una configuración de puntos que respete las relaciones de proximidad entre objetos, basándose en una matriz de similitudes. Existen diferentes técnicas métricas y no métricas dependiendo de si la matriz es simétrica u asimétrica.
El documento presenta conceptos básicos de estadística descriptiva como medidas de tendencia central (media, moda y mediana) y cómo calcularlas. Explica que la media es el promedio de los datos, la moda es el valor más frecuente y la mediana divide los datos en dos partes iguales. Proporciona ejemplos numéricos para ilustrar el cálculo de cada medida y sus características. Finalmente, plantea problemas estadísticos sobre rendimiento de autos y puntualidad de vuelos para que los estudiantes practiquen el cál
Este documento presenta varias medidas estadísticas para describir distribuciones, incluyendo medidas de centralización como la media, mediana y moda, y medidas de dispersión como la varianza y desviación estándar. Explica cómo calcular estas medidas y sus propiedades, como que la media es una operación lineal y la varianza es invariante ante traslaciones. El objetivo es que los estudiantes aprendan a comparar distribuciones y a normalizarlas para hacerlas comparables.
Este documento describe medidas de tendencia central y dispersión utilizadas para resumir y analizar datos estadísticos. Explica que las medidas de tendencia central como la media, mediana y moda identifican el punto central de los datos, mientras que las medidas de dispersión como la varianza, desviación estándar y rango indican qué tan dispersos están los valores. Proporciona fórmulas y ejemplos para calcular cada medida.
Este documento explica varias medidas de tendencia central y dispersión utilizadas en estadística. Define la media aritmética, mediana y moda como medidas de tendencia central principales. También describe el cálculo y aplicación de estas medidas, así como el rango medio, para resumir conjuntos de datos. Además, explica medidas de dispersión como la varianza y desviación estándar y cómo calcularlas a partir de series de datos simples y agrupados.
Este documento presenta información sobre medidas de tendencia central y dispersión estadística. Explica conceptos como media, mediana, moda, desviación estándar y rango. Proporciona fórmulas y ejemplos para calcular estas medidas a partir de datos agrupados y no agrupados. Además, ofrece referencias bibliográficas relacionadas con estos temas estadísticos fundamentales.
El documento proporciona una introducción al análisis multivariante. Explica que este conjunto de métodos estadísticos permite analizar datos con múltiples variables medidas para cada sujeto u objeto estudiado. Describe los objetivos del análisis multivariante y clasifica sus técnicas en métodos de dependencia, interdependencia y estructurales. Además, presenta ejemplos de aplicaciones del análisis multivariante en diversas áreas como la medicina, biología, sociología e investigación de mercados.
La econometría se ocupa de validar teorías económicas a través de la especificación de modelos matemáticos y estadísticos que se ponen a prueba con datos recolectados. Los pasos más relevantes de la econometría son la experimentación y las conclusiones, ya que implican la recolección de datos y la validación o refutación de teorías económicas. El análisis estadístico de los datos incluye la estimación de parámetros como la media, varianza, desviación estándar y otros, y perm
Este documento describe diferentes medidas estadísticas para resumir conjuntos de datos, incluidas medidas de tendencia central (media, mediana, moda), dispersión (rango, varianza, desviación estándar, coeficiente de variación), y forma (sesgo, curtosis). Explica cómo calcular cada medida y qué información proporciona sobre la distribución de los datos.
Este documento describe cómo calcular e informar incertidumbres en mediciones experimentales. Explica que la incertidumbre estima la desviación entre el valor medido y el valor real. Para mediciones directas, la incertidumbre se calcula como la precisión del instrumento o la desviación estándar de múltiples mediciones. Para mediciones indirectas, la incertidumbre depende de las incertidumbres de las mediciones utilizadas. Finalmente, los resultados deben redondearse para que la incertidumbre tenga una cifra significativa y coincida
Este documento presenta conceptos sobre distribuciones bidimensionales. Explica que estas son aquellas que estudian dos variables estadísticas de forma simultánea, representadas por (X,Y). También introduce la nube de puntos y medidas para analizar la correlación entre las variables, como el coeficiente de correlación de Pearson. Finalmente, incluye ejemplos numéricos para ilustrar los conceptos.
Este documento presenta información sobre medidas de tendencia central, posición y dispersión. Explica que las medidas de tendencia
central como la media, mediana y moda resumen un conjunto de datos indicando hacia dónde se agrupan los valores. Luego describe
medidas de posición como cuartiles y percentiles que dividen los datos ordenados en partes porcentuales. Finalmente, introduce
medidas de dispersión como rango, desviación media, varianza y desviación típica que muestran cómo se dispersan los datos.
Este documento presenta información sobre medidas de tendencia central y posición. Explica que las medidas de tendencia central como la media, mediana y moda resumen un conjunto de datos indicando hacia dónde se agrupan los valores. Luego define medidas de posición como cuartiles, deciles y percentiles que dividen los datos ordenados en partes porcentuales. Finalmente, proporciona ejercicios para calcular estas medidas a partir de datos de tiempos de reacción, edades y tiempos en una prueba.
El documento describe los conceptos y métodos fundamentales para realizar un estudio cuantitativo de una comunidad ecológica. Explica cómo seleccionar el método de muestreo apropiado, incluidas las formas y tamaños de las unidades de muestreo. También describe cómo calcular variables comunes como la densidad y frecuencia de las especies presentes. El objetivo es aplicar estos métodos a una comunidad artificial para evaluar su efectividad y comparar los resultados con los valores reales conocidos.
El documento presenta conceptos básicos de estadística, incluyendo definiciones de términos como población, muestra, variable, parámetro, estadístico. Explica cómo organizar y resumir datos en una distribución de frecuencias e histograma. También describe medidas de tendencia central como la media, mediana y moda, y de variación como rango, varianza y desviación estándar. Finalmente, incluye un ejemplo práctico para ilustrar el cálculo e interpretación de estas medidas.
Este documento describe diferentes medidas de tendencia central y dispersión estadísticas. Las medidas de tendencia central discutidas incluyen la media o promedio, la mediana y la moda. La media es la suma de todos los valores dividida por el número total de datos. La mediana es el valor central cuando los datos están ordenados de menor a mayor. La moda es el valor que se repite con mayor frecuencia. Las medidas de dispersión miden cuán dispersos están los datos respecto a la media e incluyen el rango, la varianza, la desviación estándar y el coeficiente de variación.
Clasificador_de_minima_distancia en imagenes.pptjosephcruz74484
Este documento describe varios algoritmos de clasificación, incluyendo el clasificador de mínima distancia y el algoritmo de clustering K-means. Explica cómo el clasificador de mínima distancia asigna un objeto a la clase cuyo patrón está a la distancia mínima, y cómo el algoritmo K-means itera entre la asignación de vectores a centroides y la actualización de los centroides hasta converger. También discute medidas de distancia como la distancia Euclídea y de Mahalanobis usadas para comparar vectores característicos.
Este documento describe medidas de dispersión como la desviación media, varianza y desviación estándar. Explica cómo calcular estas medidas para datos no agrupados y agrupados utilizando fórmulas y Excel. También describe propiedades como que la varianza y desviación estándar miden qué tan dispersos están los datos alrededor del promedio, y que la desviación estándar es más fácil de interpretar que la varianza debido a que está en las mismas unidades que los datos originales.
Este documento describe los conceptos fundamentales de la teoría de la decisión. Explica que la toma de decisiones implica elegir entre alternativas en situaciones de incertidumbre. Presenta el enfoque de la decisión como una forma de abordar problemas de estimación y contraste de hipótesis. Define los componentes clave de un problema de decisión, como los sucesos inciertos, las opciones disponibles y las consecuencias de cada decisión. Finalmente, introduce diferentes métodos para cuantificar las consecuencias, como las funciones de utilidad, pérdida
El documento describe el proceso de normalización de bases de datos. La normalización se aplica para proteger la integridad de los datos, evitar redundancias y problemas de actualización. Se normaliza una base de datos para evitar anomalías como la de inserción, borrado y actualización. También explica conceptos como dependencia funcional y diferentes formas de descomponer esquemas relacionales.
Este documento explica diferentes medidas de dispersión como el rango, la desviación estándar y la varianza. Define cada medida y proporciona fórmulas para calcularlas. También describe propiedades clave como que la varianza siempre es positiva o cero, y que la varianza no cambia si se suma una constante a los datos pero sí se multiplica si los datos se multiplican por una constante. Finalmente, presenta un ejemplo numérico para calcular estas medidas de dispersión.
El análisis dimensional ayuda a formular ecuaciones a partir de problemas sin ecuaciones previas. Se identifican las variables independientes y sus dimensiones, luego se eligen variables adimensionales para formar términos pi que eliminen las variables independientes y dejen solo las dependientes. Esto reduce problemas de muchas variables a solo unas cuantas, abaratando costos. La similitud dimensional permite predecir el comportamiento de sistemas a diferentes escalas.
Este documento define las medidas de tendencia central como índices de localización central utilizados para describir distribuciones de frecuencias. Explica que los datos a menudo se acumulan alrededor de un valor central entre los valores extremos de la variable estudiada. Luego describe los métodos para calcular la media aritmética, la mediana y la moda, y compara sus propiedades, señalando que la media es más útil para análisis estadísticos avanzados, mientras que la moda es la medida más fácil de determinar.
Este documento presenta una guía para realizar un estudio de mercado para una pequeña o mediana empresa. Explica los objetivos de un estudio de mercado, los métodos para recopilar información primaria y secundaria, y cómo analizar la oferta, demanda, precios y canales de comercialización. También incluye ejemplos e instrucciones para la presentación del estudio de mercado.
Este documento proporciona información sobre la hoja de seguridad del naranja de metilo. El naranja de metilo es un sólido tóxico de color naranja-amarillo con masa molecular de 285,02 g/mol y fórmula química C14H14N3NaO3S. Se usa principalmente para análisis químicos y farmacéuticos. El documento describe los peligros, primeros auxilios, medidas de protección, propiedades físicas y químicas, información toxicológica y regl
Este documento explica varias medidas de tendencia central y dispersión utilizadas en estadística. Define la media aritmética, mediana y moda como medidas de tendencia central principales. También describe el cálculo y aplicación de estas medidas, así como el rango medio, para resumir conjuntos de datos. Además, explica medidas de dispersión como la varianza y desviación estándar y cómo calcularlas a partir de series de datos simples y agrupados.
Este documento presenta información sobre medidas de tendencia central y dispersión estadística. Explica conceptos como media, mediana, moda, desviación estándar y rango. Proporciona fórmulas y ejemplos para calcular estas medidas a partir de datos agrupados y no agrupados. Además, ofrece referencias bibliográficas relacionadas con estos temas estadísticos fundamentales.
El documento proporciona una introducción al análisis multivariante. Explica que este conjunto de métodos estadísticos permite analizar datos con múltiples variables medidas para cada sujeto u objeto estudiado. Describe los objetivos del análisis multivariante y clasifica sus técnicas en métodos de dependencia, interdependencia y estructurales. Además, presenta ejemplos de aplicaciones del análisis multivariante en diversas áreas como la medicina, biología, sociología e investigación de mercados.
La econometría se ocupa de validar teorías económicas a través de la especificación de modelos matemáticos y estadísticos que se ponen a prueba con datos recolectados. Los pasos más relevantes de la econometría son la experimentación y las conclusiones, ya que implican la recolección de datos y la validación o refutación de teorías económicas. El análisis estadístico de los datos incluye la estimación de parámetros como la media, varianza, desviación estándar y otros, y perm
Este documento describe diferentes medidas estadísticas para resumir conjuntos de datos, incluidas medidas de tendencia central (media, mediana, moda), dispersión (rango, varianza, desviación estándar, coeficiente de variación), y forma (sesgo, curtosis). Explica cómo calcular cada medida y qué información proporciona sobre la distribución de los datos.
Este documento describe cómo calcular e informar incertidumbres en mediciones experimentales. Explica que la incertidumbre estima la desviación entre el valor medido y el valor real. Para mediciones directas, la incertidumbre se calcula como la precisión del instrumento o la desviación estándar de múltiples mediciones. Para mediciones indirectas, la incertidumbre depende de las incertidumbres de las mediciones utilizadas. Finalmente, los resultados deben redondearse para que la incertidumbre tenga una cifra significativa y coincida
Este documento presenta conceptos sobre distribuciones bidimensionales. Explica que estas son aquellas que estudian dos variables estadísticas de forma simultánea, representadas por (X,Y). También introduce la nube de puntos y medidas para analizar la correlación entre las variables, como el coeficiente de correlación de Pearson. Finalmente, incluye ejemplos numéricos para ilustrar los conceptos.
Este documento presenta información sobre medidas de tendencia central, posición y dispersión. Explica que las medidas de tendencia
central como la media, mediana y moda resumen un conjunto de datos indicando hacia dónde se agrupan los valores. Luego describe
medidas de posición como cuartiles y percentiles que dividen los datos ordenados en partes porcentuales. Finalmente, introduce
medidas de dispersión como rango, desviación media, varianza y desviación típica que muestran cómo se dispersan los datos.
Este documento presenta información sobre medidas de tendencia central y posición. Explica que las medidas de tendencia central como la media, mediana y moda resumen un conjunto de datos indicando hacia dónde se agrupan los valores. Luego define medidas de posición como cuartiles, deciles y percentiles que dividen los datos ordenados en partes porcentuales. Finalmente, proporciona ejercicios para calcular estas medidas a partir de datos de tiempos de reacción, edades y tiempos en una prueba.
El documento describe los conceptos y métodos fundamentales para realizar un estudio cuantitativo de una comunidad ecológica. Explica cómo seleccionar el método de muestreo apropiado, incluidas las formas y tamaños de las unidades de muestreo. También describe cómo calcular variables comunes como la densidad y frecuencia de las especies presentes. El objetivo es aplicar estos métodos a una comunidad artificial para evaluar su efectividad y comparar los resultados con los valores reales conocidos.
El documento presenta conceptos básicos de estadística, incluyendo definiciones de términos como población, muestra, variable, parámetro, estadístico. Explica cómo organizar y resumir datos en una distribución de frecuencias e histograma. También describe medidas de tendencia central como la media, mediana y moda, y de variación como rango, varianza y desviación estándar. Finalmente, incluye un ejemplo práctico para ilustrar el cálculo e interpretación de estas medidas.
Este documento describe diferentes medidas de tendencia central y dispersión estadísticas. Las medidas de tendencia central discutidas incluyen la media o promedio, la mediana y la moda. La media es la suma de todos los valores dividida por el número total de datos. La mediana es el valor central cuando los datos están ordenados de menor a mayor. La moda es el valor que se repite con mayor frecuencia. Las medidas de dispersión miden cuán dispersos están los datos respecto a la media e incluyen el rango, la varianza, la desviación estándar y el coeficiente de variación.
Clasificador_de_minima_distancia en imagenes.pptjosephcruz74484
Este documento describe varios algoritmos de clasificación, incluyendo el clasificador de mínima distancia y el algoritmo de clustering K-means. Explica cómo el clasificador de mínima distancia asigna un objeto a la clase cuyo patrón está a la distancia mínima, y cómo el algoritmo K-means itera entre la asignación de vectores a centroides y la actualización de los centroides hasta converger. También discute medidas de distancia como la distancia Euclídea y de Mahalanobis usadas para comparar vectores característicos.
Este documento describe medidas de dispersión como la desviación media, varianza y desviación estándar. Explica cómo calcular estas medidas para datos no agrupados y agrupados utilizando fórmulas y Excel. También describe propiedades como que la varianza y desviación estándar miden qué tan dispersos están los datos alrededor del promedio, y que la desviación estándar es más fácil de interpretar que la varianza debido a que está en las mismas unidades que los datos originales.
Este documento describe los conceptos fundamentales de la teoría de la decisión. Explica que la toma de decisiones implica elegir entre alternativas en situaciones de incertidumbre. Presenta el enfoque de la decisión como una forma de abordar problemas de estimación y contraste de hipótesis. Define los componentes clave de un problema de decisión, como los sucesos inciertos, las opciones disponibles y las consecuencias de cada decisión. Finalmente, introduce diferentes métodos para cuantificar las consecuencias, como las funciones de utilidad, pérdida
El documento describe el proceso de normalización de bases de datos. La normalización se aplica para proteger la integridad de los datos, evitar redundancias y problemas de actualización. Se normaliza una base de datos para evitar anomalías como la de inserción, borrado y actualización. También explica conceptos como dependencia funcional y diferentes formas de descomponer esquemas relacionales.
Este documento explica diferentes medidas de dispersión como el rango, la desviación estándar y la varianza. Define cada medida y proporciona fórmulas para calcularlas. También describe propiedades clave como que la varianza siempre es positiva o cero, y que la varianza no cambia si se suma una constante a los datos pero sí se multiplica si los datos se multiplican por una constante. Finalmente, presenta un ejemplo numérico para calcular estas medidas de dispersión.
El análisis dimensional ayuda a formular ecuaciones a partir de problemas sin ecuaciones previas. Se identifican las variables independientes y sus dimensiones, luego se eligen variables adimensionales para formar términos pi que eliminen las variables independientes y dejen solo las dependientes. Esto reduce problemas de muchas variables a solo unas cuantas, abaratando costos. La similitud dimensional permite predecir el comportamiento de sistemas a diferentes escalas.
Este documento define las medidas de tendencia central como índices de localización central utilizados para describir distribuciones de frecuencias. Explica que los datos a menudo se acumulan alrededor de un valor central entre los valores extremos de la variable estudiada. Luego describe los métodos para calcular la media aritmética, la mediana y la moda, y compara sus propiedades, señalando que la media es más útil para análisis estadísticos avanzados, mientras que la moda es la medida más fácil de determinar.
Este documento presenta una guía para realizar un estudio de mercado para una pequeña o mediana empresa. Explica los objetivos de un estudio de mercado, los métodos para recopilar información primaria y secundaria, y cómo analizar la oferta, demanda, precios y canales de comercialización. También incluye ejemplos e instrucciones para la presentación del estudio de mercado.
Este documento proporciona información sobre la hoja de seguridad del naranja de metilo. El naranja de metilo es un sólido tóxico de color naranja-amarillo con masa molecular de 285,02 g/mol y fórmula química C14H14N3NaO3S. Se usa principalmente para análisis químicos y farmacéuticos. El documento describe los peligros, primeros auxilios, medidas de protección, propiedades físicas y químicas, información toxicológica y regl
El estudio evaluó 9 muestras de yogur para verificar si cumplían con la definición reglamentaria de yogur y analizar su calidad e información nutricional. Los análisis de laboratorio mostraron que ninguna muestra contenía los cultivos lácticos indispensables (Lactobacillus bulgaricus y Streptococus termophilus), por lo que los resultados son alarmantes, ya que ninguna corresponde a yogur según la normativa.
Este documento resume los conceptos clave de la administración y el control de calidad. Explica la evolución histórica del significado de "calidad" y cómo ha cambiado de un enfoque de inspección a uno de mejora continua y satisfacción del cliente. También describe los diferentes tipos de costos asociados con la calidad, los métodos estadísticos para el control de calidad como el muestreo de aceptación y el control de procesos, y cómo estos métodos buscan minimizar los errores tipo I y tipo II.
Este documento presenta una introducción a las cadenas de suministro. Explica que una cadena de suministro involucra a todos los participantes involucrados en llevar un producto al mercado, desde las materias primas hasta los clientes finales. También describe los desafíos de coordinar una cadena de suministro eficiente que minimice costos mientras satisface las necesidades conflictivas de los diferentes participantes. Finalmente, resalta algunos factores clave para el diseño y manejo exitoso de una cadena de suministro, como la configuración de la red de distribuc
Este documento presenta una guía para realizar el análisis de las 5 fuerzas de Porter, que evalúa la atractividad de una industria considerando: 1) la amenaza de nuevos competidores, 2) el poder de negociación de los clientes, 3) la amenaza de productos sustitutos, 4) el poder de negociación de los proveedores, y 5) la rivalidad entre los competidores existentes. Proporciona una serie de preguntas para cada fuerza y una escala para calificarlas como favorables, moderadas o desfavorables para la ind
Este documento introduce los conceptos básicos de inventario. Explica que el inventario incluye materia prima, productos en proceso, producto final y repuestos. Luego describe las principales decisiones relacionadas con la administración de inventarios como qué artículos mantener, cuánto ordenar, cuándo ordenar y qué sistema usar. Finalmente, resume diferentes modelos como el de demanda determinista, demanda aleatoria con sistemas de revisión continua y periódica.
El proceso de producción de queques comienza con la recepción y almacenamiento de los ingredientes. Luego, los ingredientes son pesados y mezclados para formar la masa, la cual es moldeada y horneada. Después del horneado, los queques son enfriados y empaquetados antes de ser almacenados para su distribución.
1. Introduccion a las excavaciones subterraneas (1).pdfraulnilton2018
Cuando las excavaciones subterráneas son desarrolladas de manera artesanal, se conceptúa a la excavación como el “ que es una labor efectuada con la mínima sección posible de excavación, para permitir el tránsito del hombre o de
cémilas para realizar la extracción del material desde el
frontón hasta la superficie
Cuando las excavaciones se ejecutan controlando la sección de excavación, de manera que se disturbe lo menos posible la
roca circundante considerando la vida útil que se debe dar a la roca, es cuando aparece el
concepto de “ que abarca,
globalmente, al proceso de excavación, control de la periferia, sostenimiento, revestimiento y consolidación de la excavación
Equipo 4. Mezclado de Polímeros quimica de polimeros.pptxangiepalacios6170
Presentacion de mezclado de polimeros, de la materia de Quimica de Polímeros ultima unidad. Se describe la definición y los tipos de mezclado asi como los aditivos usados para mejorar las propiedades de las mezclas de polimeros
1. EL ANÁLISIS DE ESCALAMIENTO MULTIDIMENSIONAL: UNA
ALTERNATIVA Y UN COMPLEMENTO A OTRAS TÉCNICAS
MULTIVARIANTES.
Dra. Flor María Guerrero Casas
José Manuel Ramírez Hurtado
Departamento de Economía y Empresa
Universidad Pablo de Olavide
Ctra. de Utrera, km. 1 - 41013 SEVILLA (ESPAÑA)
Tfn. 95 434 9279-9171 / Fax: 95 434 9339
fguecas@dee.upo.es jmramhur@dee.upo.es
Resumen: En los últimos años la proliferación de datos y el fácil acceso a los mismos
ha hecho que, en la mayoría de las investigaciones, se analicen grandes conjuntos de
datos, utilizando para ello las técnicas multivariantes. En este sentido, hay que indicar
que las técnicas multivariantes cobran cada vez mayor importancia en las
investigaciones.
Dentro de las técnicas multivariantes podemos citar al Escalamiento
Multidimensional (Multidimensional Scaling, MDS). El MDS es una técnica
multivariante de interdependencia que trata de representar en un espacio geométrico de
pocas dimensiones las proximidades existentes entre un conjunto de objetos o de
estímulos. Esta técnica, aunque tiene sus raíces a principios del siglo XX, hoy día sigue
siendo infrautilizada en muchas áreas.
En este trabajo se pretende dar una visión general del funcionamiento del MDS,
comparándolo con otras técnicas multivariantes más tradicionales como son el Análisis
Factorial y el Análisis Cluster, de modo que pueda servir como alternativa y como
complemento a las mismas en cualquier investigación que utilice dichas técnicas.
También se incluye un análisis comparativo de los resultados de estas técnicas,
mediante una aplicación a la infraestructura del sector turístico en Andalucía.
Palabras clave: Análisis multivariante, escalamiento, distancia, estímulo, análisis
factorial, análisis cluster, turismo.
1. INTRODUCCIÓN.
El escalamiento multidimensional, más conocido como MultiDimensional Scaling
(MDS), tiene sus orígenes a principios de siglo XX en el campo de la Psicología. Surge
cuando se pretendía estudiar la relación que existía entre la intensidad física de ciertos
estímulos con su intensidad subjetiva.
2. El MDS es una técnica de representación espacial que trata de visualizar sobre un
mapa un conjunto de estímulos (firmas, productos, candidatos políticos, ideas u otros
artículos) cuya posición relativa se desea analizar. El propósito del MDS es transformar
los juicios de similitud o preferencia llevados a cabo por una serie de individuos sobre
un conjunto de objetos o estímulos en distancias susceptibles de ser representadas en un
espacio multidimensional. El MDS está basado en la comparación de objetos o de
estímulos, de forma que si un individuo juzga a los objetos A y B como los más
similares entonces las técnicas de MDS colocarán a los objetos A y B en el gráfico de
forma que la distancia entre ellos sea más pequeña que la distancia entre cualquier otro
par de objetos.
En la actualidad, el MDS puede ser apto para gran cantidad de tipos diferentes de
datos de entrada (tablas de contingencia, matrices de proximidad, datos de perfil,
correlaciones, etc.).
El MDS puede ayudar a determinar:
qué dimensiones utilizan los encuestados a la hora de evaluar a los objetos.
cuántas dimensiones utilizan.
la importancia relativa de cada dimensión.
cómo se relacionan perceptualmente los objetos.
Existen otras técnicas multivariantes, como son el análisis factorial y el análisis
cluster, que persiguen objetivos muy similares al MDS pero que difieren en una serie de
aspectos. Sin embargo, la utilización de alguna de estas técnicas no supone que no se
pueda utilizar el escalamiento multidimensional, sino que esta última técnica puede
servir como alternativa o bien como complemento a las otras técnicas multivariantes.
En definitiva, el MDS es una técnica multivariante que crea un gráfico aproximado a
partir de las similitudes o preferencias de un conjunto de objetos.
2. EL MODELO GENERAL DE ESCALAMIENTO MULTIDIMENSIONAL.
De modo general, podemos decir que el MDS toma como entrada una matriz de
proximidades, ∆∈Μnxn, donde n es el número de estímulos. Cada elemento δij de ∆
representa la proximidad entre el estímulo i y el estímulo j.
∆ =
nnnn
n
n
δδδ
δδδ
δδδ
L
MOMM
L
L
21
22221
11211
A partir de esta matriz de proximidades el MDS nos proporciona como salida una
matriz X∈Μnxm, donde n, al igual que antes, es el número de estímulos, y m es el
número de dimensiones. Cada valor xij representa la coordenada del estímulo i en la
dimensión j (más adelante veremos el procedimiento para obtener esta matriz).
3.
=
nmnn
m
m
xxx
xxx
xxx
X
L
MOMM
L
L
21
22221
11211
A partir de esta matriz X se puede calcular la distancia existente entre dos estímulos
cualesquiera i y j, simplemente aplicando la fórmula general de la distancia de
Minkowski:
pm
t
p
jtitij xxd
−= ∑=1
)(
donde p puede ser un valor entre 1 e infinito. A partir de estas distancias podemos
obtener una matriz de distancias que denominamos D∈Mnxn:
=
nnnn
n
n
ddd
ddd
ddd
D
L
MOMM
L
L
21
22221
11211
La solución proporcionada por el MDS debe ser de tal modo que haya la máxima
correspondencia entre la matriz de proximidades inicial ∆ y la matriz de distancias
obtenidas D. Para que exista la máxima correspondencia MDS proporciona varias
medidas, que veremos más adelante, y que nos informan sobre la bondad del modelo.
3. MODELOS DE ESCALAMIENTO MULTIDIMENSIONAL.
Existen dos modelos básicos de MDS que son: el modelo de escalamiento métrico y
el modelo de escalamiento no métrico. En el primero de ellos consideramos que los
datos están medidos en escala de razón o en escala de intervalo y en el segundo
consideramos que los datos están medidos en escala ordinal. No se ha desarrollado
todavía ningún modelo para datos en escala nominal.
Modelo de escalamiento métrico.-
Todo modelo de escalamiento parte de la idea de que las distancias son una función
de las proximidades, es decir, dij=f(δij). En el modelo de escalamiento métrico partimos
del supuesto de que la relación entre las proximidades y las distancias es de tipo lineal:
dij=a+bδij. El primer procedimiento de escalamiento métrico se debió a Torgerson
(1952, 1958) quién se basó en un teorema de Young y Householder (1938), según el
cual a partir de una matriz de distancias, D∈Mnxn, se puede obtener una matriz B∈Mnxn
de productos escalares entre vectores. El procedimiento consiste en transformar la
matriz de proximidades ∆∈Μnxn en una matriz de distancias D∈Mnxn, de tal forma que
verifique los tres axiomas de la distancia euclídea:
4. 1. No negatividad dij ≥ 0 = dii
2. Simetría dij = dji
3. Desigualdad triangular dij ≤ dik + dkj
Tabla: Axiomas de la distancia euclídea.
Los dos primeros axiomas son fáciles de cumplir, pero el tercer axioma no se
cumple siempre. Este problema se conoce con el nombre de “estimación de la constante
aditiva”. Torgerson solucionó este problema, estimando el valor mínimo de c que
verifica la desigualdad triangular de la siguiente forma:
{ }kjikijkjic δδδ −−= ),,(min max
De esta forma las distancias se obtienen sumando a las proximidades la constante c,
es decir, dij=δij+c. Por ejemplo, supongamos que tenemos la siguiente matriz de
proximidades:
=∆
025
201
510
Esta matriz no verifica la desigualdad triangular puesto que no se cumple que
δ13≤δ12+δ23 (5>1+2). Para calcular el valor mínimo de la constante aditiva c tendríamos
que calcular todas las diferencias tal como se ha señalado anteriormente. En este caso se
tendría que calcular 5-1-2=2. Estas diferencias las haríamos para todos los subíndices,
obteniéndose que el valor mínimo de c es 2. La matriz de distancias sería en este caso:
=
047
403
730
D
Una vez obtenida la matriz D∈Mnxn es necesario transformarla en una matriz
B∈Mnxn de productos escalares entre vectores mediante la siguiente transformación:
)(
2
1 2
..
2
.
2
.
2
ddddb jiijij +−−−= donde:
∑=
=
n
j
iji d
n
d
1
22
.
1
(distancia cuadrática media por fila)
∑=
=
n
i
ijj d
n
d
1
22
.
1
(distancia cuadrática media por columna)
5. ∑∑= =
=
n
i
n
j
ijd
n
d
1 1
2
2
2
..
1
(distancia cuadrática media de la matriz)
Una vez llegados a este punto, lo único que queda es transformar la matriz B∈Mnxn
en una matriz X∈Μnxm tal que B=X·X’, siendo X la matriz que nos da las coordenadas de
cada uno de los n estímulos en cada una de las m dimensiones. Cualquier método de
factorización permite transformar B en X·X’.
En resumen el procedimiento consiste en transformar:
∆ (Proximidades) → D (Distancias) → B (Productos escalares) → X (coordenadas)
Modelo de escalamiento no métrico.-
A diferencia del escalamiento métrico, el modelo de escalamiento no métrico no
presupone una relación lineal entre las proximidades y las distancias, sino que establece
una relación monótona creciente entre ambas, es decir, si δij < δkl ⇒ dij ≤ dkl. Su
desarrollo se debe a Shepard (1962) quién demostró que es posible obtener soluciones
métricas asumiendo únicamente una relación ordinal entre proximidades y distancias.
Posteriormente Kruskal (1964) mejoró el modelo. El procedimiento se basa en los
siguientes apartados:
1) Transformación de la matriz de proximidades en una matriz de rangos, desde
1 hasta (n (n - 1))/2.
2) Obtención de una matriz X∈Μnxm de coordenadas aleatorias, que nos da la
distancia entre los estímulos.
3) Comparación de las proximidades con las distancias, obteniéndose las
disparidades (ďij).
4) Definición del Stress.
5) Minimización del Stress.
Tanto para el modelo métrico como para el modelo no métrico es necesario obtener
un coeficiente que nos informe sobre la bondad del modelo. Sabemos que las distancias
son una función de las proximidades, es decir:
f: δij(x) → dij(x)
De esta forma se tiene que dij=f(δij). Esto no deja ningún margen de error, sin
embargo, en las proximidades empíricas es difícil que se dé la igualdad, con lo que
generalmente ocurre que dij≈f(δij). A las transformaciones de las proximidades por f se
le denomina disparidades. A partir de aquí podemos definir el error cuadrático como:
22
))(( ijijij dfe −= δ
6. Como medida que nos informa de la bondad del modelo podemos utilizar el Stress
que Kruskal definió como:
∑
∑ −
=
ji
ij
ji
ijij
d
df
Stress
,
2
,
2
))(( δ
Mientras mayor sea la diferencia entre las disparidades y las distancias, es decir,
entre f(δij) y dij, mayor será el Stress y por tanto peor será el modelo. Por tanto, el Stress
no es propiamente una medida de la bondad del ajuste, sino una medida de la no bondad
o “maldad” del ajuste. Su valor mínimo es 0, mientras que su límite superior para n
estímulos es )/2(1 n− .
Kruskal (1964) sugiere las siguientes interpretaciones del Stress:
- 0.2 → Pobre
- 0.1 → Aceptable
- 0.05 → Bueno
- 0.025 → Aceptable
- 0.0 → Excelente
También se suele utilizar una variante del Stress que se denomina S-Stress, definida
como:
∑
∑ −
=−
ji
ij
ji
ijij
d
df
StressS
,
22
,
222
)(
))(( δ
Otra medida que se suele utilizar es el coeficiente de correlación al cuadrado (RSQ),
que nos informa de la proporción de variabilidad de los datos de partida que es
explicada por el modelo. Los valores que puede tomar oscilan entre 0 y 1, al ser un
coeficiente de correlación al cuadrado. Valores cercanos a 1 indican que el modelo es
bueno y valores cercanos a 0 indican que el modelo es malo. Su expresión es:
−
−
−−
=
∑∑∑∑
∑∑
i j
ij
i j
ij
i j
ijij
dfdfdd
dfdfdd
RSQ
2
..
2
..
2
....
))()(()(
))()()((
La mayoría de los paquetes estadísticos tienen implementados tanto los algoritmos
para obtener soluciones con MDS así como las medidas para determinar si el modelo es
7. adecuado o no1
. En la actualidad todo los algoritmos implementados en los paquetes
estadísticos son reiterativos, de forma que se alcance la mejor solución posible.
4. RELACIÓN ENTRE MDS Y OTRAS TÉCNICAS MULTIVARIANTES.
El MDS puede ser utilizado en muchas investigaciones junto a otras técnicas
multivariantes, bien como una alternativa a dichas técnicas o bien como un
complemento a las mismas. La utilización de cada una de ellas va a depender de los
objetivos que se persigan en la investigación. Por tanto, no hay una técnica mejor que
otra, sino que en algunos casos será más apropiado utilizar una técnica que en otros.
Entre las ventajas de utilizar el MDS en comparación con otras técnicas multivariantes
están:
Los datos en MDS pueden estar medidos en cualquier escala, mientras que en el
análisis factorial deben estar medidos en escala de razón o intervalo.
El MDS proporciona soluciones para cada individuo, lo cual no es posible con el
análisis factorial ni con el análisis cluster.
En el MDS el investigador no necesita especificar cuáles son las variables a
emplear en la comparación de objetos, algo que es fundamental en el análisis
factorial y en el análisis cluster, con lo que se evita la influencia del investigador
en el análisis.
Las soluciones proporcionadas por MDS suelen ser de menor dimensionalidad
que las proporcionadas por el análisis factorial (Schiffman, Reynolds y Young,
1981).
En MDS pueden ser interpretados directamente las distancias entre todos los
puntos, mientras que en el análisis de correspondencias solamente pueden ser
interpretadas directamente las distancias entre filas o bien entre columnas.
5. APLICACIÓN DEL MDS AL SECTOR TURÍSTICO EN ANDALUCÍA.
No cabe duda de que el turismo es uno de los factores más importantes para
Andalucía, constituyendo una de las fuentes de ingresos más importantes para la
economía andaluza. Entre los elementos que forman parte del sistema turístico se
encuentra la infraestructura turística, elemento que tiene gran importancia ya que de él
depende en gran medida la capacidad de una zona para atraer los flujos turísticos.
Mediante esta investigación se pretende analizar la infraestructura turística de
Andalucía, con el objeto de identificar aquellas ciudades que sean más similares en
relación a este aspecto, utilizando para ello el MDS. Los datos se han obtenido de la
Encuesta de Coyuntura Turística de Andalucía (ECTA) y de la Encuesta de Ocupación
Hotelera de la Junta de Andalucía, las cuales consideran que la infraestructura turística
en Andalucía está formada por los siguientes elementos:
1
El procedimiento de MDS implementado en SPSS es el programa ALSCAL (Alternating Least Squares
SCALing), que fue desarrollado por Takane, Young y De Leew (1977) basándose en el algoritmo de
mínimos cuadrados alternantes.
8. Partiendo de las dos encuestas señaladas anteriormente hemos obtenido para cada
una de las provincias andaluzas los datos correspondientes al número de
establecimientos y número de plazas de hoteles, de hoteles-apartamentos, de pensiones,
de camping, de agencias de viajes (sólo número de establecimientos), de restaurantes,
de cafeterías y de infraestructuras rurales2
. Estos datos corresponden al año 2000.
Con el fin de obtener una variable que nos informe de la capacidad turística en cada
una de las provincias andaluzas se ha creado un ratio para cada una de las variables
anteriores, excepto para la variable número de agencias de viajes, dividiendo el número
de plazas entre el número de establecimientos. El siguiente paso ha sido obtener a partir
de estos ratios una matriz de correlaciones entre ciudades. Finalmente, tenemos que
hacer una última transformación de los datos, para convertirlos en distancias, a través de
la fórmula de Coxon (1982):
)1(2 ijij rd −=
Esta matriz de distancias nos informa sobre las proximidades que existen entre las
ciudades, en relación a la infraestructura turística. A partir de los datos obtenidos con la
transformación de Coxon hemos aplicado un MDS, obteniéndose los siguientes
resultados:
2
La ECTA proporciona los datos referentes al número de establecimientos turísticos rurales y plazas de
los mismos por provincias, en vez de los datos referentes a las infraestructuras turístico-deportivas.
OFERTA TURÍSTICA
(Infraestructura turística)
Establecimientos hoteleros Agencias de
viajes
Restaurantes Cafeterías Infraestructuras
turístico
deportivas
Hoteles Hoteles -
apartamentos
Pensiones Campings
USUARIOS
(turistas, visitantes)
DEMANDA TURÍSTICA
9. Los valores del Stress y del RSQ (0’13230 y 0’89424) nos indican que el ajuste de
los datos es bueno. Un gráfico importante que nos informa si el modelo es adecuado o
no es el gráfico de ajuste lineal. Si los datos se ajustan bien a una recta entonces el
modelo es adecuado, ya que estamos suponiendo una relación lineal entre las distancias
y las disparidades. En el gráfico podemos observar como los datos se ajustan bastante
bien a una recta, por lo que el análisis es adecuado.
Gráfico de ajuste lineal
Modelo de distancia euclídea
Disparidades
4,03,53,02,52,01,51,0,50,0
Distancias
4,0
3,5
3,0
2,5
2,0
1,5
1,0
,5
0,0
La configuración que se obtiene es la siguiente:
Configuración de estímulos derivada
Modelo de distancia euclídea
Dimensión 1
2,52,01,51,0,50,0-,5-1,0-1,5
Dimensión2
2,0
1,5
1,0
,5
0,0
-,5
-1,0
-1,5
sevilla
malaga
jaen
huelva
granada
cordoba
cadiz
almeria
10. A partir de esta configuración podemos deducir que existen 4 agrupamientos de
ciudades, referentes a su infraestructura turística. Por un lado está Málaga, por otro
están Granada, Cádiz y Sevilla, por otro están Almería, Huelva y Jaén y por otro está
Córdoba. Esto lo podemos corroborar a través de la aplicación de un Análisis Cluster a
nuestros datos, obteniéndose los siguientes conglomerados:
cadiz 2 òûòòòòòòòòòø
granada 4 ò÷ ùòòòòòòòòòø
sevilla 8 òòòòòòòòòòò÷ ùòòòø
cordoba 3 òòòòòòòòòòòòòòòòòòòòò÷ ùòòòòòòòòòòòòòòòòòòòòòòòø
huelva 5 òòòûòòòòòòòòòòòòòòòø ó ó
jaen 6 òòò÷ ùòòòòò÷ ó
almeria 1 òòòòòòòòòòòòòòòòòòò÷ ó
malaga 7 òòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòò÷
Si seleccionamos cuatro conglomerados observaremos que se obtienen los mismos
agrupamientos que hemos obtenido con el MDS. Así pues, el MDS puede ser una
alternativa adecuada al Análisis Cluster.
Para la interpretación de las dos dimensiones obtenidas mediante el MDS podemos
utilizar un Análisis Factorial, deduciéndose de ello que la dimensión 1 puede ser
denominada como “servicios turísticos y capacidad de establecimientos hoteleros de
prestigio” y que la dimensión 2 puede ser denominada como “capacidad de servicios de
restauración y de establecimientos hoteleros económicos”. Según la primera dimensión
Málaga es la ciudad con más servicios turísticos y más capacidad de establecimientos
hoteleros de prestigio, seguida de Sevilla, Cádiz y Granada y posteriormente del grupo
formado por Almería, Huelva, Jaén y Córdoba. A partir de la segunda dimensión
podemos deducir que Almería y Huelva son las ciudades con más capacidad de
servicios de restauración y de establecimientos hoteleros económicos, seguidas de
Málaga, Sevilla, Cádiz, Granada y Jaén, y en último lugar se encuentra Córdoba. Por
tanto, el MDS puede servir como complemento a la interpretación de los datos en un
Análisis Factorial.
6. CONCLUSIONES.
Con este trabajo se ha pretendido mostrar que la técnica de escalamiento
multidimensional, a pesar de seguir siendo infrautilizada en muchas áreas, puede ser
perfectamente utilizada en muchos casos, como alternativa a otras técnicas
multivariantes o bien como complemento a las mismas. Para ello hemos visto las
diferencias más importantes existentes entre el MDS y otras técnicas multivariantes
como son el Análisis Factorial, el Análisis Cluster y el Análisis de Correspondencias.
A través del caso práctico realizado hemos visto que datos, que en un principio
parece ser que están pensados para otro tipo de análisis, también pueden ser analizados
a través de un escalamiento multidimensional.
11. BIBLIOGRAFÍA
- ARCE, C. (1993): Escalamiento Multidimensional. Una Técnica Multivariante para
el Análisis de Datos de Proximidad y Preferencia. PPU, Barcelona.
- ARCE, C. (1994): Técnicas de Construcción de Escalas Psicológicas. Síntesis,
Madrid.
- BORG, I. y GROENEN, P. (1997): Modern Multidimensional Scaling. Springer,
New York.
- COXON, A. P. (1982): The User’s Guide to Multidimensional Scaling. Heinemann
Educational Books, London.
- GREEN, P. E. y CARMONE, F. J.(1969): Multidimensional Scaling: An
Introduction and Comparison of Nonmetric Unfolding Techniques. Journal of
Maketing Research, 6, 330-341.
- HAIR, J. F., ANDERSON R.E., TATHAM, R. L., BLACK, W. C. (1999): Análisis
Multivariante. Prentice Hall, Madrid.
- KRUSKAL, J. B. (1964): Nonmetric Multidimensional Scaling: A Numerical
Method. Psychometrika, 2, 115-129.
- LUQUE, T. (2000): Técnicas de Análisis de Datos en Investigación de Mercados.
Pirámide, Madrid.
- REAL, J. E. (2001): Escalamiento Multidimensional. La Muralla, Madrid.
- SCHIFFMAN, S. S., REYNOLDS, M. L. y YOUNG, F. W. (1981): Introduction to
Multidimensional Scaling: Theory, Methods and Applications. Academic Press,
New York.
- SHEPARD, R. N. (1962): The analysis of proximities: muldimensional scaling with
an unknown distance function. Psychometrika, 27, 125-140, 219-246.
- TAKANE, Y., YOUNG, F.W. y DE LEEW, J. (1977): Nonmetric individual
differences multidimensional scaling: an alternating least squares method with
optimal scaling feautures. Psychometrika, 42, 7-67.
- TORGENSON, W. S. (1952): Multidimensional Scaling: Theory and Method.
Psychometrika, 4, 401-419.
- YOUNG, G. y HOUSEHOLDER, A. S.(1938): Discussion of a set of points in
terms of their mutual distances. Psychometrika, 3, 19-22.