El documento presenta una introducción al análisis multivariado, definiendo este método estadístico como el conjunto de técnicas para analizar simultáneamente conjuntos de datos con múltiples variables. Explica los tipos de métodos como el análisis factorial, de clusters, de regresión y discriminante. Luego describe técnicas específicas como el análisis de componentes principales, factorial, discriminante lineal y de correlación canónica. Finalmente, concluye que el análisis multivariado permite un mejor entendimiento de los fenó
1. LIBEREMOS BOLIVIA
Investigación de mercado II
Tema: Análisis Multivariado
Alumno: Quispe Aiza Daniel Leonardo
Docente: Mgr. José Ramiro Zapata Barrientos
Grupo: 09 semestre II/2020
Análisis Multivariado
Introducción.-
El análisis multivariante puede contribuir a enriquecer el debate público sobre los fenómenos que son objeto de
interés para los profesionales y los investigadores, gracias a la oportunidad que les ofrece para llevar a cabo un
análisis complejo de los datos obtenidos en sus estudios. Al servicio de la investigación cuantitativa, y como extensión
de las técnicas de análisis univariante y bivariante, el análisis multivariante tiene como objetivo principal modelar las
múltiples relaciones existentes entre diversas variables de manera simultánea. La construcción de modelos
multivariantes ejerce, pues, un papel importante en el desarrollo de las diferentes disciplinas basadas en el análisis
de datos cuantitativos y requiere, por lo tanto, una atención especial en la formación de futuros profesionales e
investigadores. Conocer la lógica, las características específicas de las diferentes técnicas disponibles, los objetivos
particulares que permiten lograr y las condiciones en que pueden ser utilizadas son algunos de los retos importantes
a los que nos enfrentaremos en este material. Para hacerlo, en este texto nos adentraremos en los aspectos básicos
involucrados en el análisis multivariante de los datos como el marco analítico general que se propone analizar e
interpretar las relaciones simultáneas entre diversas variables mediante la construcción de modelos estadísticos
complejos que permiten distinguir la contribución independiente de cada una de ellas en el sistema de relaciones
para, de este modo, describir, explicar o predecir los fenómenos que son objeto de interés. La clave de este marco
analítico general no se encuentra, por lo tanto, en el hecho de que los investigadores dispongan de múltiples
variables, sino en la capacidad que las diferentes técnicas disponibles les ofrecen para estimar el peso específico o
la importancia relativa de cada una de ellas en sus modelos. En este sentido, como veremos, el análisis multivariante
puede proporcionar las evidencias necesarias que permitan establecer inferencias a partir de la observación de
asociaciones entre las variables, de forma que sea posible extraer conclusiones no sesgadas que, además, sean
generalizables más allá de los límites de los estudios particulares siempre que sea posible.
Desarrollo.-
Definición
Es el conjunto de métodos estadísticos cuya finalidad es analizar simultáneamente conjuntos de datos multivariantes en
el sentido de que hay varias variables medidas para cada individuo u objeto estudiado. Su razón de ser radica en un
mejor entendimiento del fenómeno objeto de estudio obteniendo información que los métodos estadísticos
univariantes y bivariantes son incapaces de conseguir
Tipos de métodos de análisis multivariante
Los métodos multivariantes pueden subdividirse según diferentes aspectos. En primer lugar, se diferencian en función
de si se debe descubrir o verificar una estructura con ellos. Los métodos de determinación de la estructura incluyen el
dominio:
2. LIBEREMOS BOLIVIA
Investigación de mercado II
Tema: Análisis Multivariado
Alumno: Quispe Aiza Daniel Leonardo
Docente: Mgr. José Ramiro Zapata Barrientos
Grupo: 09 semestre II/2020
• Análisis factorial: Reduce la estructura a datos relevantes y variables individuales. Los estudios factoriales se centran en
diferentes variables, por lo que se subdividen en análisis de componentes principales y análisis de correspondencia. Por
ejemplo: ¿Qué elementos de laweb influyen más en el comportamiento de compra?
• Análisis de clusters: Las observaciones se asignan gráficamente a grupos de variables individuales y se clasifican sobre la
base de ellas. Los resultados son clusters y segmentos, como el número de compradores de un producto en particular,
que tienen entre 35 y 47 años y tienen un alto nivel de ingresos.
Los procedimientos de revisión estructural incluyen, entre otros, el TLD:
• Análisis de regresión: Investiga la influencia de dos tipos de variables una sobre la otra. Se habla de variables
dependientes y no dependientes. Las primeras son las llamadas variables explicadas, mientras que las segundas son
variables explicativas. El primero describe el estado real sobre la base de los datos, el segundo explica estos datos por
medio de relaciones de dependencia entre las dos variables. En la práctica, varios cambios de los elementos de la página
web corresponden a variables independientes, mientras que los efectos sobre la tasa de conversión serían la variable
dependiente.
• Análisis de desviaciones: Determina la influencia de varias variables o de variables individuales en grupos calculando
promedios estadísticos. Aquí se pueden comparar variables dentro de un grupo así como diferentes grupos,
dependiendo de dónde se deben suponer las desviaciones. Por ejemplo: ¿Qué grupos hacen clic con más frecuencia en
el botón "Comprar ahora" de su cesta de la compra?
• Análisis discriminante: Se utiliza en el contexto del análisis de desviaciones para diferenciar entre grupos que se pueden
describir con características similares o idénticas.
El análisis multivariante o análisis multivariado es un método estadístico utilizado para determinar la contribución de
varios factores en un simple evento o resultado.
• Los factores de estudio son los llamados factores de riesgo (bioestadística), variables independientes o variables
explicativas.
• El resultado estudiado es el evento, la variable dependiente o la variable respuesta.
El análisis multivariante mediante técnicas de proyección sobre variables latentes tiene muchas ventajas sobre los
métodos de regresión tradicionales:
• se puede utilizar la información de múltiples variables de entrada, aunque éstas no sean linealmente
independientes
• puede trabajar con matrices que contengan más variables que observaciones
• puede trabajar con matrices incompletas, siempre que los valores faltantes estén aleatoriamente distribuidos y no
superen un 10%
3. LIBEREMOS BOLIVIA
Investigación de mercado II
Tema: Análisis Multivariado
Alumno: Quispe Aiza Daniel Leonardo
Docente: Mgr. José Ramiro Zapata Barrientos
Grupo: 09 semestre II/2020
• puesto que se basan en la extracción secuencial de los factores, que extraen la mayor variabilidad posible de la matriz de
las X (variables explicativas, tienen que ser dependientes) pueden separar la información del ruido. Se asume que las X
se miden con ruido.
Técnicas multivariantes
Análisis de componentes principales: Es una técnica utilizada para describir un conjunto de datos en términos de
nuevas variables («componentes») no correlacionadas. Los componentes se ordenan por la cantidad de varianza original
que describen, por lo que la técnica es útil para reducir la dimensionalidad de un conjunto de datos.
Análisis factorial:es una técnica estadística de reducción de datos usada para explicar las correlaciones entre las
variables observadas en términos de un número menor de variables no observadas llamadas factores. Las variables
observadas se modelan como combinaciones lineales de factores más expresiones de error. El análisis factorial se
originó en psicometría, y se usa en las ciencias del comportamiento tales como ciencias sociales, marketing, gestión de
productos, investigación operativa, y otras ciencias aplicadas que tratan con grandes cantidades de datos.
Análisis Discriminante Lineal:(ADL, o LDA por sus siglas en inglés) Es una generalización del discriminante lineal de
Fisher, un método utilizado en estadística, reconocimiento de patrones y aprendizaje de máquinas para encontrar
una combinación lineal de rasgos que caracterizan o separan dos o más clases de objetos o eventos. La combinación
resultante puede ser utilizada como un clasificador lineal, o, más comúnmente, para la reducción de dimensiones antes
de la posterior clasificación.
Análisis de correlación canónica: Es un método de análisis multivariante desarrollado por .Harold Hotelling. Su objetivo
es buscar las relaciones que pueda haber entre dos grupos de variables y la validez de las mismas. Se diferencia
del análisis de correlación múltiple en que éste solo predice una variable dependiente a partir de múltiples
independientes, mientras que la correlación canónica predice múltiples variables dependientes a partir de múltiples
independientes. La correlación hipercanónica es una correlación lineal y, por tanto, solo busca relaciones lineales entre
las variables. En este análisis, entonces, se crean combinaciones lineales de las variables originales, sobre la base de su
estructura de correlación. Al diseñar el experimento hay que considerar el tamaño de la muestra ya que son necesarias
un mínimo de observaciones por variable, para que el análisis pueda representar las correlaciones adecuadamente
Análisis de grupos o agrupamiento: Es la tarea de agrupar objetos por similitud, en grupos o conjuntos de manera que
los miembros del mismo grupo tengan características similares. Es la tarea principal de la minería de datos exploratoria y
es una técnica común en el análisis de datos estadísticos. En estadística multivariante, el análisis de correspondencias es
una técnica descriptiva desarrollada por Jean-Paul Benzécri. Suele aplicarse al estudio de tablas de contingencia y es
conceptualmente similar al análisis de componentes principales con la diferencia de que en el análisis de
correspondencias los datos se escalan de modo que filas y columnas se tratan de modo equivalente. El análisis de
correspondencias descompone el estadístico del test de la ji-cuadrado asociado a una tabla de contingencia en
4. LIBEREMOS BOLIVIA
Investigación de mercado II
Tema: Análisis Multivariado
Alumno: Quispe Aiza Daniel Leonardo
Docente: Mgr. José Ramiro Zapata Barrientos
Grupo: 09 semestre II/2020
componentes ortogonales. Dado que se trata de una técnica descriptiva, puede aplicarse incluso en circunstancias en las
que la prueba anterior no es apropiada.
Conclusiones.-
El análisis Multivariado tiene la finalidad es analizar simultáneamente conjuntos de datos multivariantes en el sentido de
que hay varias variables medidas para cada individuo ú objeto estudiado.
Su razón de ser radica en un mejor entendimiento del fenómeno objeto de estudio obteniendo información que los
métodos estadísticos univariantes y bivariantes son incapaces de conseguir.
Referencias.-
1. https://www.researchgate.net/publication/336232083_Introduccion_al_analisis_mult
ivariante
2. https://www.ecured.cu/An%C3%A1lisis_multivariados
3. https://es.ryte.com/wiki/An%C3%A1lisis_Multivariante
4. https://es.m.wikipedia.org/wiki/An%C3%A1lisis_de_correspondencias
5. http://www.ciberconta.unizar.es/leccion/anamul/inicio.html
5. LIBEREMOS BOLIVIA
Investigación de mercado II
Tema: Análisis Multivariado
Alumno: Quispe Aiza Daniel Leonardo
Docente: Mgr. José Ramiro Zapata Barrientos
Grupo: 09 semestre II/2020
Videos Referencia.-
1. https://youtu.be/dRLj3rCWHjQ
2. https://youtu.be/cxD0vBMVmGk