El documento provee una introducción al análisis multivariante. Explica que involucra el estudio simultáneo de múltiples variables para determinar su contribución a un resultado. Detalla los tipos de análisis multivariante como análisis factorial, de clusters, de regresión y discriminante. También discute las ventajas e inconvenientes del enfoque y provee referencias adicionales.
1. PeñaAruquipaJosé Fernando
Mgr. José RamiroZapata Barrientos
Materia: Investigaciónde MercadosII
“LIBEREMOS BOLIVIA”
ANALISIS MULTIVARIANTE
La ciencia se compone de errores, que a su vez son los pasos hacia la verdad
Jules Verne
1. Introducción. – El análisis multivariante no es fácil de definir.En un sentido amplio, se
refiere a todos los métodos estadísticos que analizan simultáneamente medidas
múltiplesde cada individuou objeto sometido a investigación. Cualquier análisis
simultáneo de más de dos variables puede ser considerado aproximadamente como
un análisismultivariante. En sentido estricto, muchas técnicas multivariantes son
extensionesdel análisisunivariante (análisisde distribuciones de una sola variable) y
del análisisbivariante (clasificaciones cruzadas, correlación, análisis de la varianza y
regresiones simplesutilizadas para analizar dos variables). Por ejemplo,una regresión
simple (con una variable predictor) se extiende al caso multivariante para incluir varias
variables predictores. De la misma forma, la variable dependiente que se encuentra en
el análisisde la varianza se extiende para incluir múltiplesvariables dependientesen el
análisis multivariante de la varianza, Como veremos más adelante, en muchas
ocasiones las técnicas multivariantes son un medio de representar en un análisis
simple aquello que requirió varios análisis utilizando técnicas univariantes. Otras
técnicas multivariantes, sin embargo, están diseñadas exclusivamente para tratar con
problemas multivariantes, tales como el análisis factorial que sirve para identificar la
estructura subyacente de un conjunto de variables o el análisis discriminante que sirve
para diferenciar entre grupos basados en un conjunto de variables.1
2. Desarrollo. –
El análisis multivariante o análisis multivariado es un método estadístico utilizado para
determinar la contribución de varios factores en un simple evento o resultado.
Los factores de estudio son los llamados factores de riesgo (bioestadística), variables
independientes o variables explicativas.
El resultado estudiado es el evento, la variable dependiente o la variable respuesta.
2. PeñaAruquipaJosé Fernando
Mgr. José RamiroZapata Barrientos
Materia: Investigaciónde MercadosII
“LIBEREMOS BOLIVIA”
2.1. Ventajas
El análisis multivariante mediante técnicas de proyección sobre variables latentes tiene
muchas ventajas sobre los métodos de regresión tradicionales:
Se puede utilizar la información de múltiples variables de entrada, aunque éstas no sean
linealmente independientes
puede trabajar con matrices que contengan más variables que observaciones
puede trabajar con matrices incompletas, siempre que los valores faltantes estén
aleatoriamente distribuidos y no superen un 10%
puesto que se basan en la extracción secuencial de los factores, que extraen la mayor
variabilidad posible de la matriz de las X (variables explicativas,tienen que ser
dependientes) pueden separar la información del ruido. Se asume que las X se miden con
ruido.2
2.2.Desventajas.–
Técnicas multivariantes son complejos e implican las matemáticas de alto nivel que requieren
de un programa estadístico para analizar los datos. Estos programas estadísticos son
generalmente caros. Los resultados del análisis multivariado no siempre son fáciles de
interpretar, y tienden a basarse en hipótesis que pueden ser difíciles de evaluar. Para las
técnicas multivariantes para dar resultados significativos,necesitan una amplia muestra de
datos, de lo contrario los resultados no tienen sentido debido a errores en alto nivel.Los
errores estándar determinan el grado de confianza que puede estar en los resultados, y usted
puede tener más confianza en los resultados de una muestra grande de uno pequeño.
Realización de programas de estadística es bastante simple,pero requiere un estadístico para
dar sentido a la salida.3
2.3.Tipos de métodos de análisis multivariante. –
Análisis factorial: Reduce la estructura a datos relevantesy variables individuales.Los
estudios factoriales se centran en diferentes variables, por lo que se subdividen en análisis de
componentes principales y análisis de correspondencia. Por ejemplo:¿Qué elementosde la
web influyenmás en el comportamiento de compra?4
Análisis de clusters: Las observaciones se asignan gráficamente a grupos de variables
individualesy se clasifican sobre la base de ellas. Los resultados son clusters y segmentos,
como el número de compradores de un producto en particular, que tienenentre 35 y 47 años
y tienen un alto nivel de ingresos.4
Los procedimientos de revisiónestructural incluyen,entre otros, el TLD:
Análisis de regresión: Investiga la influenciade dos tipos de variables una sobre la otra. Se
habla de variables dependientesy no dependientes.Las primeras son las llamadas variables
explicadas, mientras que las segundas son variables explicativas.El primero describe el estado
3. PeñaAruquipaJosé Fernando
Mgr. José RamiroZapata Barrientos
Materia: Investigaciónde MercadosII
“LIBEREMOS BOLIVIA”
real sobre la base de los datos, el segundo explica estos datos por medio de
relaciones de dependencia entre las dos variables. En la práctica, varios cambios de los
elementosde la página web corresponden a variables independientes,mientras que los
efectos sobre la tasa de conversión serían la variable dependiente.4
Análisis de desviaciones: Determina la influencia de varias variables o de variables
individualesen grupos calculando promedios estadísticos. Aquí se pueden comparar variables
dentro de un grupo, así como diferentes grupos, dependiendode dónde se debensuponer las
desviaciones. Por ejemplo: ¿Qué grupos hacen clic con más frecuencia en el botón "Comprar
ahora" de su cesta de la compra?4
Análisis discriminante: Se utiliza en el contexto del análisis de desviacionespara diferenciar
entre grupos que se pueden describir con características similares o idénticas. Por ejemplo,
¿en qué variables difierenlos diferentesgrupos de compradores?4
2.4. Tipología de técnicas multivariantes
Dicho lo anterior, quizás la mejor manera de entender qué es el Análisis Multivariante es la
descripción de los principales procedimientos que engloba. Sin ánimo de ser exhaustivos, éstos
pueden ser agrupados en los siguientes tipos:5
a) Modelos de rango completo y no completo.
o - Análisis de regresión múltiple.
o - Análisis de la varianza (ANOVA).
o - Análisis de la covarianza (ANCOVA).
o - Análisis multivariante de la varianza (MANOVA).
o - Análisis multivariante de la covarianza (MANCOVA).
o - Correlación canónica.
b) Reducción de la dimensionalidad.
o - Análisis de componentes principales
o - Análisis factorial.
c) Clasificación y Discriminación.
o - Análisis de Conglomerados.
o - Análisis discriminante.
c) Otros procedimientos multivariantes.
o - Análisis conjunto.
o - Escalamiento multidimensional.
o - Análisis de correspondencias.
o - Análisis logit.
o - Modelos de ecuaciones estructurales
3. Conclusiones. –
El análisis multivariante es importante para la interpretación de ciertos datos que fueron
recopilados, ciertamente estos pueden ser complicados de analizarlos, pero aun así se lo
necesita para analizar el conjunto de datos multivariantes en el sentido de que hay varias
variables medidas para cada individuo y objeto que se es estudiado.