1. Investigación de Mercados II
Tema: Análisis Multivariado
Alumno: Branco Saravia Morales
Docente: Mgr. José Ramiro Zapata Barrientos
1
“LIBEREMOS BOLIVIA”
ANÁLISIS MULTIVARIADO
“Hay que formar cerebros porque solamente el cerebro bien formado puede, no solamente usar la
técnica existente, sino mejorarla con ideas nuevas y originales gracias a su curiosidad y a que está
investigando. Si se insiste con la misma información a la gente, en lugar de cultivar su curiosidad,
terminará por aburrirse.”
MARIO BUNGE
1. Introducción
El Análisis Multivariante es el conjunto de métodos estadísticos cuya finalidad es analizar
simultáneamente conjuntos de datos multivariantes en el sentido de que hay varias variables
medidas para cada individuo u objeto estudiado.
Su razón de ser radica en un mejor entendimiento del fenómeno objeto de estudio obteniendo
información que los métodos estadísticos univariantes y bivariantes son incapaces de conseguir.1
1.1.Antecedentes
El origen del análisis multivariado se remonta a los comienzos del siglo XX, con Pearson y Sperman,
época en la cual se empezaron a introducir los conceptos de la estadística moderna. Las bases
definitivas de este tipo de análisis se establecieron en la década 1930-40 con Hotelling, Wilks, Fisher,
Mahalanobis, y Bartlett (Bramardi, 2002). En términos generales, el análisis multivariado se refiere
a todos aquellos métodos estadísticos que analizan simultáneamente medidas múltiples (más de
dos variables) de cada individuo. Por su parte Hair (Hair et al., 1992) puntualiza que para el caso del
análisis de datos resultantes de caracterización de recursos genéticos vegetales (colecciones de
germoplasma), el problema es representar geométricamente, cuantificar la asociación entre
individuos y clasificarlos respecto a un conjunto de variables, las cuales pueden ser cuantitativas,
cualitativas o la combinación de ambas. Teniendo en cuenta los objetivos que se desean alcanzar,
este investigador clasifica los métodos multivariados en dos grandes grupos. El primero se denomina
de ordenación o reducción de datos y permite arreglar y representar gráficamente el material bajo
estudio en un número reducido de dimensiones. El segundo se denomina de clasificación y permite
la búsqueda de grupos similares lo más homogéneos posible para clasificar los elementos. Cada base
de datos está compuesta por un conjunto de objetos o casos representativos de un problema en
cuestión (en este caso son las accesiones) y a su vez, cada objeto, se describe mediante un conjunto
de atributos o rasgos, también conocidos como variables de entrada o características (en este caso
son los descriptores), los cuales pueden ser cualitativos (categóricos) o cuantitativos (numéricos).
En ocasiones algunas variables pueden crear ruido en los datos, pues aquellas que son redundantes
o irrelevantes degradan la clasificación. La eliminación de estos rasgos resulta en una igual o mejor
clasificación que con el conjunto completo, no obstante, pueden obtenerse resultados no
consistentes, por lo cual los investigadores no deben hacer uso indiscriminado de los métodos de
selección de variables. La reducción de la dimensionalidad con la de extracción de atributos se trata
de encontrar un número más reducido de nuevos atributos a partir de transformaciones de los
iniciales. Entre las técnicas de extracción más conocidas tenemos el análisis por factores que se
emplea frecuentemente para crear nuevas variables que resuman toda la información de la que
2. Investigación de Mercados II
Tema: Análisis Multivariado
Alumno: Branco Saravia Morales
Docente: Mgr. José Ramiro Zapata Barrientos
2
“LIBEREMOS BOLIVIA”
podría disponerse en las variables originales, por tanto, es indudable su uso en la reducción de la
dimensionalidad del conjunto de datos. El nuevo conjunto de variables no correlacionadas
obtenidas, llamadas factores subyacentes se pueden usar en el análisis futuro de los datos (Johnson,
2000). Otra de las técnicas más usadas en la reducción de datos son las técnicas de escalamiento
óptimo, dentro de las cuales el análisis de correspondencias múltiple, también conocido como
análisis de homogeneidad, permite encontrar las cuantificaciones óptimas, es decir, que separen al
máximo las categorías entre sí. Esto implica que los objetos de la misma categoría se representan
cercanos entre sí, mientras que los objetos de categorías diferentes se representan lo más alejado
posible. En ambos métodos se toma el mayor número de nuevas variables que expliquen la mayor
variabilidad posible.5
2. Desarrollo
2.1.Definición
El análisis multivariante no es fácil de definir. En un sentido amplio, se refiere a todos los métodos
estadísticos que analizan simultáneamente medidas múltiples de cada individuo u objeto sometido
a investigación. Cualquier análisis simultáneo de más de dos variables puede ser considerado
aproximadamente como un análisis multivariante. En sentido estricto, muchas técnicas
multivariantes son extensiones del análisis univariante (análisis de distribuciones de una sola
variable) y del análisis bivariante (clasificaciones cruzadas, correlación, análisis de la varianza y
regresiones simples utilizadas para analizar dos variables). Por ejemplo, una regresión simple (con
una variable predictor) se extiende al caso multivariante para incluir varias variables predictor. De
la misma forma, la variable dependiente que se encuentra en el análisis de la varianza se extiende
para incluir múltiples variables dependientes en el análisis multivariante de la varianza, Como
veremos más adelante, en muchas ocasiones las técnicas multivariantes son un medio de
representar en un análisis simple aquello que requirió varios análisis utilizando técnicas
univariantes. Otras técnicas multivariantes, sin embargo, están diseñadas exclusivamente para
tratar con problemas multivariantes, tales como el análisis factorial que sirve para identificar la
estructura subyacente de un conjunto de variables o el análisis discriminante que sirve para
diferenciar entre grupos basados en un conjunto de variables.2
Una de las razones de la dificultad de definir el análisis multivariante es que el término multivariante
no se usa de la misma forma en la literatura. Para algunos investigadores, multivariante significa
simplemente examinar relaciones entre más de dos variables. Otros usan el término sólo para
problemas en los que se supone que todas las variables múltiples tienen una distribución normal
multivariante. Sin embargo, para ser considerado verdaderamente multivariante, todas las variables
deben ser aleatorias y estar interrelacionadas de tal forma que sus diferentes efectos no puedan ser
interpretados separadamente con algún sentido. Algunos autores afirman que el propósito del
análisis multivariante es medir, explicar y predecir el grado de relación de los valores teóricos
(combinaciones ponderadas de variables). Por tanto, el carácter multivariante reside en los
múltiples valores teóricos (combinaciones múltiples de variables) y no sólo en el número de
variables u observaciones. A efectos de este libro, no insistiremos en una definición rígida del
análisis multivariante. En lugar de esto, el análisis multivariante incluirá tanto técnicas
multivariables como técnicas multivariantes, debido a que los autores creen que el conocimiento
3. Investigación de Mercados II
Tema: Análisis Multivariado
Alumno: Branco Saravia Morales
Docente: Mgr. José Ramiro Zapata Barrientos
3
“LIBEREMOS BOLIVIA”
de las técnicas multivariables es un primer paso esencial en la comprensión del análisis
multivariante.2
2.2.Objetivos del Análisis Multivariante
Pueden sintetizarse en dos:
1. Proporcionar métodos cuya finalidad es el estudio conjunto de datos multivariantes que el
análisis estadístico uni y bidimensional es incapaz de conseguir
2. Ayudar al analista o investigador a tomar decisiones óptimas en el contexto en el que se
encuentre teniendo en cuenta la información disponible por el conjunto de datos
analizado.1
2.3.Tipos de métodos de análisis multivariante
Los métodos multivariantes pueden subdividirse según diferentes aspectos. En primer lugar, se
diferencian en función de si se debe descubrir o verificar una estructura con ellos. Los métodos de
determinación de la estructura incluyen el dominio:
• Análisis factorial: Reduce la estructura a datos relevantes y variables individuales. Los
estudios factoriales se centran en diferentes variables, por lo que se subdividen en análisis
de componentes principales y análisis de correspondencia. Por ejemplo: ¿Qué elementos
de la web influyen más en el comportamiento de compra?
• Análisis de clusters: Las observaciones se asignan gráficamente a grupos de variables
individuales y se clasifican sobre la base de ellas. Los resultados son clusters y segmentos,
como el número de compradores de un producto en particular, que tienen entre 35 y 47
años y tienen un alto nivel de ingresos.
Los procedimientos de revisión estructural incluyen, entre otros, el TLD:
• Análisis de regresión: Investiga la influencia de dos tipos de variables una sobre la otra. Se
habla de variables dependientes y no dependientes. Las primeras son las llamadas variables
explicadas, mientras que las segundas son variables explicativas. El primero describe el
estado real sobre la base de los datos, el segundo explica estos datos por medio de
relaciones de dependencia entre las dos variables. En la práctica, varios cambios de los
elementos de la página web corresponden a variables independientes, mientras que los
efectos sobre la tasa de conversión serían la variable dependiente.
• Análisis de desviaciones: Determina la influencia de varias variables o de variables
individuales en grupos calculando promedios estadísticos. Aquí se pueden comparar
variables dentro de un grupo, así como diferentes grupos, dependiendo de dónde se deben
suponer las desviaciones. Por ejemplo: ¿Qué grupos hacen clic con más frecuencia en el
botón "Comprar ahora" de su cesta de la compra?
• Análisis discriminante: Se utiliza en el contexto del análisis de desviaciones para diferenciar
entre grupos que se pueden describir con características similares o idénticas. Por ejemplo,
¿en qué variables difieren los diferentes grupos de compradores?3
2.4.Tipos de técnicas multivariantes
4. Investigación de Mercados II
Tema: Análisis Multivariado
Alumno: Branco Saravia Morales
Docente: Mgr. José Ramiro Zapata Barrientos
4
“LIBEREMOS BOLIVIA”
Se pueden clasificar en tres grandes grupos:
1. Métodos de dependencia
Suponen que las variables analizadas están divididas en dos grupos: las variables dependientes y las
variables independientes. El objetivo de los métodos de dependencia consiste en determinar si el
conjunto de variables independientes afecta al conjunto de variables dependientes y de qué forma.1
2. Métodos de interdependencia
Estos métodos no distinguen entre variables dependientes e independientes y su objetivo consiste
en identificar qué variables están relacionadas, cómo lo están y por qué.1
3. Métodos estructurales
Suponen que las variables están divididas en dos grupos: el de las variables dependientes y el de las
independientes. El objetivo de estos métodos es analizar, no sólo como las variables independientes
afectan a las variables dependientes, sino también cómo están relacionadas las variables de los dos
grupos entre sí.1
2.5.Beneficios de las pruebas multivariadas
El uso de pruebas multivariantes puede resultar útil cuando se pueden cambiar varios elementos en
la misma página a la vez para mejorar un único objetivo de conversión: registros, clics, finalización
de formularios o acciones compartidas. Si se realiza correctamente, una prueba multivariante puede
eliminar la necesidad de ejecutar varias pruebas A / B secuenciales en la misma página con el mismo
objetivo. En cambio, las pruebas se ejecutan al mismo tiempo con un mayor número de variaciones
en un período de tiempo más corto.4
2.6.Desventajas de las pruebas multivariadas
El desafío más difícil en la ejecución de pruebas multivariadas es la cantidad de tráfico de visitantes
necesaria para alcanzar resultados significativos. Debido a la naturaleza completamente factorial de
estas pruebas, el número de variaciones en una prueba puede sumarse rápidamente. El resultado
de una prueba de muchas variaciones es que el tráfico asignado a cada variación es menor. En las
pruebas A / B, el tráfico de un experimento se divide a la mitad, y el 50% del tráfico visita cada
variación. En una prueba multivariante, el tráfico se dividirá en cuartos, sextos, octavos o incluso
segmentos más pequeños, y las variaciones recibirán una porción mucho menor de tráfico que en
una prueba A / B simple.
Antes de ejecutar una prueba multivariante, proyecte el tamaño de la muestra de tráfico que
necesitará para cada variación con el fin de alcanzar un resultado estadísticamente significativo. Si
el tráfico a la página que le gustaría probar es bajo, considere usar una prueba A / B en lugar de una
prueba multivariante.
Otro desafío de las pruebas multivariadas es cuando una o más de las variables que se están
probando no tienen un efecto medible sobre el objetivo de conversión. Por ejemplo, si las
variaciones de una imagen en una página de destino no afectan el objetivo de conversión, mientras
5. Investigación de Mercados II
Tema: Análisis Multivariado
Alumno: Branco Saravia Morales
Docente: Mgr. José Ramiro Zapata Barrientos
5
“LIBEREMOS BOLIVIA”
que las modificaciones a un título sí lo hacen, la prueba habría sido más efectiva si se ejecutara como
una prueba A / B en lugar de una prueba multivariante.4
3. Conclusiones
El Análisis Multivariado es el conjunto de métodos estadísticos cuya finalidad es analizar
simultáneamente conjunto de datos multivariantes en el sentido de que hay varias variables
medidas para cada individuo u objeto estudiado. Su razón de ser radica en un mejor entendimiento
del fenómeno objeto de estudio o tenida información que los métodos estadísticos univariantes y
bivariantes son incapaces de conseguir.
4. Referencias
1. http://www.ciberconta.unizar.es/leccion/anamul/inicio.html
2. http://www.virtual.unal.edu.co
3. https://es.ryte.com/wiki/An%C3%A1lisis_Multivariante
4. https://www.optimizely.com/optimization-glossary/multivariate-testing/
5. https://www.ecured.cu/An%C3%A1lisis_multivariados
5. Videos
https://youtu.be/6xNe1uklDHM
https://youtu.be/3o-pl5-sBZE