1. Investigaciónde MercadosII
Tema:AnálisisMultivariado
Alumno:Wara Mayra Marca Orellana
Docente:Mgr. José RamiroZapata Barrientos
Página| 1
“LIBEREMOS BOLIVIA”
Introducción
Ya hemosconsideradodatosmultivariantesal hacerregresiónmúltiple.Aunasí,hay muchas otras
técnicasque permitenanalizardatosmultivariantes.Lastécnicasde análisismultivarianteincluyen
tanto métodos puramente descriptivos que tienen por objetivo extraer información de los datos
disponibles, como métodos de inferencia que, a través de la construcción de modelos, pretenden
obtener conclusiones sobre la población que ha generado los datos.1
Los principales objetivos del análisis multivariante son:
Resumir los datos mediante un pequeño conjunto de nuevas variables. 1
Encontrar grupos en los datos, si existen. 1
Clasificar nuevos datos en grupos definidos. 1
Relacionar dos conjuntos de variables.1
AnálisisDescriptivoAl igualque enelanálisisde unavariable,esnecesariocomenzarconunanálisis
descriptivo previo este análisis descriptivo conlleva el estudio de: 2
Un análisis numérico 2
Un análisis gráfico2
El análisis multivariante puede contribuir a enriquecer el debate público sobre los fenómenos que
son objeto de interés para los profesionales y los investigadores, gracias a la oportunidad que les
ofrece para llevar a cabo un análisis complejode los datos obtenidos en sus estudios.Al servicio
de la investigación cuantitativa, y como extensión de las técnicas de análisis univariante y
bivariante, el análisis multivariante tiene como objetivoprincipal modelar las múltiples relaciones
existentes entre diversas variables de manera simultánea. La construcción de modelos
multivariantes ejerce, pues, un papel importante en el desarrollo de las diferentes disciplinas
basadas en el análisis de datos cuantitativos y requiere, por lo tanto, una atención especial en la
formaciónde futurosprofesionalese investigadores.Conocerlalógica,lascaracterísticasespecíficas
de las diferentes técnicas disponibles, los objetivos particulares que permiten lograr y las
condiciones en que pueden ser utilizadas son algunos delos retos importantes a los que nos
enfrentaremos en este material.2
Para hacerlo, en este texto nos adentraremos en los aspectos básicos involucrados en el análisis
multivariante de losdatoscomoel marco analíticogeneral que se propone analizare interpretar
ANALISIS MULTIVARIADO
2. Investigaciónde MercadosII
Tema:AnálisisMultivariado
Alumno:Wara Mayra Marca Orellana
Docente:Mgr. José RamiroZapata Barrientos
Página| 2
“LIBEREMOS BOLIVIA”
las relaciones simultáneas entre di-versas variables mediante la construcción de modelos
estadísticoscomplejosque permiten distinguirlacontribuciónindependientede cadauna de ellas
en el sistemade relacionespara, de este modo,describir,explicar o predecirlosfenómenosque
son objetode interés.Laclave de este marco analíticogeneral no se encuentra,porlo tanto,enel
hecho de que los investigadores dispongan de múltiples variables, sino en la capacidad que las
diferentestécnicasdisponibles lesofrecenpara estimarel pesoespecíficoolaimportanciarelativa
de cada unade ellasensusmodelos.Enestesentido,comoveremos,elanálisismultivariantepuede
proporcionarlas evidencias necesarias que permitan establecer inferencias a partir de la
observación de asociaciones entre las variables, de forma que sea posible extraer conclusiones no
sesgadas que, además, sean generalizables más allá de los lí-mites de los estudios particulares
siempre que sea posible.2
Desarrollo
Distancias estadísticas Ejemplo: Disponemos de los datos de peso y estatura de 300 mujeres con
edadescomprendidasentre30y40 años.Queremosdeterminarlaposiciónconrespecto alamedia
de tres nuevas mujeres a partir de sus respectivospesos y estaturas. Supongamosque la mujer A
pesa63 kg.Y mide 180 cm. La mujerB pesa60 kg. Y mide 177 cm. La mujerCpesa69 kg.Y mide 177
cm.1
SeanXi = (Xi1,. . . , Xid) y Xk = (Xk1,. . . , Xkd) lasobservacionesde dosindividuosi,kobtenidasal
medirel vectord-dimensional(X1,... , Xd). Se define ladistanciaeuclídeaentreXi yXj comode (Xi
, Xk ) = vuutXd j=1 (Xij − Xkj ) 2 La distancia euclídea es la más utilizada pero tiene como
inconvenientes que: depende de las unidades de medida de las variables (no es invariante ante
cambios de escala) y presupone que las variables son incorrelacionadas y de varianza unidad. Se
define ladistanciade Mahalanobisentre Xi yXkcomodM(Xi , Xk) = q(Xi − Xk) 0Σ−1(Xi − Xk) donde
Σ representa la matriz de covarianzas. Es adecuada como medida de discrepancia entre datos,
porque esinvariante ante cambiosde escala,tieneencuentalascorrelacionesentrelasvariables.1
1) Técnicas explicativas o de dependencia
Estas técnicas investigan la existencia o ausencia de relaciones entre dos grupos de variables.En
caso que estos grupos se encuentren clasificados en variables dependientes e independientes,el
3. Investigaciónde MercadosII
Tema:AnálisisMultivariado
Alumno:Wara Mayra Marca Orellana
Docente:Mgr. José RamiroZapata Barrientos
Página| 3
“LIBEREMOS BOLIVIA”
objetivode lastécnicasde dependenciaseráestablecersi el conjuntode variablesindependientes
afecta al conjunto de variables dependientes de manera conjunta o individualmente.3
En general, para saber qué técnica se debe aplicar es necesario conocer cómo están medidas las
variables que participanenel estudio.El procesode elecciónde algunastécnicasde dependencia,
se realiza atendiendo a las respuestas que se brindan a las siguientespreguntas: (a) ¿las variables
estánmedidasenescalasmétricaso no métricas?,(b) ¿cuántas variablesdependientesexisten?,y
(c) ¿cuántas relaciones se plantean entre las variables dependientes e independientes? En este
marco, lastécnicasde análisisde dependenciasonlasque se indicanenlaFigura1. A continuación,
se presentan algunos conceptos relativos a las técnicas multivariantes.3
2) Regresión lineal múltiple
Es la técnicaadecuadasi enel análisishayuna variable dependiente cuyovalordepende de varias
variablesindependientesmétricasono métricas.En diversasinvestigacionesestatécnicatiene un
papel fundamental puesto que su aplicación permite, entre otras utilidades, observar de qué
manera las variables independientes logran predecir la variable dependiente o criterio. En otras
palabras, a partir del análisis de regresión será posible inferir acerca de la existencia o no de
relacionessignificativasentrelasvariablesindependientesylavariablecriterioorespuesta,siempre
dentro del marco científico establecido para la investigación en curso. El siguiente es un esquema
simplificado relativo al análisis de regresión múltiple.4
A modode ejemplo,se podríadesearsaberlaexistenciaonode relaciónentre el nivel de ingresos,
medidoenpesos,de una persona(variable dependiente métrica) yungrupo de variablesentre las
que se encuentran el nivel educativo, la edad (ambas independientes métricas) y el género
(independiente no métrica). 4
3) Análisis discriminante
Esta técnicase utilizapara clasificara distintosindividuosengrupos(o poblaciones) alternativosa
partirde losvaloresde unconjuntodevariablessobre losindividuosalosque se pretendeclasificar.
Cada individuopuede pertenecera un sologrupo. La pertenenciaauno u otro grupo se introduce
enel análisismediante unavariablecategóricaque tomatantosvalorescomogruposexistan.Enel
análisis discriminante esta variable desempeña el papel de variable dependiente.4
4. Investigaciónde MercadosII
Tema:AnálisisMultivariado
Alumno:Wara Mayra Marca Orellana
Docente:Mgr. José RamiroZapata Barrientos
Página| 4
“LIBEREMOS BOLIVIA”
4) Regresión de variable dependiente limitada
Es la técnicaque se utilizaenaquelloscasoscomo los planteadosparala regresiónlineal múltiple;
sinembargo,presentaladiferenciade que lavariable dependiente esdicotómica(claroqueenesta
situacióntambiénpodríausarse el análisisdiscriminante).Así,por ejemplo,puede sucederque las
opciones de respuestas de la variable nivel de ingresos, antes citada, se encuentren codificadas
como1 = inferioralamediay2= superioralamedia.De loexpuestosurgeque,másalláde coincidir
enel objetivodeanálisis,elmodoenque estámedidalavariable dependientecondicionalaelección
de la técnica.Esto es,si la variable dependiente esmétricase debe utilizarel análisisde regresión
lineal; en caso contrario, se ha de optar por el análisis discriminante (si es categórica con varios
grupos) o la regresión de variable dependiente limitada (si los grupos definidos a priori son
exclusivamente dos).4
5) Correlación canónica
Este análisispretende determinarlaexistenciade asociaciónlineal entre unconjuntode variables
independientes y otro conjunto de variables dependientes, de acuerdo con el esquema
simplificado:4
A modo de ejemplo, un investigador puede querer establecer cómo influyen las variables antes
mencionadas –niveleducativo,edadygénero–nosólosobre el nivelde ingresos,medidoenpesos,
sinotambiénsobre el nivel de satisfaccióncon el empleoactual,medidomediante unaescalatipo
Likert en la que las opciones se valoran de 1 (totalmente insatisfecho) a 5 (totalmente satisfecho)
puntos, por lo que ambas variables dependientes resultan métricas. En vista del ejemplo
presentado,esfácil verque la regresiónlineal múltiple conformauncaso particulardel análisisde
correlación canónica cuando sólo se dispone de una variable dependiente.4
6) Análisis multivariante de la varianza (MANOVA)
En este análisisse consideransimultáneamente variasvariablesdependientesque supuestamente
están relacionadas entre sí. Se utiliza en situaciones en las que la muestra total está dividida en
variosgruposbasadosenunaovariasvariablesindependientes(factores) nométricas,mientrasque
las dependientes son métricas. Su objetivo (similar al que persigue la correlación canónica) es
5. Investigaciónde MercadosII
Tema:AnálisisMultivariado
Alumno:Wara Mayra Marca Orellana
Docente:Mgr. José RamiroZapata Barrientos
Página| 5
“LIBEREMOS BOLIVIA”
averiguarsi haydiferenciassignificativasentre dichosgruposencuantoalasvariablesdependientes
se refiere.4
7) Ecuaciones estructurales
La totalidad de los métodos expuestos hasta el momento permiten evaluar de qué manera se
presenta una relación entre dos conjuntos de variables. Sin embargo, existen otras alternativas
(utilizanmúltiplesecuaciones) quese empleanenaquelloscasosenlosque se debenanalizarvarias
relaciones. El siguiente esquema simplificado, refleja el objetivo de estas técnicas:4
8) Análisis de la varianza factorial
En esta técnica se plantea si entre una cierta variable cuantitativa, llamada variable respuesta o
independiente,yciertasvariablescategóricas, llamadasfactores,existe relación.Enestatécnicaes
posible empleardosvariantes,dependiendosi existeinteracciónentre unacombinaciónde ciertos
factores y la variable respuesta. Si existe interacción, es apropiado utilizar el modelo de ANOVA
multifactorial con interacción. 5
En el caso que no exista interacción, el modelo de ANOVA multifactorial sin interacción. 5
Este métodono es equivalente ahacer variosANOVA simples,yaque ademásde diferenciasenel
planteamiento matemático, los ANOVA simples no detectan ciertas influencias. 5
9) Modelo de ANOVA multifactorial sin interacción
Para el desarrollose consideraráunasolavariable respuestacondos factoresy, ya que en el caso
de haber más factores sería cuestión de generalizar. (4.6) (4.7) (4.8) (4.9) 33 Cada observación se
denotarácomo , donde el factor estáenel nivel i,el factorestáen el nivel j y la observaciónestará
en el nivel ksi está dentrode las que tienendichascaracterísticas.Si se representalamediaglobal
como, el modelo de ANOVA sin interacción.5
6. Investigaciónde MercadosII
Tema:AnálisisMultivariado
Alumno:Wara Mayra Marca Orellana
Docente:Mgr. José RamiroZapata Barrientos
Página| 6
“LIBEREMOS BOLIVIA”
Conclusiones
Losmétodosde análisisestadísticomultivariante(regresiónlinealmúltiple,análisisdecomponentes
principalesyanálisisde lavarianza) hanresultadosermás eficientesque losbivariantes(regresión
lineal simple),dandoresultadosque lasúltimasno llegabana dar. Además,losdiagramasde cajas
hansidounaherramientagráficamuyútilparalocalizarrelacionesde formarelativamenteintuitiva.
Comoconclusionesclínicasrelevantesextraídasdelconjuntode pacientesanalizadose puede decir
que la degradación de la pared arterial está principalmente relacionada con la longitudde la capa
íntima, además de por la hipercolesterolemia y por la orientación de las células del músculo liso o
SMC. Para las demás variables, no se ha detectado correlación.
Referencias
1. http://eio.usc.es/eipc1/BASE/BASEMASTER/FORMULARIOS-PHP-
DPTO/MATERIALES/Mat_50140155_AnalisisMultivariante.pdf
2. https://www.researchgate.net/publication/336232083_Introduccion_al_analisis_multiv
ariante
3. https://www.edificacion.upm.es/personales/redondas/docencia/Postgrados/objetos/
Multiv1ICEFeb10.pdf
4. file:///C:/Users/Familia/Downloads/Dialnet-
AnalisisMultivarianteConceptosYAplicacionesEnPsico-5229555.pdf
5. https://repositorio.unican.es/xmlui/bitstream/handle/10902/9104/386731.pdf?sequen
ce=1&isAllowed=y
Videos
https://www.youtube.com/watch?v=__NwvXa3zjQ