SlideShare una empresa de Scribd logo
1 de 21
AndreaBelenDelgadilloSuarez
Mrg. José RamiroZapata
Materia: Investigaciónde mercadosII
“LIBEREMOS BOLIVIA”
1
ANALISIS MULTIVARIADO
1. -Introducción
Análisis Multivariante
-share tweet share-
En la evaluación y recopilación de datos estadísticos se utilizan métodos de análisis multivariantes para aclarar y
explicar las relaciones entre las diferentes variables que pueden estar asociadas con estos datos.
El análisismultivariante siempre se utilizacuando hay más de tresvariablesinvolucradas y el contextode su contenido
no está claro. El objetivo es detectar una estructura por un lado, y verificar los datos de las estructuras por otro.
En el contexto de la usabilidad de una web, se pueden utilizar métodos de análisis multivariante para aumentar
sistemáticamente la usabilidad. Mientras que las pruebas A/B siempre aíslan sólo una página web, los métodos
multivariantesmuestranlas relacionese interaccionesde varios elementosdentrode una página web.La expresividad
depende de qué y cuántos elementos de la web se utilicen. Todos los elementos de la web que permiten al usuario
interactuar con el sitio web a través de la interfaz de usuario se consideran generalmente variables. Esto incluye, en
particular, los que tienen un impacto en el tipo de conversión.
1.1 IMPORTANTE
Originalmente, en las estadísticas se utilizaban métodos de prueba y análisis multivariante para descubrir las
relacionescausales.Dado que los cálculos manuales son muy complejos,los métodossólo son practicables en
otros campos de aplicación con el desarrollo del hardware y software correspondiente. Hoy en día se utilizan
métodos de análisis multivariante en áreas muy diferentes:
Lingüística, Ciencias Naturales y Humanidades.
Economía, seguros y servicios financieros.
Minería de datos, big data y bases de datos relacionales.
Hoy en día, los análisis multivariantes se suelen llevar a cabo mediante el uso de software con el fin de hacer
frente a las enormescantidades de datos y controlar las variables modificadasen aplicacionesprácticas como
las pruebas de usabilidad. Sin embargo, las pruebas multivariante también pueden contribuir
significativamente a mejorar la facilidad de uso a menor escala.
AndreaBelenDelgadilloSuarez
Mrg. José RamiroZapata
Materia: Investigaciónde mercadosII
“LIBEREMOS BOLIVIA”
2
2.-Desarrollo
Tipología de técnicas multivariantes
Dicholoanterior,quizáslamejormanerade entenderqué esel AnálisisMultivariante esladescripciónde losprincipales
procedimientos que engloba. Sin ánimo de ser exhaustivos, éstos pueden ser agrupados en los siguientes tipos:
 a) Modelos de rango completo y no completo.
o - Análisis de regresión múltiple.
o - Análisis de la varianza (ANOVA).
o - Análisis de la covarianza (ANCOVA).
o - Análisis multivariante de la varianza (MANOVA).
o - Análisis multivariante de la covarianza (MANCOVA).
o - Correlación canónica.
 b) Reducción de la dimensionalidad.
o - Análisis de componentes principales
o - Análisis factorial.
 c) Clasificación y Discriminación.
o - Análisis de Conglomerados.
o - Análisis discriminante.
 c) Otros procedimientos multivariantes.
o - Análisis conjunto.
o - Escalamiento multidimensional.
o - Análisis de correspondencias.
o - Análisis logit.
o - Modelos de ecuaciones estructurales.
AndreaBelenDelgadilloSuarez
Mrg. José RamiroZapata
Materia: Investigaciónde mercadosII
“LIBEREMOS BOLIVIA”
3
1. Modelos de rango completo y no completo
Supóngase que en el problema objeto de estudio se tiene una variable dependiente (Y) y una colección de variables
independientes que se suponen explicativas de la anterior bajo una forma lineal o linealizable (X1, X2,...,Xn)
Si tanto la variable a explicar como las variables “explicativas” son cuantitativas y los datos relativos a las últimas
conforman una matriz de rango completo,la técnica que,entre otras cosas, proporciona la relaciónlineal de Y con X1,
X2,...,Xn,o en otros términos,que permite predecirlos cambiosen el valor de enrespuestaa loscambios en losvalores
de X1, X2,...,Xn),o, lo que eslo mismo, la "explicación" del comportamientode la variable de nuestro interésmediante
la información suministrada por una serie de variables de las que se supone depende linealmente, se denomina
regresiónmúltiple.El modelo de regresiónmúltiple viene dado por yi = β0 + β1χ1i + β2χ2i + ... + βpχpi + еi o, en términos
matriciales,Υ = Xβ + е, donde X es una matriz de cantidades conocidas y de rango completo y la inclusióndel término
de error se justifica por la omisión en el modelo de variables explicativas relevantes o errores de medida.
Si las variablesX1, X2,...,Xn fuesenlosnivelesde un factor o variable cualitativa,o susceptible de tratarse como tal (por
ejemplo,varónymujersonlosnivelesdel factorsexo),yse pretendieseestimarel efectode que sobrelavariable Ytiene
el hechode que una determinadaobservaciónpertenezcaaun determinadonivel del factor,latécnica que se ocupa de
estascuestionesesel Análisisde lavarianza (ANOVA).Nótese que comolasobservacionestienenque pertenecerauno
y solo uno de los nivelesdel factor considerado, la matriz X es de rango no completo,por lo cual no se podrán estimar
dichos efectossinocombinacioneslinealesde ellos,sinque estosuponga ningúndeméritopara el análisis. A modo de
ejemplo, el ANOVA responde preguntas como ¿cuál es el efecto diferencial entre hombres y mujeres parados en el
tiempo de búsqueda de empleo, suponiéndolesiguales en cuanto a otras características de interés? Originalmente el
ANOVA se utilizó para determinar el efecto sobre las cosechas de distintos tratamientos o niveles de fertilizante. Por
otra parte, resultarelativamente sencillo“reparametrizar” el modeloyconvertirloenunmodelode regresiónmúltiple.
Si los factores son dos o más, cobra especial relevancia el efecto de la interacción de sus niveles sobre la variable a
explicar.
En caso de que algunasde lasvariablesexplicativasfuesende caráctercualitativoyotras de tipocuantitativo,el modelo
se denomina modelo de análisis de la covarianza (ANCOVA). Evidentemente, resultan de especial interés las
interacciones entre las variables explicativas. Si las variables a explicar son dos o más el procedimiento se denomina
análisis multivariante de la varianza (si las variables explicativas son todas ellas factores) (MANOVA) o análisis
multivariante de la covarianza (si coexisten factores con variables cuantitativas (MANCOVA).
Finalmente, la correlación canónica es una técnica que se utiliza para determinar las combinaciones lineales de las
variables de los vectores de “variables explicativas” y “a explicar” que presenten la máxima correlación posible. Más
concretamente, consiste en determinar, en primer lugar, las dos combinaciones lineales de las variables de dichos
AndreaBelenDelgadilloSuarez
Mrg. José RamiroZapata
Materia: Investigaciónde mercadosII
“LIBEREMOS BOLIVIA”
4
vectores, de entre las infinitas que se pueden formar, que presenten la máxima correlación. Posteriormente se
determinan otras dos combinaciones lineales de tales vectores, incorrelacionadas con las anteriores, tal que la
correlación entre ellas sea máxima. Y así sucesivamente. Como puede apreciarse, el análisis de correlación canónica
puede ser visto como una extensión natural del modelo de regresión múltiple.
2. Reducción de la dimensionalidad
Son muy numerosas las ocasiones enlas que un investigador tiene que manejar, en la práctica, un elencociertamente
numerosode variablescorrelacionadasentre sí.Evidentemente,si variasde estasvariablesestáncorrelacionadas,parte
de la información que aportan al estudio del fenómeno en cuestión no es “fresca”, o, en términos, más formales, es
redundante,puesto que ya la aportan otras de las variables consideradas.Ello llevaal investigador,por cuestionesde
manejabilidad y comodidad, a reducir la dimensión del problema, es decir, a trabajar con un conjunto de nuevas
variables,menor que el original e incorreladas entre sí, que recogen una gran parte (tan grande como se quiera) de la
información que llevaban aparejadas las variables originales. Obviamente, cuanto más se reduzca la dimensionalidad
más información original se pierde.
En este sentido, el Análisis de componentes principales examina las relaciones entre un conjunto de p variables
correlacionadas y las transforma en un nuevo conjunto de variables incorreladas denominadas componentes
principales.Estas nuevas variablesson combinacioneslinealesde las originalesy se derivan en orden de importancia,
de tal manera que la primera componente principal recoge,de la variación total de los datos originales,lamayor parte
posible. Y así sucesivamente. Esta técnica es originaria de K. Pearson (1901) y fue desarrollada posteriormente por
Hotelling (1933, 1936). Su objetivo fundamental es ver si unas pocas componentes recogen la mayor parte de la
variación de los datos originales. Si es así, se puede argüir que la dimensionalidad del problema no es p sino inferior
a p. En la práctica no siempre es fácil la identificaciónde lascomponentesprincipalespor lo que su principal uso recae
en la reducción de la dimensionalidad de los datos para simplificar posteriores análisis. Por ejemplo, es una manera
muy útil de encontrar agrupaciones en los datos cuando estos vienen caracterizados por un elevado número de
variables.
El objetodel Análisisfactorial es reproducir(linealmente,puestoque eslaforma más sencilla) lasinterrelacionesentre
las variables originales en términos de una serie de factores subyacentes, por otra parte no observables.
Por tanto, mientrasque el objetoprincipal del Análisisde componentesprincipalesesla "explicaciónde la varianza de
las variablesoriginales",el objetodel Análisisfactorial esla "explicación" de lacovarianza, o correlación ensu caso, de
dichas variables originales.
El modelo básico de Análisis factorial puede escribirse de la forma: Xj - μ = aj1F1 + aj2F2 + ... + аj2F22 + ujUj donde cada
variable observada centrada se expresa linealmente en función de r (generalmente mucho menor que el número de
AndreaBelenDelgadilloSuarez
Mrg. José RamiroZapata
Materia: Investigaciónde mercadosII
“LIBEREMOS BOLIVIA”
5
variables) factores comunes a todas las variables observadas y un factor único específico de cada variable. Tanto los
factores comunes como los factores únicos se suponen (sin pérdida de generalidad puesto que en la práctica son
desconocidos) con media nula y varianza unidad. Los factores únicos se suponen incorrelacionados entre sí y con los
factores principales.
Una vez extraídos los factores comunes (uno de los procedimientos para ello es el de componentes principales), el
problema radica en su interpretación. Ésta, que se lleva a cabo a partir de las correlaciones de dichos factores con las
variablesoriginales,nosuele serclara y por ellose suelen rotar los factores,de tal manera que cada uno de ellostenga
una correlaciónlomás próximaa la unidadconunas variablesylo máspróxima a cerocon otras. Elloseráde gran ayuda
en la tarea de su identificación.
3. Clasificación y discriminación
El análisisde conglomerados,tambiéndenominadotaxonomíanumérica,clasificacióno reconocimientode patroneso
formas, está orientado a la síntesis de la información contenida en los elementos observados, síntesis llevada a cabo
con vistas a establecer una agrupación de los mismos en función de su mayor o menor homogeneidad. En otros
términos, es una técnica estadística que trata de agrupar elementos (que vendrán calificados por un determinado
número de características) en grupos mutuamente excluyentes, de tal forma que los elementos de un mismo grupo
sean lo más parecidos posible entre sí y lo más diferentes posible respecto de los pertenecientes a otros grupos.
Obviamente, a la hora de llevar a cabo un análisis de conglomerados se deben tomar, previamente, una serie de
decisiones:a) selecciónde las variablesen funciónde las cualesse van a agrupar o clasificar los elementos;b) elección
de la distancia entre los elementos; c) el criterio para llevar a cabo la formación de de grupos o conglomerados. d) el
criterio de inclusión de los elementos en uno u otro conglomerado.
En cuanto al Análisis discriminante, supóngase una variable aleatoria p-dimensional, X1, X2,...,Xn que caracteriza
individuosocasos (pde suscaracterísticas). Supóngase tambiénque la poblaciónde lacual procedendichosindividuos
se encuentra segmentada en k clases o grupos. Una de las vertientes del Análisis discriminante es el estudio de las
diferenciasexistentesentre las k clases anteriormente aludidasen base a la consideraciónconjunta de las p variables.
La otra vertiente esde carácter clasificador,pues sirve para ubicar o clasificar un determinadoindividuoo caso enuno
de los grupos en los que se ha dividido la población. La cuestión es elaborar un criterio o regla que sirva para asignar
dicho individuo a uno de los k grupos.
Un ejemploilustrativode utilizacióndel Análisisdiscriminante,yaclásicopor otra parte, hace referenciaa la concesión
de créditos en las entidades financieras. Es evidente que la población solicitante de créditos puede dividirse en dos
clasesclaramente diferenciadas:losque lo amortizan y losque no.Al solicitante del créditose le formulanuna serie de
cuestionesde carácter financiero-patrimonial ysus respuestasson los valores que toma, en este individuo,la variable
AndreaBelenDelgadilloSuarez
Mrg. José RamiroZapata
Materia: Investigaciónde mercadosII
“LIBEREMOS BOLIVIA”
6
aleatoria p-dimensional anteriormente aludida. Es evidente que una cuestión importante es la determinación de las
variablesque más discriminan entre los solicitantesque devuelvenel créditoconcedido(laspreguntas que se le harán
a los solicitantes serán relativas a estas cuestiones).
Conarreglo a dichas contestacionesse trata de ubicar o clasificara dichoindividuoenunode los dosgrupos. Ypara ello
es importante disponer de un criterio clasificador que se elaborará en base a la información disponible sobre
dichas p variables de otros individuos que solicitaron créditos en el pasado y que ya se sabe si los devolvieron o no.
Se necesita un criterio de asignación o de ubicación de cada uno de los individuos o casos nuevos en una de las
anteriores clases o poblaciones. Es decir, se necesita un criterio o regla discriminante, que será tal que asigne el
individuoa la i-ésimaclase si su vector p-dimensional cae en la i-ésimaregión de aquellasen las que se ha divididoel
espacio p-dimensional.
Obviamente,al ubicar un individuoo caso en una de las anterioresclases,con arregloa algúncriterio discriminante,se
pueden cometer dos tipos de errores:
 a) No clasificar a un individuo en una en una determinada clase cuando realmente pertenece a ella.
 b) Clasificar a un individuo en una determinada clase cuando realmente no pertenece a ella.
Lógicamente,la regla discriminante que se utilice deberá minimizar la probabilidad de clasificaciónerrónea, o incluso
el coste derivado de una clasificación errónea.
4. Otros procedimientos multivariantes
El Análisis conjunto pretende determinar qué combinación de un elenco finito de factores o atributos es el más
preferidopor una poblaciónencuestada.Se utiliza con frecuenciapara comprobar la aceptación de diseñosnuevosde
productos por parte del cliente y para valorar el atractivo de anuncios.
Básicamente, se trata de un modelo que permite obtener un indicador de la importancia relativa de cada una de las
características de un producto a través del estudio de los atributos que los consumidores descartan en su elección. El
principio básico del análisis consiste en descomponer utilidad por producto en utilidades por atributo.
El análisis conjunto se suele llevar a cabo en las siguientes etapas:
 a) Identificación y selección de los atributos relevantes. Para identificarlos pueden utilizarse técnicas
cualitativas como focus group o aprovechar la experiencia del equipo que está desarrollando el producto.
 b) Definición de niveles u opciones para cada atributo.
AndreaBelenDelgadilloSuarez
Mrg. José RamiroZapata
Materia: Investigaciónde mercadosII
“LIBEREMOS BOLIVIA”
7
 c) Definición de la combinación de atributos a ser evaluada, con el objetivo final de determinar cuál de todas
las combinaciones es la preferida por los consumidores
 d) Recogida de información (opiniones de los consumidores).
 e) Selección del procedimiento de medición de utilidad de cada combinación de atributos.
Bajo ladenominaciónde Escalamientomultidimensional se agrupanunconjuntode técnicasque persiguenelpropósito
de obteneruna configuraciónde puntos endimensiónreducidaque reflejenlomás fielmente posible laspercepciones
que se tengansobre las similitudesentre ciertosobjetosoestímulos.Paraalcanzardicho propósito,se suele definiruna
función no lineal que establezca las desviaciones de las distancias definidas en la configuración de puntos con las
similitudesobservadasentre losobjetosoestímulos.Atravésde un procesoiterativose minimizadichafunción,loque
puede hacerse por diversos procedimientos de optimización. Se suele utilizar en marketing y ciencias sociales. Los
consumidorespotencialestienenque compararparesde productosy hacer juiciossobre sussimilitudes.Mientrasotras
técnicas obtienen dimensiones de las respuestas a los atributos de los productos identificados por el investigador, el
escalamientomultidimensional proporcionalas dimensionesde losjuiciosde los encuestadossobre la similitudde los
productos. Es decir,losresultados nodependende losjuiciosde los investigadores.Además,noesnecesariomostrar a
los encuestados una lista de atributos. Las dimensiones resultantes provienen de los juicios de los encuestados sobre
pares de productos. Es la técnica más comúnmente utilizada en mapeado perceptual.
El análisis de correspondenciasse utilizapara estudiar, desde un punto de vista gráfico, las relacionesde dependencia
e independencia de un conjunto de factores a partir de la información contenida en una tabla de contingencia
(tabulacióncruzada de dos o más variables cualitativaso factores).Consiste enasociar a cada uno de los nivelesde los
factores un punto en el espacio n-dimensional, de forma que las relaciones de cercanía/lejanía entre los puntos
calculados reflejen las relaciones de dependencia y semejanza existentes entre ellos. A modo de ejemplo, supóngase
que las preferencias de una serie de encuestados por una determinada marca están cruzadas en una tabla de
contingencia por sexo y ocupación. Pues bien, a través del Análisis de correspondencias se muestra en un mapa
bidimensional o tridimensional la asociación o “correspondencia” de marcas y características de sexo y ocupación de
aquéllos que prefieren cada marca (perfiles).
El análisis logit está orientado a modelar cómo influye en la probabilidad de aparición de un suceso, habitualmente
dicotómico, la presencia o no de diversos factores y el valor o nivel de los mismos. También puede ser utilizado para
estimar la probabilidad de aparición de cada una de las posibilidades de un suceso con más de dos categorías
(multinomial).Eneste tipo de situacionesno es aplicable la metodologíade la regresiónlineal ya que ahora la variable
respuesta sólo presenta dos valores (en el caso dicotómico).
AndreaBelenDelgadilloSuarez
Mrg. José RamiroZapata
Materia: Investigaciónde mercadosII
“LIBEREMOS BOLIVIA”
8
Los modelos de ecuaciones estructurales permiten describir, gráfica y analíticamente, las relaciones que se cree que
existen entre las variables observables y las no observables, teniendo en cuenta la dirección de cada una de tales
relaciones. A partir de la información muestral, se pueden estimar tales relaciones y juzgar su importancia, de tal
manera que se puede simplificarel diagrama inicial representativode las posiblesrelacioneshasta obtenerun modelo
parsimonioso.
Unaspecto clave enla estimaciónde cualquiertipode modeloestadísticoessusujeciónal planteamientode unateoría
debidamente asentada en el área de conocimiento en que se esté trabajando. Este requisito es especialmente
importante en un área de modelización tan flexible como ésta. Por ello, se debe prestar una gran atención a la
especificación e identificación del modelo. El primer aspecto se refiere al correcto planteamiento del sistema de
ecuacionesen función de la teoría subyacente (cumplimientode supuestosbásicos, definiciónde algunos parámetros
como fijos y otros como libres o estimables); el segundo aspecto tiene que ver con que la cantidad de información
disponible sea suficiente para tener una estimación única de los parámetros libres, más de una o ninguna.
2.2.- Análisis de Correspondencias Múltiple (MCA)
El Análisis de Correspondencias Múltiple es una extensión del Análisis de Correspondencias Simple. La estructura de
datos sobre los que se aplica el MCA puede ser una matriz formada por variables ficticias de ausencia – presencia de
cada nivel de las variables nominales ó una matriz Burt, que no es más que el conjunto de todas las tablas de
contingenciapar a par del conjunto de variablesque están siendoanalizadas. (Greenacre,2007). El MCA cuantifica los
datos nominales (categóricos) mediante la asignación de valores numéricos a los individuos y a las categorías, de
manera que los individuos de la misma categoría estén cerca los unos de los otros y los individuos de categorías
diferentesestén alejados los unos de los otros. Cada individuo se encuentra lo más cerca posible de los puntos de las
categorías que se aplican a cada uno de ellos. De esta manera, las categorías dividen los individuos en subgrupos
homogéneos. Las variables se consideran homogéneas cuando clasifican individuos de las mismas categorías en los
mismos subgrupos.
2.2.- EL VALOR TEORICO
Como ya se ha mencionado, el elementoesencial del análisismultivariante es el valor teórico, una combinación lineal
de variables con ponderacionesdeterminadasempíricamente.El investigadorespecificalasvariables,mientrasque las
ponderaciones son objeto específico de determinación por parte de la técnica multivariante, Un valor teórico de n
variables ponderadas (X1a Xn) puede expresarse matemáticamente así:
Valor teórico = w1X1 + w2X2 + w3X3 + … + wnXn
donde Xnes la variable observada y Wnes la ponderación determinada por la técnica multivariante.
AndreaBelenDelgadilloSuarez
Mrg. José RamiroZapata
Materia: Investigaciónde mercadosII
“LIBEREMOS BOLIVIA”
9
El resultado esun valor único que representauna combinación de todo el conjunto de variablesque mejorse adaptan
al objeto del análisismultivariante específico.Enregresionesmúltiples,el valorteórico se determinade tal forma que
guarde la mejor correlación con la variable que se está prediciendo. En el análisis discriminante, el valor teórico se
forma de tal manera que produzca resultados para cada observación que diferencien de forma máxima entre grupos
de observaciones. Y en el análisis factorial, los valores teóricos se forman para representar mejor las estructuras
subyacentes o la dimensionalidad de las variables tal y como se representan en sus intercorrelaciones.
En cada caso, el valor teórico capta el carácter multivariante del análisis. Por tanto, en nuestras discusiones de cada
técnica, el valor teórico es el punto central del análisis por varias razones. Debemos entender no sólo su impacto
conjunto para lograr cumplir el objetivo de cada técnica, sino también la contribución de cada variable separada al
efecto del valor teórico en su conjunto.
ESCALAS DE MEDIDA
El análisisde los datos implicala separación, identificaciónymedidade la variación en un conjuntode variables,tanto
entre ellasmismas como entre una variable dependiente yuna o más variablesindependientes.El término clave aquí
esmedida,dado que el investigadorno puede separaro identificarunavariación a menosque puedaser mesurable.La
medida es importante para representar con precisión el concepto de nuestro interés y es crucial en la selección del
método de análisis multivariante apropiado. En los siguientes párrafos vamos a discutir el concepto de medida en lo
que se refiere al análisis de datos y particularmente a las diversas técnicas multivariantes.
Existen dos tipos básicos de datos: no métricos (cualitativos) y métricos (cuantitativos). Los datos no métricos son
atributos, características o propiedades categóricas que identifican o describen a un sujeto. Describen diferencias en
tipo o clase indicando la presencia o ausencia de una característica o propiedad. Muchas propiedades son discretas
porque tienenuna característica peculiarque excluye todas las demás características. Por ejemplo,si uno es hombre,
no puede ser mujer; No hay cantidad de «género», sólo la condición de ser hombre o mujer. Por el contrario, las
medidas de datos métricos están constituidas de tal forma que los sujetos pueden ser identificados por diferencias
entre gradoo cantidad.Las variablesmedidasmétricamente reflejancantidadesrelativasogrado.Lasmedidasmétricas
sonlas más apropiadaspara casosque involucrancantidad omagnitud,talescomo el nivel de satisfacciónolademanda
de trabajo.
Escalas de medidas no metricas
Las medidasnométricaspuedentenerescalasnominalesuordinales.Lamedidaconunaescalanominal asignanúmeros
que se usan para etiquetar o identificar sujetos u objetos. Las escalas nominales, también conocidas como escalas de
categoría, proporcionan el númerode ocurrencias en cada clase o categoría de la variable que se está estudiando.Por
tanto, los númeroso símbolosasignadosa losobjetosno tienenmás significadocuantitativoque indicar la presenciao
AndreaBelenDelgadilloSuarez
Mrg. José RamiroZapata
Materia: Investigaciónde mercadosII
“LIBEREMOS BOLIVIA”
10
ausencia del atributo o característica bajo investigación.Los ejemplosde datos con escala nominal incluyenel sexo,la
religión o el partido político de una persona. Para trabajar con estos datos, el analista puede asignar números a cada
categoría, por ejemplo, 2 para mujeres y 1 para hombres. Estos números sólo representan categorías o clases y no
implican cantidades de un atributo o característica.
Las escalas ordinales representan un nivel superior de precisión de la medida. Las variables pueden ser ordenadas o
clasificadas con escalas ordinales en relación a la cantidad del atributo poseído. Cada subclase puede ser comparada
conotra entérminosde unarelaciónde «mayorque»o«menorque».Porejemplo.losdiferentesnivelesde satisfacción
del consumidorindividual con diferentesproductos nuevospuede ilustrarse en una escala ordinal. La siguiente escala
muestra la ideaque tiene un encuestado acerca de tres productos. El encuestado está más satisfecho con A que con B
y más satisfecho con B que con C.
Los númerosutilizadosenescalasordinalescomoéstasno son cuantitativos,dado que indicansóloposicionesrelativas
enseriesordenadas.Nohay medidade cuánta satisfacciónrecibe el consumidorentérminosabsolutos,el investigador
ni conoce la diferencia exacta entre puntos de la escala de satisfacción. Muchas escalas de las ciencias del
comportamiento caen dentro de esta categoría ordinal.
Escalas de medidas métricas
Las escalas de intervalos y de razón (ambas métricas) proporcionan el nivel más alto de medida de precisión,
permitiendorealizarcasi todas las operacionesmatemáticas. Estas dos escalas tienenunidadesconstantesde medida,
de tal forma que las diferencias entre dos puntos adyacentes de cualquier parte de la escala son iguales. La única
diferencia real entre las escalas de intervalo y las de razón es que las de intervalo tienen un punto cero arbitrario,
mientras que las escalas de razón tienen un punto de cero absoluto. Las escalas de intervalo más familiares son las
escalas de temperatura Celsius y Fahrenheit. Ambas tienen un punto de cero arbitrario, pero ese cero no indica una
cantidad cero o ausencia de temperatura,dado que podemosregistrar temperaturas por debajodel punto cero de esa
escala. Por tanto, no es posible decir que un valor cualquiera situado en un intervalo de la escala es un múltiplo de
cualquier otro punto de la escala. Por ejemplo, si un día se registran 80°F, no se puede decir que sea dos veces más
caluroso que uno de 40°F porque sabemos que 80°F, en una escala diferente como Celsius, equivalen a 26,7°C. De la
misma forma,40°F enCelsiuscorrespondena4,4°C. Aunque 80°F son, desde luego,dosveces40°F,no se puede afirmar
que el calor de 80°F sea dos veces el calor de 40°F porque usando diferentes escalas, el calor no es dos veces mayor;
esto es, 4,4°F X 2 '* 26,7°C.
Las escalas de razón representanla forma superiorde medida de precisión,dado que poseenlas ventajas de todas las
escalasinferioresmásunpuntode cero absoluto.Conlas medidasde escalade razón se permitentodaslasoperaciones
matemáticas.El pesoque tenemosenel bañouotrasmáquinasde pesocomunesutilizanestasescalas,dadoque tienen
AndreaBelenDelgadilloSuarez
Mrg. José RamiroZapata
Materia: Investigaciónde mercadosII
“LIBEREMOS BOLIVIA”
11
un punto de cero absoluto y que pueden ser expresados en términos de múltiplos cuando se relaciona un punto con
otro de la escala; por ejemplo, 100 kilos es dos veces más pesado que 50 kilos.
Es importante entenderlosdiferentestiposde escalasde medidapordosrazones.Enprimerlugar, el investigadordebe
identificar la escala de medida de cada variable empleada, de tal forma que no se estén utilizando datos no métricos
como si fueranmétricos.En segundolugar, la escala de medidaes crucial para determinarqué técnicamultivariante es
la másconveniente paralosdatos,consideraciónhechatantopara las variablesdependientescomolasindependientes.
En la discusiónde lastécnicasy su clasificación,que haremosenposterioresseccionesde este capítulo,laspropiedades
métricas o no métricas de las variables dependientesoindependientessonlos factores determinantesenla selección
de la técnica apropiada.
ERROR DE MEDIDA Y MEDIDAS MULTIVARIANTES
El usode múltiplesvariablesasí comoladependenciade sucombinación(el valorteórico) enlastécnicasmultivariantes
también dirige su atención a un tema complementario, el error de medida.
El error de medida es el grado en que los valores observados no son representativos de los valores «verdaderos». El
error de medida tiene múltiplesfuentes,que vandesde errores en la entrada de datos a la imprecisiónen la medición
(por ejemplo,imponiendoescalasde puntuación de siete puntos a la actitud medida cuando el investigadorsabe que
los encuestadossólopuedenrespondercon precisióna una puntuación de tres puntos) pasando por la incapacidad de
los encuestados a proporcionar información precisa (por ejemplo, las respuestas a la renta de una economía familiar
pueden ser razonablemente precisas pero rara vez lo son completamente). Por tanto, se debe asumir que todas las
variable usadas en las técnicas multivariantes tienenalgún grado de error de medida. El impacto del error de medida
esañadir «ruido»a lasvariablesmedidasuobservadas.Portanto, el valorobservadoobtenidorepresentatantoel nivel
«verdadero» como el «ruido». Cuando se calculan correlaciones o medias, normalmente el efecto «verdadero» está
parcialmente camufladopor el error de medida,causando la debilidadde las correlacionesy la pérdidade precisiónde
las medias.
El objetivodel investigadorde reducir el error de medida puede seguir varios caminos. Al valorar el grado de error de
medida presente en cualquier medición, el analista debe enfrentarse tanto con la validez como con la fiabilidad de la
medida.La validezesel gradoenque lamedidarepresentaconprecisiónloque se supone que representa.Porejemplo,
si queremosmedirla renta discrecional,nopreguntaremospor la renta total de las economíasdomésticas.Asegurarla
validezempiezaconunconocimientoprofundode loquese vaamedirysóloentoncesrealizarlamedidatan«correcta»
y precisa como sea posible. Sin embargo, la precisión no asegura la validez. En nuestro ejemplo de la renta, el
investigadorpodría definirmuy precisamente el total de la renta familiarpero no tiene una medida válida de la renta
discrecional porque no se ha planteado la pregunta «correcta».
AndreaBelenDelgadilloSuarez
Mrg. José RamiroZapata
Materia: Investigaciónde mercadosII
“LIBEREMOS BOLIVIA”
12
Si la validezestáasegurada, el investigadordebe considerarlafiabilidadde lasmedidas.La fiabilidadesel gradoenque
la variable observada mide el valor «verdadero»y está «libre de error»; por tanto es lo opuestoal error de medida.Si
la misma medida se realiza repetidas veces, por ejemplo, las medidas más fiables mostrarán una mayor consistencia
que las medidas menos fiables. El investigador deberá valorar siempre las variables que están siendo usadas y si se
pueden encontrar medidas alternativas válidas, elegir la variable con la mayor fiabilidad.
El investigador puede también optar por desarrollar mediciones multivariantes, también conocidas como escalas
sumadas, donde diversasvariablesse unenen una medidacompuestapara representarun concepto(por ejemplo,una
escala de personalidad de entrada múltiple o puntuaciones sumadas de un producto). El objetivo es evitar usar sólo
una únicavariable para representarunconcepto,yensulugar utilizarvariasvariablescomoindicadores, representando
todosellosdiferentesfacetasdel conceptoparaobtenerunaperspectivamáscompleta.El usode indicadoresmúltiples
permite al investigadorllegar a una especificaciónmásprecisa de las respuestasdeseadasy no dejala fiabilidadplena
a una única respuestasinoenla respuesta«media»o«típica» de un conjuntode respuestasrelacionadas.Por ejemplo,
al medirla satisfacción,unopodríapreguntaruna únicacuestión,«¿cuál essugradode satisfacción?»,ybasar el análisis
en una única respuesta. O se podría desarrollar una escala aditiva que combinara varias respuestas de satisfacción,
quizá en diferentes formatos de respuesta y en diferentes áreas de interés, que contemple la satisfacción total. La
premisabásica esque las respuestasmúltiplesreflejanconmayor precisiónla respuesta«verdadera»que la respuesta
única.
El impacto del error de mediday la escasa fiabilidadnopuedenser observadas directamente,dadoque se encuentran
en las variables observadas. El investigadordebe,por tanto, trabajar siempre para aumentar la validezy la fiabilidad,
loque al final llevaráa unretrato más «auténtico»de lasvariablesde interés.Losmalosresultadosnosiempre se deben
al error de medida,pero la presenciadel error de medidaesgarantía de distorsiónenlas relacionesobservadasy hace
menospoderosaslas técnicasmultivariantes.Reducir el error de medida,aunque implique esfuerzo,tiempoyrecursos
adicionales, puede mejorar resultados débiles o marginales, así como fortalecer resultados probados.
SIGNIFICACION ESTADISTICA FRENTE A POTENCIA ESTADISTICA
Todas las técnicas multivariantes, excepto el análisis cluster y el análisis multidimensional, se basan en la inferencia
estadísticade losvalores de una poblaciónola relaciónentre variablesde una muestra escogidaaleatoriamente de esa
población. Si estamos realizando un Censo de toda la población, entonces la inferencia estadística no es necesaria,
porque cualquier diferenciaorelación,por pequeñaque sea,es «verdad» y existe. Perorara vez,casi nunca, se realiza
un censo; por tanto, el investigador está obligado a deducir inferencias de una muestra.
Para interpretarlas inferenciasestadísticas,el investigadordebe especificarlosnivelesaceptablesde errorestadístico.
El modode aproximaciónmás común esdeterminarel nivel de error de Tipo I, tambiénconocidocomo alfa (α).El error
AndreaBelenDelgadilloSuarez
Mrg. José RamiroZapata
Materia: Investigaciónde mercadosII
“LIBEREMOS BOLIVIA”
13
de Tipo I es la probabilidad de rechazar la hipótesis nula cuando es cierta, o expresado en términos más sencillos, la
posibilidad de que la prueba muestre significación estadística cuando en realidad no está presente (el caso de un
«positivo falso»). Especificando un nivel alfa, el investigador fija los márgenes admisibles de error especificando la
probabilidad de concluir que la significación existe cuando en realidad no existe.
Al especificarel nivel de error de Tipo I. el investigadortambiéndeterminaun error asociado. denominadoel error de
Tipo II o beta (β).El error de Tipo II es la probabilidadde fallaren rechazar la hipótesisnula cuando esrealmente falsa.
Una probabilidad más interesante es 1 - β, denominado la potencia del test de inferencia estadística. Potencia es la
probabilidad de rechazar correctamente la hipótesis nula cuando debe ser rechazada. Por tanto, la potencia es la
probabilidad de que la inferencia estadística se indique cuando esté presente.
Aunque laespecificaciónalfaestablece el nivel de significaciónestadísticaaceptable,esel nivel de potenciael quedicta
la probabilidad de «éxito» en la búsqueda de las diferencias si es que realmente existen. Entonces, ¿por qué no se
plantean niveles aceptables tanto de alfa como de beta? Porque los errores de Tipo I y Tipo II están inversamente
relacionados,y a medida que el error de TipoI se hace más restrictivo(se acerca a cero),el error de Tipo II aumenta. Al
disminuirel errorde TipoItambiénse reduce el poderde lapruebaestadística.Portanto,el analistatiene que conseguir
un equilibrio entre el nivel de alfa y la potencia resultante.
La potencia no es sólo una función de alfa; Realmente está determinada por tres factores:
1.Efecto tamaño: La probabilidadde conseguirsignificaciónestadísticase basa no sólo enconsideracionesestadísticas
sino tambiénen la magnitud real del efectoque nos interesa(por ejemplo,una diferenciade mediasentre dos grupos
o la correlaciónentre variables) enla población,denominadoefectotamaño.Comocabría esperar,un efectogrande es
más probable de encontrar que un efecto pequeño y por tanto, afecta a la potencia de la prueba estadística. Para
evaluar la potencia de cualquier prueba estadística, el investigador debe entender primero el efecto examinado. Los
efectosde tamaños se miden en términosestandarizados para facilitar la comparación. Las diferenciasrespectode la
media se determinan en términos de desviaciones estándar, así que un efecto tamaño de 0,5 indica que la diferencia
respecto de la media es la mitad de la desviación estándar. Para las correlaciones, el efecto tamaño se basa en la
correlación efectiva entre las variables.
2.Alfa (α): Como ya se ha discutido,a medidaque alfa se vuelve más restrictivo,la potencia decrece.Estosignificaque
como el analista reduce la oportunidad de encontrar un efecto incorrecto significativo, la probabilidad de encontrar
correctamente un efecto tambiéndisminuye.Las directricesconvencionales sugieren niveles alfa de 0,05 o 0,01. Pero
el investigador debe considerar el impacto de esta decisión sobre la potencia antes de seleccionar el nivel alfa.
3.El tamaño de la muestra: Para cualquier nivel de alfa dado, el aumento de la muestra siempre produce una mayor
potenciadel Test estadístico.Peroaumentar el tamaño de la muestra tambiénpuede producir «demasiada»potencia.
AndreaBelenDelgadilloSuarez
Mrg. José RamiroZapata
Materia: Investigaciónde mercadosII
“LIBEREMOS BOLIVIA”
14
Por este hecho, entendemosque al aumentar el tamaño de la muestra, se observará que efectoscada vez más y más
pequeños serán significativos, hasta que para muestras muy grandes casi cualquier efecto es significativo. El
investigadordebe tenersiempre presente que el tamañode la muestra puede afectar a la prueba estadísticatanto por
hacerla insensible (para muestras muy pequeñas) o demasiado sensible (para muestras muy grandes).
Las relacionesentre alfa, tamaño de la muestra, efectotamaño y potenciason bastante complicadas, pero se pueden
encontrar ciertos puntos de partida. Cohen ha examinadola potencia para la mayor parte de las pruebas de inferencia
estadística y ha proporcionado pautas para los niveles aceptables de potencia, sugiriendo que los estudios deben
diseñarse para conseguir niveles de alfa de al menos 0,05 con niveles de potencia del 80 por ciento.
Para conseguir dichos niveles,debenconsiderarse simultáneamente lostres factores. Estas interrelacionesse pueden
ilustrar mediante dos ejemplos sencillos. El primero implica la comprobación de la diferencia entre las puntuaciones
medias de dos grupos. Suponiendo que el efecto tamaño sea entre pequeño (0,02) y moderado (0,5), el investigador
debe determinarel nivel alfa y el tamaño de muestra necesariode cada grupo. La Tabla 1.1 ilustra el impacto tanto del
tamaño de la muestra como del nivel alfa sobre la potencia. Como puede verse, la potencia llegaa ser aceptable para
tamaños de muestra de 100 o más en situaciones con un efecto tamaño moderado para ambos niveles de alfa. Pero
cuando ocurre un efecto tamaño pequeño, las pruebas estadísticas tiene poca potencia, incluso con niveles de alfa
expandidosa muestrasde 200 o más. Por ejemplo,unamuestrade 200 encada grupo con un alfa de 0,05 todavía tiene
un 50 por cientode posibilidadesde encontrarse diferenciassignificativassi el efectotamañoes pequeño.Estosugiere
que el analista, al anticipar que los efectosvan a ser pequeños,debe diseñarel estudiocon muestras mucho mayores
y/o niveles de alfa menos restrictivos (0,05 o 0,10).
Tamaño
muestral
alfa (x) = 0.05
Efecto tamaño (ET)
alfa (x) = 0.01
Efecto tamaño (ET)
Pequeño
(0.2)
Moderado
(0.5)
Pequeño
(0.2)
Moderado
(0.5)
20 0.095 0.338 0.025 0.144
40 0.143 0.598 0.045 0.349
60 0.192 0.775 0.067 0.549
80 0.242 0.882 0.092 0.709
AndreaBelenDelgadilloSuarez
Mrg. José RamiroZapata
Materia: Investigaciónde mercadosII
“LIBEREMOS BOLIVIA”
15
100 0.290 0.940 0.120 0.823
150 0.411 0.990 0.201 0.959
200 0.516 0.998 0.284 0.992
TABLA 1.1. Niveles de potencia para la comparación
entre dos medias: variaciones por el tamaño de la
muestra, el nivel de significación y el efecto tamaño
Fuente: Solo Power Analysis.BMDP Statistical Software,
Inc
En el segundo ejemplo, la Figura 1.1 representa gráficamente ]a potencia para niveles de significación de 0,01; 0,5 Y
0,10 con tamaños de muestra de 20 a 300 por grupo, cuando el efecto tamaño (0,35) es entre pequeño y moderado.
Enfrentado a tales perspectivas,la especificaciónde un nivel de significaciónde un 0,01 requiere una muestra de 200
por grupo para conseguir el nivel deseado de potencia del 80 por ciento. Pero si se relaja el nivel alfa, se alcanza la
potenciadel 80 por cientopara muestrasde 130 para unnivel alfa 0,05 y muestrasde 100 para un nivel de significación
de un 0,10.
Tales análisis permiten al investigador tomar decisiones más adecuadas en el estudio, diseño e interpretación de los
resultados. Al planificar la investigación, el investigador debe estimar el efecto tamaño esperado para seleccionar
entoncesel tamaño de la muestra y el nivel alfa para conseguirel nivel de potenciadeseado.Ademásde sus usos para
la planificación, el análisis de potencia se utiliza también después de que el análisis ha terminado para determinar la
potencia real conseguida, de tal forma que los resultados puedan ser correctamente interpretados. ¿Se deben los
resultados al efecto tamaño, tamaño muestral o niveles de significación? Los analistas pueden evaluar cada uno de
AndreaBelenDelgadilloSuarez
Mrg. José RamiroZapata
Materia: Investigaciónde mercadosII
“LIBEREMOS BOLIVIA”
16
estos factores por su impacto sobre la significatividad o no significatividad de los resultados. El investigador puede
referirse hoyendíaa estudiospublicadosdonde se analizanlosdetallesconcretosde ladeterminaciónde lapotencia o
acudir a variosprogramas de ordenadorpersonal que asistenenlosestudiosde planificaciónparaconseguirlapotencia
deseada o calcular la potencia de los resultados reales.
Habiendo ya expuesto la extensión de las técnicas multivariantes desde sus orígenes univariantes o bivariantes,
introduciremosahora brevemente cadamétodomultivariante.A partir de la introducción de las técnicas,presentamos
un esquema de clasificación para ayudar en la selección de la técnica apropiada respecto de la identificación de los
objetivos de investigación (relaciones de dependencia o independencia) y el tipo de datos (métricos o no métricos).
CLASIFICACION DE LAS TECNICAS MULTIVARIANTES
Para ayudarle a familiarizarse con las técnicas multivariantes, presentamos una clasificación de los métodos
multivariantes. Esta clasificación se basa en tres juicios que el analista debe hacer sobre el objeto a investigar y la
naturaleza de losdatos: (l) ¿puedendividirse lasvariablesendependientesoindependientesbasándose la clasificación
en alguna teoría? (2) Si puede hacerse, ¿cuántas de estas variables son tratadas como dependientes en un análisis
simple? (3) ¿Cómo son las variables medidas? La selección de la técnica multivariante apropiada depende de las
respuestas a estas tres cuestiones.
Cuando consideramos la aplicación de las técnicas estadísticas multivariantes, la primera cuestión que nos debemos
preguntar es,¿puedendividirse lasvariablesmediante laclasificaciónde dependientee independiente?Larespuestaa
esta cuestión indica si se debería utilizar un análisis de dependencia o interdependencia.
Un análisis de dependenciapuede definirse comoaquel en el que una variable o conjunto de variables es identificado
como la variable dependiente y que va a ser explicada por otras variables conocidas como variables independientes.
Como ejemplo de una dependencia técnica tenemos el análisis de regresión múltiple. Como contraste, un análisis de
interdependencia es aquel en que ninguna variable o grupo de variables es definido como independiente o
dependiente. Más bien, el procedimiento implica el análisis de todas las variables del conjunto simultáneamente. El
análisis factorial es un ejemplo de un análisis de interdependencia.
Los diferentes métodos que constituyen el análisis de dependencia pueden ser a su vez divididos en dos tipos según:
(1) el número de variablesdependientesy(2) el tipo de escalas de medida empleadaspara las variables.Teniendoen
cuenta el número de variablesdependientes,el análisisde dependenciapuede clasificarse comoaquel que tiene tanto
una variable dependiente única como varias variables dependientes o incluso varias relaciones de
dependencia/independencia.El análisis de dependenciapuede inclusoser clasificadoen función del tipo de escala de
la variable con variables métricas (numéricas/cuantitativas) o no métricas (cualitativas/categóricas). Si el análisis
implica una única variable dependiente que es métrica, la técnica apropiada es tanto el análisis de regresiónmúltiple
AndreaBelenDelgadilloSuarez
Mrg. José RamiroZapata
Materia: Investigaciónde mercadosII
“LIBEREMOS BOLIVIA”
17
como el análisis conjunto. El análisis conjunto es un caso especial. Se trata de un procedimiento de dependencia que
puede tratar la variable dependiente como métrica o no métrica, en función de las circunstancias. Por otro lado, si la
única variable dependienteesnométrica(categórica),entonceslatécnicaapropiada es,o bienel análisisdiscriminante
múltiple, o bien los modelos de probabilidad lineal. En contraste, cuando el problema del investigador implica varias
variables dependientes, hay otras cuatro técnicas estadísticas apropiadas. Si varias variables dependientes son
métricas, debemos entonces mirar a las variables independientes. Si las variables independientes son no métricas,
debemos elegir la técnica multivariante de análisis de la varianza. Si las variables independientes son métricas, la
apropiada es la correlación canónica.
REPRESENTACION PARA EL ANALISIS MULTIVARIANTE INTERPRETACION
Como se ha podidocomprobar, el análisismultivariante tiene un carácter variado y puede ser bastante poderoso.Este
poder es especialmente tentadorcuandoel investigadorno está seguro del diseñodel análisismás apropiado y utiliza
el análisis multivariante como un sustituto del necesario análisis conceptual. Incluso cuando se aplica correctamente,
los esfuerzospor acomodar las múltiplesvariablesy relacionescrean complejidadesadicionalesenlos resultadosy su
interpretación. Por tanto, advertimos contra su uso sin la base conceptual apropiada para apoyar la técnica
seleccionada sobre aquellos conceptos básicos mencionados previamente y los temas abordados en la siguiente
sección.
Hemos discutido también varios asuntos particularmente aplicables al análisis multivariantes. Por tanto, mientras no
existaunaúnica «respuesta»,hemosencontradoque el análisisylainterpretaciónde cualquierproblemamultivariante
puede verse ayudado por un conjunto general de directrices. No se trata de ningún modo de una lista exhaustiva de
consideraciones,sinoque lalistarepresentamásbienuna«filosofíadel análisismultivariante».Lassiguientessecciones
discuten estos puntos pero no en un orden concreto, sino haciendo igual énfasis en todos ellos.
ESTABLECER LA SIGNIFICACION PRACTICA ASI COMO LA ESTADISTICA
La fuerza del análisis multivariante reside en sus medios aparentemente «mágicos» para clasificar una variedad de
posibles alternativas y encontrar aquellas que tienen significación estadística. Pero con este poder debemos tener
precaución. Muchos investigadores se vuelven miopes al fijarse solamente en la significación conseguida por los
resultados sin entender sus interpretaciones, buenas o malas. En su lugar. el investigador debe atender no sólo a la
significaciónestadística de los resultadossino tambiéna su significaciónpráctica. La significaciónpráctica se refiere a
la cuestión,«¿y para qué'?».Para cualquieraplicaciónen la gestión,losresultadosdebentenerun efectodemostrable
que justifique laacción. En el terrenoacadémico,el investigadorse llegaa fijarno sólo enla significaciónestadística de
AndreaBelenDelgadilloSuarez
Mrg. José RamiroZapata
Materia: Investigaciónde mercadosII
“LIBEREMOS BOLIVIA”
18
los resultados sino también en sus implicaciones teóricas y sustantivas, que en muchas ocasiones se deducen de su
significación práctica.
Como ejemplo ilustrativo de esta situación consideramos un análisis de regresión para predecir las intenciones de
compra, medidas como la probabilidad entre O y 100 de que el cliente volverá a comprar a la empresa. El estudio se
lleva a cabo y el resultado es significativo al nivel de significación de 0,05. Los ejecutivos aceptan los resultados y
modifican la estrategia de la empresa. Pero lo que no se ha percibido es que mientras la relación era significativa, la
capacidad predictivaera baja, tan baja que la estimaciónde la posibilidadde repetircompra podría variar tanto como
un 20 por cientoal nivel de significacióndel 0,05. ¡La relaciónde la «significaciónestadística»podríaentoncestenerun
rango de error de 40 puntos porcentuales!Uncliente del cual se predice que tiene una oportunidadde volver de 50/50
podría realmente tener probabilidades del 30 al 70 por ciento, representando niveles inaceptables sobre los cuales
actuar. Los investigadores y los gerentes no han probado la significación práctica o de gestión de los resultados.
olvidando que la relación todavía necesitaba un ulterior refinamiento.
TAMAÑO MUESTRAL AFECTA A TODOS LOS RESULTADOS
La discusión de la potencia estadística demuestra que el impacto sustancial del tamaño muestral opera en la
consecución de la significación estadística, tanto en tamaños muestrales grandes como pequeños. Para muestras
pequeñas,lasofistificacióny la complejidaddel análisismultivariante puede fácilmente resultartantoen(1) muy poca
potencia estadística de la prueba para identificar de forma realista resultados significativos o (2) fácilmente un
«sobreaprovechamiento» de los datos de tal forma que sean artificialmente buenos porque se ajustan muy bien a la
muestra, aunque no sean generalizables.Lo mismo ocurre para muestras grandes que,como ya se ha discutidoantes,
pueden hacer a los test estadísticos altamente sensibles. Siempre que los tamaños muestrales excedan los 200 o 400
encuestados, el investigador debería examinar todos los resultados significativos para asegurarse que tienen
significación práctica debido al aumento de la potencia estadística como consecuencia del tamaño muestral. Los
tamaños muestralestambiénafectana los resultadoscuando losanálisisimplicangruposde encuestados,comoocurre
enel análisisdiscriminante oenMANOVA.Tamañosmuestralesdesigualesentre losgruposinfluencianalosresultados
y requieren un análisis y/o interpretación adicional. Por tanto, el investigador o usuario del análisis multivariante
debería siempre valorar los resultados a la luz de la muestra utilizada.
CONOCER LOS DATOS
Las técnicas del análisis multivariante, por su propia naturaleza, identifican relaciones complejas que son difíciles de
representar de forma simple. Como resultado, la tendencia es aceptar los resultados sin el típico examen que uno
emprende en los análisis univariante y bivariante (por ejemplo, gráfico de dispersión de correlaciones y boxplots de
comparaciones de media). Pero estos «atajos» pueden ser el preludio del desastre. El análisis multivariante requiere
AndreaBelenDelgadilloSuarez
Mrg. José RamiroZapata
Materia: Investigaciónde mercadosII
“LIBEREMOS BOLIVIA”
19
un exameninclusomás riguroso de losdatos porque la influenciade atípicos,violacionesde los supuestosy la pérdida
de datos puede agravarse a travésde varias variablesy tenerefectossustancialmente diferentes.Paraservirse de todos
los beneficios de las técnicas multivariantes, el analista debe también «saber dónde mirar» con formulaciones
alternativas del modelo original, tales como relaciones no lineales e interactivas. El analista tiene, sin embargo, un
conjunto de técnicas de diagnóstico en continua expansión que permiten que estas relaciones multivariantes sean
descubiertas por medios similares a los métodos univariantes y bivariantes. El investigador de un problema
multivariante debe tomarse su tiempo en utilizar estas medidas de diagnóstico para un mayor entendimiento de los
datos y de las relaciones básicas que existen.
PROCURAR LA PARSIMONIA DEL MODELO
Las técnicasmultivariantesse diseñanpara acomodar lasvariablesenel análisis.Este carácter, sinembargo,no debería
sustituirel desarrollode modelosconceptualesantesde que se apliquenlastécnicas multivariantes.Aunque essiempre
importante evitar omitir una variable predictor crítica, denominada error de especificación, por varias razones el
analistadebe tambiénintentarevitarinsertarvariablesindiscriminadamente.Enprimerlugar,lasvariablesirrelevantes
habitualmente aumentan la capacidad del análisis para ajustar la muestra de datos pero a costa de sobreajustar los
datos y hacerlos menos generalizables para la población. En segundo lugar, las variables irrelevantes no sesgan
típicamente las estimaciones de las variables relevantes, pero puedenenmascarar los efectos verdaderos debido a la
multicolinealidad.Lamulticolinealidadrepresentael gradoenel que cualquierefectode unavariable puede serprevista
o explicadapor las otras variablesdel análisis.A medidaque aumenta la multicolinealidad.lacapacidad para definirel
efecto de cualquier variable disminuye. Por tanto, incluyendo variables que no son relevantes conceptualmente
podemostener varios efectospotencialmente dañinos.inclusosi las variables adicionalesno sesgan directamente los
resultados del modelo.
ATENDER A LOS ERRORES
Inclusocon lacapacidad del análisismultivariante.difícilmente conseguiremoslamejorpredicciónenel primeranálisis.
El analista se enfrenta con la cuestión. «¿adónde podemos ir desde aquí?». La mejor respuesta es mirar a los errores
en la predicción.tanto si son los residuosdel análisisde regresión.la ausencia de clasificaciónde observacionesen el
análisis discriminante o los atípicos del análisis cluster.
En cada caso. el analistadeberíautilizarloserroresde predicciónnocomounamedidade erroro comoalgo meramente
a eliminar.sinocomounpuntode partidapara diagnosticarla validezde losresultadosobtenidosycomounaindicación
de las relaciones que quedan sin explicar.
VALIDAR LOS RESULTADOS
AndreaBelenDelgadilloSuarez
Mrg. José RamiroZapata
Materia: Investigaciónde mercadosII
“LIBEREMOS BOLIVIA”
20
La capacidad del análisis multivariante para identificar interrelaciones complejas también implica que puede darse el
caso de que los resultadosseanespecificassóloparala muestra y no generalizablesalapoblación.El investigadordebe
siempre asegurar que existen observaciones suficientes por parámetro estimado para evitar el «sobreajuste» de la
muestra. como se ha discutido antes. Pero igual de importantes son los esfuerzos destinados a validar los resultados
mediante diferentes métodos, que incluyen (1) división de la muestra y el uso de una submuestra para estimar el
modelo y usar una segunda submuestra para estimar la precisión predictiva. (2) empleo de un análisis de
«bootstrapping»[9]. o (3) inclusoconseguirunamuestra distintapara asegurar que los resultadossonapropiados para
otras muestras.Cualquieraque sealatécnicamultivariante empleada.elinvestigadordebe centrarse nosóloenestimar
un modelo significativo sino también en asegurar que es representativo de la población en su conjunto. Recordemos
que el objetivonoes encontrar el mejor «ajuste»sólo para la muestra sinodesarrollar el modeloque mejor describaa
la población en su conjunto.
3.- Conclusiónes
En conclusión el Análisis Multivariante es el conjunto de métodos estadísticos cuya finalidad es analizar
simultáneamente conjuntos de datos multivariantes en el sentido de que hay varias variables medidas para cada
individuo ú objeto estudiado.
Su razón de ser radica en un mejor entendimiento del fenómeno objeto de estudio obteniendo información que los
métodos estadísticos univariantes y bivariantes son incapaces de conseguir.
En esta lecciónse va a dar una breve visióngeneral de dicho conjunto de técnicasexponiendo,brevemente,cuál essu
finalidad, ilustrada con ejemplos.
Tres son los objetivos de la lección:
 Definir qué es el Análisis Multivariante y cuáles son sus objetivos
 Clasificarlas distintastécnicas multivariantes,distinguiendoentre métodosde dependencia,interdependencia
y estructurale e indicando,de formaresumida,losobjetivosde lasdiversastécnicasmultivariantespresentadas
en la lección.
 Indicar cuáles son las etapas a seguir en la resolución de un problema de Análisis Multivariante
.4.-Referencias
1.- (1Y1.1) https://es.ryte.com/wiki/An%C3%A1lisis_Multivariante
AndreaBelenDelgadilloSuarez
Mrg. José RamiroZapata
Materia: Investigaciónde mercadosII
“LIBEREMOS BOLIVIA”
21
2.-(2) (2)
https://guiasjuridicas.wolterskluwer.es/Content/Documento.aspx?params=H4sIAAAAAAAEAMtMSbF1jTAAASNDSwtDtb
LUouLM_DxbIwMDS0MDIwuQQGZapUt-ckhlQaptWmJOcSoATrah7TUAAAA=WKE
3.-(2.2) https://www.ecured.cu/An%C3%A1lisis_multivariados
4.-(2.3) http://www.cyta.com.ar/biblioteca/bddoc/bdlibros/guia_multivariante/guia_multivariante.htm
5.-(3) http://www.ciberconta.unizar.es/leccion/anamul/inicio.html
5.-Videos
1.- https://www.youtube.com/watch?v=_3YKNZW2HNc
2,.
https://www.youtube.com/watch?v=6xNe1uklDHM

Más contenido relacionado

La actualidad más candente

5 Semana Analisis Multivariante Parte II
5 Semana Analisis Multivariante Parte II5 Semana Analisis Multivariante Parte II
5 Semana Analisis Multivariante Parte IIjpgv84
 
1 Semana Analisis Multivariante
1  Semana Analisis Multivariante1  Semana Analisis Multivariante
1 Semana Analisis Multivariantejpgv84
 
6 Semana Analisis Multivariante Parte I
6 Semana Analisis Multivariante Parte I6 Semana Analisis Multivariante Parte I
6 Semana Analisis Multivariante Parte Ijpgv84
 
5 Semana Analisis Multivariante Parte I
5 Semana Analisis Multivariante Parte I5 Semana Analisis Multivariante Parte I
5 Semana Analisis Multivariante Parte Ijpgv84
 
Analisis factorial
Analisis factorialAnalisis factorial
Analisis factorialnorlan9886
 
diagnosis de la regresion
diagnosis de la regresiondiagnosis de la regresion
diagnosis de la regresioncarlosjardon
 
Analisis multivariado
Analisis multivariadoAnalisis multivariado
Analisis multivariadoLisbethParra5
 
SPSS Función Analizar
SPSS Función AnalizarSPSS Función Analizar
SPSS Función AnalizarLupita Naranjo
 
Analisis Factorial
Analisis FactorialAnalisis Factorial
Analisis Factorialnorlan9886
 
Bueno de regresion lineal[1]
Bueno de regresion lineal[1]Bueno de regresion lineal[1]
Bueno de regresion lineal[1]EQUIPO7
 
Pruebas parametricas y no parametricas
Pruebas parametricas y no parametricasPruebas parametricas y no parametricas
Pruebas parametricas y no parametricasLuisais Pire
 
Prueba estadística paramétrica
Prueba estadística paramétricaPrueba estadística paramétrica
Prueba estadística paramétricajuanchojuancho
 

La actualidad más candente (19)

5 Semana Analisis Multivariante Parte II
5 Semana Analisis Multivariante Parte II5 Semana Analisis Multivariante Parte II
5 Semana Analisis Multivariante Parte II
 
1 Semana Analisis Multivariante
1  Semana Analisis Multivariante1  Semana Analisis Multivariante
1 Semana Analisis Multivariante
 
6 Semana Analisis Multivariante Parte I
6 Semana Analisis Multivariante Parte I6 Semana Analisis Multivariante Parte I
6 Semana Analisis Multivariante Parte I
 
5 Semana Analisis Multivariante Parte I
5 Semana Analisis Multivariante Parte I5 Semana Analisis Multivariante Parte I
5 Semana Analisis Multivariante Parte I
 
Analisis factorial
Analisis factorialAnalisis factorial
Analisis factorial
 
diagnosis de la regresion
diagnosis de la regresiondiagnosis de la regresion
diagnosis de la regresion
 
Analisis multivariado
Analisis multivariadoAnalisis multivariado
Analisis multivariado
 
Tema10 prueba t
Tema10 prueba tTema10 prueba t
Tema10 prueba t
 
SPSS Función Analizar
SPSS Función AnalizarSPSS Función Analizar
SPSS Función Analizar
 
Estadística: Chi Cuadrado y Alfa de Crounbach
Estadística: Chi Cuadrado y Alfa de CrounbachEstadística: Chi Cuadrado y Alfa de Crounbach
Estadística: Chi Cuadrado y Alfa de Crounbach
 
Analisis Factorial
Analisis FactorialAnalisis Factorial
Analisis Factorial
 
Experimentos con un solo factor
Experimentos con un solo factorExperimentos con un solo factor
Experimentos con un solo factor
 
Bueno de regresion lineal[1]
Bueno de regresion lineal[1]Bueno de regresion lineal[1]
Bueno de regresion lineal[1]
 
Pruebas parametricas y no parametricas
Pruebas parametricas y no parametricasPruebas parametricas y no parametricas
Pruebas parametricas y no parametricas
 
Trabajo de factorial
Trabajo de factorialTrabajo de factorial
Trabajo de factorial
 
Prueba estadística paramétrica
Prueba estadística paramétricaPrueba estadística paramétrica
Prueba estadística paramétrica
 
Unidad 5 estadistica 2
Unidad 5 estadistica 2Unidad 5 estadistica 2
Unidad 5 estadistica 2
 
Estadística: Correlaciones
Estadística: CorrelacionesEstadística: Correlaciones
Estadística: Correlaciones
 
Tema9disenos
Tema9disenosTema9disenos
Tema9disenos
 

Similar a Analisis multivariado

Similar a Analisis multivariado (20)

Analisis multivariado
Analisis multivariadoAnalisis multivariado
Analisis multivariado
 
Análisis Multivariado
Análisis  MultivariadoAnálisis  Multivariado
Análisis Multivariado
 
INVESTIGACIÓN ANALISIS MULTIVARIADO
INVESTIGACIÓN ANALISIS MULTIVARIADOINVESTIGACIÓN ANALISIS MULTIVARIADO
INVESTIGACIÓN ANALISIS MULTIVARIADO
 
Análisis de datos
Análisis de datosAnálisis de datos
Análisis de datos
 
Analisis multivariado -_branco_saravia_morales
Analisis multivariado -_branco_saravia_moralesAnalisis multivariado -_branco_saravia_morales
Analisis multivariado -_branco_saravia_morales
 
Analisis multivariado
Analisis multivariadoAnalisis multivariado
Analisis multivariado
 
Analisis multivariado
Analisis multivariadoAnalisis multivariado
Analisis multivariado
 
Analisis multivariado
Analisis multivariadoAnalisis multivariado
Analisis multivariado
 
REPASO MODELOS ECONOMETRICOS.pdf
REPASO MODELOS ECONOMETRICOS.pdfREPASO MODELOS ECONOMETRICOS.pdf
REPASO MODELOS ECONOMETRICOS.pdf
 
REPASO MODELOS ECONOMETRICOS.pdf
REPASO MODELOS ECONOMETRICOS.pdfREPASO MODELOS ECONOMETRICOS.pdf
REPASO MODELOS ECONOMETRICOS.pdf
 
Analisis de encuestas
Analisis de encuestasAnalisis de encuestas
Analisis de encuestas
 
Analisis multivariante
Analisis multivariante Analisis multivariante
Analisis multivariante
 
1 INTRODUCCION AL ANALISIS MULTIVARIANTE.ppt
1 INTRODUCCION AL ANALISIS MULTIVARIANTE.ppt1 INTRODUCCION AL ANALISIS MULTIVARIANTE.ppt
1 INTRODUCCION AL ANALISIS MULTIVARIANTE.ppt
 
Paso 4 descripción de la información.
Paso 4 descripción de la información.Paso 4 descripción de la información.
Paso 4 descripción de la información.
 
Analisis multivariado _Raul_Olmos_Morales
Analisis multivariado _Raul_Olmos_MoralesAnalisis multivariado _Raul_Olmos_Morales
Analisis multivariado _Raul_Olmos_Morales
 
Análisis Multivariado
Análisis Multivariado Análisis Multivariado
Análisis Multivariado
 
Analisis multivariable
Analisis multivariableAnalisis multivariable
Analisis multivariable
 
Tema estadistica
Tema estadisticaTema estadistica
Tema estadistica
 
Análisis multivariante
Análisis multivarianteAnálisis multivariante
Análisis multivariante
 
Tema estadistica
Tema estadisticaTema estadistica
Tema estadistica
 

Más de AndreaBelenDelgadill (17)

Competencia administrativa
Competencia administrativaCompetencia administrativa
Competencia administrativa
 
Analisis foda
Analisis fodaAnalisis foda
Analisis foda
 
Analisis pest
Analisis pestAnalisis pest
Analisis pest
 
Ampliacion de contenido sobre las emociones
Ampliacion de contenido sobre las emocionesAmpliacion de contenido sobre las emociones
Ampliacion de contenido sobre las emociones
 
Marketing
MarketingMarketing
Marketing
 
Las 6 emosiones de paul ekman
Las 6 emosiones de paul ekmanLas 6 emosiones de paul ekman
Las 6 emosiones de paul ekman
 
La prevision
La previsionLa prevision
La prevision
 
Recopilacion de informacion
Recopilacion de informacionRecopilacion de informacion
Recopilacion de informacion
 
Importaciones en bolivia..
Importaciones en bolivia..Importaciones en bolivia..
Importaciones en bolivia..
 
El flujo circular de la economia..
El flujo circular de la economia..El flujo circular de la economia..
El flujo circular de la economia..
 
El enfoque sistemico
El enfoque sistemicoEl enfoque sistemico
El enfoque sistemico
 
Estudio comparativo de impuestos en america latina
Estudio comparativo de impuestos en america latinaEstudio comparativo de impuestos en america latina
Estudio comparativo de impuestos en america latina
 
Thomas Malthus..
Thomas Malthus..Thomas Malthus..
Thomas Malthus..
 
Thomas Malthus
Thomas MalthusThomas Malthus
Thomas Malthus
 
Investigacion cuantitativa
Investigacion cuantitativaInvestigacion cuantitativa
Investigacion cuantitativa
 
INVESTIGACION CUALITATIVA
INVESTIGACION CUALITATIVA INVESTIGACION CUALITATIVA
INVESTIGACION CUALITATIVA
 
Investigacion cualitativa
Investigacion cualitativaInvestigacion cualitativa
Investigacion cualitativa
 

Último

UNIDAD DPCC. 2DO. DE SECUNDARIA DEL 2024
UNIDAD DPCC. 2DO. DE  SECUNDARIA DEL 2024UNIDAD DPCC. 2DO. DE  SECUNDARIA DEL 2024
UNIDAD DPCC. 2DO. DE SECUNDARIA DEL 2024AndreRiva2
 
ACERTIJO DE LA BANDERA OLÍMPICA CON ECUACIONES DE LA CIRCUNFERENCIA. Por JAVI...
ACERTIJO DE LA BANDERA OLÍMPICA CON ECUACIONES DE LA CIRCUNFERENCIA. Por JAVI...ACERTIJO DE LA BANDERA OLÍMPICA CON ECUACIONES DE LA CIRCUNFERENCIA. Por JAVI...
ACERTIJO DE LA BANDERA OLÍMPICA CON ECUACIONES DE LA CIRCUNFERENCIA. Por JAVI...JAVIER SOLIS NOYOLA
 
NARRACIONES SOBRE LA VIDA DEL GENERAL ELOY ALFARO
NARRACIONES SOBRE LA VIDA DEL GENERAL ELOY ALFARONARRACIONES SOBRE LA VIDA DEL GENERAL ELOY ALFARO
NARRACIONES SOBRE LA VIDA DEL GENERAL ELOY ALFAROJosé Luis Palma
 
Identificación de componentes Hardware del PC
Identificación de componentes Hardware del PCIdentificación de componentes Hardware del PC
Identificación de componentes Hardware del PCCesarFernandez937857
 
TIPOLOGÍA TEXTUAL- EXPOSICIÓN Y ARGUMENTACIÓN.pptx
TIPOLOGÍA TEXTUAL- EXPOSICIÓN Y ARGUMENTACIÓN.pptxTIPOLOGÍA TEXTUAL- EXPOSICIÓN Y ARGUMENTACIÓN.pptx
TIPOLOGÍA TEXTUAL- EXPOSICIÓN Y ARGUMENTACIÓN.pptxlclcarmen
 
Plan Refuerzo Escolar 2024 para estudiantes con necesidades de Aprendizaje en...
Plan Refuerzo Escolar 2024 para estudiantes con necesidades de Aprendizaje en...Plan Refuerzo Escolar 2024 para estudiantes con necesidades de Aprendizaje en...
Plan Refuerzo Escolar 2024 para estudiantes con necesidades de Aprendizaje en...Carlos Muñoz
 
RETO MES DE ABRIL .............................docx
RETO MES DE ABRIL .............................docxRETO MES DE ABRIL .............................docx
RETO MES DE ABRIL .............................docxAna Fernandez
 
Informatica Generalidades - Conceptos Básicos
Informatica Generalidades - Conceptos BásicosInformatica Generalidades - Conceptos Básicos
Informatica Generalidades - Conceptos BásicosCesarFernandez937857
 
Caja de herramientas de inteligencia artificial para la academia y la investi...
Caja de herramientas de inteligencia artificial para la academia y la investi...Caja de herramientas de inteligencia artificial para la academia y la investi...
Caja de herramientas de inteligencia artificial para la academia y la investi...Lourdes Feria
 
CALENDARIZACION DE MAYO / RESPONSABILIDAD
CALENDARIZACION DE MAYO / RESPONSABILIDADCALENDARIZACION DE MAYO / RESPONSABILIDAD
CALENDARIZACION DE MAYO / RESPONSABILIDADauxsoporte
 
DE LAS OLIMPIADAS GRIEGAS A LAS DEL MUNDO MODERNO.ppt
DE LAS OLIMPIADAS GRIEGAS A LAS DEL MUNDO MODERNO.pptDE LAS OLIMPIADAS GRIEGAS A LAS DEL MUNDO MODERNO.ppt
DE LAS OLIMPIADAS GRIEGAS A LAS DEL MUNDO MODERNO.pptELENA GALLARDO PAÚLS
 
texto argumentativo, ejemplos y ejercicios prácticos
texto argumentativo, ejemplos y ejercicios prácticostexto argumentativo, ejemplos y ejercicios prácticos
texto argumentativo, ejemplos y ejercicios prácticosisabeltrejoros
 
Registro Auxiliar - Primaria 2024 (1).pptx
Registro Auxiliar - Primaria  2024 (1).pptxRegistro Auxiliar - Primaria  2024 (1).pptx
Registro Auxiliar - Primaria 2024 (1).pptxFelicitasAsuncionDia
 
Historia y técnica del collage en el arte
Historia y técnica del collage en el arteHistoria y técnica del collage en el arte
Historia y técnica del collage en el arteRaquel Martín Contreras
 
Manual - ABAS II completo 263 hojas .pdf
Manual - ABAS II completo 263 hojas .pdfManual - ABAS II completo 263 hojas .pdf
Manual - ABAS II completo 263 hojas .pdfMaryRotonda1
 
DECÁGOLO DEL GENERAL ELOY ALFARO DELGADO
DECÁGOLO DEL GENERAL ELOY ALFARO DELGADODECÁGOLO DEL GENERAL ELOY ALFARO DELGADO
DECÁGOLO DEL GENERAL ELOY ALFARO DELGADOJosé Luis Palma
 
SINTAXIS DE LA ORACIÓN SIMPLE 2023-2024.pptx
SINTAXIS DE LA ORACIÓN SIMPLE 2023-2024.pptxSINTAXIS DE LA ORACIÓN SIMPLE 2023-2024.pptx
SINTAXIS DE LA ORACIÓN SIMPLE 2023-2024.pptxlclcarmen
 
OLIMPIADA DEL CONOCIMIENTO INFANTIL 2024.pptx
OLIMPIADA DEL CONOCIMIENTO INFANTIL 2024.pptxOLIMPIADA DEL CONOCIMIENTO INFANTIL 2024.pptx
OLIMPIADA DEL CONOCIMIENTO INFANTIL 2024.pptxjosetrinidadchavez
 
Estrategia de prompts, primeras ideas para su construcción
Estrategia de prompts, primeras ideas para su construcciónEstrategia de prompts, primeras ideas para su construcción
Estrategia de prompts, primeras ideas para su construcciónLourdes Feria
 
celula, tipos, teoria celular, energia y dinamica
celula, tipos, teoria celular, energia y dinamicacelula, tipos, teoria celular, energia y dinamica
celula, tipos, teoria celular, energia y dinamicaFlor Idalia Espinoza Ortega
 

Último (20)

UNIDAD DPCC. 2DO. DE SECUNDARIA DEL 2024
UNIDAD DPCC. 2DO. DE  SECUNDARIA DEL 2024UNIDAD DPCC. 2DO. DE  SECUNDARIA DEL 2024
UNIDAD DPCC. 2DO. DE SECUNDARIA DEL 2024
 
ACERTIJO DE LA BANDERA OLÍMPICA CON ECUACIONES DE LA CIRCUNFERENCIA. Por JAVI...
ACERTIJO DE LA BANDERA OLÍMPICA CON ECUACIONES DE LA CIRCUNFERENCIA. Por JAVI...ACERTIJO DE LA BANDERA OLÍMPICA CON ECUACIONES DE LA CIRCUNFERENCIA. Por JAVI...
ACERTIJO DE LA BANDERA OLÍMPICA CON ECUACIONES DE LA CIRCUNFERENCIA. Por JAVI...
 
NARRACIONES SOBRE LA VIDA DEL GENERAL ELOY ALFARO
NARRACIONES SOBRE LA VIDA DEL GENERAL ELOY ALFARONARRACIONES SOBRE LA VIDA DEL GENERAL ELOY ALFARO
NARRACIONES SOBRE LA VIDA DEL GENERAL ELOY ALFARO
 
Identificación de componentes Hardware del PC
Identificación de componentes Hardware del PCIdentificación de componentes Hardware del PC
Identificación de componentes Hardware del PC
 
TIPOLOGÍA TEXTUAL- EXPOSICIÓN Y ARGUMENTACIÓN.pptx
TIPOLOGÍA TEXTUAL- EXPOSICIÓN Y ARGUMENTACIÓN.pptxTIPOLOGÍA TEXTUAL- EXPOSICIÓN Y ARGUMENTACIÓN.pptx
TIPOLOGÍA TEXTUAL- EXPOSICIÓN Y ARGUMENTACIÓN.pptx
 
Plan Refuerzo Escolar 2024 para estudiantes con necesidades de Aprendizaje en...
Plan Refuerzo Escolar 2024 para estudiantes con necesidades de Aprendizaje en...Plan Refuerzo Escolar 2024 para estudiantes con necesidades de Aprendizaje en...
Plan Refuerzo Escolar 2024 para estudiantes con necesidades de Aprendizaje en...
 
RETO MES DE ABRIL .............................docx
RETO MES DE ABRIL .............................docxRETO MES DE ABRIL .............................docx
RETO MES DE ABRIL .............................docx
 
Informatica Generalidades - Conceptos Básicos
Informatica Generalidades - Conceptos BásicosInformatica Generalidades - Conceptos Básicos
Informatica Generalidades - Conceptos Básicos
 
Caja de herramientas de inteligencia artificial para la academia y la investi...
Caja de herramientas de inteligencia artificial para la academia y la investi...Caja de herramientas de inteligencia artificial para la academia y la investi...
Caja de herramientas de inteligencia artificial para la academia y la investi...
 
CALENDARIZACION DE MAYO / RESPONSABILIDAD
CALENDARIZACION DE MAYO / RESPONSABILIDADCALENDARIZACION DE MAYO / RESPONSABILIDAD
CALENDARIZACION DE MAYO / RESPONSABILIDAD
 
DE LAS OLIMPIADAS GRIEGAS A LAS DEL MUNDO MODERNO.ppt
DE LAS OLIMPIADAS GRIEGAS A LAS DEL MUNDO MODERNO.pptDE LAS OLIMPIADAS GRIEGAS A LAS DEL MUNDO MODERNO.ppt
DE LAS OLIMPIADAS GRIEGAS A LAS DEL MUNDO MODERNO.ppt
 
texto argumentativo, ejemplos y ejercicios prácticos
texto argumentativo, ejemplos y ejercicios prácticostexto argumentativo, ejemplos y ejercicios prácticos
texto argumentativo, ejemplos y ejercicios prácticos
 
Registro Auxiliar - Primaria 2024 (1).pptx
Registro Auxiliar - Primaria  2024 (1).pptxRegistro Auxiliar - Primaria  2024 (1).pptx
Registro Auxiliar - Primaria 2024 (1).pptx
 
Historia y técnica del collage en el arte
Historia y técnica del collage en el arteHistoria y técnica del collage en el arte
Historia y técnica del collage en el arte
 
Manual - ABAS II completo 263 hojas .pdf
Manual - ABAS II completo 263 hojas .pdfManual - ABAS II completo 263 hojas .pdf
Manual - ABAS II completo 263 hojas .pdf
 
DECÁGOLO DEL GENERAL ELOY ALFARO DELGADO
DECÁGOLO DEL GENERAL ELOY ALFARO DELGADODECÁGOLO DEL GENERAL ELOY ALFARO DELGADO
DECÁGOLO DEL GENERAL ELOY ALFARO DELGADO
 
SINTAXIS DE LA ORACIÓN SIMPLE 2023-2024.pptx
SINTAXIS DE LA ORACIÓN SIMPLE 2023-2024.pptxSINTAXIS DE LA ORACIÓN SIMPLE 2023-2024.pptx
SINTAXIS DE LA ORACIÓN SIMPLE 2023-2024.pptx
 
OLIMPIADA DEL CONOCIMIENTO INFANTIL 2024.pptx
OLIMPIADA DEL CONOCIMIENTO INFANTIL 2024.pptxOLIMPIADA DEL CONOCIMIENTO INFANTIL 2024.pptx
OLIMPIADA DEL CONOCIMIENTO INFANTIL 2024.pptx
 
Estrategia de prompts, primeras ideas para su construcción
Estrategia de prompts, primeras ideas para su construcciónEstrategia de prompts, primeras ideas para su construcción
Estrategia de prompts, primeras ideas para su construcción
 
celula, tipos, teoria celular, energia y dinamica
celula, tipos, teoria celular, energia y dinamicacelula, tipos, teoria celular, energia y dinamica
celula, tipos, teoria celular, energia y dinamica
 

Analisis multivariado

  • 1. AndreaBelenDelgadilloSuarez Mrg. José RamiroZapata Materia: Investigaciónde mercadosII “LIBEREMOS BOLIVIA” 1 ANALISIS MULTIVARIADO 1. -Introducción Análisis Multivariante -share tweet share- En la evaluación y recopilación de datos estadísticos se utilizan métodos de análisis multivariantes para aclarar y explicar las relaciones entre las diferentes variables que pueden estar asociadas con estos datos. El análisismultivariante siempre se utilizacuando hay más de tresvariablesinvolucradas y el contextode su contenido no está claro. El objetivo es detectar una estructura por un lado, y verificar los datos de las estructuras por otro. En el contexto de la usabilidad de una web, se pueden utilizar métodos de análisis multivariante para aumentar sistemáticamente la usabilidad. Mientras que las pruebas A/B siempre aíslan sólo una página web, los métodos multivariantesmuestranlas relacionese interaccionesde varios elementosdentrode una página web.La expresividad depende de qué y cuántos elementos de la web se utilicen. Todos los elementos de la web que permiten al usuario interactuar con el sitio web a través de la interfaz de usuario se consideran generalmente variables. Esto incluye, en particular, los que tienen un impacto en el tipo de conversión. 1.1 IMPORTANTE Originalmente, en las estadísticas se utilizaban métodos de prueba y análisis multivariante para descubrir las relacionescausales.Dado que los cálculos manuales son muy complejos,los métodossólo son practicables en otros campos de aplicación con el desarrollo del hardware y software correspondiente. Hoy en día se utilizan métodos de análisis multivariante en áreas muy diferentes: Lingüística, Ciencias Naturales y Humanidades. Economía, seguros y servicios financieros. Minería de datos, big data y bases de datos relacionales. Hoy en día, los análisis multivariantes se suelen llevar a cabo mediante el uso de software con el fin de hacer frente a las enormescantidades de datos y controlar las variables modificadasen aplicacionesprácticas como las pruebas de usabilidad. Sin embargo, las pruebas multivariante también pueden contribuir significativamente a mejorar la facilidad de uso a menor escala.
  • 2. AndreaBelenDelgadilloSuarez Mrg. José RamiroZapata Materia: Investigaciónde mercadosII “LIBEREMOS BOLIVIA” 2 2.-Desarrollo Tipología de técnicas multivariantes Dicholoanterior,quizáslamejormanerade entenderqué esel AnálisisMultivariante esladescripciónde losprincipales procedimientos que engloba. Sin ánimo de ser exhaustivos, éstos pueden ser agrupados en los siguientes tipos:  a) Modelos de rango completo y no completo. o - Análisis de regresión múltiple. o - Análisis de la varianza (ANOVA). o - Análisis de la covarianza (ANCOVA). o - Análisis multivariante de la varianza (MANOVA). o - Análisis multivariante de la covarianza (MANCOVA). o - Correlación canónica.  b) Reducción de la dimensionalidad. o - Análisis de componentes principales o - Análisis factorial.  c) Clasificación y Discriminación. o - Análisis de Conglomerados. o - Análisis discriminante.  c) Otros procedimientos multivariantes. o - Análisis conjunto. o - Escalamiento multidimensional. o - Análisis de correspondencias. o - Análisis logit. o - Modelos de ecuaciones estructurales.
  • 3. AndreaBelenDelgadilloSuarez Mrg. José RamiroZapata Materia: Investigaciónde mercadosII “LIBEREMOS BOLIVIA” 3 1. Modelos de rango completo y no completo Supóngase que en el problema objeto de estudio se tiene una variable dependiente (Y) y una colección de variables independientes que se suponen explicativas de la anterior bajo una forma lineal o linealizable (X1, X2,...,Xn) Si tanto la variable a explicar como las variables “explicativas” son cuantitativas y los datos relativos a las últimas conforman una matriz de rango completo,la técnica que,entre otras cosas, proporciona la relaciónlineal de Y con X1, X2,...,Xn,o en otros términos,que permite predecirlos cambiosen el valor de enrespuestaa loscambios en losvalores de X1, X2,...,Xn),o, lo que eslo mismo, la "explicación" del comportamientode la variable de nuestro interésmediante la información suministrada por una serie de variables de las que se supone depende linealmente, se denomina regresiónmúltiple.El modelo de regresiónmúltiple viene dado por yi = β0 + β1χ1i + β2χ2i + ... + βpχpi + еi o, en términos matriciales,Υ = Xβ + е, donde X es una matriz de cantidades conocidas y de rango completo y la inclusióndel término de error se justifica por la omisión en el modelo de variables explicativas relevantes o errores de medida. Si las variablesX1, X2,...,Xn fuesenlosnivelesde un factor o variable cualitativa,o susceptible de tratarse como tal (por ejemplo,varónymujersonlosnivelesdel factorsexo),yse pretendieseestimarel efectode que sobrelavariable Ytiene el hechode que una determinadaobservaciónpertenezcaaun determinadonivel del factor,latécnica que se ocupa de estascuestionesesel Análisisde lavarianza (ANOVA).Nótese que comolasobservacionestienenque pertenecerauno y solo uno de los nivelesdel factor considerado, la matriz X es de rango no completo,por lo cual no se podrán estimar dichos efectossinocombinacioneslinealesde ellos,sinque estosuponga ningúndeméritopara el análisis. A modo de ejemplo, el ANOVA responde preguntas como ¿cuál es el efecto diferencial entre hombres y mujeres parados en el tiempo de búsqueda de empleo, suponiéndolesiguales en cuanto a otras características de interés? Originalmente el ANOVA se utilizó para determinar el efecto sobre las cosechas de distintos tratamientos o niveles de fertilizante. Por otra parte, resultarelativamente sencillo“reparametrizar” el modeloyconvertirloenunmodelode regresiónmúltiple. Si los factores son dos o más, cobra especial relevancia el efecto de la interacción de sus niveles sobre la variable a explicar. En caso de que algunasde lasvariablesexplicativasfuesende caráctercualitativoyotras de tipocuantitativo,el modelo se denomina modelo de análisis de la covarianza (ANCOVA). Evidentemente, resultan de especial interés las interacciones entre las variables explicativas. Si las variables a explicar son dos o más el procedimiento se denomina análisis multivariante de la varianza (si las variables explicativas son todas ellas factores) (MANOVA) o análisis multivariante de la covarianza (si coexisten factores con variables cuantitativas (MANCOVA). Finalmente, la correlación canónica es una técnica que se utiliza para determinar las combinaciones lineales de las variables de los vectores de “variables explicativas” y “a explicar” que presenten la máxima correlación posible. Más concretamente, consiste en determinar, en primer lugar, las dos combinaciones lineales de las variables de dichos
  • 4. AndreaBelenDelgadilloSuarez Mrg. José RamiroZapata Materia: Investigaciónde mercadosII “LIBEREMOS BOLIVIA” 4 vectores, de entre las infinitas que se pueden formar, que presenten la máxima correlación. Posteriormente se determinan otras dos combinaciones lineales de tales vectores, incorrelacionadas con las anteriores, tal que la correlación entre ellas sea máxima. Y así sucesivamente. Como puede apreciarse, el análisis de correlación canónica puede ser visto como una extensión natural del modelo de regresión múltiple. 2. Reducción de la dimensionalidad Son muy numerosas las ocasiones enlas que un investigador tiene que manejar, en la práctica, un elencociertamente numerosode variablescorrelacionadasentre sí.Evidentemente,si variasde estasvariablesestáncorrelacionadas,parte de la información que aportan al estudio del fenómeno en cuestión no es “fresca”, o, en términos, más formales, es redundante,puesto que ya la aportan otras de las variables consideradas.Ello llevaal investigador,por cuestionesde manejabilidad y comodidad, a reducir la dimensión del problema, es decir, a trabajar con un conjunto de nuevas variables,menor que el original e incorreladas entre sí, que recogen una gran parte (tan grande como se quiera) de la información que llevaban aparejadas las variables originales. Obviamente, cuanto más se reduzca la dimensionalidad más información original se pierde. En este sentido, el Análisis de componentes principales examina las relaciones entre un conjunto de p variables correlacionadas y las transforma en un nuevo conjunto de variables incorreladas denominadas componentes principales.Estas nuevas variablesson combinacioneslinealesde las originalesy se derivan en orden de importancia, de tal manera que la primera componente principal recoge,de la variación total de los datos originales,lamayor parte posible. Y así sucesivamente. Esta técnica es originaria de K. Pearson (1901) y fue desarrollada posteriormente por Hotelling (1933, 1936). Su objetivo fundamental es ver si unas pocas componentes recogen la mayor parte de la variación de los datos originales. Si es así, se puede argüir que la dimensionalidad del problema no es p sino inferior a p. En la práctica no siempre es fácil la identificaciónde lascomponentesprincipalespor lo que su principal uso recae en la reducción de la dimensionalidad de los datos para simplificar posteriores análisis. Por ejemplo, es una manera muy útil de encontrar agrupaciones en los datos cuando estos vienen caracterizados por un elevado número de variables. El objetodel Análisisfactorial es reproducir(linealmente,puestoque eslaforma más sencilla) lasinterrelacionesentre las variables originales en términos de una serie de factores subyacentes, por otra parte no observables. Por tanto, mientrasque el objetoprincipal del Análisisde componentesprincipalesesla "explicaciónde la varianza de las variablesoriginales",el objetodel Análisisfactorial esla "explicación" de lacovarianza, o correlación ensu caso, de dichas variables originales. El modelo básico de Análisis factorial puede escribirse de la forma: Xj - μ = aj1F1 + aj2F2 + ... + аj2F22 + ujUj donde cada variable observada centrada se expresa linealmente en función de r (generalmente mucho menor que el número de
  • 5. AndreaBelenDelgadilloSuarez Mrg. José RamiroZapata Materia: Investigaciónde mercadosII “LIBEREMOS BOLIVIA” 5 variables) factores comunes a todas las variables observadas y un factor único específico de cada variable. Tanto los factores comunes como los factores únicos se suponen (sin pérdida de generalidad puesto que en la práctica son desconocidos) con media nula y varianza unidad. Los factores únicos se suponen incorrelacionados entre sí y con los factores principales. Una vez extraídos los factores comunes (uno de los procedimientos para ello es el de componentes principales), el problema radica en su interpretación. Ésta, que se lleva a cabo a partir de las correlaciones de dichos factores con las variablesoriginales,nosuele serclara y por ellose suelen rotar los factores,de tal manera que cada uno de ellostenga una correlaciónlomás próximaa la unidadconunas variablesylo máspróxima a cerocon otras. Elloseráde gran ayuda en la tarea de su identificación. 3. Clasificación y discriminación El análisisde conglomerados,tambiéndenominadotaxonomíanumérica,clasificacióno reconocimientode patroneso formas, está orientado a la síntesis de la información contenida en los elementos observados, síntesis llevada a cabo con vistas a establecer una agrupación de los mismos en función de su mayor o menor homogeneidad. En otros términos, es una técnica estadística que trata de agrupar elementos (que vendrán calificados por un determinado número de características) en grupos mutuamente excluyentes, de tal forma que los elementos de un mismo grupo sean lo más parecidos posible entre sí y lo más diferentes posible respecto de los pertenecientes a otros grupos. Obviamente, a la hora de llevar a cabo un análisis de conglomerados se deben tomar, previamente, una serie de decisiones:a) selecciónde las variablesen funciónde las cualesse van a agrupar o clasificar los elementos;b) elección de la distancia entre los elementos; c) el criterio para llevar a cabo la formación de de grupos o conglomerados. d) el criterio de inclusión de los elementos en uno u otro conglomerado. En cuanto al Análisis discriminante, supóngase una variable aleatoria p-dimensional, X1, X2,...,Xn que caracteriza individuosocasos (pde suscaracterísticas). Supóngase tambiénque la poblaciónde lacual procedendichosindividuos se encuentra segmentada en k clases o grupos. Una de las vertientes del Análisis discriminante es el estudio de las diferenciasexistentesentre las k clases anteriormente aludidasen base a la consideraciónconjunta de las p variables. La otra vertiente esde carácter clasificador,pues sirve para ubicar o clasificar un determinadoindividuoo caso enuno de los grupos en los que se ha dividido la población. La cuestión es elaborar un criterio o regla que sirva para asignar dicho individuo a uno de los k grupos. Un ejemploilustrativode utilizacióndel Análisisdiscriminante,yaclásicopor otra parte, hace referenciaa la concesión de créditos en las entidades financieras. Es evidente que la población solicitante de créditos puede dividirse en dos clasesclaramente diferenciadas:losque lo amortizan y losque no.Al solicitante del créditose le formulanuna serie de cuestionesde carácter financiero-patrimonial ysus respuestasson los valores que toma, en este individuo,la variable
  • 6. AndreaBelenDelgadilloSuarez Mrg. José RamiroZapata Materia: Investigaciónde mercadosII “LIBEREMOS BOLIVIA” 6 aleatoria p-dimensional anteriormente aludida. Es evidente que una cuestión importante es la determinación de las variablesque más discriminan entre los solicitantesque devuelvenel créditoconcedido(laspreguntas que se le harán a los solicitantes serán relativas a estas cuestiones). Conarreglo a dichas contestacionesse trata de ubicar o clasificara dichoindividuoenunode los dosgrupos. Ypara ello es importante disponer de un criterio clasificador que se elaborará en base a la información disponible sobre dichas p variables de otros individuos que solicitaron créditos en el pasado y que ya se sabe si los devolvieron o no. Se necesita un criterio de asignación o de ubicación de cada uno de los individuos o casos nuevos en una de las anteriores clases o poblaciones. Es decir, se necesita un criterio o regla discriminante, que será tal que asigne el individuoa la i-ésimaclase si su vector p-dimensional cae en la i-ésimaregión de aquellasen las que se ha divididoel espacio p-dimensional. Obviamente,al ubicar un individuoo caso en una de las anterioresclases,con arregloa algúncriterio discriminante,se pueden cometer dos tipos de errores:  a) No clasificar a un individuo en una en una determinada clase cuando realmente pertenece a ella.  b) Clasificar a un individuo en una determinada clase cuando realmente no pertenece a ella. Lógicamente,la regla discriminante que se utilice deberá minimizar la probabilidad de clasificaciónerrónea, o incluso el coste derivado de una clasificación errónea. 4. Otros procedimientos multivariantes El Análisis conjunto pretende determinar qué combinación de un elenco finito de factores o atributos es el más preferidopor una poblaciónencuestada.Se utiliza con frecuenciapara comprobar la aceptación de diseñosnuevosde productos por parte del cliente y para valorar el atractivo de anuncios. Básicamente, se trata de un modelo que permite obtener un indicador de la importancia relativa de cada una de las características de un producto a través del estudio de los atributos que los consumidores descartan en su elección. El principio básico del análisis consiste en descomponer utilidad por producto en utilidades por atributo. El análisis conjunto se suele llevar a cabo en las siguientes etapas:  a) Identificación y selección de los atributos relevantes. Para identificarlos pueden utilizarse técnicas cualitativas como focus group o aprovechar la experiencia del equipo que está desarrollando el producto.  b) Definición de niveles u opciones para cada atributo.
  • 7. AndreaBelenDelgadilloSuarez Mrg. José RamiroZapata Materia: Investigaciónde mercadosII “LIBEREMOS BOLIVIA” 7  c) Definición de la combinación de atributos a ser evaluada, con el objetivo final de determinar cuál de todas las combinaciones es la preferida por los consumidores  d) Recogida de información (opiniones de los consumidores).  e) Selección del procedimiento de medición de utilidad de cada combinación de atributos. Bajo ladenominaciónde Escalamientomultidimensional se agrupanunconjuntode técnicasque persiguenelpropósito de obteneruna configuraciónde puntos endimensiónreducidaque reflejenlomás fielmente posible laspercepciones que se tengansobre las similitudesentre ciertosobjetosoestímulos.Paraalcanzardicho propósito,se suele definiruna función no lineal que establezca las desviaciones de las distancias definidas en la configuración de puntos con las similitudesobservadasentre losobjetosoestímulos.Atravésde un procesoiterativose minimizadichafunción,loque puede hacerse por diversos procedimientos de optimización. Se suele utilizar en marketing y ciencias sociales. Los consumidorespotencialestienenque compararparesde productosy hacer juiciossobre sussimilitudes.Mientrasotras técnicas obtienen dimensiones de las respuestas a los atributos de los productos identificados por el investigador, el escalamientomultidimensional proporcionalas dimensionesde losjuiciosde los encuestadossobre la similitudde los productos. Es decir,losresultados nodependende losjuiciosde los investigadores.Además,noesnecesariomostrar a los encuestados una lista de atributos. Las dimensiones resultantes provienen de los juicios de los encuestados sobre pares de productos. Es la técnica más comúnmente utilizada en mapeado perceptual. El análisis de correspondenciasse utilizapara estudiar, desde un punto de vista gráfico, las relacionesde dependencia e independencia de un conjunto de factores a partir de la información contenida en una tabla de contingencia (tabulacióncruzada de dos o más variables cualitativaso factores).Consiste enasociar a cada uno de los nivelesde los factores un punto en el espacio n-dimensional, de forma que las relaciones de cercanía/lejanía entre los puntos calculados reflejen las relaciones de dependencia y semejanza existentes entre ellos. A modo de ejemplo, supóngase que las preferencias de una serie de encuestados por una determinada marca están cruzadas en una tabla de contingencia por sexo y ocupación. Pues bien, a través del Análisis de correspondencias se muestra en un mapa bidimensional o tridimensional la asociación o “correspondencia” de marcas y características de sexo y ocupación de aquéllos que prefieren cada marca (perfiles). El análisis logit está orientado a modelar cómo influye en la probabilidad de aparición de un suceso, habitualmente dicotómico, la presencia o no de diversos factores y el valor o nivel de los mismos. También puede ser utilizado para estimar la probabilidad de aparición de cada una de las posibilidades de un suceso con más de dos categorías (multinomial).Eneste tipo de situacionesno es aplicable la metodologíade la regresiónlineal ya que ahora la variable respuesta sólo presenta dos valores (en el caso dicotómico).
  • 8. AndreaBelenDelgadilloSuarez Mrg. José RamiroZapata Materia: Investigaciónde mercadosII “LIBEREMOS BOLIVIA” 8 Los modelos de ecuaciones estructurales permiten describir, gráfica y analíticamente, las relaciones que se cree que existen entre las variables observables y las no observables, teniendo en cuenta la dirección de cada una de tales relaciones. A partir de la información muestral, se pueden estimar tales relaciones y juzgar su importancia, de tal manera que se puede simplificarel diagrama inicial representativode las posiblesrelacioneshasta obtenerun modelo parsimonioso. Unaspecto clave enla estimaciónde cualquiertipode modeloestadísticoessusujeciónal planteamientode unateoría debidamente asentada en el área de conocimiento en que se esté trabajando. Este requisito es especialmente importante en un área de modelización tan flexible como ésta. Por ello, se debe prestar una gran atención a la especificación e identificación del modelo. El primer aspecto se refiere al correcto planteamiento del sistema de ecuacionesen función de la teoría subyacente (cumplimientode supuestosbásicos, definiciónde algunos parámetros como fijos y otros como libres o estimables); el segundo aspecto tiene que ver con que la cantidad de información disponible sea suficiente para tener una estimación única de los parámetros libres, más de una o ninguna. 2.2.- Análisis de Correspondencias Múltiple (MCA) El Análisis de Correspondencias Múltiple es una extensión del Análisis de Correspondencias Simple. La estructura de datos sobre los que se aplica el MCA puede ser una matriz formada por variables ficticias de ausencia – presencia de cada nivel de las variables nominales ó una matriz Burt, que no es más que el conjunto de todas las tablas de contingenciapar a par del conjunto de variablesque están siendoanalizadas. (Greenacre,2007). El MCA cuantifica los datos nominales (categóricos) mediante la asignación de valores numéricos a los individuos y a las categorías, de manera que los individuos de la misma categoría estén cerca los unos de los otros y los individuos de categorías diferentesestén alejados los unos de los otros. Cada individuo se encuentra lo más cerca posible de los puntos de las categorías que se aplican a cada uno de ellos. De esta manera, las categorías dividen los individuos en subgrupos homogéneos. Las variables se consideran homogéneas cuando clasifican individuos de las mismas categorías en los mismos subgrupos. 2.2.- EL VALOR TEORICO Como ya se ha mencionado, el elementoesencial del análisismultivariante es el valor teórico, una combinación lineal de variables con ponderacionesdeterminadasempíricamente.El investigadorespecificalasvariables,mientrasque las ponderaciones son objeto específico de determinación por parte de la técnica multivariante, Un valor teórico de n variables ponderadas (X1a Xn) puede expresarse matemáticamente así: Valor teórico = w1X1 + w2X2 + w3X3 + … + wnXn donde Xnes la variable observada y Wnes la ponderación determinada por la técnica multivariante.
  • 9. AndreaBelenDelgadilloSuarez Mrg. José RamiroZapata Materia: Investigaciónde mercadosII “LIBEREMOS BOLIVIA” 9 El resultado esun valor único que representauna combinación de todo el conjunto de variablesque mejorse adaptan al objeto del análisismultivariante específico.Enregresionesmúltiples,el valorteórico se determinade tal forma que guarde la mejor correlación con la variable que se está prediciendo. En el análisis discriminante, el valor teórico se forma de tal manera que produzca resultados para cada observación que diferencien de forma máxima entre grupos de observaciones. Y en el análisis factorial, los valores teóricos se forman para representar mejor las estructuras subyacentes o la dimensionalidad de las variables tal y como se representan en sus intercorrelaciones. En cada caso, el valor teórico capta el carácter multivariante del análisis. Por tanto, en nuestras discusiones de cada técnica, el valor teórico es el punto central del análisis por varias razones. Debemos entender no sólo su impacto conjunto para lograr cumplir el objetivo de cada técnica, sino también la contribución de cada variable separada al efecto del valor teórico en su conjunto. ESCALAS DE MEDIDA El análisisde los datos implicala separación, identificaciónymedidade la variación en un conjuntode variables,tanto entre ellasmismas como entre una variable dependiente yuna o más variablesindependientes.El término clave aquí esmedida,dado que el investigadorno puede separaro identificarunavariación a menosque puedaser mesurable.La medida es importante para representar con precisión el concepto de nuestro interés y es crucial en la selección del método de análisis multivariante apropiado. En los siguientes párrafos vamos a discutir el concepto de medida en lo que se refiere al análisis de datos y particularmente a las diversas técnicas multivariantes. Existen dos tipos básicos de datos: no métricos (cualitativos) y métricos (cuantitativos). Los datos no métricos son atributos, características o propiedades categóricas que identifican o describen a un sujeto. Describen diferencias en tipo o clase indicando la presencia o ausencia de una característica o propiedad. Muchas propiedades son discretas porque tienenuna característica peculiarque excluye todas las demás características. Por ejemplo,si uno es hombre, no puede ser mujer; No hay cantidad de «género», sólo la condición de ser hombre o mujer. Por el contrario, las medidas de datos métricos están constituidas de tal forma que los sujetos pueden ser identificados por diferencias entre gradoo cantidad.Las variablesmedidasmétricamente reflejancantidadesrelativasogrado.Lasmedidasmétricas sonlas más apropiadaspara casosque involucrancantidad omagnitud,talescomo el nivel de satisfacciónolademanda de trabajo. Escalas de medidas no metricas Las medidasnométricaspuedentenerescalasnominalesuordinales.Lamedidaconunaescalanominal asignanúmeros que se usan para etiquetar o identificar sujetos u objetos. Las escalas nominales, también conocidas como escalas de categoría, proporcionan el númerode ocurrencias en cada clase o categoría de la variable que se está estudiando.Por tanto, los númeroso símbolosasignadosa losobjetosno tienenmás significadocuantitativoque indicar la presenciao
  • 10. AndreaBelenDelgadilloSuarez Mrg. José RamiroZapata Materia: Investigaciónde mercadosII “LIBEREMOS BOLIVIA” 10 ausencia del atributo o característica bajo investigación.Los ejemplosde datos con escala nominal incluyenel sexo,la religión o el partido político de una persona. Para trabajar con estos datos, el analista puede asignar números a cada categoría, por ejemplo, 2 para mujeres y 1 para hombres. Estos números sólo representan categorías o clases y no implican cantidades de un atributo o característica. Las escalas ordinales representan un nivel superior de precisión de la medida. Las variables pueden ser ordenadas o clasificadas con escalas ordinales en relación a la cantidad del atributo poseído. Cada subclase puede ser comparada conotra entérminosde unarelaciónde «mayorque»o«menorque».Porejemplo.losdiferentesnivelesde satisfacción del consumidorindividual con diferentesproductos nuevospuede ilustrarse en una escala ordinal. La siguiente escala muestra la ideaque tiene un encuestado acerca de tres productos. El encuestado está más satisfecho con A que con B y más satisfecho con B que con C. Los númerosutilizadosenescalasordinalescomoéstasno son cuantitativos,dado que indicansóloposicionesrelativas enseriesordenadas.Nohay medidade cuánta satisfacciónrecibe el consumidorentérminosabsolutos,el investigador ni conoce la diferencia exacta entre puntos de la escala de satisfacción. Muchas escalas de las ciencias del comportamiento caen dentro de esta categoría ordinal. Escalas de medidas métricas Las escalas de intervalos y de razón (ambas métricas) proporcionan el nivel más alto de medida de precisión, permitiendorealizarcasi todas las operacionesmatemáticas. Estas dos escalas tienenunidadesconstantesde medida, de tal forma que las diferencias entre dos puntos adyacentes de cualquier parte de la escala son iguales. La única diferencia real entre las escalas de intervalo y las de razón es que las de intervalo tienen un punto cero arbitrario, mientras que las escalas de razón tienen un punto de cero absoluto. Las escalas de intervalo más familiares son las escalas de temperatura Celsius y Fahrenheit. Ambas tienen un punto de cero arbitrario, pero ese cero no indica una cantidad cero o ausencia de temperatura,dado que podemosregistrar temperaturas por debajodel punto cero de esa escala. Por tanto, no es posible decir que un valor cualquiera situado en un intervalo de la escala es un múltiplo de cualquier otro punto de la escala. Por ejemplo, si un día se registran 80°F, no se puede decir que sea dos veces más caluroso que uno de 40°F porque sabemos que 80°F, en una escala diferente como Celsius, equivalen a 26,7°C. De la misma forma,40°F enCelsiuscorrespondena4,4°C. Aunque 80°F son, desde luego,dosveces40°F,no se puede afirmar que el calor de 80°F sea dos veces el calor de 40°F porque usando diferentes escalas, el calor no es dos veces mayor; esto es, 4,4°F X 2 '* 26,7°C. Las escalas de razón representanla forma superiorde medida de precisión,dado que poseenlas ventajas de todas las escalasinferioresmásunpuntode cero absoluto.Conlas medidasde escalade razón se permitentodaslasoperaciones matemáticas.El pesoque tenemosenel bañouotrasmáquinasde pesocomunesutilizanestasescalas,dadoque tienen
  • 11. AndreaBelenDelgadilloSuarez Mrg. José RamiroZapata Materia: Investigaciónde mercadosII “LIBEREMOS BOLIVIA” 11 un punto de cero absoluto y que pueden ser expresados en términos de múltiplos cuando se relaciona un punto con otro de la escala; por ejemplo, 100 kilos es dos veces más pesado que 50 kilos. Es importante entenderlosdiferentestiposde escalasde medidapordosrazones.Enprimerlugar, el investigadordebe identificar la escala de medida de cada variable empleada, de tal forma que no se estén utilizando datos no métricos como si fueranmétricos.En segundolugar, la escala de medidaes crucial para determinarqué técnicamultivariante es la másconveniente paralosdatos,consideraciónhechatantopara las variablesdependientescomolasindependientes. En la discusiónde lastécnicasy su clasificación,que haremosenposterioresseccionesde este capítulo,laspropiedades métricas o no métricas de las variables dependientesoindependientessonlos factores determinantesenla selección de la técnica apropiada. ERROR DE MEDIDA Y MEDIDAS MULTIVARIANTES El usode múltiplesvariablesasí comoladependenciade sucombinación(el valorteórico) enlastécnicasmultivariantes también dirige su atención a un tema complementario, el error de medida. El error de medida es el grado en que los valores observados no son representativos de los valores «verdaderos». El error de medida tiene múltiplesfuentes,que vandesde errores en la entrada de datos a la imprecisiónen la medición (por ejemplo,imponiendoescalasde puntuación de siete puntos a la actitud medida cuando el investigadorsabe que los encuestadossólopuedenrespondercon precisióna una puntuación de tres puntos) pasando por la incapacidad de los encuestados a proporcionar información precisa (por ejemplo, las respuestas a la renta de una economía familiar pueden ser razonablemente precisas pero rara vez lo son completamente). Por tanto, se debe asumir que todas las variable usadas en las técnicas multivariantes tienenalgún grado de error de medida. El impacto del error de medida esañadir «ruido»a lasvariablesmedidasuobservadas.Portanto, el valorobservadoobtenidorepresentatantoel nivel «verdadero» como el «ruido». Cuando se calculan correlaciones o medias, normalmente el efecto «verdadero» está parcialmente camufladopor el error de medida,causando la debilidadde las correlacionesy la pérdidade precisiónde las medias. El objetivodel investigadorde reducir el error de medida puede seguir varios caminos. Al valorar el grado de error de medida presente en cualquier medición, el analista debe enfrentarse tanto con la validez como con la fiabilidad de la medida.La validezesel gradoenque lamedidarepresentaconprecisiónloque se supone que representa.Porejemplo, si queremosmedirla renta discrecional,nopreguntaremospor la renta total de las economíasdomésticas.Asegurarla validezempiezaconunconocimientoprofundode loquese vaamedirysóloentoncesrealizarlamedidatan«correcta» y precisa como sea posible. Sin embargo, la precisión no asegura la validez. En nuestro ejemplo de la renta, el investigadorpodría definirmuy precisamente el total de la renta familiarpero no tiene una medida válida de la renta discrecional porque no se ha planteado la pregunta «correcta».
  • 12. AndreaBelenDelgadilloSuarez Mrg. José RamiroZapata Materia: Investigaciónde mercadosII “LIBEREMOS BOLIVIA” 12 Si la validezestáasegurada, el investigadordebe considerarlafiabilidadde lasmedidas.La fiabilidadesel gradoenque la variable observada mide el valor «verdadero»y está «libre de error»; por tanto es lo opuestoal error de medida.Si la misma medida se realiza repetidas veces, por ejemplo, las medidas más fiables mostrarán una mayor consistencia que las medidas menos fiables. El investigador deberá valorar siempre las variables que están siendo usadas y si se pueden encontrar medidas alternativas válidas, elegir la variable con la mayor fiabilidad. El investigador puede también optar por desarrollar mediciones multivariantes, también conocidas como escalas sumadas, donde diversasvariablesse unenen una medidacompuestapara representarun concepto(por ejemplo,una escala de personalidad de entrada múltiple o puntuaciones sumadas de un producto). El objetivo es evitar usar sólo una únicavariable para representarunconcepto,yensulugar utilizarvariasvariablescomoindicadores, representando todosellosdiferentesfacetasdel conceptoparaobtenerunaperspectivamáscompleta.El usode indicadoresmúltiples permite al investigadorllegar a una especificaciónmásprecisa de las respuestasdeseadasy no dejala fiabilidadplena a una única respuestasinoenla respuesta«media»o«típica» de un conjuntode respuestasrelacionadas.Por ejemplo, al medirla satisfacción,unopodríapreguntaruna únicacuestión,«¿cuál essugradode satisfacción?»,ybasar el análisis en una única respuesta. O se podría desarrollar una escala aditiva que combinara varias respuestas de satisfacción, quizá en diferentes formatos de respuesta y en diferentes áreas de interés, que contemple la satisfacción total. La premisabásica esque las respuestasmúltiplesreflejanconmayor precisiónla respuesta«verdadera»que la respuesta única. El impacto del error de mediday la escasa fiabilidadnopuedenser observadas directamente,dadoque se encuentran en las variables observadas. El investigadordebe,por tanto, trabajar siempre para aumentar la validezy la fiabilidad, loque al final llevaráa unretrato más «auténtico»de lasvariablesde interés.Losmalosresultadosnosiempre se deben al error de medida,pero la presenciadel error de medidaesgarantía de distorsiónenlas relacionesobservadasy hace menospoderosaslas técnicasmultivariantes.Reducir el error de medida,aunque implique esfuerzo,tiempoyrecursos adicionales, puede mejorar resultados débiles o marginales, así como fortalecer resultados probados. SIGNIFICACION ESTADISTICA FRENTE A POTENCIA ESTADISTICA Todas las técnicas multivariantes, excepto el análisis cluster y el análisis multidimensional, se basan en la inferencia estadísticade losvalores de una poblaciónola relaciónentre variablesde una muestra escogidaaleatoriamente de esa población. Si estamos realizando un Censo de toda la población, entonces la inferencia estadística no es necesaria, porque cualquier diferenciaorelación,por pequeñaque sea,es «verdad» y existe. Perorara vez,casi nunca, se realiza un censo; por tanto, el investigador está obligado a deducir inferencias de una muestra. Para interpretarlas inferenciasestadísticas,el investigadordebe especificarlosnivelesaceptablesde errorestadístico. El modode aproximaciónmás común esdeterminarel nivel de error de Tipo I, tambiénconocidocomo alfa (α).El error
  • 13. AndreaBelenDelgadilloSuarez Mrg. José RamiroZapata Materia: Investigaciónde mercadosII “LIBEREMOS BOLIVIA” 13 de Tipo I es la probabilidad de rechazar la hipótesis nula cuando es cierta, o expresado en términos más sencillos, la posibilidad de que la prueba muestre significación estadística cuando en realidad no está presente (el caso de un «positivo falso»). Especificando un nivel alfa, el investigador fija los márgenes admisibles de error especificando la probabilidad de concluir que la significación existe cuando en realidad no existe. Al especificarel nivel de error de Tipo I. el investigadortambiéndeterminaun error asociado. denominadoel error de Tipo II o beta (β).El error de Tipo II es la probabilidadde fallaren rechazar la hipótesisnula cuando esrealmente falsa. Una probabilidad más interesante es 1 - β, denominado la potencia del test de inferencia estadística. Potencia es la probabilidad de rechazar correctamente la hipótesis nula cuando debe ser rechazada. Por tanto, la potencia es la probabilidad de que la inferencia estadística se indique cuando esté presente. Aunque laespecificaciónalfaestablece el nivel de significaciónestadísticaaceptable,esel nivel de potenciael quedicta la probabilidad de «éxito» en la búsqueda de las diferencias si es que realmente existen. Entonces, ¿por qué no se plantean niveles aceptables tanto de alfa como de beta? Porque los errores de Tipo I y Tipo II están inversamente relacionados,y a medida que el error de TipoI se hace más restrictivo(se acerca a cero),el error de Tipo II aumenta. Al disminuirel errorde TipoItambiénse reduce el poderde lapruebaestadística.Portanto,el analistatiene que conseguir un equilibrio entre el nivel de alfa y la potencia resultante. La potencia no es sólo una función de alfa; Realmente está determinada por tres factores: 1.Efecto tamaño: La probabilidadde conseguirsignificaciónestadísticase basa no sólo enconsideracionesestadísticas sino tambiénen la magnitud real del efectoque nos interesa(por ejemplo,una diferenciade mediasentre dos grupos o la correlaciónentre variables) enla población,denominadoefectotamaño.Comocabría esperar,un efectogrande es más probable de encontrar que un efecto pequeño y por tanto, afecta a la potencia de la prueba estadística. Para evaluar la potencia de cualquier prueba estadística, el investigador debe entender primero el efecto examinado. Los efectosde tamaños se miden en términosestandarizados para facilitar la comparación. Las diferenciasrespectode la media se determinan en términos de desviaciones estándar, así que un efecto tamaño de 0,5 indica que la diferencia respecto de la media es la mitad de la desviación estándar. Para las correlaciones, el efecto tamaño se basa en la correlación efectiva entre las variables. 2.Alfa (α): Como ya se ha discutido,a medidaque alfa se vuelve más restrictivo,la potencia decrece.Estosignificaque como el analista reduce la oportunidad de encontrar un efecto incorrecto significativo, la probabilidad de encontrar correctamente un efecto tambiéndisminuye.Las directricesconvencionales sugieren niveles alfa de 0,05 o 0,01. Pero el investigador debe considerar el impacto de esta decisión sobre la potencia antes de seleccionar el nivel alfa. 3.El tamaño de la muestra: Para cualquier nivel de alfa dado, el aumento de la muestra siempre produce una mayor potenciadel Test estadístico.Peroaumentar el tamaño de la muestra tambiénpuede producir «demasiada»potencia.
  • 14. AndreaBelenDelgadilloSuarez Mrg. José RamiroZapata Materia: Investigaciónde mercadosII “LIBEREMOS BOLIVIA” 14 Por este hecho, entendemosque al aumentar el tamaño de la muestra, se observará que efectoscada vez más y más pequeños serán significativos, hasta que para muestras muy grandes casi cualquier efecto es significativo. El investigadordebe tenersiempre presente que el tamañode la muestra puede afectar a la prueba estadísticatanto por hacerla insensible (para muestras muy pequeñas) o demasiado sensible (para muestras muy grandes). Las relacionesentre alfa, tamaño de la muestra, efectotamaño y potenciason bastante complicadas, pero se pueden encontrar ciertos puntos de partida. Cohen ha examinadola potencia para la mayor parte de las pruebas de inferencia estadística y ha proporcionado pautas para los niveles aceptables de potencia, sugiriendo que los estudios deben diseñarse para conseguir niveles de alfa de al menos 0,05 con niveles de potencia del 80 por ciento. Para conseguir dichos niveles,debenconsiderarse simultáneamente lostres factores. Estas interrelacionesse pueden ilustrar mediante dos ejemplos sencillos. El primero implica la comprobación de la diferencia entre las puntuaciones medias de dos grupos. Suponiendo que el efecto tamaño sea entre pequeño (0,02) y moderado (0,5), el investigador debe determinarel nivel alfa y el tamaño de muestra necesariode cada grupo. La Tabla 1.1 ilustra el impacto tanto del tamaño de la muestra como del nivel alfa sobre la potencia. Como puede verse, la potencia llegaa ser aceptable para tamaños de muestra de 100 o más en situaciones con un efecto tamaño moderado para ambos niveles de alfa. Pero cuando ocurre un efecto tamaño pequeño, las pruebas estadísticas tiene poca potencia, incluso con niveles de alfa expandidosa muestrasde 200 o más. Por ejemplo,unamuestrade 200 encada grupo con un alfa de 0,05 todavía tiene un 50 por cientode posibilidadesde encontrarse diferenciassignificativassi el efectotamañoes pequeño.Estosugiere que el analista, al anticipar que los efectosvan a ser pequeños,debe diseñarel estudiocon muestras mucho mayores y/o niveles de alfa menos restrictivos (0,05 o 0,10). Tamaño muestral alfa (x) = 0.05 Efecto tamaño (ET) alfa (x) = 0.01 Efecto tamaño (ET) Pequeño (0.2) Moderado (0.5) Pequeño (0.2) Moderado (0.5) 20 0.095 0.338 0.025 0.144 40 0.143 0.598 0.045 0.349 60 0.192 0.775 0.067 0.549 80 0.242 0.882 0.092 0.709
  • 15. AndreaBelenDelgadilloSuarez Mrg. José RamiroZapata Materia: Investigaciónde mercadosII “LIBEREMOS BOLIVIA” 15 100 0.290 0.940 0.120 0.823 150 0.411 0.990 0.201 0.959 200 0.516 0.998 0.284 0.992 TABLA 1.1. Niveles de potencia para la comparación entre dos medias: variaciones por el tamaño de la muestra, el nivel de significación y el efecto tamaño Fuente: Solo Power Analysis.BMDP Statistical Software, Inc En el segundo ejemplo, la Figura 1.1 representa gráficamente ]a potencia para niveles de significación de 0,01; 0,5 Y 0,10 con tamaños de muestra de 20 a 300 por grupo, cuando el efecto tamaño (0,35) es entre pequeño y moderado. Enfrentado a tales perspectivas,la especificaciónde un nivel de significaciónde un 0,01 requiere una muestra de 200 por grupo para conseguir el nivel deseado de potencia del 80 por ciento. Pero si se relaja el nivel alfa, se alcanza la potenciadel 80 por cientopara muestrasde 130 para unnivel alfa 0,05 y muestrasde 100 para un nivel de significación de un 0,10. Tales análisis permiten al investigador tomar decisiones más adecuadas en el estudio, diseño e interpretación de los resultados. Al planificar la investigación, el investigador debe estimar el efecto tamaño esperado para seleccionar entoncesel tamaño de la muestra y el nivel alfa para conseguirel nivel de potenciadeseado.Ademásde sus usos para la planificación, el análisis de potencia se utiliza también después de que el análisis ha terminado para determinar la potencia real conseguida, de tal forma que los resultados puedan ser correctamente interpretados. ¿Se deben los resultados al efecto tamaño, tamaño muestral o niveles de significación? Los analistas pueden evaluar cada uno de
  • 16. AndreaBelenDelgadilloSuarez Mrg. José RamiroZapata Materia: Investigaciónde mercadosII “LIBEREMOS BOLIVIA” 16 estos factores por su impacto sobre la significatividad o no significatividad de los resultados. El investigador puede referirse hoyendíaa estudiospublicadosdonde se analizanlosdetallesconcretosde ladeterminaciónde lapotencia o acudir a variosprogramas de ordenadorpersonal que asistenenlosestudiosde planificaciónparaconseguirlapotencia deseada o calcular la potencia de los resultados reales. Habiendo ya expuesto la extensión de las técnicas multivariantes desde sus orígenes univariantes o bivariantes, introduciremosahora brevemente cadamétodomultivariante.A partir de la introducción de las técnicas,presentamos un esquema de clasificación para ayudar en la selección de la técnica apropiada respecto de la identificación de los objetivos de investigación (relaciones de dependencia o independencia) y el tipo de datos (métricos o no métricos). CLASIFICACION DE LAS TECNICAS MULTIVARIANTES Para ayudarle a familiarizarse con las técnicas multivariantes, presentamos una clasificación de los métodos multivariantes. Esta clasificación se basa en tres juicios que el analista debe hacer sobre el objeto a investigar y la naturaleza de losdatos: (l) ¿puedendividirse lasvariablesendependientesoindependientesbasándose la clasificación en alguna teoría? (2) Si puede hacerse, ¿cuántas de estas variables son tratadas como dependientes en un análisis simple? (3) ¿Cómo son las variables medidas? La selección de la técnica multivariante apropiada depende de las respuestas a estas tres cuestiones. Cuando consideramos la aplicación de las técnicas estadísticas multivariantes, la primera cuestión que nos debemos preguntar es,¿puedendividirse lasvariablesmediante laclasificaciónde dependientee independiente?Larespuestaa esta cuestión indica si se debería utilizar un análisis de dependencia o interdependencia. Un análisis de dependenciapuede definirse comoaquel en el que una variable o conjunto de variables es identificado como la variable dependiente y que va a ser explicada por otras variables conocidas como variables independientes. Como ejemplo de una dependencia técnica tenemos el análisis de regresión múltiple. Como contraste, un análisis de interdependencia es aquel en que ninguna variable o grupo de variables es definido como independiente o dependiente. Más bien, el procedimiento implica el análisis de todas las variables del conjunto simultáneamente. El análisis factorial es un ejemplo de un análisis de interdependencia. Los diferentes métodos que constituyen el análisis de dependencia pueden ser a su vez divididos en dos tipos según: (1) el número de variablesdependientesy(2) el tipo de escalas de medida empleadaspara las variables.Teniendoen cuenta el número de variablesdependientes,el análisisde dependenciapuede clasificarse comoaquel que tiene tanto una variable dependiente única como varias variables dependientes o incluso varias relaciones de dependencia/independencia.El análisis de dependenciapuede inclusoser clasificadoen función del tipo de escala de la variable con variables métricas (numéricas/cuantitativas) o no métricas (cualitativas/categóricas). Si el análisis implica una única variable dependiente que es métrica, la técnica apropiada es tanto el análisis de regresiónmúltiple
  • 17. AndreaBelenDelgadilloSuarez Mrg. José RamiroZapata Materia: Investigaciónde mercadosII “LIBEREMOS BOLIVIA” 17 como el análisis conjunto. El análisis conjunto es un caso especial. Se trata de un procedimiento de dependencia que puede tratar la variable dependiente como métrica o no métrica, en función de las circunstancias. Por otro lado, si la única variable dependienteesnométrica(categórica),entonceslatécnicaapropiada es,o bienel análisisdiscriminante múltiple, o bien los modelos de probabilidad lineal. En contraste, cuando el problema del investigador implica varias variables dependientes, hay otras cuatro técnicas estadísticas apropiadas. Si varias variables dependientes son métricas, debemos entonces mirar a las variables independientes. Si las variables independientes son no métricas, debemos elegir la técnica multivariante de análisis de la varianza. Si las variables independientes son métricas, la apropiada es la correlación canónica. REPRESENTACION PARA EL ANALISIS MULTIVARIANTE INTERPRETACION Como se ha podidocomprobar, el análisismultivariante tiene un carácter variado y puede ser bastante poderoso.Este poder es especialmente tentadorcuandoel investigadorno está seguro del diseñodel análisismás apropiado y utiliza el análisis multivariante como un sustituto del necesario análisis conceptual. Incluso cuando se aplica correctamente, los esfuerzospor acomodar las múltiplesvariablesy relacionescrean complejidadesadicionalesenlos resultadosy su interpretación. Por tanto, advertimos contra su uso sin la base conceptual apropiada para apoyar la técnica seleccionada sobre aquellos conceptos básicos mencionados previamente y los temas abordados en la siguiente sección. Hemos discutido también varios asuntos particularmente aplicables al análisis multivariantes. Por tanto, mientras no existaunaúnica «respuesta»,hemosencontradoque el análisisylainterpretaciónde cualquierproblemamultivariante puede verse ayudado por un conjunto general de directrices. No se trata de ningún modo de una lista exhaustiva de consideraciones,sinoque lalistarepresentamásbienuna«filosofíadel análisismultivariante».Lassiguientessecciones discuten estos puntos pero no en un orden concreto, sino haciendo igual énfasis en todos ellos. ESTABLECER LA SIGNIFICACION PRACTICA ASI COMO LA ESTADISTICA La fuerza del análisis multivariante reside en sus medios aparentemente «mágicos» para clasificar una variedad de posibles alternativas y encontrar aquellas que tienen significación estadística. Pero con este poder debemos tener precaución. Muchos investigadores se vuelven miopes al fijarse solamente en la significación conseguida por los resultados sin entender sus interpretaciones, buenas o malas. En su lugar. el investigador debe atender no sólo a la significaciónestadística de los resultadossino tambiéna su significaciónpráctica. La significaciónpráctica se refiere a la cuestión,«¿y para qué'?».Para cualquieraplicaciónen la gestión,losresultadosdebentenerun efectodemostrable que justifique laacción. En el terrenoacadémico,el investigadorse llegaa fijarno sólo enla significaciónestadística de
  • 18. AndreaBelenDelgadilloSuarez Mrg. José RamiroZapata Materia: Investigaciónde mercadosII “LIBEREMOS BOLIVIA” 18 los resultados sino también en sus implicaciones teóricas y sustantivas, que en muchas ocasiones se deducen de su significación práctica. Como ejemplo ilustrativo de esta situación consideramos un análisis de regresión para predecir las intenciones de compra, medidas como la probabilidad entre O y 100 de que el cliente volverá a comprar a la empresa. El estudio se lleva a cabo y el resultado es significativo al nivel de significación de 0,05. Los ejecutivos aceptan los resultados y modifican la estrategia de la empresa. Pero lo que no se ha percibido es que mientras la relación era significativa, la capacidad predictivaera baja, tan baja que la estimaciónde la posibilidadde repetircompra podría variar tanto como un 20 por cientoal nivel de significacióndel 0,05. ¡La relaciónde la «significaciónestadística»podríaentoncestenerun rango de error de 40 puntos porcentuales!Uncliente del cual se predice que tiene una oportunidadde volver de 50/50 podría realmente tener probabilidades del 30 al 70 por ciento, representando niveles inaceptables sobre los cuales actuar. Los investigadores y los gerentes no han probado la significación práctica o de gestión de los resultados. olvidando que la relación todavía necesitaba un ulterior refinamiento. TAMAÑO MUESTRAL AFECTA A TODOS LOS RESULTADOS La discusión de la potencia estadística demuestra que el impacto sustancial del tamaño muestral opera en la consecución de la significación estadística, tanto en tamaños muestrales grandes como pequeños. Para muestras pequeñas,lasofistificacióny la complejidaddel análisismultivariante puede fácilmente resultartantoen(1) muy poca potencia estadística de la prueba para identificar de forma realista resultados significativos o (2) fácilmente un «sobreaprovechamiento» de los datos de tal forma que sean artificialmente buenos porque se ajustan muy bien a la muestra, aunque no sean generalizables.Lo mismo ocurre para muestras grandes que,como ya se ha discutidoantes, pueden hacer a los test estadísticos altamente sensibles. Siempre que los tamaños muestrales excedan los 200 o 400 encuestados, el investigador debería examinar todos los resultados significativos para asegurarse que tienen significación práctica debido al aumento de la potencia estadística como consecuencia del tamaño muestral. Los tamaños muestralestambiénafectana los resultadoscuando losanálisisimplicangruposde encuestados,comoocurre enel análisisdiscriminante oenMANOVA.Tamañosmuestralesdesigualesentre losgruposinfluencianalosresultados y requieren un análisis y/o interpretación adicional. Por tanto, el investigador o usuario del análisis multivariante debería siempre valorar los resultados a la luz de la muestra utilizada. CONOCER LOS DATOS Las técnicas del análisis multivariante, por su propia naturaleza, identifican relaciones complejas que son difíciles de representar de forma simple. Como resultado, la tendencia es aceptar los resultados sin el típico examen que uno emprende en los análisis univariante y bivariante (por ejemplo, gráfico de dispersión de correlaciones y boxplots de comparaciones de media). Pero estos «atajos» pueden ser el preludio del desastre. El análisis multivariante requiere
  • 19. AndreaBelenDelgadilloSuarez Mrg. José RamiroZapata Materia: Investigaciónde mercadosII “LIBEREMOS BOLIVIA” 19 un exameninclusomás riguroso de losdatos porque la influenciade atípicos,violacionesde los supuestosy la pérdida de datos puede agravarse a travésde varias variablesy tenerefectossustancialmente diferentes.Paraservirse de todos los beneficios de las técnicas multivariantes, el analista debe también «saber dónde mirar» con formulaciones alternativas del modelo original, tales como relaciones no lineales e interactivas. El analista tiene, sin embargo, un conjunto de técnicas de diagnóstico en continua expansión que permiten que estas relaciones multivariantes sean descubiertas por medios similares a los métodos univariantes y bivariantes. El investigador de un problema multivariante debe tomarse su tiempo en utilizar estas medidas de diagnóstico para un mayor entendimiento de los datos y de las relaciones básicas que existen. PROCURAR LA PARSIMONIA DEL MODELO Las técnicasmultivariantesse diseñanpara acomodar lasvariablesenel análisis.Este carácter, sinembargo,no debería sustituirel desarrollode modelosconceptualesantesde que se apliquenlastécnicas multivariantes.Aunque essiempre importante evitar omitir una variable predictor crítica, denominada error de especificación, por varias razones el analistadebe tambiénintentarevitarinsertarvariablesindiscriminadamente.Enprimerlugar,lasvariablesirrelevantes habitualmente aumentan la capacidad del análisis para ajustar la muestra de datos pero a costa de sobreajustar los datos y hacerlos menos generalizables para la población. En segundo lugar, las variables irrelevantes no sesgan típicamente las estimaciones de las variables relevantes, pero puedenenmascarar los efectos verdaderos debido a la multicolinealidad.Lamulticolinealidadrepresentael gradoenel que cualquierefectode unavariable puede serprevista o explicadapor las otras variablesdel análisis.A medidaque aumenta la multicolinealidad.lacapacidad para definirel efecto de cualquier variable disminuye. Por tanto, incluyendo variables que no son relevantes conceptualmente podemostener varios efectospotencialmente dañinos.inclusosi las variables adicionalesno sesgan directamente los resultados del modelo. ATENDER A LOS ERRORES Inclusocon lacapacidad del análisismultivariante.difícilmente conseguiremoslamejorpredicciónenel primeranálisis. El analista se enfrenta con la cuestión. «¿adónde podemos ir desde aquí?». La mejor respuesta es mirar a los errores en la predicción.tanto si son los residuosdel análisisde regresión.la ausencia de clasificaciónde observacionesen el análisis discriminante o los atípicos del análisis cluster. En cada caso. el analistadeberíautilizarloserroresde predicciónnocomounamedidade erroro comoalgo meramente a eliminar.sinocomounpuntode partidapara diagnosticarla validezde losresultadosobtenidosycomounaindicación de las relaciones que quedan sin explicar. VALIDAR LOS RESULTADOS
  • 20. AndreaBelenDelgadilloSuarez Mrg. José RamiroZapata Materia: Investigaciónde mercadosII “LIBEREMOS BOLIVIA” 20 La capacidad del análisis multivariante para identificar interrelaciones complejas también implica que puede darse el caso de que los resultadosseanespecificassóloparala muestra y no generalizablesalapoblación.El investigadordebe siempre asegurar que existen observaciones suficientes por parámetro estimado para evitar el «sobreajuste» de la muestra. como se ha discutido antes. Pero igual de importantes son los esfuerzos destinados a validar los resultados mediante diferentes métodos, que incluyen (1) división de la muestra y el uso de una submuestra para estimar el modelo y usar una segunda submuestra para estimar la precisión predictiva. (2) empleo de un análisis de «bootstrapping»[9]. o (3) inclusoconseguirunamuestra distintapara asegurar que los resultadossonapropiados para otras muestras.Cualquieraque sealatécnicamultivariante empleada.elinvestigadordebe centrarse nosóloenestimar un modelo significativo sino también en asegurar que es representativo de la población en su conjunto. Recordemos que el objetivonoes encontrar el mejor «ajuste»sólo para la muestra sinodesarrollar el modeloque mejor describaa la población en su conjunto. 3.- Conclusiónes En conclusión el Análisis Multivariante es el conjunto de métodos estadísticos cuya finalidad es analizar simultáneamente conjuntos de datos multivariantes en el sentido de que hay varias variables medidas para cada individuo ú objeto estudiado. Su razón de ser radica en un mejor entendimiento del fenómeno objeto de estudio obteniendo información que los métodos estadísticos univariantes y bivariantes son incapaces de conseguir. En esta lecciónse va a dar una breve visióngeneral de dicho conjunto de técnicasexponiendo,brevemente,cuál essu finalidad, ilustrada con ejemplos. Tres son los objetivos de la lección:  Definir qué es el Análisis Multivariante y cuáles son sus objetivos  Clasificarlas distintastécnicas multivariantes,distinguiendoentre métodosde dependencia,interdependencia y estructurale e indicando,de formaresumida,losobjetivosde lasdiversastécnicasmultivariantespresentadas en la lección.  Indicar cuáles son las etapas a seguir en la resolución de un problema de Análisis Multivariante .4.-Referencias 1.- (1Y1.1) https://es.ryte.com/wiki/An%C3%A1lisis_Multivariante
  • 21. AndreaBelenDelgadilloSuarez Mrg. José RamiroZapata Materia: Investigaciónde mercadosII “LIBEREMOS BOLIVIA” 21 2.-(2) (2) https://guiasjuridicas.wolterskluwer.es/Content/Documento.aspx?params=H4sIAAAAAAAEAMtMSbF1jTAAASNDSwtDtb LUouLM_DxbIwMDS0MDIwuQQGZapUt-ckhlQaptWmJOcSoATrah7TUAAAA=WKE 3.-(2.2) https://www.ecured.cu/An%C3%A1lisis_multivariados 4.-(2.3) http://www.cyta.com.ar/biblioteca/bddoc/bdlibros/guia_multivariante/guia_multivariante.htm 5.-(3) http://www.ciberconta.unizar.es/leccion/anamul/inicio.html 5.-Videos 1.- https://www.youtube.com/watch?v=_3YKNZW2HNc 2,. https://www.youtube.com/watch?v=6xNe1uklDHM