Harvey, David. - Paris capital de la modernidad [2008].pdf
Analisis multivariado
1. VERA RICALDEZ JHOSSELYN
MGR. JOSERAMIRO ZAPATA BARRIENTOS
INVESTIGACION DEMERCADOSII
GRUPO 09
1
LIBEREMOS BOLIVIA
“La verdaderaoportunidadhaciael éxitoreside enlapersona,noenel puestode trabajo” (ZIG
ZIGLAR)
1. ANALISIS MULTIVARIADO
1.1.INTRODUCCION
El análisis multivariante o análisis multivariado es un método estadístico utilizado para
determinar la contribución de varios factores en un simple evento o resultado.
Los factores de estudio son los llamados factores de riesgo (bioestadística), variables
independientes o variables explicativas.
El resultado estudiado es el evento, la variable dependiente o la variable respuesta.
El análisismultivariante mediante técnicasde proyecciónsobrevariableslatentestienemuchas
ventajas sobre los métodos de regresión tradicionales:
se puede utilizarlainformaciónde múltiplesvariablesde entrada,aunque éstasnosean
linealmente independientes
puede trabajar con matrices que contengan más variables que observaciones
puede trabajar con matrices incompletas, siempre que los valores faltantes estén
aleatoriamente distribuidos y no superen un 10%
puesto que se basan en la extracción secuencial de los factores, que extraenla mayor
variabilidad posible de la matriz de las X (variables explicativas, tienen que ser
dependientes) pueden separar la información del ruido. Se asume que las X se miden
con ruido.5
Conjunto de métodos estadísticos cuya finalidad es analizar simultáneamente conjuntos de
datos multivariantes: hay varias variables medidas para cada caso.
Permiten un mejor entendimientodel fenómeno objeto de estudio, obteniendo información
que los métodos univariantes y bivariantes son incapaces de conseguir.3
Originalmente,enlasestadísticasse utilizabanmétodosde pruebayanálisismultivariantepara
descubrir las relaciones causales. Dado que los cálculos manuales son muy complejos, los
métodos sólo son practicables en otros campos de aplicación con el desarrollo del hardware y
software correspondiente.Hoyendíase utilizanmétodosdeanálisismultivarianteenáreasmuy
diferentes:
Lingüística, Ciencias Naturales y Humanidades.
2. VERA RICALDEZ JHOSSELYN
MGR. JOSERAMIRO ZAPATA BARRIENTOS
INVESTIGACION DEMERCADOSII
GRUPO 09
2
LIBEREMOS BOLIVIA
Economía, seguros y servicios financieros.
Minería de datos, big data y bases de datos relacionales.
Hoy en día, los análisis multivariantes se suelen llevar a cabo mediante el uso de software con
el fin de hacerfrente alasenormescantidadesde datosycontrolarlasvariablesmodificadasen
aplicaciones prácticas como las pruebas de usabilidad. Sinembargo, las pruebas multivariante
también pueden contribuir significativamente a mejorar la facilidad de uso a menor escala.4
1.2.DESARROLLO
1.2.1. PARA QUE SE UTILIZA
Técnicas multivariantes se utilizan para estudiar el conjunto de datos de consumidores y
estudiosde mercado,controlde calidadyaseguramientodelacalidad,optimizacióndeprocesos
y control de procesos, la investigación y el desarrollo. Estas técnicas son especialmente
importantes en la investigación de las ciencias sociales, porque los científicos sociales en
general,puedenusarlosexperimentosde laboratorioaleatorios,talescomolosque se utilizan
en la medicina y las ciencias naturales. Aquí técnicas multivariantes pueden estimar
estadísticamente larelaciónentre lasdistintasvariables,ycorrelacionarlaimportanciade cada
uno de ellos es el resultado final y si hay dependencias entre ellos.2
1.2.2. PARA QUE SIRVE
Representar datos de forma intangible.
Esclarecer la distribución real de “varias variables”.
Desarrollar un modelo de predicción basado en multiples variables.
Hallar las relaciones de causa-efecto entre variables.1
1.2.3. OBJETIVOS
Proporcionarmétodosparaestudiardatosmultivariantesque el análisisestadísticouni
y bidimensional es incapaz de conseguir.
Ayudaral investigadoratomardecisionesóptimasenel contextoenelque seencuentre
teniendo en cuenta la información disponible por el conjunto de datos analizado.3
1.2.4. ESCALAS DE MEDICION
VARIABLECUANTITATIVA O METRICA:esaquellaque identificaal sujetocomodiferente
a los demás en cuanto a cantidad o grado.
VARIABLE CUALITATIVA O NO METRICA: se va a identificar al objeto de estudio por
características, propiedades, categorías o atributos que posee.
3. VERA RICALDEZ JHOSSELYN
MGR. JOSERAMIRO ZAPATA BARRIENTOS
INVESTIGACION DEMERCADOSII
GRUPO 09
3
LIBEREMOS BOLIVIA
Para variables métricas se utilizan intervalos y razones.
Para variables no métricas se utilizan nominales y ordinales.
ESCALA NOMINAL: asigna un número a una característica o atributo.
ESCALA ORDINAL: jerarquiza los datos en relación a la cantidad que poseen.
Los intervalos y las razones son iguales solo que las razones tienen sentido físicoy los
intervalos pueden tener un sentido arbitrario.1
1.2.5. METODOS
1.2.5.1. METODOS DE DEPENDENCIA
Suponen que las variables analizadas están divididas en dos grupos: las variables
dependientes y las variables independientes.
El objetivo consiste en determinar si el conjunto de variables independientes afecta al
conjunto de variables dependientes y de qué forma.3
1.2.5.2. METODOS DE INTERDEPENDENCIA
No distinguenentre variablesdependientes e independientesysuobjetivoconsiste en
identificar qué variables están relacionadas, cómo lo están y por qué.3
1.2.5.3. METODOS ESTRUCTURALES
Suponen que las variables están divididas en dos grupos: el de las variables
dependientes y el de las independientes.
El objetivo es analizar como las variables independientes afectan a las variables
dependientes y las relaciones de las variables de los dos grupos entre sí.3
1.2.6. TECNICAS
Los métodosmultivariantespuedensubdividirsesegúndiferentesaspectos.Enprimerlugar, se
diferencianenfunciónde si se debe descubriroverificarunaestructuracon ellos.Losmétodos
de determinación de la estructura incluyen el dominio:
1.2.6.1. ANALISIS FACTORIAL
Reduce la estructura a datos relevantes y variables individuales. Los estudios factoriales se
centranendiferentesvariables,porloque se subdividenenanálisisde componentesprincipales
y análisis de correspondencia. Por ejemplo: ¿Qué elementos de laweb influyen más en el
comportamiento de compra?4
4. VERA RICALDEZ JHOSSELYN
MGR. JOSERAMIRO ZAPATA BARRIENTOS
INVESTIGACION DEMERCADOSII
GRUPO 09
4
LIBEREMOS BOLIVIA
1.2.6.2. ANÁLISIS DE CLUSTERS
Las observaciones se asignan gráficamente a grupos de variables individuales y se clasifican
sobre labase de ellas.Losresultadossonclustersysegmentos,comoel númerodecompradores
de un productoen particular,que tienenentre35 y 47 añosy tienenunaltonivel de ingresos.4
Los procedimientos de revisión estructural incluyen, entre otros, el TLD:
1.2.6.3. ANALISIS DE REGRESION
Investiga la influencia de dos tipos de variables una sobre la otra. Se habla de variables
dependientes y no dependientes.Las primeras son las llamadas variables explicadas,mientras
que las segundasson variablesexplicativas.El primerodescribe el estadoreal sobre la base de
losdatos,el segundoexplicaestosdatospormediode relacionesde dependenciaentre lasdos
variables. En la práctica, varios cambios de los elementos de la página web corresponden a
variablesindependientes,mientrasquelosefectossobrelatasade conversiónseríanlavariable
dependiente.4
1.2.6.4. ANALISIS DE DESVIACIONES
Determina la influencia de varias variables o de variables individuales en grupos calculando
promedios estadísticos. Aquí se pueden comparar variables dentro de un grupo así como
diferentes grupos, dependiendo de dónde se deben suponer las desviaciones. Por ejemplo:
¿Qué grupos hacen clic con más frecuencia en el botón "Comprar ahora" de su cesta de la
compra?4
1.2.6.5. ANALISIS DISCRIMINANTE
Se utilizaenelcontextodelanálisisde desviacionesparadiferenciarentregruposquese pueden
describir con características similares o idénticas. Por ejemplo, ¿en qué variables difieren los
diferentes grupos de compradores?4
1.2.7. PORQUE SE UTILIZAN LAS TECNICAS MULTIVARIANTES
Dado que la mayoría de los análisis de datos trata de responder a preguntas complejas que
involucran más de dos variables, estas cuestiones se abordan mejor con técnicas estadísticas
multivariantes. Existen varias técnicas multivariantespara elegir, con base en supuestos sobre
la naturaleza de los datos y el tipo de análisis de asociación. Cada técnica pondrá a prueba los
modelos teóricos de una solicitud de investigación sobre las asociaciones contra los datos
observados. Los modelos teóricos se basan en hechos, así como nuevas hipótesis plausibles
sobre las asociaciones entre variables.
5. VERA RICALDEZ JHOSSELYN
MGR. JOSERAMIRO ZAPATA BARRIENTOS
INVESTIGACION DEMERCADOSII
GRUPO 09
5
LIBEREMOS BOLIVIA
1.2.8. VENTAJAS
Técnicasmultivariantespermitenalosinvestigadoresobservanlasrelacionesentrelasvariables
de una manera general y cuantificar las relaciones entre las variables.Se puede comprobar la
asociaciónentre lasvariablesmediante tabulacionescruzadas,correlaciónparcial yregresiones
múltiples, e introducir otras variables para determinar los vínculos entre las variables
independientesydependientesopara especificarlascondicionesenlasque la asociaciónlleva
a cabo. Esto da un aspecto mucho más rico y realista a una sola variable y proporciona una
poderosa prueba de significación con respecto a las técnicas univariantes.2
1.2.9. DESVENTAJAS
Técnicas multivariantes son complejose implican las matemáticas de alto nivel que requieren
de un programa estadístico para analizar los datos. Estos programas estadísticos son
generalmente caros. Los resultados del análisis multivariado no siempre son fáciles de
interpretar, ytiendenabasarse enhipótesisquepuedenserdifícilesde evaluar.Paralastécnicas
multivariantesparadar resultadossignificativos,necesitanunaampliamuestrade datos,de lo
contrario los resultados no tienen sentido debidoa errores en alto nivel.Los errores estándar
determinanel gradode confianzaque puede estaren los resultados,yustedpuede tenermás
confianzaenlos resultadosde unamuestragrande de uno pequeño.Realizaciónde programas
de estadística es bastante simple, pero requiere un estadístico para dar sentido a la salida.2
1.2.10. ETAPAS
1.2.10.1. OBJETIVOS DEL ANALISIS
Define el problema
Especifica los objetivos
Escoge las técnicas multivariantes
Establecer el problema en términos conceptuales definiendo:
Los conceptos
Las relaciones fundamentales
Establecer si dichas relaciones son:
De dependencia
De interdependencia
Se determinan las variables a observar.1
1.2.10.2. DISEÑO DEL ANALISIS
Se determina:
6. VERA RICALDEZ JHOSSELYN
MGR. JOSERAMIRO ZAPATA BARRIENTOS
INVESTIGACION DEMERCADOSII
GRUPO 09
6
LIBEREMOS BOLIVIA
El tamaño muestral
Las ecuaciones a estimar (si procede)
Las distancias a calcular (si procede)
Las técnicas de estimación a emplear
Decidir qué hacer con los “datos perdidos”1
1.2.10.3. HIPOTESIS DEL ANALISIS
Escoger formulación de hipótesis subyacente a la técnica:
Normalidad
Linealidad
Independencia
Homocedasticidad1
1.2.10.4. REALIZACION DEL ANALISIS
Se estima el modelo
Se evalua el ajuste a los datos
Observaciones atípicas (outliers)1
1.2.10.5. INTERPRETAR RESULTADOS
Evitar la procrastinacion
Reespecificaciones adicionales:
De las variables
Del modelo1
1.2.10.6. VALIDACION DEL ANALISIS
Establecer la validez de los resultados obtenidos analizando si los resultados obtenidos con la
muestra se generalizan a la población de la que procede.
Dividir la muestra en varias partes
Técnicas de remuestro:
Jacknife
Bootstrap1
7. VERA RICALDEZ JHOSSELYN
MGR. JOSERAMIRO ZAPATA BARRIENTOS
INVESTIGACION DEMERCADOSII
GRUPO 09
7
LIBEREMOS BOLIVIA
1.3.CONCLUSIONES
Al realizar esta investigación pude llegar a la conclusión de que el análisis multivariado es un
conjuntode métodosestadísticosdonde sirvenparaanalizardiferentesvariablesestaspueden
ser cualitativas o cuantitativas, este análisis permite a los investigadores observar la relación
entre lasvariablesde unamaneramásgeneralmediante tabulacionesuotrosmétodos,también
estosanálisissonmuycomplejosycostos,hay diferentesprogramaspararealizarlosejercicios
peroaunasí esdifícil realizarunabuenainterpretación, pararealizaresteanálisisse necesitade
expertos.
1.4.GLOSARIO
Estadístico: Un estadístico es cualquier función real medible de la muestra de una
variable aleatoria.
Bioestadística: Ciencia que aplica el análisis estadístico a los problemas y a los objetos
de estudio de la biología.
Big data: Cuando hablamos de Big Data nos referimos a conjuntos de datos o
combinaciones de conjuntos de datos cuyo tamaño (volumen), complejidad
(variabilidad) y velocidad de crecimiento (velocidad) dificultan su captura, gestión,
procesamiento o análisis mediante tecnologías y herramientas convencionales, tales
como bases de datos relacionales y estadísticas convencionales o paquetes de
visualización, dentro del tiempo necesario para que sean útiles.
Arbitrario: Que depende solamente de la voluntad o el capricho de una persona y no
obedece a principios dictados por la razón, la lógica o las leyes.
Clusters: Grupo de empresas e instituciones interrelacionadas, concentradas
geográficamente, que compiten en un mismo negocio.
Plausibles: La etimología del términoplausible nos lleva al latín plausibilis, un adjetivo
que procede del verboplaudere (quepuede traducirse como“aplaudir”). Puededecirse,
endefinitiva,que algoplausible esloque suenalógicoy,porlo tanto,puede sercreído
o aceptado.
Homocedasticidad: es una propiedad fundamental del modelo de regresión lineal
general y está dentro de sus supuestos clásicos básicos. es un escalar constante para
todo i. Lo que significaría que habría una distribución de probabilidad de idéntica
amplitud para cada variable aleatoria.
8. VERA RICALDEZ JHOSSELYN
MGR. JOSERAMIRO ZAPATA BARRIENTOS
INVESTIGACION DEMERCADOSII
GRUPO 09
8
LIBEREMOS BOLIVIA
Outliers:Un outlieres una observaciónanormal y extremaenuna muestraestadística
o serie temporal de datos que puede afectar potencialmente a la estimación de los
parámetros del mismo.
Procrastinación: (del latínprocrastinare:pro,adelante,ycrastinus,referenteal futuro),
postergación o posposición es la acción o hábito de retrasar actividades o situaciones
que deben atenderse, sustituyéndolas por otras situaciones más irrelevantes o
agradables por miedo a afrontarlas.
1.5.REFERENCIAS
1.- https://www.academia.cat/files/425-3397-DOCUMENT/Sancho-9-14Maig12.pdf
2.-http://bueno-saber.com/aficiones-juegos-y-juguetes/ciencia-y-naturaleza/tecnicas-
multivariantes-ventajas-y-desventajas.php
3.- http://www.uco.es/zootecniaygestion/img/pictorex/16_11_29_8_multivariante.pdf
4.- https://es.ryte.com/wiki/An%C3%A1lisis_Multivariante
5.- https://es.wikipedia.org/wiki/An%C3%A1lisis_multivariante
1.6.VIDEOS
https://www.youtube.com/watch?v=6xNe1uklDHM
9. VERA RICALDEZ JHOSSELYN
MGR. JOSERAMIRO ZAPATA BARRIENTOS
INVESTIGACION DEMERCADOSII
GRUPO 09
9
LIBEREMOS BOLIVIA
https://www.youtube.com/watch?v=hXxeAzTkkUU