1. Presentación #1:
Manual de Análisis Factorial
(páginas 215 – 262)
Vanessa Santiago Olivares
Universidad Interamericana
MATE 6600 Econometría
2. Introducción
El Capítulo 7 se toca el tema del análisis
factorial usando la técnica R
La técnica R busca identificar relaciones
entre factores y variables cuando se usan
los mismos instrumentos de medida en
muchos sujetos
Antes de la sección 7.5 (página 215) se
describe el método Varimax para realizar el
análisis
3. Método de Criterios en Tandem
El método pretende usar rotaciones
de los factores para poder identificar
relaciones fuertes y únicas entre
dichos factores y las variables
Este método hace uso de dos criterios
para realizar la separación y rotación
de los datos
4. Método de Criterios en Tandem
Criterio I - Se basa en el siguiente
principio
Si dos variables están correlacionadas,
deben aparecer en el mismo factor
5. Método de Criterios en Tandem
Matemáticamente se expresa así:
m n n
F = ∑∑∑ r 'ij aik a jk
2 2 2
donde
k =1 i =1 j =1
n
r = ∑a a
ij
k =1
ik jk es la correlación entre la variable i y la variable j
a ik es el peso de la variable i en el factor k
a jk es el peso de la variable j en el factor k
6. Método de Criterios en Tandem
Luego de la rotación, los factores cuyo
peso es demasiado pequeño (<0.3) se
descartan
Los criterios marginales (entre 0.3 y
0.45) y fuertes (>0.45) pasan a una
segunda rotación, conocida como el
Criterio II
7. Método de Criterios en Tandem
Criterio II - Se basa en el siguiente
principio
Si dos variables no están
correlacionadas, no deben aparecer
en el mismo factor
8. Método de Criterios en Tandem
Matemáticamente se expresa así:
( )a
m n n
F = ∑∑∑ 1 − r 'ij
2 2 2
k =1 i =1 j =1
ik a jk donde
r ij es la correlación entre la variable i y la variable j
a ik es el peso de la variable i en el factor k
a jk es el peso de la variable j en el factor k
9. Método de Criterios en Tandem
El método de los Criterios en Tandem
produce resultados similares al
método Varimax cuando se aplican
siguiendo los mismos controles
10. Estrategia de Trabajo para el
Análisis Factorial
1. Extraer factores con el método de
residuo mínimo hasta alcanzar
convergencia
2. Inspeccionar los factores y eliminar los
que tengan un peso de 0.2 o menos
3. Rotar bajo el Criterio I y desechar los
factores con peso de 0.3 o menos
11. Estrategia de Trabajo para el
Análisis Factorial
4. Rotar bajo el Criterio II y eliminar los
factores que no se aumenten o
pierdan su carácter básico
5. Continuar proceso de eliminación con
el Criterio I
6. La solución final puede ser rotada
para satisfacer otros criterios del
investigador
12. Principios de Diseño
El investigador debe ser libre para
definir el área que desea estudiar
Definir el dominio
Establecer estructura factorial hipotética
Formular el modelo factorial con los
factores esperados y las hipótesis
alternativas
13. Principios de Diseño
Escoger las variables con las que se quiere
trabajar
Frecuentemente, el investigador se encuentra
con que debe generar nuevas variables con las
características deseadas que sirvan de variables
indicadoras de los factores que se conjetura
aparecerán.
Cada factor debe tener cinco o más variables
como buenos indicadores
Mientras más variables, más seguro que se
encuentre una relación en las rotaciones
14. Principios de Diseño
Obtener datos de una muestra
adecuada de individuos
Realizar en análisis
15. Jerarquía Factorial
Se refiere a la importancia de los factores
en el modelo final
La presencia de factores de bajo nivel
jerárquico que resultan de la introducción
de variables con varianza solapada, a
menudo, no es prevista por el investigador
Ante esto, es prudente repasar el análisis
luego de eliminar o combinar variables para
suprimir factores de baja jerarquía
16. Jerarquía Factorial
Otra forma de impulsar factores de
interés es mediante la extracción de
factores de bajo nivel y realizando
rotaciones
La dificultad de este método estriba
en la capacidad de identificar
correctamente el número de factores
que se deben eliminar
17. Jerarquía Factorial
Aunque los factores de alto nivel son
útiles para algunos fines,
generalmente se desea tener un
modelos con factores de jerarquía
intermedia ya que se ha encontrado
que son más útiles para fines
cinetíficos.
18. Variables
Las variables deben generar datos
continuos y distribuidos normalmente
Las regresiones de pares de variables
deben ser lineales
Esto permite que el coeficiente de
correlación Pearson produzca
resultados confiables
19. Variables
Las escalas de medida afectan los
resultados del análisis factorial y las
correlaciones encontradas
Para variables que no son continuas,
sino categóricas, es deseable tener
12 o más grados en vez de dos o tres
Las variables incluidas en la misma
matriz no deberían ser dependientes
unas de otras
20. Variables
Muestras de tamaño 50 ofrecen
fiabilidad muy ineficiente de los
coeficientes de correlación
Muestras de tamaño 1000 son más
adecuadas para la mayoría de los
fines del análisis factorial
21. Variables
Para el trabajo exploratorio es
importante garantizar que haya
mucha varianza, por tanto, el tamaño
de la muestra pasa a un segundo
plano
Para refinar el modelo hipotetisado, la
muestra debe ser grande
(representativa de la población) para
asegurar correlaciones precisas
22. Coeficientes de Correlación
El coeficiente de correlación de
Pearson es apropiado para las
diversas situaciones que ocupan al
análisis factorial
El inconveniente que tiene es que es
intensivo en cómputos matemáticos,
lo que dificulta su aplicación por el
método manual
23. Coeficientes de Correlación
Otros coeficientes disponibles:
ϕ - Se emplea cuando las variables
representas dicotomías absolutas
Punto Biserial – Se emplea cuando una
de las variables es una dicotomía
absoluta, y la otra es continua y
aproximadamente normal
24. Coeficiente de Correlación
Otros coeficientes disponibles:
Biserial – Se emplea cuando una de las
variables se distribuye normalmente
pero ha sido artificialmente
dicotomizada, y la otra es continua y
aproximadamente normal
Tetracórico – Se emplea cuando ambas
variables estén distribuidas normalmente
pero artificialmente dicotomizadas
25. Coeficientes de Correlación
Se debe evitar variables dicotómicas
siempre que sea posible
Se debe intentar tener variables
continuas o con, al menos, 12
categorías
Calcular la correlación Pearson, que
ofrece buena resolución
26. Errores Comunes
1. Recoger datos antes de planificar
2. Usar variables con malas
distribuciones y regresiones
inapropiadas
3. Usar variables que no son
independientes entre si
4. Sobre-determinar factores
5. Utilizar demasiadas variables
complejas
27. Errores Comunes
6. Incluir variables muy similares
7. No proporcionar buenas variables
indicadores de un factor
8. Procedimientos deficientes de
muestreo
9. No incluir suficientes factores en el
análisis
10.Utilización de coeficientes de
correlación inadecuados
28. Errores Comunes
11.Utilización de estimaciones
inapropiados
12.Extraer demasiado pocos factores
13.Procedimientos de rotación
deficientes
14.Interpretar el primer factor extraído
como un factor general
15.Sacar conclusiones con evidencia
insuficiente
29. Técnica Q
Esta técnica es similar a la técnica R,
pero hace comparaciones entre las
columnas de la matriz en vez de las
filas
Establece correlaciones entre los sujetos
en vez de las pruebas
Puesto que las pruebas utilizadas no son
iguales, requiere normalización de los
datos
30. Técnica Q
Al tipificar o normalizar los datos, el
promedio se vuelve cero y la
desviación estándar 1
Este proceso causa que los efectos
importantes se aumenten y los no
importantes se supriman
31. Técnica Q
La estabilidad del coeficiente de
correlación depende de que se tome
una muestra grande y representativa
de casos de la población
Con la técnica R, esto significa usar
muchos sujetos con un número limitado
de variables
Con la técnica Q, esto significa medir
muchas variables para un número
limitado de sujetos
32. Problema de la Rotación en el
Análisis Mediante la Técnica Q
Los sujetos deben ser
cuidadosamente seleccionados para
obtener resultados factoriales
significativos
No hacerlo causaría que no se pueda
discriminar entre los sujetos y parezca
que todos pertenecen al mismo grupo
33. Técnica P
Utilizado para el análisis clínico
La matriz está compuesta por
observaciones (columnas) de las
mismas variables (filas) para el
mismo sujeto
Los factores derivados de la técnica P
representan grupos de variables
sustancialmente correlacionadas
34. Técnica P
Este análisis es apropiado para
variables con variaciones medibles a
través del tiempo pero que sean
inmunes al efecto de práctica,
aprendizaje o error
Tiene poco potencial para
características que son estables en el
individuo
35. Otras Técnicas
Técnica O – Similar a la técnica P, pero
comparando columnas en vez de filas de la
matriz de datos
Técnica T – Correlaciones entre las
ocasiones en que grupos de individuos se
comportan de forma similar
Técnica S – Correlaciona dos individuos
sobre una serie de acontecimientos en los
que se miden las variables de interés
36. ¿Preguntas?
Vanessa Santiago Olivares
Universidad Interamericana
MATE 6600 Econometría