SlideShare una empresa de Scribd logo
1 de 28
Descargar para leer sin conexión
Autor: Prof. Rubén J. Rodríguez
Estadística II
Licenciatura en Sociología
1
Facultad de Psicología y Ciencias Sociales
Licenciatura en Sociología
ESTADÍSTICA II (Plan 2008)
ANÁLISIS DE COMPONENTES PRINCIPALES y
ANÁLISIS DE FACTORES COMUNES
Prof. Titular
Lic. Rubén José Rodríguez
16 de abril de 2012
INTRODUCCIÓN
Autor: Prof. Rubén J. Rodríguez
Estadística II
Licenciatura en Sociología
2
En las siguientes 28 diapositivas se expone sintéticamente la técnica multivariada
genéricamente denominada Análisis Factorial que en realidad engloba dos tipos de
procedimientos diferentes: Análisis de Componentes Principales (ACP) y Análisis
de Factores Comunes (AFC), el primero reduce la variabilidad total, el segundo
la variabilidad común.
Se exponen los antecedentes del Análisis Factorial, los objetivos, y los pasos del AF:
1° Examen de la Matriz de Correlaciones, 2° Extracción de los Factores o de los
Componentes, 3° Rotación de los factores o ejes, 4° Cálculo de las
puntuaciones factoriales, y 5° Denominación e interpretación de los Factores o
Ejes.
Se presenta un primer ejemplo de AF mediante la visualización de un Diagrama de
Análisis Causal, un segundo ejemplo desarrollado de ACP correspondiente a
una matriz de correlaciones entre indicadores socio-económico-demográficos de
109 países del fichero MUNDO 95, y un tercer ejemplo de una matriz factorial
correspondiente a 18 indicadores de nacionalismo mediante escalas tipo Likert y su
reducción a dimensiones factoriales.
Se brindan las definiciones y la ejemplificación (MUNDO 95) de diversos índices de
incorrelación e intercorrelación de la matriz de correlaciones.
Autor: Lic. Rubén José Rodríguez
Autor: Prof. Rubén J. Rodríguez
Estadística II
Licenciatura en Sociología
3
ANTECEDENTES ANÁLISIS FACTORIAL (1)
Charles Spearman (1863-1945): Psicólogo inglés. Fue
oficial del ejercito británico en la India y a su vuelta, a
los 40 años, influido por la lectura de Francis Galton,
decidió realizar su tesis doctoral sobre la medición
objetiva de la inteligencia. Propuso el primer modelo
factorial, basado en un factor común (factor g), y un
factor específico (factor s) (1901), conocida como
Teoría bifactorialista de la inteligencia. Ocupo la
primera Cátedra de Psicología en la University College
en Londres. El Análisis Factorial (AF) engloba dos
técnicas: Análisis de Componentes Principales (ACP)
y Análisis de Factores Comunes (AFC).
Autor: Prof. Rubén J. Rodríguez
Estadística II
Licenciatura en Sociología
4
ANTECEDENTES ANÁLISIS FACTORIAL (2)
Karl Pearson (1857-1936): Científico inglés, discípulo de
Francis Galton. Conocido por sus aplicaciones de la
estadística a los problemas biológicos y psicológicos.
Cofundador de la revista Biométrika (1902). Fue el que
presentó la propuesta del Análisis de Componentes
Principales (1901)(ACP) primer paso para el cálculo del
Análisis Factorial. El ACP es una técnica descriptiva que
intenta condensar la matriz de correlaciones entre las
variables en unos componentes principales la
variabilidad total que presentan los individuos en las
pruebas o variables medidas. Harold Hottelling (1885-
1993) desarrolló el ACP y el Análisis de Correlaciones
Canónicas.
Autor: Prof. Rubén J. Rodríguez
Estadística II
Licenciatura en Sociología
5
OBJETIVOS DEL ANÁLISIS FACTORIAL (1)
El objetivo del AF consiste en identificar un número
de factores o componentes, inferior al número de
variables observadas (F<V) mediante los cuales se
pueda describir el fenómeno observado en forma
simplificada. El AF es un método de reducción de la
información, identificando los factores que son
constructos no directamente observables
(variables latentes).
A partir de la matriz de datos original se calcula la
matriz de correlaciones y el ACP/AFC convierte a
ésta en una matriz factorial. “El AF es, en fin de
cuentas, un estudio de los coeficientes de correlación” (Yela,
Mariano (1957). La Técnica del Análisis Factorial. Madrid: Biblioteca Nueva,
1997, p. 32
Autor: Prof. Rubén J. Rodríguez
Estadística II
Licenciatura en Sociología
6
OBJETIVO DEL ANÁLISIS FACTORIAL (2)
El AF al ser un técnica descriptiva o de interdepen-
dencia busca resumir, reducir o simplificar la informa-
ción contenida en una matriz de datos con V
variables. Reduce un gran número de variables
empíricas a pocas variables fundamentales donde
aquellas están altamente saturadas en éstas.
E identifica un reducido número de factores o
componentes F siendo F < V, de modo que
expliquen un máximo de la variabilidad total (ACP),
(Análisis de Componentes Principales) o bien,
solamente la variabilidad común (AFC) (Análisis
Factorial Común) (Hair, et al., 1999: 90 y 768). El AF
debe cumplir los Principios de parsimonia e
interpretabilidad.
Autor: Prof. Rubén J. Rodríguez
Estadística II
Licenciatura en Sociología
7
OBJETIVO DEL ANÁLISIS FACTORIAL (3)
El Análisis Factorial (AF) puede ser exploratorio o con-
firmatorio.
El Análisis Factorial Exploratorio (AFE) se caracteriza
porque no se conocen a priori el número de factores y es
en la aplicación empírica donde se de-termina este núme-
ro. se usa para tratar de descubrir la estructura interna de
un número relativamente grande de variables. La hipóte-
sis a priori del investigador es que pueden existir una
serie de factores asociados a grupos de variables.
Las cargas o pesos (Coeficientes factoriales) de los distin-
tos factores -con relación a los ítems donde estos se satu-
ran- se utilizan para intuir la relación de éstos con las dis-
tintas variables. Es el tipo de análisis factorial más común.
Autor: Prof. Rubén J. Rodríguez
Estadística II
Licenciatura en Sociología
8
OBJETIVO DEL ANÁLISIS FACTORIAL (4)
Por el contrario, en el Análisis Factorial Confirmatorio (AFC)
los factores están fijados a priori, utilizándose contrastes de
hipótesis para su corroboración. trata de determinar si el
número de factores obtenidos y sus cargas se corresponden
con los que cabría esperar a la luz de una teoría previa acerca
de los datos. La hipótesis a priori es que existen unos determi-
nados factores preestablecidos y que cada uno de ellos está
asociado con un determinado subconjunto de las variable,
arroja un nivel de confianza para poder aceptar o rechazar
dicha hipótesis. El Análisis Factorial Confirmatorio es un caso
particular del Modelo de Ecuaciones Estructurales (MES ó
SEM). Éste utiliza los diagramas de flujos causales (Path
Analysis). Desde su creación el AF fue de tipo exploratorio pero
a partir de la década del 60 Karl Jöreskog y Dag Sörbon
desarrollaron el AFC y el SEM y en el 70 el programa LISREL.
Autor: Prof. Rubén J. Rodríguez
Estadística II
Licenciatura en Sociología
9
DIAGRAMA DE ANÁLISIS CAUSAL
Índice de industrialización
Periódicos semanales por hab.
U$ por Hab de Ventas al Detalle
U$ por Hab del Ventas al Por Mayor
% de Mujeres > 14 años que trabajan
% de Trabajadoras en agricultura
Índice de Fomento del Nivel de Vida
Índice de Salud
Gastos en Ayudas a los Niños x Hab.
Índice de Paro Laboral (Desocup.)
Extensión de las Enferm. Mentales
% de Viviendas Construidas reciént.
Estabilidad de la Población
Índice de Actividad Migratoria
INDUSRI
PERIODIC
VENTASDE
VENTASMA
EMPLEOMU
AGRICULT
NIVELVID
SALUD
AYUDASNI
PARO
MENTALEN
VIVIENDA
ESTAPOBL
MEGRACIO
F 1
F 2
F 3
VARIABLES ORIGINALES COEFICIENTES
FACTORIALES
FACTORES
EXTRAIDOS
NOMBRE
FACTOR
LATENTE
Actividad
Económica
Bienestar
Social
Estabilidad
Social
.913
.866
.840
.834
.082
-.657
.888
.791
-.755
-.625
-.475
.842
-.822
.777
Bisquerra Alzina, Rafael (1989). Introducción conceptual al Análisis Multivariable. Tomo I. Madrid: PPU-Promociones y
Publicaciones Universitarias, 1989, p. 329.
Autor: Prof. Rubén J. Rodríguez
Estadística II
Licenciatura en Sociología
10
PASOS DEL ANÁLISIS FACTORIAL(1)
1º Exámen de la Matriz de Correlaciones: El requisito
es que las variables estén intercorrelacionadas. Los
indicadores estadísticos para medir la significación del
grado de correlación: Test de Esfericidad de Barlett,
Índice de K-M-O de Kaiser, Meyer y Olkin,
Coeficiente de Correlación Parcial y Múltiple, y
Gráfico de Sedimentación.
Si de estos indicadores estadísticos surge que las
variables en la matriz de datos están incorrelaciona-
das, por lo tanto no es posible aplicar el ACP o el AFC,
pues, no hay variabilidad o variancia (total o común) que
explicar para obtener un componente principal o factor
común.
Autor: Prof. Rubén J. Rodríguez
Estadística II
Licenciatura en Sociología
11
PASOS DEL ANÁLISIS FACTORIAL(2)
2º Extracción de los Factores o Componentes:
Determinar un número reducido de factores que
puedan representar a las variables originales. Uno de
los métodos de extracción es de Componentes
Principales (CP), que a su vez es una técnica
estadística del AF: ACP.
El método de CP analiza la variancia total y extrae la
primera proporción de máxima varianza (primer CP)
que explique los datos. El segundo CP extrae la
mayor proporción de la varianza residual, y así suce
sivamente. Los CP extraídos deben no estar
correlacionados entre sí (ortogonales). Los
posteriores CP explican cada vez menos de la
variancia residual.
Autor: Prof. Rubén J. Rodríguez
Estadística II
Licenciatura en Sociología
12
PASOS DEL ANÁLISIS FACTORIAL(3)
3º Rotación de Factores: Consiste en hacer rotar,
girar los ejes factoriales hasta que se aproximen al
máximo a las variables. La finalidad es obtener una
representación gráfica fácilmente interpretable.
4º Cálculo de las Puntuaciones Factoriales: Una
vez obtenidos los factores donde las variables tienen
alta saturación se pueden calcular las puntuaciones
que obtendrían los sujetos en esos factores. A partir
de la matriz factorial rotada se calculan las puntua-
ciones factoriales que se transforman en puntuacio
es estandarizadas Zij y expresan al AF como una
ecuación de regresión múltiple:
1 1 2 2 ...
ij i i i i i j
F FZ F Z FZ
   
Autor: Prof. Rubén J. Rodríguez
Estadística II
Licenciatura en Sociología
13
TEST DE ESFERICIDAD DE BARLETT
El test pone a prueba la H0 mediante X2 que dice que
la matriz de correlaciones empírica R es igual a la
matriz identidad I (cuya diagonal principal son unos y
el resto de los coeficientes son 0):
H0 : │R│= 1 (Hay incorrelación)
H1 : │R│ 1 (Hay correlación)
Si se confirma la H0 significa que las variables no
están intercorrelacionadas, por lo tanto la nube de
puntos en el espacio formaría una esfera
(esfericidad).

Autor: Prof. Rubén J. Rodríguez
Estadística II
Licenciatura en Sociología
14
ÍNDICE KMO de KAISER, MEYER y OLKIN
ij
r .
ij z
r
.
ij z
r
Este índice compara las magnitudes de los
coeficientes de correlación observados rij con los
coeficientes de correlación parcial .
El índice KMO varía entre 0,0 a 1,0. Si el índice
tiende a 1,0 señala la existencia de intercorrelación
entre las variables.
Valores de KMO inferiores a 0,50 suponen, por el con
trario, la no adecuación del AF, al haber poca
correlación. Su fórmula es:
2
1 1
2 2
.
1 1 1 1
N N
ij
i j
N N N N
ij ij z
i j i i
r
KMO
r r
 
   



 
Autor: Prof. Rubén J. Rodríguez
Estadística II
Licenciatura en Sociología
15
EJEMPLO DE APLICACIÓN DEL AF - MUNDO 95 109 Países X 18 Variables
Pérez, César (2004). Técnicas de análisis multivariante de datos con SPSS,
Madrid: Pearson, 2004, pp. 195-203.
Nota:
César
Pérez
(2004)
ejemplifica
el
AF
con
9
indicadores,
además,
utiliza
el
Método
de
Rotación
Oblimin,
mientra
que
en
nuestra
ejemplificación
utilizamos
el
Método
Varimax,
por
lo
que
sus
resultado
divergen
de
los
mostrados
en
la
presentación
de
la
unidad
temática.
(RJR)
Estadísticos descriptivos
68831,14 195296,366 59
159,869 581,7396 59
49,76 25,186 59
65,83 11,078 59
61,34 9,932 59
69,58 22,326 59
2,214 ,9604 59
57,729 36,9310 59
3107,93 4789,315 59
2588,81 516,132 59
12800,08 54071,331 59
31,492 11,1144 59
9,89 4,977 59
34,9374 61,31802 59
3,7760 2,08576 59
4,303 1,8497 59
75,36 19,793 59
62,12 27,017 59
Población x1000
Habitantes por Km2
Habitantes en ciudades
(%)
Esperanza de vida
femenina
Esperanza de vida
masculina
Alfabetización (%)
Aumento de la población
(% anual)
Mortalidad infantil
(muertes por 1000
nacimientos vivos)
Producto interior bruto
per-capita
Ingesta diaria de calorías
Casos de SIDA
Tasa de natalidad (por 1.
000 habitantes)
Tasa de mortalidad (por
1.000 habitantes)
Casos de SIDA por 100.
000 habitantes
Tasa
Nacimientos/Defunciones
Número promedio de
hijos
Hombres alfabetizados
(%)
Mujeres alfabetizadas (%)
Media
Desviación
típica N del análisis
Autor: Prof. Rubén J. Rodríguez
Estadística II
Licenciatura en Sociología
16
EJEMPLO DE APLICACIÓN DEL AF - MUNDO 95 109 Países X 18 Variables
Matriz de Correlaciones
Matriz de correlacionesa
1,000 ,001 -,172 ,008 ,056 ,013 -,210 ,011 -,030 ,018 ,119 -,181 -,081 -,095 -,124 -,195 ,056 -,005
,001 1,000 ,181 ,112 ,117 ,074 -,158 -,143 ,295 ,110 -,047 -,179 -,073 -,079 -,094 -,166 ,091 ,077
-,172 ,181 1,000 ,741 ,717 ,614 -,192 -,705 ,558 ,674 ,103 -,566 -,592 -,284 ,261 -,533 ,595 ,634
,008 ,112 ,741 1,000 ,987 ,827 -,392 -,951 ,547 ,716 ,091 -,817 -,845 -,499 ,270 -,790 ,754 ,815
,056 ,117 ,717 ,987 1,000 ,785 -,325 -,931 ,529 ,711 ,075 -,773 -,866 -,521 ,318 -,747 ,727 ,773
,013 ,074 ,614 ,827 ,785 1,000 -,567 -,891 ,469 ,575 ,154 -,822 -,616 -,127 ,043 -,814 ,939 ,963
-,210 -,158 -,192 -,392 -,325 -,567 1,000 ,420 -,422 -,393 -,191 ,776 ,017 ,012 ,692 ,755 -,542 -,580
,011 -,143 -,705 -,951 -,931 -,891 ,420 1,000 -,563 -,701 -,134 ,809 ,764 ,302 -,231 ,784 -,805 -,856
-,030 ,295 ,558 ,547 ,529 ,469 -,422 -,563 1,000 ,703 ,561 -,591 -,218 ,050 -,170 -,495 ,439 ,458
,018 ,110 ,674 ,716 ,711 ,575 -,393 -,701 ,703 1,000 ,256 -,658 -,441 -,229 ,040 -,581 ,576 ,548
,119 -,047 ,103 ,091 ,075 ,154 -,191 -,134 ,561 ,256 1,000 -,169 ,064 ,391 -,191 -,135 ,144 ,164
-,181 -,179 -,566 -,817 -,773 -,822 ,776 ,809 -,591 -,658 -,169 1,000 ,543 ,310 ,188 ,968 -,756 -,811
-,081 -,073 -,592 -,845 -,866 -,616 ,017 ,764 -,218 -,441 ,064 ,543 1,000 ,626 -,573 ,566 -,551 -,589
-,095 -,079 -,284 -,499 -,521 -,127 ,012 ,302 ,050 -,229 ,391 ,310 ,626 1,000 -,302 ,322 -,146 -,166
-,124 -,094 ,261 ,270 ,318 ,043 ,692 -,231 -,170 ,040 -,191 ,188 -,573 -,302 1,000 ,152 ,029 ,032
-,195 -,166 -,533 -,790 -,747 -,814 ,755 ,784 -,495 -,581 -,135 ,968 ,566 ,322 ,152 1,000 -,759 -,819
,056 ,091 ,595 ,754 ,727 ,939 -,542 -,805 ,439 ,576 ,144 -,756 -,551 -,146 ,029 -,759 1,000 ,960
-,005 ,077 ,634 ,815 ,773 ,963 -,580 -,856 ,458 ,548 ,164 -,811 -,589 -,166 ,032 -,819 ,960 1,000
498 096 475 337 461 055 467 412 447 184 086 271 236 175 070 338 484
Población x1000
Habitantes por Km2
Habitantes en ciudades
(%)
Esperanza de vida
femenina
Esperanza de vida
masculina
Alfabetización (%)
Aumento de la población
(% anual)
Mortalidad infantil
(muertes por 1000
nacimientos vivos)
Producto interior bruto
per-capita
Ingesta diaria de calorías
Casos de SIDA
Tasa de natalidad (por 1.
000 habitantes)
Tasa de mortalidad (por
1.000 habitantes)
Casos de SIDA por 100.
000 habitantes
Tasa
Nacimientos/Defunciones
Número promedio de
hijos
Hombres alfabetizados
(%)
Mujeres alfabetizadas (%)
P bl ió 1000
Correlación
Si (U il t l)
Población
x1000
Habitantes
por Km2
Habitantes en
ciudades (%)
Esperanza de
vida femenina
Esperanza
de vida
masculina
Alfabetización
(%)
Aumento de
la población
(% anual)
Mortalidad
infantil
(muertes por
1000
nacimientos
vivos)
Producto
interior bruto
per-capita
Ingesta diaria
de calorías
Casos de
SIDA
Tasa de
natalidad
(por 1.000
habitantes)
Tasa de
mortalidad
(por 1.000
habitantes)
Casos de
SIDA por
100.000
habitantes
Tasa
Nacimientos/
Defunciones
Número
promedio
de hijos
Hombres
alfabetizados
(%)
Mujeres
alfabetizadas
(%)
Autor: Prof. Rubén J. Rodríguez
Estadística II
Licenciatura en Sociología
17
EJEMPLO DE APLICACIÓN DEL AF - MUNDO 95 109 Países X 18 Variables
Pruebas de ajuste del Análisis Factorial
ÍNDICE KMO: 0,834  Alta intercorrelación entre los indicadores
TEST DE ESFERICIDAD DE BARLETT: X2 = 1545,023 Sig. 0,000
Rechazo de H0  Hay intercorrelación entre las variables
KMO y prueba de Bartlett
,834
1545,023
153
,000
Medida de adecuación muestral de
Kaiser-Meyer-Olkin.
Chi-cuadrado
aproximado
gl
Sig.
Prueba de esfericidad
de Bartlett
Autor: Prof. Rubén J. Rodríguez
Estadística II
Licenciatura en Sociología
18
EJEMPLO DE APLICACIÓN DEL AF - MUNDO 95 109 Países X 18 Variables
Comunalidades
Los Componentes extraídos varían entre 0,706 y 0,967 indicando una alta comunalidad
(h2). Estas indican la proporción de varianza explicada por todos los factores (resultan-
tes de la extracción). La comunalidad de cada variable es igual a la suma de cuadrados
de los coeficiente factoriales de cada variable. La comunalidad es la cantidad de varian-
za que una variable comparte con las demás variables consideradas
2 2 2 2 2
1 2 ...
k j j kj kj
h F F F F
     
1,000 ,852
1,000 ,732
1,000 ,748
1,000 ,967
1,000 ,956
1,000 ,942
1,000 ,952
1,000 ,927
1,000 ,896
1,000 ,706
1,000 ,843
1,000 ,942
1,000 ,915
1,000 ,783
1,000 ,888
1,000 ,914
1,000 ,861
1,000 ,939
Población x1000
Habitantes por Km2
Habitantes en ciudades (%)
Esperanza de vida femenina
Esperanza de vida masculina
Alfabetización (%)
Aumento de la población (% anual)
Mortalidad infantil (muertes por 1000 nacimientos vivos)
Producto interior bruto per-capita
Ingesta diaria de calorías
Casos de SIDA
Tasa de natalidad (por 1.000 habitantes)
Tasa de mortalidad (por 1.000 habitantes)
Casos de SIDA por 100.000 habitantes
Tasa Nacimientos/Defunciones
Número promedio de hijos
Hombres alfabetizados (%)
Mujeres alfabetizadas (%)
Inicial Extracción
Método de extracción: Análisis de Componentes principales.
Autor: Prof. Rubén J. Rodríguez
Estadística II
Licenciatura en Sociología
19
EJEMPLO DE APLICACIÓN DEL AF - MUNDO 95 109 Países X 18 Variables
Varianza total explicada
Los Autovalores o Eigenvalores (Valores propios: Lmbda) son el cuadrado del Coeficiente Factorial (cargas, pesos o
saturaciones factoriales) e indican la proporción de la variancia total de una variable explicada por ese factor. Se convierte
en el % explicado por el Factor I, II, etc., dividiendo el Autovalor por el nº de variables y multiplicado por 100, por ejemplo
para el FI = [(8,836 / 18) * 100] = 49,091. Se observa que el FI explica el 49,09% de la variancia total, el FII el 13,46% y FIII el
10,06%. Los tres primeros factores explican el 72.62% de la variancia total, pues sus Autovalores son > que 1 (1,811 a
8,836). No se toman en cuenta los FIV y FV que si bien son > que 1 agregan poca variancia explicada residual.
I

p
9,312 51,735 51,735 9,312 51,735 51,735 8,836 49,09 49,091
2,681 14,894 66,629 2,681 14,894 66,629 2,424 13,46 62,556
1,534 8,520 75,149 1,534 8,520 75,149 1,811 10,06 72,618
1,159 6,437 81,586 1,159 6,437 81,586 1,425 7,915 80,534
1,077 5,986 87,571 1,077 5,986 87,571 1,267 7,038 87,571
,758 4,211 91,783
,442 2,458 94,241
,291 1,614 95,855
,232 1,288 97,143
,167 ,928 98,071
,136 ,756 98,827
,072 ,402 99,229
,040 ,224 99,453
,036 ,202 99,656
,025 ,140 99,796
,018 ,101 99,897
,014 ,077 99,974
,005 ,026 100,000
Componente
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
Total
% de la
varianza % acumulado Total
% de la
varianza % acumulado Total
% de la
varianza % acumulado
Autovalores iniciales
Sumas de las saturaciones al cuadrado
de la extracción
Suma de las saturaciones al cuadrado
de la rotación
Método de extracción: Análisis de Componentes principales.
Autor: Prof. Rubén J. Rodríguez
Estadística II
Licenciatura en Sociología
20
EJEMPLO DE APLICACIÓN DEL AF - MUNDO 95 109 Países X 18 Variables
Gráfico de sedimentación
I

Los Autovalores iniciales mayores a 1 son los 5 primeros componentes (1,077 a 9,312) y
que acumulan el 88% de la explicación de la variancia total. El punto de inflexión de la
curva indica el número mínimo de factores estadísticamente significativos. Por razones
de economía explicativa se toman los 3 primeros factores que explican el 73% de
variancia explicada total acumulada.
Autor: Prof. Rubén J. Rodríguez
Estadística II
Licenciatura en Sociología
21
EJEMPLO DE APLICACIÓN DEL AF - MUNDO 95 109 Países X 18 Variables
Matriz de componentes sin rotar
,956 -,227 ,015 ,019 ,042
-,949 ,123 -,080 ,060 ,030
,930 -,280 ,015 ,040 ,104
,913 ,086 -,027 -,273 -,162
-,911 -,251 ,215 -,052 -,018
,907 ,091 -,039 -,269 -,186
-,889 -,214 ,280 -,002 -,004
,869 ,099 -,044 -,264 -,155
,758 ,068 ,277 ,179 ,138
,753 -,203 ,325 ,143 -,120
-,737 ,582 ,072 ,006 -,168
,628 ,371 ,495 ,310 ,149
,092 -,879 ,270 -,120 ,138
-,566 -,695 ,369 -,029 ,111
-,362 ,571 ,451 -,328 -,121
,180 ,499 ,574 -,126 ,465
,173 ,112 ,007 ,804 -,210
,064 ,187 -,474 ,015 ,767
Esperanza de vida
femenina
Mortalidad infantil
(muertes por 1000
nacimientos vivos)
Esperanza de vida
masculina
Alfabetización (%)
Tasa de natalidad (por 1.
000 habitantes)
Mujeres alfabetizadas (%)
Número promedio de
hijos
Hombres alfabetizados
(%)
Ingesta diaria de calorías
Habitantes en ciudades
(%)
Tasa de mortalidad (por
1.000 habitantes)
Producto interior bruto
per-capita
Tasa
Nacimientos/Defunciones
Aumento de la población
(% anual)
Casos de SIDA por 100.
000 habitantes
Casos de SIDA
Habitantes por Km2
Población x1000
1 2 3 4 5
Componente
Método de extracción: Análisis de componentes principales.
5 componentes extraídos
a.
Autor: Prof. Rubén J. Rodríguez
Estadística II
Licenciatura en Sociología
22
EJEMPLO DE APLICACIÓN DEL AF - MUNDO 95 109 Países X 18 Variables
Matriz de componentes rotados según el Método VARIMAX
,957 -,090 ,072 -,083 ,073
,955 -,106 ,053 -,077 ,086
-,932 -,177 -,117 -,119 -,006
,922 ,269 ,051 ,182 -,092
,914 -,108 ,062 -,083 ,060
,887 ,333 ,051 ,191 -,141
-,885 ,246 -,075 -,206 ,224
-,881 ,242 -,001 -,150 ,238
-,714 -,578 ,148 -,092 ,201
,694 ,304 ,197 ,303 ,208
,659 ,120 ,398 ,312 -,054
,090 ,919 -,117 -,118 ,090
-,574 ,750 -,057 -,136 ,196
,081 -,101 ,896 -,103 -,114
,481 -,073 ,686 ,432 ,030
-,327 -,409 ,509 -,336 ,371
,039 -,130 -,033 ,842 ,067
,003 -,112 ,071 -,086 -,909
Alfabetización (%)
Mujeres alfabetizadas (%)
Mortalidad infantil
(muertes por 1000
nacimientos vivos)
Esperanza de vida
femenina
Hombres alfabetizados
(%)
Esperanza de vida
masculina
Tasa de natalidad (por 1.
000 habitantes)
Número promedio de
hijos
Tasa de mortalidad (por
1.000 habitantes)
Habitantes en ciudades
(%)
Ingesta diaria de calorías
Tasa
Nacimientos/Defunciones
Aumento de la población
(% anual)
Casos de SIDA
Producto interior bruto
per-capita
Casos de SIDA por 100.
000 habitantes
Habitantes por Km2
Población x1000
1 2 3 4 5
Componente
Método de extracción: Análisis de componentes principales.
Método de rotación: Normalización Varimax con Kaiser.
La rotación ha convergido en 9 iteraciones.
a.
Obsérvese
que
16
de
los
18
indicadores
se
saturan
en
3
componentes.
El
FI
explica
11
indicadores,
el
FII
2,
y
el
FIII
3
indicador-es.
Los
FIV
y
FV
explican
1
indicador
cada
uno,
por
lo
que
significatividad
la
corre-lación
ítem-factor
es
nula,
de
este
modo
se
logra
mayor
reducción
de
la
dimensionalidad
de
la
variancia
total.
Autor: Prof. Rubén J. Rodríguez
Estadística II
Licenciatura en Sociología
23
EJEMPLO DE APLICACIÓN DEL AF - MUNDO 95 109 Países X 218 Variables
Gráfico de Saturaciones con el Método de Rotación Varimax
Autor: Prof. Rubén J. Rodríguez
Estadística II
Licenciatura en Sociología
24
EJEMPLO DE APLICACIÓN DEL AF - MUNDO 95 109 Países X 18 Variables
Gráfico de componentes en espacio rotado
El Gráfico de saturación visualiza la ubicación en el espacio tridimensional los
indicadores que están más saturados (más altos Coeficientes factoriales) en cada
uno de los 3 componentes. En la opción de Extracción no se restringió el número de factores a
extraer.
Autor: Prof. Rubén J. Rodríguez
Estadística II
Licenciatura en Sociología
25
EJEMPLO DE APLICACIÓN DEL AF - MUNDO 95 109 Países X 18 Variables
Gráfico de Saturaciones con el Método de Rotación Varimax
Autor: Prof. Rubén J. Rodríguez
Estadística II
Licenciatura en Sociología
26
EJEMPLO DE APLICACIÓN DEL AF - MUNDO 95 109 Países X 18 Variables
Gráfico de componentes en espacio rotado
El Gráfico de saturación visualiza la ubicación en el espacio bidimensional los indicado-
res que están más saturados (más altos Coeficientes factoriales) en cada uno de los 2
componentes. En la opción de Extracción se restringió a 2 (dos) el número de factores a
extraer. La cercanía o proximidad del indicador a uno de los ejes expresa que ese
indicador está explicado (está saturado) por el componente más próximo a él.
Autor: Prof. Rubén J. Rodríguez
Estadística II
Licenciatura en Sociología
27
ESCALA DE NACIONALISMO - MATRIZ FACTORIAL
COEFICIENTES FACTORIALES Fj (Cargas o Saturaciones Factoriales)
F1 F2 F3 F4 F5
Me gusta ser peruano 0,800
Estoy orgulloso de ser peruano 0,790
En general me agradan los peruanos 0,651
Prefiero ser peruano más que de cualquier otro país 0,620
Los peruanos no debemos mezclarnos con gente de otros países 0,811
En el Perú solamente debería vivir la gente que es peruana 0,808
Todos los peruanos deberían vivir en el Perú y no irse al extranjero 0,528
Se debe cerrar las fronteras a productos de afuera 0,478
No hay que confiar mucho en los países vecinos 0,702
Las empresas norteamericanas vienen y se llevan la plata 0,671
Todos los problemas del Perú surgen con la venida de los españoles durante la conquista 0,653
Las inversiones chilenas en el Perú son un peligro para el país 0,625
Siento que formo parte de una familia peruana 0,723
Siento que comparto un mismo pasado con todos los peruanos 0,682
Siento que tengo sangre chola 0,626
A pesar de que hay excepciones, está claro que los peruanos somos más capaces que los
habitantes de los países vecinos
0,766
Los peruanos son más valientes y patriotas que las personas de los países vecinos. 0,719
Los peruanos somos mejores que las personas de otros países 0,519
http://www.waporcolonia.com/presentaciones/chaparro-saravia.pps#792,28,Diapositiva%2028
http://www.waporcolonia.com/presentaciones/chaparro-saravia.pps#792,28,Diapositiva%2028
Autor: Prof. Rubén J. Rodríguez
Estadística II
Licenciatura en Sociología
28
ANIMOSIDAD (3.68 de promedio)
ENDOGAMIA (2.89 de promedio)
PERTENENCIA GRUPAL (4.01 de promedio)
ORGULLO (4.24 de promedio)
DENOMINACIÓN DE LAS DIMENSIONES FACTORIALES
Promedio en las Escalas Likert
SENTIMIENTO DE SUPERIORIDAD (3.42 de prom)
DIMENSIONES
INCLUYENTES
DIMENSIONES DE
CONFRONTACION
• De los 66 ítems iniciales se obtiene una escala de 18 ítems
• Las dimensiones que mejor explican los cambios en puntuaciones generales son la
Endogamia, la Animosidad y Superioridad. Es ahí donde hay mayor varianza.

Más contenido relacionado

Similar a Analisis_de_Componentes_Principales_y_Analisis_de_Factores_Comunes.pdf

Similar a Analisis_de_Componentes_Principales_y_Analisis_de_Factores_Comunes.pdf (20)

Mbe unidad 4. lectura comprensiva estadistica 13 octubre2016
Mbe unidad 4. lectura comprensiva estadistica 13 octubre2016Mbe unidad 4. lectura comprensiva estadistica 13 octubre2016
Mbe unidad 4. lectura comprensiva estadistica 13 octubre2016
 
Proyecto estadistica inferencial
Proyecto estadistica inferencialProyecto estadistica inferencial
Proyecto estadistica inferencial
 
Tecnologia
TecnologiaTecnologia
Tecnologia
 
Proyecto estadistica inferencial
Proyecto estadistica inferencialProyecto estadistica inferencial
Proyecto estadistica inferencial
 
Q1
Q1Q1
Q1
 
Tecnologia
TecnologiaTecnologia
Tecnologia
 
Estadistica
EstadisticaEstadistica
Estadistica
 
Metodos globales.final
Metodos globales.finalMetodos globales.final
Metodos globales.final
 
Proyecto estadistica inferencial
Proyecto estadistica inferencialProyecto estadistica inferencial
Proyecto estadistica inferencial
 
Análisis factorial SPSS
Análisis factorial SPSSAnálisis factorial SPSS
Análisis factorial SPSS
 
Estadistica introduccion
Estadistica introduccionEstadistica introduccion
Estadistica introduccion
 
Estadistica
EstadisticaEstadistica
Estadistica
 
Trabajo de estadistica
Trabajo de estadisticaTrabajo de estadistica
Trabajo de estadistica
 
Estadistica
EstadisticaEstadistica
Estadistica
 
Manual spss 6 to noche (reparado)
Manual spss 6 to noche (reparado)Manual spss 6 to noche (reparado)
Manual spss 6 to noche (reparado)
 
Fundamentos de estadistica
Fundamentos de estadisticaFundamentos de estadistica
Fundamentos de estadistica
 
Estadistica
EstadisticaEstadistica
Estadistica
 
Estadistica
EstadisticaEstadistica
Estadistica
 
Estadistica exposicion
Estadistica exposicionEstadistica exposicion
Estadistica exposicion
 
Estadistica trabajo
Estadistica trabajoEstadistica trabajo
Estadistica trabajo
 

Analisis_de_Componentes_Principales_y_Analisis_de_Factores_Comunes.pdf

  • 1. Autor: Prof. Rubén J. Rodríguez Estadística II Licenciatura en Sociología 1 Facultad de Psicología y Ciencias Sociales Licenciatura en Sociología ESTADÍSTICA II (Plan 2008) ANÁLISIS DE COMPONENTES PRINCIPALES y ANÁLISIS DE FACTORES COMUNES Prof. Titular Lic. Rubén José Rodríguez 16 de abril de 2012
  • 2. INTRODUCCIÓN Autor: Prof. Rubén J. Rodríguez Estadística II Licenciatura en Sociología 2 En las siguientes 28 diapositivas se expone sintéticamente la técnica multivariada genéricamente denominada Análisis Factorial que en realidad engloba dos tipos de procedimientos diferentes: Análisis de Componentes Principales (ACP) y Análisis de Factores Comunes (AFC), el primero reduce la variabilidad total, el segundo la variabilidad común. Se exponen los antecedentes del Análisis Factorial, los objetivos, y los pasos del AF: 1° Examen de la Matriz de Correlaciones, 2° Extracción de los Factores o de los Componentes, 3° Rotación de los factores o ejes, 4° Cálculo de las puntuaciones factoriales, y 5° Denominación e interpretación de los Factores o Ejes. Se presenta un primer ejemplo de AF mediante la visualización de un Diagrama de Análisis Causal, un segundo ejemplo desarrollado de ACP correspondiente a una matriz de correlaciones entre indicadores socio-económico-demográficos de 109 países del fichero MUNDO 95, y un tercer ejemplo de una matriz factorial correspondiente a 18 indicadores de nacionalismo mediante escalas tipo Likert y su reducción a dimensiones factoriales. Se brindan las definiciones y la ejemplificación (MUNDO 95) de diversos índices de incorrelación e intercorrelación de la matriz de correlaciones. Autor: Lic. Rubén José Rodríguez
  • 3. Autor: Prof. Rubén J. Rodríguez Estadística II Licenciatura en Sociología 3 ANTECEDENTES ANÁLISIS FACTORIAL (1) Charles Spearman (1863-1945): Psicólogo inglés. Fue oficial del ejercito británico en la India y a su vuelta, a los 40 años, influido por la lectura de Francis Galton, decidió realizar su tesis doctoral sobre la medición objetiva de la inteligencia. Propuso el primer modelo factorial, basado en un factor común (factor g), y un factor específico (factor s) (1901), conocida como Teoría bifactorialista de la inteligencia. Ocupo la primera Cátedra de Psicología en la University College en Londres. El Análisis Factorial (AF) engloba dos técnicas: Análisis de Componentes Principales (ACP) y Análisis de Factores Comunes (AFC).
  • 4. Autor: Prof. Rubén J. Rodríguez Estadística II Licenciatura en Sociología 4 ANTECEDENTES ANÁLISIS FACTORIAL (2) Karl Pearson (1857-1936): Científico inglés, discípulo de Francis Galton. Conocido por sus aplicaciones de la estadística a los problemas biológicos y psicológicos. Cofundador de la revista Biométrika (1902). Fue el que presentó la propuesta del Análisis de Componentes Principales (1901)(ACP) primer paso para el cálculo del Análisis Factorial. El ACP es una técnica descriptiva que intenta condensar la matriz de correlaciones entre las variables en unos componentes principales la variabilidad total que presentan los individuos en las pruebas o variables medidas. Harold Hottelling (1885- 1993) desarrolló el ACP y el Análisis de Correlaciones Canónicas.
  • 5. Autor: Prof. Rubén J. Rodríguez Estadística II Licenciatura en Sociología 5 OBJETIVOS DEL ANÁLISIS FACTORIAL (1) El objetivo del AF consiste en identificar un número de factores o componentes, inferior al número de variables observadas (F<V) mediante los cuales se pueda describir el fenómeno observado en forma simplificada. El AF es un método de reducción de la información, identificando los factores que son constructos no directamente observables (variables latentes). A partir de la matriz de datos original se calcula la matriz de correlaciones y el ACP/AFC convierte a ésta en una matriz factorial. “El AF es, en fin de cuentas, un estudio de los coeficientes de correlación” (Yela, Mariano (1957). La Técnica del Análisis Factorial. Madrid: Biblioteca Nueva, 1997, p. 32
  • 6. Autor: Prof. Rubén J. Rodríguez Estadística II Licenciatura en Sociología 6 OBJETIVO DEL ANÁLISIS FACTORIAL (2) El AF al ser un técnica descriptiva o de interdepen- dencia busca resumir, reducir o simplificar la informa- ción contenida en una matriz de datos con V variables. Reduce un gran número de variables empíricas a pocas variables fundamentales donde aquellas están altamente saturadas en éstas. E identifica un reducido número de factores o componentes F siendo F < V, de modo que expliquen un máximo de la variabilidad total (ACP), (Análisis de Componentes Principales) o bien, solamente la variabilidad común (AFC) (Análisis Factorial Común) (Hair, et al., 1999: 90 y 768). El AF debe cumplir los Principios de parsimonia e interpretabilidad.
  • 7. Autor: Prof. Rubén J. Rodríguez Estadística II Licenciatura en Sociología 7 OBJETIVO DEL ANÁLISIS FACTORIAL (3) El Análisis Factorial (AF) puede ser exploratorio o con- firmatorio. El Análisis Factorial Exploratorio (AFE) se caracteriza porque no se conocen a priori el número de factores y es en la aplicación empírica donde se de-termina este núme- ro. se usa para tratar de descubrir la estructura interna de un número relativamente grande de variables. La hipóte- sis a priori del investigador es que pueden existir una serie de factores asociados a grupos de variables. Las cargas o pesos (Coeficientes factoriales) de los distin- tos factores -con relación a los ítems donde estos se satu- ran- se utilizan para intuir la relación de éstos con las dis- tintas variables. Es el tipo de análisis factorial más común.
  • 8. Autor: Prof. Rubén J. Rodríguez Estadística II Licenciatura en Sociología 8 OBJETIVO DEL ANÁLISIS FACTORIAL (4) Por el contrario, en el Análisis Factorial Confirmatorio (AFC) los factores están fijados a priori, utilizándose contrastes de hipótesis para su corroboración. trata de determinar si el número de factores obtenidos y sus cargas se corresponden con los que cabría esperar a la luz de una teoría previa acerca de los datos. La hipótesis a priori es que existen unos determi- nados factores preestablecidos y que cada uno de ellos está asociado con un determinado subconjunto de las variable, arroja un nivel de confianza para poder aceptar o rechazar dicha hipótesis. El Análisis Factorial Confirmatorio es un caso particular del Modelo de Ecuaciones Estructurales (MES ó SEM). Éste utiliza los diagramas de flujos causales (Path Analysis). Desde su creación el AF fue de tipo exploratorio pero a partir de la década del 60 Karl Jöreskog y Dag Sörbon desarrollaron el AFC y el SEM y en el 70 el programa LISREL.
  • 9. Autor: Prof. Rubén J. Rodríguez Estadística II Licenciatura en Sociología 9 DIAGRAMA DE ANÁLISIS CAUSAL Índice de industrialización Periódicos semanales por hab. U$ por Hab de Ventas al Detalle U$ por Hab del Ventas al Por Mayor % de Mujeres > 14 años que trabajan % de Trabajadoras en agricultura Índice de Fomento del Nivel de Vida Índice de Salud Gastos en Ayudas a los Niños x Hab. Índice de Paro Laboral (Desocup.) Extensión de las Enferm. Mentales % de Viviendas Construidas reciént. Estabilidad de la Población Índice de Actividad Migratoria INDUSRI PERIODIC VENTASDE VENTASMA EMPLEOMU AGRICULT NIVELVID SALUD AYUDASNI PARO MENTALEN VIVIENDA ESTAPOBL MEGRACIO F 1 F 2 F 3 VARIABLES ORIGINALES COEFICIENTES FACTORIALES FACTORES EXTRAIDOS NOMBRE FACTOR LATENTE Actividad Económica Bienestar Social Estabilidad Social .913 .866 .840 .834 .082 -.657 .888 .791 -.755 -.625 -.475 .842 -.822 .777 Bisquerra Alzina, Rafael (1989). Introducción conceptual al Análisis Multivariable. Tomo I. Madrid: PPU-Promociones y Publicaciones Universitarias, 1989, p. 329.
  • 10. Autor: Prof. Rubén J. Rodríguez Estadística II Licenciatura en Sociología 10 PASOS DEL ANÁLISIS FACTORIAL(1) 1º Exámen de la Matriz de Correlaciones: El requisito es que las variables estén intercorrelacionadas. Los indicadores estadísticos para medir la significación del grado de correlación: Test de Esfericidad de Barlett, Índice de K-M-O de Kaiser, Meyer y Olkin, Coeficiente de Correlación Parcial y Múltiple, y Gráfico de Sedimentación. Si de estos indicadores estadísticos surge que las variables en la matriz de datos están incorrelaciona- das, por lo tanto no es posible aplicar el ACP o el AFC, pues, no hay variabilidad o variancia (total o común) que explicar para obtener un componente principal o factor común.
  • 11. Autor: Prof. Rubén J. Rodríguez Estadística II Licenciatura en Sociología 11 PASOS DEL ANÁLISIS FACTORIAL(2) 2º Extracción de los Factores o Componentes: Determinar un número reducido de factores que puedan representar a las variables originales. Uno de los métodos de extracción es de Componentes Principales (CP), que a su vez es una técnica estadística del AF: ACP. El método de CP analiza la variancia total y extrae la primera proporción de máxima varianza (primer CP) que explique los datos. El segundo CP extrae la mayor proporción de la varianza residual, y así suce sivamente. Los CP extraídos deben no estar correlacionados entre sí (ortogonales). Los posteriores CP explican cada vez menos de la variancia residual.
  • 12. Autor: Prof. Rubén J. Rodríguez Estadística II Licenciatura en Sociología 12 PASOS DEL ANÁLISIS FACTORIAL(3) 3º Rotación de Factores: Consiste en hacer rotar, girar los ejes factoriales hasta que se aproximen al máximo a las variables. La finalidad es obtener una representación gráfica fácilmente interpretable. 4º Cálculo de las Puntuaciones Factoriales: Una vez obtenidos los factores donde las variables tienen alta saturación se pueden calcular las puntuaciones que obtendrían los sujetos en esos factores. A partir de la matriz factorial rotada se calculan las puntua- ciones factoriales que se transforman en puntuacio es estandarizadas Zij y expresan al AF como una ecuación de regresión múltiple: 1 1 2 2 ... ij i i i i i j F FZ F Z FZ    
  • 13. Autor: Prof. Rubén J. Rodríguez Estadística II Licenciatura en Sociología 13 TEST DE ESFERICIDAD DE BARLETT El test pone a prueba la H0 mediante X2 que dice que la matriz de correlaciones empírica R es igual a la matriz identidad I (cuya diagonal principal son unos y el resto de los coeficientes son 0): H0 : │R│= 1 (Hay incorrelación) H1 : │R│ 1 (Hay correlación) Si se confirma la H0 significa que las variables no están intercorrelacionadas, por lo tanto la nube de puntos en el espacio formaría una esfera (esfericidad). 
  • 14. Autor: Prof. Rubén J. Rodríguez Estadística II Licenciatura en Sociología 14 ÍNDICE KMO de KAISER, MEYER y OLKIN ij r . ij z r . ij z r Este índice compara las magnitudes de los coeficientes de correlación observados rij con los coeficientes de correlación parcial . El índice KMO varía entre 0,0 a 1,0. Si el índice tiende a 1,0 señala la existencia de intercorrelación entre las variables. Valores de KMO inferiores a 0,50 suponen, por el con trario, la no adecuación del AF, al haber poca correlación. Su fórmula es: 2 1 1 2 2 . 1 1 1 1 N N ij i j N N N N ij ij z i j i i r KMO r r           
  • 15. Autor: Prof. Rubén J. Rodríguez Estadística II Licenciatura en Sociología 15 EJEMPLO DE APLICACIÓN DEL AF - MUNDO 95 109 Países X 18 Variables Pérez, César (2004). Técnicas de análisis multivariante de datos con SPSS, Madrid: Pearson, 2004, pp. 195-203. Nota: César Pérez (2004) ejemplifica el AF con 9 indicadores, además, utiliza el Método de Rotación Oblimin, mientra que en nuestra ejemplificación utilizamos el Método Varimax, por lo que sus resultado divergen de los mostrados en la presentación de la unidad temática. (RJR) Estadísticos descriptivos 68831,14 195296,366 59 159,869 581,7396 59 49,76 25,186 59 65,83 11,078 59 61,34 9,932 59 69,58 22,326 59 2,214 ,9604 59 57,729 36,9310 59 3107,93 4789,315 59 2588,81 516,132 59 12800,08 54071,331 59 31,492 11,1144 59 9,89 4,977 59 34,9374 61,31802 59 3,7760 2,08576 59 4,303 1,8497 59 75,36 19,793 59 62,12 27,017 59 Población x1000 Habitantes por Km2 Habitantes en ciudades (%) Esperanza de vida femenina Esperanza de vida masculina Alfabetización (%) Aumento de la población (% anual) Mortalidad infantil (muertes por 1000 nacimientos vivos) Producto interior bruto per-capita Ingesta diaria de calorías Casos de SIDA Tasa de natalidad (por 1. 000 habitantes) Tasa de mortalidad (por 1.000 habitantes) Casos de SIDA por 100. 000 habitantes Tasa Nacimientos/Defunciones Número promedio de hijos Hombres alfabetizados (%) Mujeres alfabetizadas (%) Media Desviación típica N del análisis
  • 16. Autor: Prof. Rubén J. Rodríguez Estadística II Licenciatura en Sociología 16 EJEMPLO DE APLICACIÓN DEL AF - MUNDO 95 109 Países X 18 Variables Matriz de Correlaciones Matriz de correlacionesa 1,000 ,001 -,172 ,008 ,056 ,013 -,210 ,011 -,030 ,018 ,119 -,181 -,081 -,095 -,124 -,195 ,056 -,005 ,001 1,000 ,181 ,112 ,117 ,074 -,158 -,143 ,295 ,110 -,047 -,179 -,073 -,079 -,094 -,166 ,091 ,077 -,172 ,181 1,000 ,741 ,717 ,614 -,192 -,705 ,558 ,674 ,103 -,566 -,592 -,284 ,261 -,533 ,595 ,634 ,008 ,112 ,741 1,000 ,987 ,827 -,392 -,951 ,547 ,716 ,091 -,817 -,845 -,499 ,270 -,790 ,754 ,815 ,056 ,117 ,717 ,987 1,000 ,785 -,325 -,931 ,529 ,711 ,075 -,773 -,866 -,521 ,318 -,747 ,727 ,773 ,013 ,074 ,614 ,827 ,785 1,000 -,567 -,891 ,469 ,575 ,154 -,822 -,616 -,127 ,043 -,814 ,939 ,963 -,210 -,158 -,192 -,392 -,325 -,567 1,000 ,420 -,422 -,393 -,191 ,776 ,017 ,012 ,692 ,755 -,542 -,580 ,011 -,143 -,705 -,951 -,931 -,891 ,420 1,000 -,563 -,701 -,134 ,809 ,764 ,302 -,231 ,784 -,805 -,856 -,030 ,295 ,558 ,547 ,529 ,469 -,422 -,563 1,000 ,703 ,561 -,591 -,218 ,050 -,170 -,495 ,439 ,458 ,018 ,110 ,674 ,716 ,711 ,575 -,393 -,701 ,703 1,000 ,256 -,658 -,441 -,229 ,040 -,581 ,576 ,548 ,119 -,047 ,103 ,091 ,075 ,154 -,191 -,134 ,561 ,256 1,000 -,169 ,064 ,391 -,191 -,135 ,144 ,164 -,181 -,179 -,566 -,817 -,773 -,822 ,776 ,809 -,591 -,658 -,169 1,000 ,543 ,310 ,188 ,968 -,756 -,811 -,081 -,073 -,592 -,845 -,866 -,616 ,017 ,764 -,218 -,441 ,064 ,543 1,000 ,626 -,573 ,566 -,551 -,589 -,095 -,079 -,284 -,499 -,521 -,127 ,012 ,302 ,050 -,229 ,391 ,310 ,626 1,000 -,302 ,322 -,146 -,166 -,124 -,094 ,261 ,270 ,318 ,043 ,692 -,231 -,170 ,040 -,191 ,188 -,573 -,302 1,000 ,152 ,029 ,032 -,195 -,166 -,533 -,790 -,747 -,814 ,755 ,784 -,495 -,581 -,135 ,968 ,566 ,322 ,152 1,000 -,759 -,819 ,056 ,091 ,595 ,754 ,727 ,939 -,542 -,805 ,439 ,576 ,144 -,756 -,551 -,146 ,029 -,759 1,000 ,960 -,005 ,077 ,634 ,815 ,773 ,963 -,580 -,856 ,458 ,548 ,164 -,811 -,589 -,166 ,032 -,819 ,960 1,000 498 096 475 337 461 055 467 412 447 184 086 271 236 175 070 338 484 Población x1000 Habitantes por Km2 Habitantes en ciudades (%) Esperanza de vida femenina Esperanza de vida masculina Alfabetización (%) Aumento de la población (% anual) Mortalidad infantil (muertes por 1000 nacimientos vivos) Producto interior bruto per-capita Ingesta diaria de calorías Casos de SIDA Tasa de natalidad (por 1. 000 habitantes) Tasa de mortalidad (por 1.000 habitantes) Casos de SIDA por 100. 000 habitantes Tasa Nacimientos/Defunciones Número promedio de hijos Hombres alfabetizados (%) Mujeres alfabetizadas (%) P bl ió 1000 Correlación Si (U il t l) Población x1000 Habitantes por Km2 Habitantes en ciudades (%) Esperanza de vida femenina Esperanza de vida masculina Alfabetización (%) Aumento de la población (% anual) Mortalidad infantil (muertes por 1000 nacimientos vivos) Producto interior bruto per-capita Ingesta diaria de calorías Casos de SIDA Tasa de natalidad (por 1.000 habitantes) Tasa de mortalidad (por 1.000 habitantes) Casos de SIDA por 100.000 habitantes Tasa Nacimientos/ Defunciones Número promedio de hijos Hombres alfabetizados (%) Mujeres alfabetizadas (%)
  • 17. Autor: Prof. Rubén J. Rodríguez Estadística II Licenciatura en Sociología 17 EJEMPLO DE APLICACIÓN DEL AF - MUNDO 95 109 Países X 18 Variables Pruebas de ajuste del Análisis Factorial ÍNDICE KMO: 0,834  Alta intercorrelación entre los indicadores TEST DE ESFERICIDAD DE BARLETT: X2 = 1545,023 Sig. 0,000 Rechazo de H0  Hay intercorrelación entre las variables KMO y prueba de Bartlett ,834 1545,023 153 ,000 Medida de adecuación muestral de Kaiser-Meyer-Olkin. Chi-cuadrado aproximado gl Sig. Prueba de esfericidad de Bartlett
  • 18. Autor: Prof. Rubén J. Rodríguez Estadística II Licenciatura en Sociología 18 EJEMPLO DE APLICACIÓN DEL AF - MUNDO 95 109 Países X 18 Variables Comunalidades Los Componentes extraídos varían entre 0,706 y 0,967 indicando una alta comunalidad (h2). Estas indican la proporción de varianza explicada por todos los factores (resultan- tes de la extracción). La comunalidad de cada variable es igual a la suma de cuadrados de los coeficiente factoriales de cada variable. La comunalidad es la cantidad de varian- za que una variable comparte con las demás variables consideradas 2 2 2 2 2 1 2 ... k j j kj kj h F F F F       1,000 ,852 1,000 ,732 1,000 ,748 1,000 ,967 1,000 ,956 1,000 ,942 1,000 ,952 1,000 ,927 1,000 ,896 1,000 ,706 1,000 ,843 1,000 ,942 1,000 ,915 1,000 ,783 1,000 ,888 1,000 ,914 1,000 ,861 1,000 ,939 Población x1000 Habitantes por Km2 Habitantes en ciudades (%) Esperanza de vida femenina Esperanza de vida masculina Alfabetización (%) Aumento de la población (% anual) Mortalidad infantil (muertes por 1000 nacimientos vivos) Producto interior bruto per-capita Ingesta diaria de calorías Casos de SIDA Tasa de natalidad (por 1.000 habitantes) Tasa de mortalidad (por 1.000 habitantes) Casos de SIDA por 100.000 habitantes Tasa Nacimientos/Defunciones Número promedio de hijos Hombres alfabetizados (%) Mujeres alfabetizadas (%) Inicial Extracción Método de extracción: Análisis de Componentes principales.
  • 19. Autor: Prof. Rubén J. Rodríguez Estadística II Licenciatura en Sociología 19 EJEMPLO DE APLICACIÓN DEL AF - MUNDO 95 109 Países X 18 Variables Varianza total explicada Los Autovalores o Eigenvalores (Valores propios: Lmbda) son el cuadrado del Coeficiente Factorial (cargas, pesos o saturaciones factoriales) e indican la proporción de la variancia total de una variable explicada por ese factor. Se convierte en el % explicado por el Factor I, II, etc., dividiendo el Autovalor por el nº de variables y multiplicado por 100, por ejemplo para el FI = [(8,836 / 18) * 100] = 49,091. Se observa que el FI explica el 49,09% de la variancia total, el FII el 13,46% y FIII el 10,06%. Los tres primeros factores explican el 72.62% de la variancia total, pues sus Autovalores son > que 1 (1,811 a 8,836). No se toman en cuenta los FIV y FV que si bien son > que 1 agregan poca variancia explicada residual. I  p 9,312 51,735 51,735 9,312 51,735 51,735 8,836 49,09 49,091 2,681 14,894 66,629 2,681 14,894 66,629 2,424 13,46 62,556 1,534 8,520 75,149 1,534 8,520 75,149 1,811 10,06 72,618 1,159 6,437 81,586 1,159 6,437 81,586 1,425 7,915 80,534 1,077 5,986 87,571 1,077 5,986 87,571 1,267 7,038 87,571 ,758 4,211 91,783 ,442 2,458 94,241 ,291 1,614 95,855 ,232 1,288 97,143 ,167 ,928 98,071 ,136 ,756 98,827 ,072 ,402 99,229 ,040 ,224 99,453 ,036 ,202 99,656 ,025 ,140 99,796 ,018 ,101 99,897 ,014 ,077 99,974 ,005 ,026 100,000 Componente 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 Total % de la varianza % acumulado Total % de la varianza % acumulado Total % de la varianza % acumulado Autovalores iniciales Sumas de las saturaciones al cuadrado de la extracción Suma de las saturaciones al cuadrado de la rotación Método de extracción: Análisis de Componentes principales.
  • 20. Autor: Prof. Rubén J. Rodríguez Estadística II Licenciatura en Sociología 20 EJEMPLO DE APLICACIÓN DEL AF - MUNDO 95 109 Países X 18 Variables Gráfico de sedimentación I  Los Autovalores iniciales mayores a 1 son los 5 primeros componentes (1,077 a 9,312) y que acumulan el 88% de la explicación de la variancia total. El punto de inflexión de la curva indica el número mínimo de factores estadísticamente significativos. Por razones de economía explicativa se toman los 3 primeros factores que explican el 73% de variancia explicada total acumulada.
  • 21. Autor: Prof. Rubén J. Rodríguez Estadística II Licenciatura en Sociología 21 EJEMPLO DE APLICACIÓN DEL AF - MUNDO 95 109 Países X 18 Variables Matriz de componentes sin rotar ,956 -,227 ,015 ,019 ,042 -,949 ,123 -,080 ,060 ,030 ,930 -,280 ,015 ,040 ,104 ,913 ,086 -,027 -,273 -,162 -,911 -,251 ,215 -,052 -,018 ,907 ,091 -,039 -,269 -,186 -,889 -,214 ,280 -,002 -,004 ,869 ,099 -,044 -,264 -,155 ,758 ,068 ,277 ,179 ,138 ,753 -,203 ,325 ,143 -,120 -,737 ,582 ,072 ,006 -,168 ,628 ,371 ,495 ,310 ,149 ,092 -,879 ,270 -,120 ,138 -,566 -,695 ,369 -,029 ,111 -,362 ,571 ,451 -,328 -,121 ,180 ,499 ,574 -,126 ,465 ,173 ,112 ,007 ,804 -,210 ,064 ,187 -,474 ,015 ,767 Esperanza de vida femenina Mortalidad infantil (muertes por 1000 nacimientos vivos) Esperanza de vida masculina Alfabetización (%) Tasa de natalidad (por 1. 000 habitantes) Mujeres alfabetizadas (%) Número promedio de hijos Hombres alfabetizados (%) Ingesta diaria de calorías Habitantes en ciudades (%) Tasa de mortalidad (por 1.000 habitantes) Producto interior bruto per-capita Tasa Nacimientos/Defunciones Aumento de la población (% anual) Casos de SIDA por 100. 000 habitantes Casos de SIDA Habitantes por Km2 Población x1000 1 2 3 4 5 Componente Método de extracción: Análisis de componentes principales. 5 componentes extraídos a.
  • 22. Autor: Prof. Rubén J. Rodríguez Estadística II Licenciatura en Sociología 22 EJEMPLO DE APLICACIÓN DEL AF - MUNDO 95 109 Países X 18 Variables Matriz de componentes rotados según el Método VARIMAX ,957 -,090 ,072 -,083 ,073 ,955 -,106 ,053 -,077 ,086 -,932 -,177 -,117 -,119 -,006 ,922 ,269 ,051 ,182 -,092 ,914 -,108 ,062 -,083 ,060 ,887 ,333 ,051 ,191 -,141 -,885 ,246 -,075 -,206 ,224 -,881 ,242 -,001 -,150 ,238 -,714 -,578 ,148 -,092 ,201 ,694 ,304 ,197 ,303 ,208 ,659 ,120 ,398 ,312 -,054 ,090 ,919 -,117 -,118 ,090 -,574 ,750 -,057 -,136 ,196 ,081 -,101 ,896 -,103 -,114 ,481 -,073 ,686 ,432 ,030 -,327 -,409 ,509 -,336 ,371 ,039 -,130 -,033 ,842 ,067 ,003 -,112 ,071 -,086 -,909 Alfabetización (%) Mujeres alfabetizadas (%) Mortalidad infantil (muertes por 1000 nacimientos vivos) Esperanza de vida femenina Hombres alfabetizados (%) Esperanza de vida masculina Tasa de natalidad (por 1. 000 habitantes) Número promedio de hijos Tasa de mortalidad (por 1.000 habitantes) Habitantes en ciudades (%) Ingesta diaria de calorías Tasa Nacimientos/Defunciones Aumento de la población (% anual) Casos de SIDA Producto interior bruto per-capita Casos de SIDA por 100. 000 habitantes Habitantes por Km2 Población x1000 1 2 3 4 5 Componente Método de extracción: Análisis de componentes principales. Método de rotación: Normalización Varimax con Kaiser. La rotación ha convergido en 9 iteraciones. a. Obsérvese que 16 de los 18 indicadores se saturan en 3 componentes. El FI explica 11 indicadores, el FII 2, y el FIII 3 indicador-es. Los FIV y FV explican 1 indicador cada uno, por lo que significatividad la corre-lación ítem-factor es nula, de este modo se logra mayor reducción de la dimensionalidad de la variancia total.
  • 23. Autor: Prof. Rubén J. Rodríguez Estadística II Licenciatura en Sociología 23 EJEMPLO DE APLICACIÓN DEL AF - MUNDO 95 109 Países X 218 Variables Gráfico de Saturaciones con el Método de Rotación Varimax
  • 24. Autor: Prof. Rubén J. Rodríguez Estadística II Licenciatura en Sociología 24 EJEMPLO DE APLICACIÓN DEL AF - MUNDO 95 109 Países X 18 Variables Gráfico de componentes en espacio rotado El Gráfico de saturación visualiza la ubicación en el espacio tridimensional los indicadores que están más saturados (más altos Coeficientes factoriales) en cada uno de los 3 componentes. En la opción de Extracción no se restringió el número de factores a extraer.
  • 25. Autor: Prof. Rubén J. Rodríguez Estadística II Licenciatura en Sociología 25 EJEMPLO DE APLICACIÓN DEL AF - MUNDO 95 109 Países X 18 Variables Gráfico de Saturaciones con el Método de Rotación Varimax
  • 26. Autor: Prof. Rubén J. Rodríguez Estadística II Licenciatura en Sociología 26 EJEMPLO DE APLICACIÓN DEL AF - MUNDO 95 109 Países X 18 Variables Gráfico de componentes en espacio rotado El Gráfico de saturación visualiza la ubicación en el espacio bidimensional los indicado- res que están más saturados (más altos Coeficientes factoriales) en cada uno de los 2 componentes. En la opción de Extracción se restringió a 2 (dos) el número de factores a extraer. La cercanía o proximidad del indicador a uno de los ejes expresa que ese indicador está explicado (está saturado) por el componente más próximo a él.
  • 27. Autor: Prof. Rubén J. Rodríguez Estadística II Licenciatura en Sociología 27 ESCALA DE NACIONALISMO - MATRIZ FACTORIAL COEFICIENTES FACTORIALES Fj (Cargas o Saturaciones Factoriales) F1 F2 F3 F4 F5 Me gusta ser peruano 0,800 Estoy orgulloso de ser peruano 0,790 En general me agradan los peruanos 0,651 Prefiero ser peruano más que de cualquier otro país 0,620 Los peruanos no debemos mezclarnos con gente de otros países 0,811 En el Perú solamente debería vivir la gente que es peruana 0,808 Todos los peruanos deberían vivir en el Perú y no irse al extranjero 0,528 Se debe cerrar las fronteras a productos de afuera 0,478 No hay que confiar mucho en los países vecinos 0,702 Las empresas norteamericanas vienen y se llevan la plata 0,671 Todos los problemas del Perú surgen con la venida de los españoles durante la conquista 0,653 Las inversiones chilenas en el Perú son un peligro para el país 0,625 Siento que formo parte de una familia peruana 0,723 Siento que comparto un mismo pasado con todos los peruanos 0,682 Siento que tengo sangre chola 0,626 A pesar de que hay excepciones, está claro que los peruanos somos más capaces que los habitantes de los países vecinos 0,766 Los peruanos son más valientes y patriotas que las personas de los países vecinos. 0,719 Los peruanos somos mejores que las personas de otros países 0,519 http://www.waporcolonia.com/presentaciones/chaparro-saravia.pps#792,28,Diapositiva%2028 http://www.waporcolonia.com/presentaciones/chaparro-saravia.pps#792,28,Diapositiva%2028
  • 28. Autor: Prof. Rubén J. Rodríguez Estadística II Licenciatura en Sociología 28 ANIMOSIDAD (3.68 de promedio) ENDOGAMIA (2.89 de promedio) PERTENENCIA GRUPAL (4.01 de promedio) ORGULLO (4.24 de promedio) DENOMINACIÓN DE LAS DIMENSIONES FACTORIALES Promedio en las Escalas Likert SENTIMIENTO DE SUPERIORIDAD (3.42 de prom) DIMENSIONES INCLUYENTES DIMENSIONES DE CONFRONTACION • De los 66 ítems iniciales se obtiene una escala de 18 ítems • Las dimensiones que mejor explican los cambios en puntuaciones generales son la Endogamia, la Animosidad y Superioridad. Es ahí donde hay mayor varianza.