Se presenta el análisis de correspondencias múltiples, método de reducción de la dimensión en presencia de datos cualitativos. Se puede incluir entre los temas de aprendizaje no supervisado.
1. Análisis de
Correspondencias
Múltiples
Javier Trejos
Introducción
Tablas de datos
Objetivos del ACM
Nubes de perfiles
Ejes y coordenadas
factoriales
Interpretaciones en
A.C.M.
Ejemplos
Análisis de Correspondencias Múltiples
Javier Trejos
Escuela de Matemática – CIMPA
Universidad de Costa Rica
September 17, 2020
2. Análisis de
Correspondencias
Múltiples
Javier Trejos
Introducción
Tablas de datos
Objetivos del ACM
Nubes de perfiles
Ejes y coordenadas
factoriales
Interpretaciones en
A.C.M.
Ejemplos
Esquema
Introducción
Tablas de datos
Objetivos del ACM
Nubes de perfiles
Ejes y coordenadas factoriales
Interpretaciones en A.C.M.
Ejemplos
3. Análisis de
Correspondencias
Múltiples
Javier Trejos
Introducción
Tablas de datos
Objetivos del ACM
Nubes de perfiles
Ejes y coordenadas
factoriales
Interpretaciones en
A.C.M.
Ejemplos
Análisis de Correspondencias Múltiples
Introducción
◮ Generalización del Análisis Factorial de
Correspondencias Simples (AFC) al caso de más de 2
variables cualitativas
◮ Propuesto por Ludovic Lebart (1974)
◮ Es básicamente un AFC de:
◮ La tabla disyuntiva completa
◮ La tabla de Burt
◮ Es un análisis bien adaptado al caso de análisis de
cuestionarios con varias preguntas asociadas a
variables cualitativas
4. Análisis de
Correspondencias
Múltiples
Javier Trejos
Introducción
Tablas de datos
Objetivos del ACM
Nubes de perfiles
Ejes y coordenadas
factoriales
Interpretaciones en
A.C.M.
Ejemplos
Las tablas del ACM
Tabla de datos codificada
◮ Generalmente, los nombres de las variables se abrevian y
éstas se codifican
◮ La tabla 1 contiene 3 variables cualitativas
ind sexo edad ingreso
1 f 4 medio
2 f 3 alto
3 m 4 bajo
4 f 1 bajo
5 m 2 medio
6 m 1 alto
7 f 2 medio
8 m 3 bajo
9 m 1 alto
10 f 4 medio
Tabla: Tres variables cualitativas observadas en 10 individuos.
5. Análisis de
Correspondencias
Múltiples
Javier Trejos
Introducción
Tablas de datos
Objetivos del ACM
Nubes de perfiles
Ejes y coordenadas
factoriales
Interpretaciones en
A.C.M.
Ejemplos
Las tablas del ACM
Tabla con código disyuntivo completo
Cada variable tiene asociadas tantas columnas como
modalidades posea, codificadas de forma binaria.
ind
Sexo Edad Ingreso
f m 1 2 3 4 bajo medio alto
1 1 0 0 0 0 1 0 1 0
2 1 0 0 0 1 0 0 0 1
3 0 1 0 0 0 1 1 0 0
4 1 0 1 0 0 0 1 0 0
5 0 1 0 1 0 0 0 1 0
6 0 1 1 0 0 0 0 0 1
7 1 0 0 1 0 0 0 1 0
8 0 1 0 0 1 0 1 0 0
9 0 1 1 0 0 0 0 0 1
10 1 0 0 0 0 1 0 1 0
x·j 6 4 2 3 3 2 3 4 3
Tabla: Código disyuntivo completo de los datos de la Tabla 1.
6. Análisis de
Correspondencias
Múltiples
Javier Trejos
Introducción
Tablas de datos
Objetivos del ACM
Nubes de perfiles
Ejes y coordenadas
factoriales
Interpretaciones en
A.C.M.
Ejemplos
Las Tablas del ACM
Tabla con código disyuntivo completo
◮ La Tabla 2 tiene la estructura
X = [X1 X2 X3]10×9, donde las matrices X1, X2 y X3
tienen como columnas las indicatrices de las variables
sexo, edad e ingreso respectivamente.
7. Análisis de
Correspondencias
Múltiples
Javier Trejos
Introducción
Tablas de datos
Objetivos del ACM
Nubes de perfiles
Ejes y coordenadas
factoriales
Interpretaciones en
A.C.M.
Ejemplos
Las Tablas del ACM
Tabla con código disyuntivo completo
◮ La Tabla 2 tiene la estructura
X = [X1 X2 X3]10×9, donde las matrices X1, X2 y X3
tienen como columnas las indicatrices de las variables
sexo, edad e ingreso respectivamente.
◮ En general si se tienen p variables cualitativas
x1, . . . , xp y n individuos, la matriz X asume la forma
X = [X1 . . . Xp]n×m donde Xl es la matriz n × ml con
las indicatrices de la variable xl como columnas; y
m = m1 + · · · + mp es el número total de indicatrices
(modalidades).
8. Análisis de
Correspondencias
Múltiples
Javier Trejos
Introducción
Tablas de datos
Objetivos del ACM
Nubes de perfiles
Ejes y coordenadas
factoriales
Interpretaciones en
A.C.M.
Ejemplos
Las Tablas del ACM
Tabla con código disyuntivo completo
◮ La Tabla 2 tiene la estructura
X = [X1 X2 X3]10×9, donde las matrices X1, X2 y X3
tienen como columnas las indicatrices de las variables
sexo, edad e ingreso respectivamente.
◮ En general si se tienen p variables cualitativas
x1, . . . , xp y n individuos, la matriz X asume la forma
X = [X1 . . . Xp]n×m donde Xl es la matriz n × ml con
las indicatrices de la variable xl como columnas; y
m = m1 + · · · + mp es el número total de indicatrices
(modalidades).
◮ La casilla i, j de la matriz X se denota con xij.
9. Análisis de
Correspondencias
Múltiples
Javier Trejos
Introducción
Tablas de datos
Objetivos del ACM
Nubes de perfiles
Ejes y coordenadas
factoriales
Interpretaciones en
A.C.M.
Ejemplos
Las Tablas del ACM
Tabla con código disyuntivo completo
◮ La Tabla 2 tiene la estructura
X = [X1 X2 X3]10×9, donde las matrices X1, X2 y X3
tienen como columnas las indicatrices de las variables
sexo, edad e ingreso respectivamente.
◮ En general si se tienen p variables cualitativas
x1, . . . , xp y n individuos, la matriz X asume la forma
X = [X1 . . . Xp]n×m donde Xl es la matriz n × ml con
las indicatrices de la variable xl como columnas; y
m = m1 + · · · + mp es el número total de indicatrices
(modalidades).
◮ La casilla i, j de la matriz X se denota con xij.
◮ Puede notarse que la matriz Xt
lXs es la tabla de
contingencia asociada a las variables cualitativas xl y
xs.
11. Análisis de
Correspondencias
Múltiples
Javier Trejos
Introducción
Tablas de datos
Objetivos del ACM
Nubes de perfiles
Ejes y coordenadas
factoriales
Interpretaciones en
A.C.M.
Ejemplos
Las tablas del ACM
Márgenes de X
◮ Sea xi·(l) el total de la fila i de la matriz Xl. Es claro
que xi·(l) = 1 para todo i, l.
◮ En consecuencia los márgenes de fila xi· de X se
escriben como la suma de los márgenes de fila xi·(l):
xi· =
Pp
l=1 xi·(l) = p.
12. Análisis de
Correspondencias
Múltiples
Javier Trejos
Introducción
Tablas de datos
Objetivos del ACM
Nubes de perfiles
Ejes y coordenadas
factoriales
Interpretaciones en
A.C.M.
Ejemplos
Las tablas del ACM
Márgenes de X
◮ Sea xi·(l) el total de la fila i de la matriz Xl. Es claro
que xi·(l) = 1 para todo i, l.
◮ En consecuencia los márgenes de fila xi· de X se
escriben como la suma de los márgenes de fila xi·(l):
xi· =
Pp
l=1 xi·(l) = p.
◮ Los márgenes de columna de X, notados x·j
representan la cantidad de individuos que poseen la
modalidad j. Esto es, x·j =
Pn
i=1 xij.
13. Análisis de
Correspondencias
Múltiples
Javier Trejos
Introducción
Tablas de datos
Objetivos del ACM
Nubes de perfiles
Ejes y coordenadas
factoriales
Interpretaciones en
A.C.M.
Ejemplos
Las tablas del ACM
Márgenes de X
◮ Sea xi·(l) el total de la fila i de la matriz Xl. Es claro
que xi·(l) = 1 para todo i, l.
◮ En consecuencia los márgenes de fila xi· de X se
escriben como la suma de los márgenes de fila xi·(l):
xi· =
Pp
l=1 xi·(l) = p.
◮ Los márgenes de columna de X, notados x·j
representan la cantidad de individuos que poseen la
modalidad j. Esto es, x·j =
Pn
i=1 xij.
◮ En la Tabla 2, se ve que el margen de cada lı́nea es 3,
igual al número de variables. Del lado de las columnas,
se ve que para la variable sexo, por ejemplo, x·1 = 6
que es el número de personas del sexo femenino. Para
la variable ingreso, x·8 = 5 que es el número de
personas con ingresos de la clase medio.
14. Análisis de
Correspondencias
Múltiples
Javier Trejos
Introducción
Tablas de datos
Objetivos del ACM
Nubes de perfiles
Ejes y coordenadas
factoriales
Interpretaciones en
A.C.M.
Ejemplos
Análisis de Correspondencias Múltiples
Objetivos de un ACM
◮ Los objetivos principales del A.C.M. se refieren a la
búsqueda de proximidades y disimilitudes entre
individuos y entre modalidades de las variables.
15. Análisis de
Correspondencias
Múltiples
Javier Trejos
Introducción
Tablas de datos
Objetivos del ACM
Nubes de perfiles
Ejes y coordenadas
factoriales
Interpretaciones en
A.C.M.
Ejemplos
Análisis de Correspondencias Múltiples
Objetivos de un ACM
◮ Los objetivos principales del A.C.M. se refieren a la
búsqueda de proximidades y disimilitudes entre
individuos y entre modalidades de las variables.
◮ Individuos: se representan en plano óptimos que
reflejen las distancias entre ellos.
16. Análisis de
Correspondencias
Múltiples
Javier Trejos
Introducción
Tablas de datos
Objetivos del ACM
Nubes de perfiles
Ejes y coordenadas
factoriales
Interpretaciones en
A.C.M.
Ejemplos
Análisis de Correspondencias Múltiples
Objetivos de un ACM
◮ Los objetivos principales del A.C.M. se refieren a la
búsqueda de proximidades y disimilitudes entre
individuos y entre modalidades de las variables.
◮ Individuos: se representan en plano óptimos que
reflejen las distancias entre ellos.
◮ Modalidades: se encuentran planos que muestran
similitudes entre las modalidades según su
comportamiento en la tabla.
17. Análisis de
Correspondencias
Múltiples
Javier Trejos
Introducción
Tablas de datos
Objetivos del ACM
Nubes de perfiles
Ejes y coordenadas
factoriales
Interpretaciones en
A.C.M.
Ejemplos
Análisis de Correspondencias Múltiples
Objetivos de un ACM
◮ Los objetivos principales del A.C.M. se refieren a la
búsqueda de proximidades y disimilitudes entre
individuos y entre modalidades de las variables.
◮ Individuos: se representan en plano óptimos que
reflejen las distancias entre ellos.
◮ Modalidades: se encuentran planos que muestran
similitudes entre las modalidades según su
comportamiento en la tabla.
◮ La representación simultánea de individuos y
modalidades puede ayudar a identificar relaciones entre
estas dos clases de objetos.
18. Análisis de
Correspondencias
Múltiples
Javier Trejos
Introducción
Tablas de datos
Objetivos del ACM
Nubes de perfiles
Ejes y coordenadas
factoriales
Interpretaciones en
A.C.M.
Ejemplos
Análisis de Correspondencias Múltiples
Objetivos de un ACM
◮ Los objetivos principales del A.C.M. se refieren a la
búsqueda de proximidades y disimilitudes entre
individuos y entre modalidades de las variables.
◮ Individuos: se representan en plano óptimos que
reflejen las distancias entre ellos.
◮ Modalidades: se encuentran planos que muestran
similitudes entre las modalidades según su
comportamiento en la tabla.
◮ La representación simultánea de individuos y
modalidades puede ayudar a identificar relaciones entre
estas dos clases de objetos.
◮ ACM y otros métodos: se puede usar para bajar la
dimensión de una tabla muy grande con variables
cualitativas, o para cuantificar las variables cualitativas
y usar las primeras r componentes principales en un
método con variables cuantitativas.
21. Análisis de
Correspondencias
Múltiples
Javier Trejos
Introducción
Tablas de datos
Objetivos del ACM
Nubes de perfiles
Ejes y coordenadas
factoriales
Interpretaciones en
A.C.M.
Ejemplos
Perfiles y Distancias en ACM
Perfiles-fila y distancia
◮ El total de cualquier fila de la tabla X es p.
◮ El perfil-fila de un individuo i es:
pfi = (
xi1
p
, . . . ,
xim
p
)
y su peso es
pi =
xi·
x··
=
p
np
=
1
n
22. Análisis de
Correspondencias
Múltiples
Javier Trejos
Introducción
Tablas de datos
Objetivos del ACM
Nubes de perfiles
Ejes y coordenadas
factoriales
Interpretaciones en
A.C.M.
Ejemplos
Perfiles y Distancias en ACM
Perfiles-fila y distancia
◮ El total de cualquier fila de la tabla X es p.
◮ El perfil-fila de un individuo i es:
pfi = (
xi1
p
, . . . ,
xim
p
)
y su peso es
pi =
xi·
x··
=
p
np
=
1
n
◮ El centro de gravedad de los perfiles-fila es
gI =
n
X
i=1
1
n
pfi ==
1
np
(x·1, . . . , x·m)
donde x·j =
Pn
i=1 xij
23. Análisis de
Correspondencias
Múltiples
Javier Trejos
Introducción
Tablas de datos
Objetivos del ACM
Nubes de perfiles
Ejes y coordenadas
factoriales
Interpretaciones en
A.C.M.
Ejemplos
Perfiles y Distancias en ACM
Perfiles-fila y distancia
◮ El total de cualquier fila de la tabla X es p.
◮ El perfil-fila de un individuo i es:
pfi = (
xi1
p
, . . . ,
xim
p
)
y su peso es
pi =
xi·
x··
=
p
np
=
1
n
◮ El centro de gravedad de los perfiles-fila es
gI =
n
X
i=1
1
n
pfi ==
1
np
(x·1, . . . , x·m)
donde x·j =
Pn
i=1 xij
◮ También se dice que gI es el perfil-fila promedio o el
individuo promedio.
24. Análisis de
Correspondencias
Múltiples
Javier Trejos
Introducción
Tablas de datos
Objetivos del ACM
Nubes de perfiles
Ejes y coordenadas
factoriales
Interpretaciones en
A.C.M.
Ejemplos
Perfiles y Distancias en ACM
Perfiles-fila y distancia
◮ La distancia χ2 entre dos perfiles-fila pfi y pfi′ es
determinada por la inversa de DM = diag(
x·j
np ), la
matriz diagonal de los pesos de los perfiles-columna de
la matriz X.
25. Análisis de
Correspondencias
Múltiples
Javier Trejos
Introducción
Tablas de datos
Objetivos del ACM
Nubes de perfiles
Ejes y coordenadas
factoriales
Interpretaciones en
A.C.M.
Ejemplos
Perfiles y Distancias en ACM
Perfiles-fila y distancia
◮ La distancia χ2 entre dos perfiles-fila pfi y pfi′ es
determinada por la inversa de DM = diag(
x·j
np ), la
matriz diagonal de los pesos de los perfiles-columna de
la matriz X.
◮ Por lo tanto el cuadrado de la distancia entre
perfiles-fila se expresa como
d2
χ2 (pfi, pfi′ ) = (pfi − pfi′ )D−1
M (pfi − pfi′ )t
= np
m
X
j=1
1
x·j
xij
p
−
xi′j
p
2
=
n
p
m
X
j=1
1
x·j
xij − xi′j
2
.
26. Análisis de
Correspondencias
Múltiples
Javier Trejos
Introducción
Tablas de datos
Objetivos del ACM
Nubes de perfiles
Ejes y coordenadas
factoriales
Interpretaciones en
A.C.M.
Ejemplos
Perfiles y Distancias en ACM
Perfiles-fila y distancia
◮ Véase que
xij − xi′j
2
=
0 si xij = xi′j
1 si xij 6= xi′j.
27. Análisis de
Correspondencias
Múltiples
Javier Trejos
Introducción
Tablas de datos
Objetivos del ACM
Nubes de perfiles
Ejes y coordenadas
factoriales
Interpretaciones en
A.C.M.
Ejemplos
Perfiles y Distancias en ACM
Perfiles-fila y distancia
◮ Véase que
xij − xi′j
2
=
0 si xij = xi′j
1 si xij 6= xi′j.
◮ Luego
dχ2 (pfi, pfi′ ) =
v
u
u
t
n
p
X
j∈Mii′
1
x·j
donde Mii′ = {j ∈ {1, . . . , m}|xij 6= xi′j} es el
conjunto de modalidades asumidas por uno de los
individuos i ó i′ (pero no por ambos).
28. Análisis de
Correspondencias
Múltiples
Javier Trejos
Introducción
Tablas de datos
Objetivos del ACM
Nubes de perfiles
Ejes y coordenadas
factoriales
Interpretaciones en
A.C.M.
Ejemplos
Perfiles y Distancias en ACM
Perfiles-fila y distancia
◮ Véase que
xij − xi′j
2
=
0 si xij = xi′j
1 si xij 6= xi′j.
◮ Luego
dχ2 (pfi, pfi′ ) =
v
u
u
t
n
p
X
j∈Mii′
1
x·j
donde Mii′ = {j ∈ {1, . . . , m}|xij 6= xi′j} es el
conjunto de modalidades asumidas por uno de los
individuos i ó i′ (pero no por ambos).
◮ Mientras más modalidades asuman simultáneamente los
individuos i e i′, menor es la distancia entre ellos y más
parecidos son.
29. Análisis de
Correspondencias
Múltiples
Javier Trejos
Introducción
Tablas de datos
Objetivos del ACM
Nubes de perfiles
Ejes y coordenadas
factoriales
Interpretaciones en
A.C.M.
Ejemplos
Perfiles y Distancias en ACM
Perfiles-fila y distancia
◮ Véase que
xij − xi′j
2
=
0 si xij = xi′j
1 si xij 6= xi′j.
◮ Luego
dχ2 (pfi, pfi′ ) =
v
u
u
t
n
p
X
j∈Mii′
1
x·j
donde Mii′ = {j ∈ {1, . . . , m}|xij 6= xi′j} es el
conjunto de modalidades asumidas por uno de los
individuos i ó i′ (pero no por ambos).
◮ Mientras más modalidades asuman simultáneamente los
individuos i e i′, menor es la distancia entre ellos y más
parecidos son.
◮ La distancia χ2 tiene un significado ‘natural’ y se
adapta bien al caso del análisis de cuestionarios.
31. Análisis de
Correspondencias
Múltiples
Javier Trejos
Introducción
Tablas de datos
Objetivos del ACM
Nubes de perfiles
Ejes y coordenadas
factoriales
Interpretaciones en
A.C.M.
Ejemplos
Perfiles y Distancias en ACM
Perfiles-columna y distancia
◮ El total de la columna j de X se denota por x·j.
◮ El perfil-columna de la modalidad j es:
pcj =
x1j
x·j
, . . . ,
xnj
x·j
t
32. Análisis de
Correspondencias
Múltiples
Javier Trejos
Introducción
Tablas de datos
Objetivos del ACM
Nubes de perfiles
Ejes y coordenadas
factoriales
Interpretaciones en
A.C.M.
Ejemplos
Perfiles y Distancias en ACM
Perfiles-columna y distancia
◮ El total de la columna j de X se denota por x·j.
◮ El perfil-columna de la modalidad j es:
pcj =
x1j
x·j
, . . . ,
xnj
x·j
t
◮ con peso qj =
x·j
np .
33. Análisis de
Correspondencias
Múltiples
Javier Trejos
Introducción
Tablas de datos
Objetivos del ACM
Nubes de perfiles
Ejes y coordenadas
factoriales
Interpretaciones en
A.C.M.
Ejemplos
Perfiles y Distancias en ACM
Perfiles-columna y distancia
◮ El total de la columna j de X se denota por x·j.
◮ El perfil-columna de la modalidad j es:
pcj =
x1j
x·j
, . . . ,
xnj
x·j
t
◮ con peso qj =
x·j
np .
◮ centro de gravedad del conjunto de perfiles-columna:
gM =
m
X
j=1
x·j
np
pcj =
1
np
(p, . . . , p)t
=
1
n
1n
donde 1t
n = (1 . . . 1)1×n ∈ Rn.
34. Análisis de
Correspondencias
Múltiples
Javier Trejos
Introducción
Tablas de datos
Objetivos del ACM
Nubes de perfiles
Ejes y coordenadas
factoriales
Interpretaciones en
A.C.M.
Ejemplos
Perfiles y Distancias en ACM
Perfiles-columna y distancia
◮ Matriz de distancia entre perfiles columna: D−1
n donde
Dn = 1
nI es la diagonal de pesos de las filas de X.
35. Análisis de
Correspondencias
Múltiples
Javier Trejos
Introducción
Tablas de datos
Objetivos del ACM
Nubes de perfiles
Ejes y coordenadas
factoriales
Interpretaciones en
A.C.M.
Ejemplos
Perfiles y Distancias en ACM
Perfiles-columna y distancia
◮ Matriz de distancia entre perfiles columna: D−1
n donde
Dn = 1
nI es la diagonal de pesos de las filas de X.
◮ Por lo tanto
d2
χ2 pcj, pcj′
= n(pcj − pcj′ )t(pcj − pcj′ )
36. Análisis de
Correspondencias
Múltiples
Javier Trejos
Introducción
Tablas de datos
Objetivos del ACM
Nubes de perfiles
Ejes y coordenadas
factoriales
Interpretaciones en
A.C.M.
Ejemplos
Perfiles y Distancias en ACM
Perfiles-columna y distancia
◮ Matriz de distancia entre perfiles columna: D−1
n donde
Dn = 1
nI es la diagonal de pesos de las filas de X.
◮ Por lo tanto
d2
χ2 pcj, pcj′
= n(pcj − pcj′ )t(pcj − pcj′ )
◮ de donde
d2
χ2 pcj, pcj′
=
n
X
i=1
n
xij
x·j
−
xij′
x·j′
2
.
37. Análisis de
Correspondencias
Múltiples
Javier Trejos
Introducción
Tablas de datos
Objetivos del ACM
Nubes de perfiles
Ejes y coordenadas
factoriales
Interpretaciones en
A.C.M.
Ejemplos
Perfiles y Distancias en ACM
Perfiles-columna y distancia
◮ Matriz de distancia entre perfiles columna: D−1
n donde
Dn = 1
nI es la diagonal de pesos de las filas de X.
◮ Por lo tanto
d2
χ2 pcj, pcj′
= n(pcj − pcj′ )t(pcj − pcj′ )
◮ de donde
d2
χ2 pcj, pcj′
=
n
X
i=1
n
xij
x·j
−
xij′
x·j′
2
.
◮ Simplificando:
d2
χ2 pcj, pcj′
= n
1
x·j
+
1
x·j′
−
2bjj′
x·jx·j′
donde bjj′ es el número de individuos que poseen en
común las modalidades j y j′.
38. Análisis de
Correspondencias
Múltiples
Javier Trejos
Introducción
Tablas de datos
Objetivos del ACM
Nubes de perfiles
Ejes y coordenadas
factoriales
Interpretaciones en
A.C.M.
Ejemplos
Análisis de Correspondencias Múltiples
Nubes de perfiles
Elemento Perfiles-Fila Perfiles-Columna
Puntos
xij
xi·
=
xij
p
xij
x·j
Pesos xi·
np = p
np = 1
n
x·j
np
Métrica diag
np
x·j
diag
np
xi·
= diag(n)
Distancia2 n
p
X
j∈Mii′
1
x·j
n
1
x·j
+ 1
x·j′
−
2bjj′
x·jx·j′
= n
bj ¯
j′ +bj′j̄
x·jx·j′
39. Análisis de
Correspondencias
Múltiples
Javier Trejos
Introducción
Tablas de datos
Objetivos del ACM
Nubes de perfiles
Ejes y coordenadas
factoriales
Interpretaciones en
A.C.M.
Ejemplos
Análisis de Correspondencias Múltiples
Ejes y coordenadas factoriales
Se hace un AFC de la tabla X, es decir, un ACP de la nube
de perfiles-fila (individuos):
NI = (
1
p
X, D−1
M ,
1
n
I)
y de la bune de perfiles-columna (modalidades):
NM = (Xt
pc, nI, DM ).
40. Análisis de
Correspondencias
Múltiples
Javier Trejos
Introducción
Tablas de datos
Objetivos del ACM
Nubes de perfiles
Ejes y coordenadas
factoriales
Interpretaciones en
A.C.M.
Ejemplos
Análisis de Correspondencias Múltiples
Coordenadas factoriales de los individuos
◮ Sean u1, . . . , ur los vectores propios del A.C.P. de la
nube NI y 1 λ1 ≥ · · · ≥ λr 0 los valores propios
simples correspondientes, donde λs = 0 si s r.
41. Análisis de
Correspondencias
Múltiples
Javier Trejos
Introducción
Tablas de datos
Objetivos del ACM
Nubes de perfiles
Ejes y coordenadas
factoriales
Interpretaciones en
A.C.M.
Ejemplos
Análisis de Correspondencias Múltiples
Coordenadas factoriales de los individuos
◮ Sean u1, . . . , ur los vectores propios del A.C.P. de la
nube NI y 1 λ1 ≥ · · · ≥ λr 0 los valores propios
simples correspondientes, donde λs = 0 si s r.
◮ Las coordenadas factoriales de los perfiles-fila en el eje
factorial determinado por el vector
uh = (uh1, . . . , uhm)t son las entradas de la columna
1
p XD−1
M uh.
42. Análisis de
Correspondencias
Múltiples
Javier Trejos
Introducción
Tablas de datos
Objetivos del ACM
Nubes de perfiles
Ejes y coordenadas
factoriales
Interpretaciones en
A.C.M.
Ejemplos
Análisis de Correspondencias Múltiples
Coordenadas factoriales de los individuos
◮ Sean u1, . . . , ur los vectores propios del A.C.P. de la
nube NI y 1 λ1 ≥ · · · ≥ λr 0 los valores propios
simples correspondientes, donde λs = 0 si s r.
◮ Las coordenadas factoriales de los perfiles-fila en el eje
factorial determinado por el vector
uh = (uh1, . . . , uhm)t son las entradas de la columna
1
p XD−1
M uh.
◮ Las coordenadas una a una son:
coorduh
(pfi) = pfiD−1
M uh = n
m
X
j=1
xijuhj
x·j
.
43. Análisis de
Correspondencias
Múltiples
Javier Trejos
Introducción
Tablas de datos
Objetivos del ACM
Nubes de perfiles
Ejes y coordenadas
factoriales
Interpretaciones en
A.C.M.
Ejemplos
Análisis de Correspondencias Múltiples
Coordenadas factoriales de los individuos
◮ Sean u1, . . . , ur los vectores propios del A.C.P. de la
nube NI y 1 λ1 ≥ · · · ≥ λr 0 los valores propios
simples correspondientes, donde λs = 0 si s r.
◮ Las coordenadas factoriales de los perfiles-fila en el eje
factorial determinado por el vector
uh = (uh1, . . . , uhm)t son las entradas de la columna
1
p XD−1
M uh.
◮ Las coordenadas una a una son:
coorduh
(pfi) = pfiD−1
M uh = n
m
X
j=1
xijuhj
x·j
.
◮ Representación gráfica de pfi en primer plano:
(coordu1 (pfi), coordu2 (pfi))
44. Análisis de
Correspondencias
Múltiples
Javier Trejos
Introducción
Tablas de datos
Objetivos del ACM
Nubes de perfiles
Ejes y coordenadas
factoriales
Interpretaciones en
A.C.M.
Ejemplos
Análisis de Correspondencias Múltiples
Coordenadas factoriales de las modalidades
◮ Sean v1, . . . , vr los vectores propios del A.C.P. de la
nube de modalidades NM = (Xt
pc, nI, DM ) asociados a
los valores propios 1 λ1 ≥ · · · ≥ λr 0.
45. Análisis de
Correspondencias
Múltiples
Javier Trejos
Introducción
Tablas de datos
Objetivos del ACM
Nubes de perfiles
Ejes y coordenadas
factoriales
Interpretaciones en
A.C.M.
Ejemplos
Análisis de Correspondencias Múltiples
Coordenadas factoriales de las modalidades
◮ Sean v1, . . . , vr los vectores propios del A.C.P. de la
nube de modalidades NM = (Xt
pc, nI, DM ) asociados a
los valores propios 1 λ1 ≥ · · · ≥ λr 0.
◮ Las coordenadas de los perfiles-columna en el eje
factorial determinado por vh = (v1h, . . . , vmh)t son las
entradas de la columna Xt
pcnIvh.
46. Análisis de
Correspondencias
Múltiples
Javier Trejos
Introducción
Tablas de datos
Objetivos del ACM
Nubes de perfiles
Ejes y coordenadas
factoriales
Interpretaciones en
A.C.M.
Ejemplos
Análisis de Correspondencias Múltiples
Coordenadas factoriales de las modalidades
◮ Sean v1, . . . , vr los vectores propios del A.C.P. de la
nube de modalidades NM = (Xt
pc, nI, DM ) asociados a
los valores propios 1 λ1 ≥ · · · ≥ λr 0.
◮ Las coordenadas de los perfiles-columna en el eje
factorial determinado por vh = (v1h, . . . , vmh)t son las
entradas de la columna Xt
pcnIvh.
◮ Es decir
coordvh
(pcj) = npct
jvh =
1
x·j
n
X
i=1
xijvih
47. Análisis de
Correspondencias
Múltiples
Javier Trejos
Introducción
Tablas de datos
Objetivos del ACM
Nubes de perfiles
Ejes y coordenadas
factoriales
Interpretaciones en
A.C.M.
Ejemplos
Análisis de Correspondencias Múltiples
Coordenadas factoriales de las modalidades
◮ Sean v1, . . . , vr los vectores propios del A.C.P. de la
nube de modalidades NM = (Xt
pc, nI, DM ) asociados a
los valores propios 1 λ1 ≥ · · · ≥ λr 0.
◮ Las coordenadas de los perfiles-columna en el eje
factorial determinado por vh = (v1h, . . . , vmh)t son las
entradas de la columna Xt
pcnIvh.
◮ Es decir
coordvh
(pcj) = npct
jvh =
1
x·j
n
X
i=1
xijvih
◮ Representación gráfica de pcj en primer plano:
(x1j, x2j), donde x1j = coordv1 (pcj) y
x2j = coordv2 (pcj)
48. Análisis de
Correspondencias
Múltiples
Javier Trejos
Introducción
Tablas de datos
Objetivos del ACM
Nubes de perfiles
Ejes y coordenadas
factoriales
Interpretaciones en
A.C.M.
Ejemplos
Análisis de Correspondencias Múltiples
Relaciones de transición entre coordenadas
◮ Relacionan las coordenadas de los individuos y de las
variables, y permiten hacer una representación
simultánea
49. Análisis de
Correspondencias
Múltiples
Javier Trejos
Introducción
Tablas de datos
Objetivos del ACM
Nubes de perfiles
Ejes y coordenadas
factoriales
Interpretaciones en
A.C.M.
Ejemplos
Análisis de Correspondencias Múltiples
Relaciones de transición entre coordenadas
◮ Relacionan las coordenadas de los individuos y de las
variables, y permiten hacer una representación
simultánea
coorduh
(pfi) =
1
√
λh
m
X
j=1
xij coordvh
(pcj)
p
=
1
p
√
λh
X
j∈Mi
coordvh
(pcj) (1)
donde Mi = {j ∈ {1, . . . , m} |xij = 1} es el conjunto
de modalidades que son asumidas por el individuo i. Es
claro que |Mi| = p.
50. Análisis de
Correspondencias
Múltiples
Javier Trejos
Introducción
Tablas de datos
Objetivos del ACM
Nubes de perfiles
Ejes y coordenadas
factoriales
Interpretaciones en
A.C.M.
Ejemplos
Análisis de Correspondencias Múltiples
Relaciones de transición entre coordenadas
◮ Similarmente las coordenadas de los perfiles-columna se
escriben en términos de las coordenadas de los
perfiles-fila:
coordvh
(pcj) =
1
√
λh
n
X
i=1
xij
x·j
coorduh
(pfi)
=
1
x·j
√
λh
X
i∈Ij
coorduh
(pfi) (2)
donde Ij = {i ∈ {1, . . . , n} | xij = 1} es el conjunto de
individuos que asumen la modalidad j; |Ij| = x·j.
51. Análisis de
Correspondencias
Múltiples
Javier Trejos
Introducción
Tablas de datos
Objetivos del ACM
Nubes de perfiles
Ejes y coordenadas
factoriales
Interpretaciones en
A.C.M.
Ejemplos
Análisis de Correspondencias Múltiples
Relaciones de transición entre coordenadas
◮ Similarmente las coordenadas de los perfiles-columna se
escriben en términos de las coordenadas de los
perfiles-fila:
coordvh
(pcj) =
1
√
λh
n
X
i=1
xij
x·j
coorduh
(pfi)
=
1
x·j
√
λh
X
i∈Ij
coorduh
(pfi) (2)
donde Ij = {i ∈ {1, . . . , n} | xij = 1} es el conjunto de
individuos que asumen la modalidad j; |Ij| = x·j.
◮ Las modalidades son puntos promedio de los individuos
que las han escogido.
◮ Dos modalidades próximas promedian individuos iguales
o similares.
◮ Dos modalidades próximas de una misma variable: el
promedio es en relación a las otras variables.
52. Análisis de
Correspondencias
Múltiples
Javier Trejos
Introducción
Tablas de datos
Objetivos del ACM
Nubes de perfiles
Ejes y coordenadas
factoriales
Interpretaciones en
A.C.M.
Ejemplos
Análisis de Correspondencias Múltiples
Elementos suplementarios
◮ Sea (s1, . . . , sn) el código disyuntivo completo de una
modalidad suplementaria s
◮ s+ =
Pn
i=1 si es el total de individuos que poseen dicha
modalidad
◮ Su perfil es por definición pc (s) =
s1
s+
, . . . , sn
s+
.
53. Análisis de
Correspondencias
Múltiples
Javier Trejos
Introducción
Tablas de datos
Objetivos del ACM
Nubes de perfiles
Ejes y coordenadas
factoriales
Interpretaciones en
A.C.M.
Ejemplos
Análisis de Correspondencias Múltiples
Elementos suplementarios
◮ Sea (s1, . . . , sn) el código disyuntivo completo de una
modalidad suplementaria s
◮ s+ =
Pn
i=1 si es el total de individuos que poseen dicha
modalidad
◮ Su perfil es por definición pc (s) =
s1
s+
, . . . , sn
s+
.
◮ La coordenada de la proyección ( 1
n I)−1 - ortogonal de
este perfil sobre el vector propio vh es
coordvh
(pc (s)) = n
n
X
i=1
si
s+
vih =
n
s+
X
i∈Is
vih
donde Is = {i ∈ {1, . . . , n} | si = 1} es el conjunto de
individuos activos que poseen la modalidad
suplementaria s.
54. Análisis de
Correspondencias
Múltiples
Javier Trejos
Introducción
Tablas de datos
Objetivos del ACM
Nubes de perfiles
Ejes y coordenadas
factoriales
Interpretaciones en
A.C.M.
Ejemplos
Análisis de Correspondencias Múltiples
Elementos suplementarios
◮ Sea s+ =
Pm
j=1 sj el total de modalidades que posee el
individuo suplementario s.
◮ Su perfil es pf (s) =
s1
s+
, . . . , sm
s+
.
55. Análisis de
Correspondencias
Múltiples
Javier Trejos
Introducción
Tablas de datos
Objetivos del ACM
Nubes de perfiles
Ejes y coordenadas
factoriales
Interpretaciones en
A.C.M.
Ejemplos
Análisis de Correspondencias Múltiples
Elementos suplementarios
◮ Sea s+ =
Pm
j=1 sj el total de modalidades que posee el
individuo suplementario s.
◮ Su perfil es pf (s) =
s1
s+
, . . . , sm
s+
.
◮ La coordenada de la proyección D−1
M - ortogonal de este
perfil sobre el vector propio uh es
coorduh
(pf (s)) =
np
s+
m
X
j=1
sjuhj
x·j
=
np
s+
m
X
j∈Ms
uhj
x·j
donde Ms = {j ∈ {1, . . . , m} | sj = 1} es el conjunto
de modalidades activas que posee el individuo
suplementario s.
56. Análisis de
Correspondencias
Múltiples
Javier Trejos
Introducción
Tablas de datos
Objetivos del ACM
Nubes de perfiles
Ejes y coordenadas
factoriales
Interpretaciones en
A.C.M.
Ejemplos
Análisis de Correspondencias Múltiples
Proyección de centros de gravedad
◮ Sea gj el centro de gravedad de la clase de individuos
determinada por una modalidad j de una variable
cualitativa activa.
57. Análisis de
Correspondencias
Múltiples
Javier Trejos
Introducción
Tablas de datos
Objetivos del ACM
Nubes de perfiles
Ejes y coordenadas
factoriales
Interpretaciones en
A.C.M.
Ejemplos
Análisis de Correspondencias Múltiples
Proyección de centros de gravedad
◮ Sea gj el centro de gravedad de la clase de individuos
determinada por una modalidad j de una variable
cualitativa activa.
◮ En la variable ingreso de la Tabla 1 se tiene
bajo = {3, 4, 8}, medio = {1, 5, 7, 10} y alto = {2, 6, 9}.
58. Análisis de
Correspondencias
Múltiples
Javier Trejos
Introducción
Tablas de datos
Objetivos del ACM
Nubes de perfiles
Ejes y coordenadas
factoriales
Interpretaciones en
A.C.M.
Ejemplos
Análisis de Correspondencias Múltiples
Proyección de centros de gravedad
◮ Sea gj el centro de gravedad de la clase de individuos
determinada por una modalidad j de una variable
cualitativa activa.
◮ En la variable ingreso de la Tabla 1 se tiene
bajo = {3, 4, 8}, medio = {1, 5, 7, 10} y alto = {2, 6, 9}.
◮ Es decir,
gj =
1
| Ej |
X
i∈Ej
pfi
donde Ej = {i ∈ I | xij = 1}.
59. Análisis de
Correspondencias
Múltiples
Javier Trejos
Introducción
Tablas de datos
Objetivos del ACM
Nubes de perfiles
Ejes y coordenadas
factoriales
Interpretaciones en
A.C.M.
Ejemplos
Análisis de Correspondencias Múltiples
Proyección de centros de gravedad
◮ Sea gj el centro de gravedad de la clase de individuos
determinada por una modalidad j de una variable
cualitativa activa.
◮ En la variable ingreso de la Tabla 1 se tiene
bajo = {3, 4, 8}, medio = {1, 5, 7, 10} y alto = {2, 6, 9}.
◮ Es decir,
gj =
1
| Ej |
X
i∈Ej
pfi
donde Ej = {i ∈ I | xij = 1}.
◮ Proyectando gj sobre el eje determinado por el vector
uh se puede deducir que la coordenada de gj en el eje
factorial h− ésimo se escribe como
coorduh
(gj) =
p
λhcoordvh
(pcj). (3)
60. Análisis de
Correspondencias
Múltiples
Javier Trejos
Introducción
Tablas de datos
Objetivos del ACM
Nubes de perfiles
Ejes y coordenadas
factoriales
Interpretaciones en
A.C.M.
Ejemplos
Análisis de Correspondencias Múltiples
Variables continuas suplementarias
◮ Sea x una variable suplementaria cuantitativa continua,
centrada y reducida.
61. Análisis de
Correspondencias
Múltiples
Javier Trejos
Introducción
Tablas de datos
Objetivos del ACM
Nubes de perfiles
Ejes y coordenadas
factoriales
Interpretaciones en
A.C.M.
Ejemplos
Análisis de Correspondencias Múltiples
Variables continuas suplementarias
◮ Sea x una variable suplementaria cuantitativa continua,
centrada y reducida.
◮ Las coordenadas de x en los ejes factoriales
determinados por los vectores propios v1, . . . , vr, son
las correlaciones de la variable con cada vector vh. Es
decir, coordvh
(x) =
Pn
i=1 vihxi, donde
x = (x1, . . . , xn) y vh = (v1h, . . . , vnh).
◮ Si una variable continua se ubica en la dirección de un
eje, entonces cuanto más cerca esté del cı́rculo de radio
uno, más se asocia la variable con aquel eje.
62. Análisis de
Correspondencias
Múltiples
Javier Trejos
Introducción
Tablas de datos
Objetivos del ACM
Nubes de perfiles
Ejes y coordenadas
factoriales
Interpretaciones en
A.C.M.
Ejemplos
Análisis de Correspondencias Múltiples
Interpretaciones en A.C.M.
◮ El centro de gravedad de la nube de modalidades:
gM =
1
n
, . . . ,
1
n
.
63. Análisis de
Correspondencias
Múltiples
Javier Trejos
Introducción
Tablas de datos
Objetivos del ACM
Nubes de perfiles
Ejes y coordenadas
factoriales
Interpretaciones en
A.C.M.
Ejemplos
Análisis de Correspondencias Múltiples
Interpretaciones en A.C.M.
◮ El centro de gravedad de la nube de modalidades:
gM =
1
n
, . . . ,
1
n
.
◮ Distancia de un perfil-columna al centro de gravedad:
d2
(pcj, gM ) = n
n
X
i=1
xij
x·j
−
1
n
2
= n
n
X
i=1
xij
x2
·j
−
2xij
nx·j
+
1
n2
!
=
n
x·j
− 1.
64. Análisis de
Correspondencias
Múltiples
Javier Trejos
Introducción
Tablas de datos
Objetivos del ACM
Nubes de perfiles
Ejes y coordenadas
factoriales
Interpretaciones en
A.C.M.
Ejemplos
Análisis de Correspondencias Múltiples
Interpretaciones en A.C.M.
◮ El centro de gravedad de la nube de modalidades:
gM =
1
n
, . . . ,
1
n
.
◮ Distancia de un perfil-columna al centro de gravedad:
d2
(pcj, gM ) = n
n
X
i=1
xij
x·j
−
1
n
2
= n
n
X
i=1
xij
x2
·j
−
2xij
nx·j
+
1
n2
!
=
n
x·j
− 1.
◮ La distancia es mayor si el efectivo de la modalidad es
pequeño.
65. Análisis de
Correspondencias
Múltiples
Javier Trejos
Introducción
Tablas de datos
Objetivos del ACM
Nubes de perfiles
Ejes y coordenadas
factoriales
Interpretaciones en
A.C.M.
Ejemplos
Análisis de Correspondencias Múltiples
Interpretaciones en A.C.M.
◮ Contribución de la modalidad (columna) pcj a la
inercia:
I(pcj) =
x·j
np
d2
(pcj, gM )
=
x·j
np
n
x·j
− 1
=
1
p
1 −
x·j
n
.
◮ La contribución a la inercia es mayor si el efectivo de la
modalidad es pequeño.
66. Análisis de
Correspondencias
Múltiples
Javier Trejos
Introducción
Tablas de datos
Objetivos del ACM
Nubes de perfiles
Ejes y coordenadas
factoriales
Interpretaciones en
A.C.M.
Ejemplos
Análisis de Correspondencias Múltiples
Interpretaciones en A.C.M.
◮ Contribución de la variable k a la inercia:
I(Xk) =
mk
X
j=1
I(pcj) =
mk
X
j=1
1
p
1 −
x·j
n
=
1
p
(mk − 1).
◮ Crece con el número de modalidades
◮ El mı́nimo 1
p se obtiene cuando mk = 2.
◮ Inercia total:
I(Npc) =
p
X
k=1
I(Xk) =
p
X
k=1
1
p
(m − p) =
m
p
− 1
◮ No tiene significado estadı́stico pues es una constante.
67. Análisis de
Correspondencias
Múltiples
Javier Trejos
Introducción
Tablas de datos
Objetivos del ACM
Nubes de perfiles
Ejes y coordenadas
factoriales
Interpretaciones en
A.C.M.
Ejemplos
Análisis de Correspondencias Múltiples
Interpretaciones en A.C.M.
◮ Individuos cercanos son parecidos (tienen muchas
modalidades en común).
68. Análisis de
Correspondencias
Múltiples
Javier Trejos
Introducción
Tablas de datos
Objetivos del ACM
Nubes de perfiles
Ejes y coordenadas
factoriales
Interpretaciones en
A.C.M.
Ejemplos
Análisis de Correspondencias Múltiples
Interpretaciones en A.C.M.
◮ Individuos cercanos son parecidos (tienen muchas
modalidades en común).
◮ Modalidades cercanas de variables distintas: hay
proximidad entre los centros de gravedad
correspondientes (en el espacio de los individuos, Rm) o
como la proximidad entre los perfiles columna (en el
espacio de las modalidades, Rn).
69. Análisis de
Correspondencias
Múltiples
Javier Trejos
Introducción
Tablas de datos
Objetivos del ACM
Nubes de perfiles
Ejes y coordenadas
factoriales
Interpretaciones en
A.C.M.
Ejemplos
Análisis de Correspondencias Múltiples
Interpretaciones en A.C.M.
◮ Individuos cercanos son parecidos (tienen muchas
modalidades en común).
◮ Modalidades cercanas de variables distintas: hay
proximidad entre los centros de gravedad
correspondientes (en el espacio de los individuos, Rm) o
como la proximidad entre los perfiles columna (en el
espacio de las modalidades, Rn).
◮ Proximidad de dos modalidades de variables distintas:
los mismos individuos poseen en común estas dos
modalidades (interpretación en Rn) o que muchos
individuos parecidos poseen en común esas modalidades
(interpretación en Rm).
70. Análisis de
Correspondencias
Múltiples
Javier Trejos
Introducción
Tablas de datos
Objetivos del ACM
Nubes de perfiles
Ejes y coordenadas
factoriales
Interpretaciones en
A.C.M.
Ejemplos
Análisis de Correspondencias Múltiples
Interpretaciones en A.C.M.
◮ Individuos cercanos son parecidos (tienen muchas
modalidades en común).
◮ Modalidades cercanas de variables distintas: hay
proximidad entre los centros de gravedad
correspondientes (en el espacio de los individuos, Rm) o
como la proximidad entre los perfiles columna (en el
espacio de las modalidades, Rn).
◮ Proximidad de dos modalidades de variables distintas:
los mismos individuos poseen en común estas dos
modalidades (interpretación en Rn) o que muchos
individuos parecidos poseen en común esas modalidades
(interpretación en Rm).
◮ Sean E y E′ las clases de individuos definidas por dos
modalidades de una misma variable (E ∩ E′ = ∅). Si
hay proximidad entre esas modalidades se explica en
Rm: los centros de gravedad de E y E′ son próximos.
71. Análisis de
Correspondencias
Múltiples
Javier Trejos
Introducción
Tablas de datos
Objetivos del ACM
Nubes de perfiles
Ejes y coordenadas
factoriales
Interpretaciones en
A.C.M.
Ejemplos
Análisis de Correspondencias Múltiples
Ejemplo de Lebart
◮ Encuesta francesa a nivel nacional (principios de los
años 1980)
72. Análisis de
Correspondencias
Múltiples
Javier Trejos
Introducción
Tablas de datos
Objetivos del ACM
Nubes de perfiles
Ejes y coordenadas
factoriales
Interpretaciones en
A.C.M.
Ejemplos
Análisis de Correspondencias Múltiples
Ejemplo de Lebart
◮ Encuesta francesa a nivel nacional (principios de los
años 1980)
◮ Variables de opinión (activas):
◮ ¿Necesita transformaciones la sociedad?
◮ ¿Es posible romper el matrimonio?
◮ ¿A qué hora se va a dormir?
◮ ¿Es la familia el único lugar donde uno se puede sentir
bien?
◮ ¿Tiene usted restricciones presupuestarias regularmente?
73. Análisis de
Correspondencias
Múltiples
Javier Trejos
Introducción
Tablas de datos
Objetivos del ACM
Nubes de perfiles
Ejes y coordenadas
factoriales
Interpretaciones en
A.C.M.
Ejemplos
Análisis de Correspondencias Múltiples
Ejemplo de Lebart
◮ Encuesta francesa a nivel nacional (principios de los
años 1980)
◮ Variables de opinión (activas):
◮ ¿Necesita transformaciones la sociedad?
◮ ¿Es posible romper el matrimonio?
◮ ¿A qué hora se va a dormir?
◮ ¿Es la familia el único lugar donde uno se puede sentir
bien?
◮ ¿Tiene usted restricciones presupuestarias regularmente?
◮ Variables de señalización (demográficas):
◮ Sexo
◮ Edad
◮ Nivel educativo
◮ Ciudad o pueblo donde vive
◮ Casa donde vive (propia, hipotecada, alquilada)
◮ ¿Posee acciones?
◮ ¿Posee bienes inmuebles?
74. Análisis de
Correspondencias
Múltiples
Javier Trejos
Introducción
Tablas de datos
Objetivos del ACM
Nubes de perfiles
Ejes y coordenadas
factoriales
Interpretaciones en
A.C.M.
Ejemplos
Análisis de Correspondencias Múltiples
Ejemplo de Lebart
Valores propios
Valor propio % inercia % inercia acumulada
1 0.25001878 9.72 9.72
2 0.21836281 8.49 18.21
3 0.18465650 7.18 25.40
4 0.17460611 6.79 32.19
5 0.16103518 6.26 38.45
6 0.15802696 6.15 44.59
.
.
.
.
.
.
.
.
.
.
.
.
18 0.06661423 2.59 100.0
77. Análisis de
Correspondencias
Múltiples
Javier Trejos
Introducción
Tablas de datos
Objetivos del ACM
Nubes de perfiles
Ejes y coordenadas
factoriales
Interpretaciones en
A.C.M.
Ejemplos
Análisis de Correspondencias Múltiples
Ejemplo: datos médicos
◮ Estudio médico sobre incontinencia anal (1998)
◮ Se observaron 8 variables cualitativas en 16 pacientes
(individuos).
◮ Variables:
◮ Sexo: Masc = Masculino, Feme = Femenino.
◮ Enfermedad Congénita (EC): ecSI, ecNO.
◮ Multiparidad (Multi): mpSI, mpNO.
◮ Trauma Obstétrico (TO): toSI, toNO.
◮ Cirujı́a ano Rectal (CR): carSI, carNO.
◮ Trauma Anal (TA): taSI, taNO.
◮ Respuesta a la esfinteroplastı́a (Resp): Cont =
Continente, Mejo = Mejorı́a, RN/A = no hay datos.
◮ Uso Colostomı́a de Protección (UCP): ucpSI, ucpNO.
78. Análisis de
Correspondencias
Múltiples
Javier Trejos
Introducción
Tablas de datos
Objetivos del ACM
Nubes de perfiles
Ejes y coordenadas
factoriales
Interpretaciones en
A.C.M.
Ejemplos
Análisis de Correspondencias Múltiples
Ejemplo: datos médicos
ind
Variables cualitativas
Sexo EC Multi TO CR TA Resp UCP
1 Masc ecNo mpNo toNo carSi taSi Cont ucpNo
2 Masc ecNo mpNo toNo carNo taSi Mejo ucpNo
3 Masc ecNo mpNo toNo carNo taSi RN/A ucpSi
4 Masc ecSi mpNo toNo carNo taNo Mejo ucpSi
5 Feme ecNo mpSi toSi carNo taSi Mejo ucpNo
6 Feme ecNo mpSi toNo carSi taNo Mejo ucpNo
7 Feme ecNo mpNo toNo carSi taNo Mejo ucpSi
8 Feme ecNo mpSi toNo carSi taNo Cont ucpNo
9 Feme ecNo mpSi toNo carSi taNo RN/A ucpNo
10 Feme ecNo mpNo toSi carNo taNo Cont ucpSi
11 Feme ecNo mpNo toSi carNo taNo Cont ucpNo
12 Feme ecNo mpSi toSi carNo taNo RN/A ucpNo
13 Feme ecNo mpSi toNo carSi taNo Cont ucpSi
14 Feme ecSi mpSi toNo carSi taNo Cont ucpSi
15 Feme ecNo mpSi toNo carNo taNo Cont ucpSi
79. Análisis de
Correspondencias
Múltiples
Javier Trejos
Introducción
Tablas de datos
Objetivos del ACM
Nubes de perfiles
Ejes y coordenadas
factoriales
Interpretaciones en
A.C.M.
Ejemplos
Análisis de Correspondencias Múltiples
Ejemplo: datos médicos – valores propios
Eje Valor propio % de Inercia
% de Inercia
Acumulada
1 0.08 39.33 39.33
2 0.06 27.09 66.42
3 0.03 14.61 81.03
4 0.02 7.36 88.38
80. Análisis de
Correspondencias
Múltiples
Javier Trejos
Introducción
Tablas de datos
Objetivos del ACM
Nubes de perfiles
Ejes y coordenadas
factoriales
Interpretaciones en
A.C.M.
Ejemplos
Análisis de Correspondencias Múltiples
Ejemplo: datos médicos – Primer plano principal
Eje2
Eje1
✻
❄
✲
✛
•
Masc
•
Feme
•
ecSI
•
ecNO
•
mpSI
•
mpNO
•
toSI
•
toNO
•
carSI
•
carNO •
taSI
•
taNO
•
Cont
•
Mejo
•
RN/A
•
ucpSI
•
ucpNO
81. Análisis de
Correspondencias
Múltiples
Javier Trejos
Introducción
Tablas de datos
Objetivos del ACM
Nubes de perfiles
Ejes y coordenadas
factoriales
Interpretaciones en
A.C.M.
Ejemplos
Análisis de Correspondencias Múltiples
Ejemplo: datos médicos – interpretación
◮ Todas las modalidades, excepto ecSI, ecNO, toSI,
toNO, Mejo, y RN/A, son descriptivas del primer eje.
◮ Es decir, su contribución absoluta cta1(j) satisface la
condición cta1(j) 1
17.
◮ Las modalidades explicativas del segundo eje son:
Masc, ecSI, toSI, toNO, ucpSI y ucpNO.
◮ Por otra parte todas las modalidades representadas en
el primer plano principal en un 50% o más, se
consideran bien representadas en este plano. Las únicas
modalidades que no satisfacen este umbral son RN/A,
ucpSI y ucpNO.
82. Análisis de
Correspondencias
Múltiples
Javier Trejos
Introducción
Tablas de datos
Objetivos del ACM
Nubes de perfiles
Ejes y coordenadas
factoriales
Interpretaciones en
A.C.M.
Ejemplos
Análisis de Correspondencias Múltiples
Ejemplo: datos médicos – interpretación
◮ La oposición de modalidades por los ejes 1 y 2, podrı́a
ser interpretable por el especialista en el tema.
◮ Es el caso, por ejemplo, de las modalidades taSI,
carNO, mpNO, Masc y Mejo (parte derecha de la
Figura 37), que son opuestas por el primer eje, a las
modalidades taNO, carSI, mpSI, Feme y Cont (parte
izquierda de la Figura 37).
◮ Posible asociación del Sexo con las variables
Multiparidad (mpSI, mpNO), Cirujı́a ano Rectal (carSI,
carNO), Trauma Anal (taSI, taNO) y Respuesta a la
esfinteroplastı́a (Cont, Mejo).
◮ Una lectura similar se puede hacer del eje 2, que opone
ucpSI y toNO (en la parte superior del plano), con
ucpNO y toSI (en la parte inferior del plano).
83. Análisis de
Correspondencias
Múltiples
Javier Trejos
Introducción
Tablas de datos
Objetivos del ACM
Nubes de perfiles
Ejes y coordenadas
factoriales
Interpretaciones en
A.C.M.
Ejemplos
Análisis de Correspondencias Múltiples
Ejemplo: datos sociológicos
◮ Datos de 1987
◮ Se estudian las actitudes de los estudiantes
costarricenses de secundaria respecto a ciertos
conceptos sociológicos escogidos, tales como
◮ empresa privada–libertad, y
◮ democracia–ejército.
◮ Para el estudio, se redactó un cuestionario con dos tipos
de preguntas.
◮ Por un lado, lo que se llamarán variables
socioeconómicas,
◮ y por otro, la opinión de los estudiantes acerca de una
serie de aspectos relacionados con la libertad, la
democracia, la paz, etc.
84. Análisis de
Correspondencias
Múltiples
Javier Trejos
Introducción
Tablas de datos
Objetivos del ACM
Nubes de perfiles
Ejes y coordenadas
factoriales
Interpretaciones en
A.C.M.
Ejemplos
Análisis de Correspondencias Múltiples
Ejemplo: datos sociológicos
◮ Variables socioeconómicas:
◮ sexo: sexo del estudiante.
◮ cole: tipo de colegio.
◮ ingr: ingreso familiar.
◮ reli: religión del estudiante.
◮ poli: partido polı́tico por el que simpatiza.
◮ edpa: grado de educación del padre.
◮ edma: grado de educación de la madre.
◮ En cuanto al fenómeno de la opinión, cada tema tiene
asociadas cinco preguntas: una principal, dos
caracterı́sticas y dos de control. De los doce temas del
cuestionario se han escogido dos: libertad y democracia.
85. Análisis de
Correspondencias
Múltiples
Javier Trejos
Introducción
Tablas de datos
Objetivos del ACM
Nubes de perfiles
Ejes y coordenadas
factoriales
Interpretaciones en
A.C.M.
Ejemplos
Análisis de Correspondencias Múltiples
Ejemplo: datos sociológicos
◮ Relación entre libertad y empresa privada:
◮ var1: la empresa privada es necesaria para que exista
libertad.
◮ var2: se puede entrar en un sindicato sin ser perseguido
o despedido.
◮ var3: si se trabaja en la empresa privada no hay tiempo
para ocuparse de sus propias cosas.
◮ var4: los trabajadores deben respetar las órdenes de su
patrono sin criticarlas.
◮ var5: mi padre debe dedicarle más tiempo a la empresa
o institución donde trabaja.
86. Análisis de
Correspondencias
Múltiples
Javier Trejos
Introducción
Tablas de datos
Objetivos del ACM
Nubes de perfiles
Ejes y coordenadas
factoriales
Interpretaciones en
A.C.M.
Ejemplos
Análisis de Correspondencias Múltiples
Ejemplo: datos sociológicos
◮ Relación entre democracia y ejército:
◮ var6: un paı́s democrático no necesita ejército.
◮ var7: un paı́s con ejército es un paı́s totalitario.
◮ var8: es necesario que Costa Rica tenga ejército para
defenderse de amenazas externas.
◮ var9: la existencia de un ejército en Costa Rica podrı́a
llevar a una dictadura militar en corto plazo.
◮ var10: Estados Unidos no es un paı́s democrático
porque tiene ejército.
87. Análisis de
Correspondencias
Múltiples
Javier Trejos
Introducción
Tablas de datos
Objetivos del ACM
Nubes de perfiles
Ejes y coordenadas
factoriales
Interpretaciones en
A.C.M.
Ejemplos
Análisis de Correspondencias Múltiples
Ejemplo: datos sociológicos
◮ Cada pregunta tiene cinco modalidades de respuesta:
◮ fde: fuertemente en desacuerdo.
◮ des: en desacuerdo.
◮ ind: indeciso.
◮ dac: de acuerdo.
◮ fac: fuertemente de acuerdo.
◮ El cuestionario fue pasado en dos colegios del área
metropolitana, uno público y otro privado. Se entrevistó
un total de 232 estudiantes de cuarto y quinto año,
durante el primer semestre de 1987.
◮ No respuesta: se mantienen para ingr y poli. Se
sustituyen al azar para las demás.
◮ Las modalidades con muy poco efectivo fueron reunidas
con otras.
88. Análisis de
Correspondencias
Múltiples
Javier Trejos
Introducción
Tablas de datos
Objetivos del ACM
Nubes de perfiles
Ejes y coordenadas
factoriales
Interpretaciones en
A.C.M.
Ejemplos
Análisis de Correspondencias Múltiples
Ejemplo: datos sociológicos – Frecuencias para las variables
socioeconómicas
Variable Modalidades código frec. %
Tipo de público publ 124 53
colegio privado priv 108 47
Sexo masculino masc 101 44
femenino feme 131 56
Nivel de I 7 I1 24 10
ingreso 7 ≤ I 14 I2 44 19
de la 14 ≤ I 21 I3 35 15
familia 21 ≤ I 28 I4 30 13
(en miles 28 ≤ I 35 I5 34 15
de 35 ≤ I I6 47 20
colones) no responde I7 18 8
Grado de primaria incompleta P1 35 15
educación primaria completa P2 30 13
del padre secundaria incompleta P3 34 15
secundaria completa P4 35 16
universit. incompleta P5 29 12
universit. completa P6 68 29
89. Análisis de
Correspondencias
Múltiples
Javier Trejos
Introducción
Tablas de datos
Objetivos del ACM
Nubes de perfiles
Ejes y coordenadas
factoriales
Interpretaciones en
A.C.M.
Ejemplos
Análisis de Correspondencias Múltiples
Ejemplo: datos sociológicos – Frecuencias para las variables
socioeconómicas
Variable Modalidades código frec. %
Grado de primaria incompleta M1 37 16
educación primaria completa M2 41 18
de la madre secundaria incompleta M3 43 18
secundaria completa M4 41 17
universit. incompleta M5 18 8
universit. completa M6 52 23
Religión católica cato 127 55
evangélica evan 75 32
no creyente nocr 8 3
otra otra 22 10
Partido PUSC pusc 82 35
polı́tico PLN pln 129 56
otro otro 8 4
no responde nore 12 5
90. Análisis de
Correspondencias
Múltiples
Javier Trejos
Introducción
Tablas de datos
Objetivos del ACM
Nubes de perfiles
Ejes y coordenadas
factoriales
Interpretaciones en
A.C.M.
Ejemplos
Análisis de Correspondencias Múltiples
Ejemplo: datos sociológicos – Frecuencias de las variables de opinión
(Empresa privada–Libertad).
Cód. Variable Mod. frec. %
var1 La empresa privada es fde1 60 26
necesaria para que des1 74 32
exista libertad ind1 39 17
dac1 32 14
fac1 27 11
var2 Se puede entrar en un fde2 60 26
sindicato sin ser des2 119 51
perseguido o ind2 29 13
despedido dac2 24 10
var3 Si se trabaja en la des3 10 4
empresa privada no hay ind3 36 16
tiempo para ocuparse dac3 145 62
de sus propias cosas fac3 41 18
var4 Los trabajadores deben des4 58 25
respetar las órdenes ind4 22 9
de su patrono sin dac4 123 53
criticarlas fac4 29 13
var5 Mi padre debe dedicarle des5 32 18
más tiempo a la ind5 93 40
empresa o institución dac5 60 26
donde trabaja fac5 37 16
91. Análisis de
Correspondencias
Múltiples
Javier Trejos
Introducción
Tablas de datos
Objetivos del ACM
Nubes de perfiles
Ejes y coordenadas
factoriales
Interpretaciones en
A.C.M.
Ejemplos
Análisis de Correspondencias Múltiples
Ejemplo: datos sociológicos – Frecuencias de las variables de opinión
(Democracia–Libertad).
Cód. Variable Mod. frec. %
var6 Un paı́s des6 40 17
democrático no ind6 24 11
necesita ejército dac6 56 24
fac6 112 48
var7 Un paı́s con fde7 19 8
ejército es un paı́s des7 45 19
totalitario ind7 106 46
dac7 44 19
fac7 18 8
var8 Es necesario que Costa fde8 15 6
Rica tenga ejército des8 23 10
para defenderse de ind8 36 16
amenazas externas dac8 41 18
fac8 117 50
var9 La existencia de un des9 97 41
ejército en Costa ind9 67 29
Rica podrı́a llevar dac9 34 15
a una dictadura. . . fac9 34 15
var10 Estados Unidos no es un fde0 23 10
paı́s democático des0 41 18
porque tiene ind0 118 51
ejército dac0 50 21
92. Análisis de
Correspondencias
Múltiples
Javier Trejos
Introducción
Tablas de datos
Objetivos del ACM
Nubes de perfiles
Ejes y coordenadas
factoriales
Interpretaciones en
A.C.M.
Ejemplos
Análisis de Correspondencias Múltiples
ACM de las 10 variables sociológicas de opinión – Primer plano principal
•
dac6
• ind1
•
fac9 •
dac4
•
des0
•
dac5
•
ind7
• fde8
•
des2
• dac3
•
des1 •
ind5
•
des5
•
ind6
•
fac7
•
dac1
•
ind9
• ind2
• des4
• ind0
•
dac7
• dac9
• des8
•
ind9
•
des3
•
des7
•
fac6
•
fde1
•
fde0
•
fde2
•
fac5
•
des9
•
fac4
•
fac8
•
fac9
•
fac1
• des6
•
fde7
• ind8
• ind4
• dac0
• dac8
•
dac2
✻
✲
Eje 1
Eje 2
93. Análisis de
Correspondencias
Múltiples
Javier Trejos
Introducción
Tablas de datos
Objetivos del ACM
Nubes de perfiles
Ejes y coordenadas
factoriales
Interpretaciones en
A.C.M.
Ejemplos
Análisis de Correspondencias Múltiples
ACM de las 10 variables sociológicas de opinión
Hechos sobresalientes en el primer plano principal:
94. Análisis de
Correspondencias
Múltiples
Javier Trejos
Introducción
Tablas de datos
Objetivos del ACM
Nubes de perfiles
Ejes y coordenadas
factoriales
Interpretaciones en
A.C.M.
Ejemplos
Análisis de Correspondencias Múltiples
ACM de las 10 variables sociológicas de opinión
Hechos sobresalientes en el primer plano principal:
◮ Se muestra una relación directa entre las variables 4
y 5, excepto por la modalidad “indecisos”. Es decir, la
opinión de los entrevistados respecto de la proposición
“los trabajadores deben respetar las órdenes de los
patronos” (var4), es básicamente la misma que tienen
respecto de “mi padre debe dedicarle más tiempo a la
empresa” (var5), excepto por los indecisos. Dicha
relación se indica en la Figura 1 por medio de
trayectorias siguiendo el orden de las modalidades de
una misma variable.
95. Análisis de
Correspondencias
Múltiples
Javier Trejos
Introducción
Tablas de datos
Objetivos del ACM
Nubes de perfiles
Ejes y coordenadas
factoriales
Interpretaciones en
A.C.M.
Ejemplos
Análisis de Correspondencias Múltiples
ACM de las 10 variables sociológicas de opinión
Hechos sobresalientes en el primer plano principal:
◮ Se muestra una relación directa entre las variables 4
y 5, excepto por la modalidad “indecisos”. Es decir, la
opinión de los entrevistados respecto de la proposición
“los trabajadores deben respetar las órdenes de los
patronos” (var4), es básicamente la misma que tienen
respecto de “mi padre debe dedicarle más tiempo a la
empresa” (var5), excepto por los indecisos. Dicha
relación se indica en la Figura 1 por medio de
trayectorias siguiendo el orden de las modalidades de
una misma variable.
◮ Sobre este plano también se observa que la opinión
favorable (fac1) respecto de la proposición “la empresa
privada es necesaria para que exista libertad”, está
asociada con una opinión desfavorable (des6) respecto
de la proposición “un paı́s democrático no necesita
ejército”.
96. Análisis de
Correspondencias
Múltiples
Javier Trejos
Introducción
Tablas de datos
Objetivos del ACM
Nubes de perfiles
Ejes y coordenadas
factoriales
Interpretaciones en
A.C.M.
Ejemplos
Análisis de Correspondencias Múltiples
ACM de las preguntas “empresa privada–libertad”
•
fac1
•
dac1
•
ind1
•
des1
•
fde1
•
fde2
• des2
•
ind2
• dac2
•
fac3
•
dac3
• ind3
•
des3
•
fac4
•
dac4
•
ind4
• des4
•
fac5
•
dac5
•
ind5
• des5
✻
✲
Eje 1
Eje 2