SlideShare una empresa de Scribd logo
1 de 51
Descargar para leer sin conexión
Análisis en
Componentes
Principales
Javier Trejos
Introducción
Objetivo del
ACP
Solución del
ACP
ACP normado
Ejemplo
Elementos
principales
Representaciones
Gráficas
Indices de
Calidad
Interpretación
de Resultados
Análisis en Componentes Principales
Javier Trejos
Escuela de Matemática – CIMPA
Universidad de Costa Rica
II ciclo 2020
Análisis en
Componentes
Principales
Javier Trejos
Introducción
Objetivo del
ACP
Solución del
ACP
ACP normado
Ejemplo
Elementos
principales
Representaciones
Gráficas
Indices de
Calidad
Interpretación
de Resultados
Esquema
1 Introducción
2 Objetivo del ACP
3 Solución del ACP
4 ACP normado
5 Ejemplo
6 Elementos principales
7 Representaciones Gráficas
8 Indices de Calidad
9 Interpretación de Resultados
Análisis en
Componentes
Principales
Javier Trejos
Introducción
Objetivo del
ACP
Solución del
ACP
ACP normado
Ejemplo
Elementos
principales
Representaciones
Gráficas
Indices de
Calidad
Interpretación
de Resultados
Análisis en Componentes Principales
Introducción
Se dispone de una tabla de datos X de p variables
cuantitativas medidas sobre n individuos
Análisis en
Componentes
Principales
Javier Trejos
Introducción
Objetivo del
ACP
Solución del
ACP
ACP normado
Ejemplo
Elementos
principales
Representaciones
Gráficas
Indices de
Calidad
Interpretación
de Resultados
Análisis en Componentes Principales
Introducción
Se dispone de una tabla de datos X de p variables
cuantitativas medidas sobre n individuos
ACP: técnica de reducción de las dimensiones
Análisis en
Componentes
Principales
Javier Trejos
Introducción
Objetivo del
ACP
Solución del
ACP
ACP normado
Ejemplo
Elementos
principales
Representaciones
Gráficas
Indices de
Calidad
Interpretación
de Resultados
Análisis en Componentes Principales
Introducción
Se dispone de una tabla de datos X de p variables
cuantitativas medidas sobre n individuos
ACP: técnica de reducción de las dimensiones
Pearson (1900): encontrar la recta de mejor ajuste en 2
dimensiones
Análisis en
Componentes
Principales
Javier Trejos
Introducción
Objetivo del
ACP
Solución del
ACP
ACP normado
Ejemplo
Elementos
principales
Representaciones
Gráficas
Indices de
Calidad
Interpretación
de Resultados
Análisis en Componentes Principales
Introducción
Se dispone de una tabla de datos X de p variables
cuantitativas medidas sobre n individuos
ACP: técnica de reducción de las dimensiones
Pearson (1900): encontrar la recta de mejor ajuste en 2
dimensiones
Hotelling (1933): encontrar variables sintéticas
independientes de máxima varianza
Análisis en
Componentes
Principales
Javier Trejos
Introducción
Objetivo del
ACP
Solución del
ACP
ACP normado
Ejemplo
Elementos
principales
Representaciones
Gráficas
Indices de
Calidad
Interpretación
de Resultados
Análisis en Componentes Principales
Introducción
Se dispone de una tabla de datos X de p variables
cuantitativas medidas sobre n individuos
ACP: técnica de reducción de las dimensiones
Pearson (1900): encontrar la recta de mejor ajuste en 2
dimensiones
Hotelling (1933): encontrar variables sintéticas
independientes de máxima varianza
Pagès (1970): reducir la dimensión del espacio de
representación de los individuos perdiendo el mı́nimo de
información
Análisis en
Componentes
Principales
Javier Trejos
Introducción
Objetivo del
ACP
Solución del
ACP
ACP normado
Ejemplo
Elementos
principales
Representaciones
Gráficas
Indices de
Calidad
Interpretación
de Resultados
Análisis en Componentes Principales
Introducción
Se dispone de una tabla de datos X de p variables
cuantitativas medidas sobre n individuos
ACP: técnica de reducción de las dimensiones
Pearson (1900): encontrar la recta de mejor ajuste en 2
dimensiones
Hotelling (1933): encontrar variables sintéticas
independientes de máxima varianza
Pagès (1970): reducir la dimensión del espacio de
representación de los individuos perdiendo el mı́nimo de
información
Los objetivos son duales y equivalentes
Análisis en
Componentes
Principales
Javier Trejos
Introducción
Objetivo del
ACP
Solución del
ACP
ACP normado
Ejemplo
Elementos
principales
Representaciones
Gráficas
Indices de
Calidad
Interpretación
de Resultados
Análisis en Componentes Principales
Situación
Se tiene una tabla de datos cuantitativos n × p.
Análisis en
Componentes
Principales
Javier Trejos
Introducción
Objetivo del
ACP
Solución del
ACP
ACP normado
Ejemplo
Elementos
principales
Representaciones
Gráficas
Indices de
Calidad
Interpretación
de Resultados
Análisis en Componentes Principales
Objetivo
Se quiere:
obtener una representación en pocas dimensiones de los
objetos, perdiendo el mı́nimo de información;
Análisis en
Componentes
Principales
Javier Trejos
Introducción
Objetivo del
ACP
Solución del
ACP
ACP normado
Ejemplo
Elementos
principales
Representaciones
Gráficas
Indices de
Calidad
Interpretación
de Resultados
Análisis en Componentes Principales
Objetivo
Se quiere:
obtener una representación en pocas dimensiones de los
objetos, perdiendo el mı́nimo de información;
obtener (pocas) variables sintéticas, basadas en las
variables originales y no correlacionadas entre ellas;
Análisis en
Componentes
Principales
Javier Trejos
Introducción
Objetivo del
ACP
Solución del
ACP
ACP normado
Ejemplo
Elementos
principales
Representaciones
Gráficas
Indices de
Calidad
Interpretación
de Resultados
Análisis en Componentes Principales
Objetivo
Se quiere:
obtener una representación en pocas dimensiones de los
objetos, perdiendo el mı́nimo de información;
obtener (pocas) variables sintéticas, basadas en las
variables originales y no correlacionadas entre ellas;
son objetivos equivalentes (y duales).
Análisis en
Componentes
Principales
Javier Trejos
Introducción
Objetivo del
ACP
Solución del
ACP
ACP normado
Ejemplo
Elementos
principales
Representaciones
Gráficas
Indices de
Calidad
Interpretación
de Resultados
Objetivo del ACP
Sean la nube de puntos N = (X, M, Dp), con M la
métrica p × p sobre el espacio de individuos y Dp la
métrica de pesos (matriz diagonal n × n) sobre el espacio
de variables
Análisis en
Componentes
Principales
Javier Trejos
Introducción
Objetivo del
ACP
Solución del
ACP
ACP normado
Ejemplo
Elementos
principales
Representaciones
Gráficas
Indices de
Calidad
Interpretación
de Resultados
Objetivo del ACP
Sean la nube de puntos N = (X, M, Dp), con M la
métrica p × p sobre el espacio de individuos y Dp la
métrica de pesos (matriz diagonal n × n) sobre el espacio
de variables
Supondremos que las variables xj están centradas
Se busca un espacio de dimensión q, menor que p, de
manera que las posiciones relativas de los
puntos–individuos sean lo más similares posibles a sus
posiciones en el espacio Rp
Análisis en
Componentes
Principales
Javier Trejos
Introducción
Objetivo del
ACP
Solución del
ACP
ACP normado
Ejemplo
Elementos
principales
Representaciones
Gráficas
Indices de
Calidad
Interpretación
de Resultados
Objetivo del ACP
Sean la nube de puntos N = (X, M, Dp), con M la
métrica p × p sobre el espacio de individuos y Dp la
métrica de pesos (matriz diagonal n × n) sobre el espacio
de variables
Supondremos que las variables xj están centradas
Se busca un espacio de dimensión q, menor que p, de
manera que las posiciones relativas de los
puntos–individuos sean lo más similares posibles a sus
posiciones en el espacio Rp
Esto significa que hay una pérdida mı́nima de
información al proyectar los n individuos sobre un espacio
de dimensión menor
Análisis en
Componentes
Principales
Javier Trejos
Introducción
Objetivo del
ACP
Solución del
ACP
ACP normado
Ejemplo
Elementos
principales
Representaciones
Gráficas
Indices de
Calidad
Interpretación
de Resultados
Objetivo del ACP
Sean la nube de puntos N = (X, M, Dp), con M la
métrica p × p sobre el espacio de individuos y Dp la
métrica de pesos (matriz diagonal n × n) sobre el espacio
de variables
Supondremos que las variables xj están centradas
Se busca un espacio de dimensión q, menor que p, de
manera que las posiciones relativas de los
puntos–individuos sean lo más similares posibles a sus
posiciones en el espacio Rp
Esto significa que hay una pérdida mı́nima de
información al proyectar los n individuos sobre un espacio
de dimensión menor
De esta forma, su dispersión en el espacio proyectado Rq
debe ser máxima, de manera que la forma de la nube se
asemeje lo mejor posible a su forma original.
Análisis en
Componentes
Principales
Javier Trejos
Introducción
Objetivo del
ACP
Solución del
ACP
ACP normado
Ejemplo
Elementos
principales
Representaciones
Gráficas
Indices de
Calidad
Interpretación
de Resultados
Objetivo del ACP
Objetivo dual
Se puede plantear de otra forma el objetivo del ACP, esta
vez desde el punto de vista de las variables
Dada la tabla Xn×p, se busca un conjunto de q variables
sintéticas c1, c2, . . . , cq, donde q < p (las componentes
principales), tal que:
1 Cada componente principal ck
debe ser combinación
lineal de las variables originales xj
; esto significa que la
información contenida en las xj
también está reflejada en
las ck
.
2 Las componentes principales deben ser no
correlacionadas dos a dos; esto significa que las ck
no
tienen información redundante.
3 Las componentes principales deben tener varianza
máxima; esto significa que contendrán el máximo de
información posible.
Todo lo anterior se puede deducir del objetivo inicial:
reducción de la dimensión del espacio de individuos
Análisis en
Componentes
Principales
Javier Trejos
Introducción
Objetivo del
ACP
Solución del
ACP
ACP normado
Ejemplo
Elementos
principales
Representaciones
Gráficas
Indices de
Calidad
Interpretación
de Resultados
Objetivo del ACP
Ejemplo: Tabla de notas escolares
Sea la tabla de datos de notas escolares, que contiene las notas
obtenidas por 10 estudiantes en cinco materias.
Todas las notas están en la escala de 0 a 10.
Estudiante Matemáticas Ciencias Español Historia Ed. Fı́sica
Lucı́a 7.0 6.5 9.2 8.6 8.0
Pedro 7.5 9.4 7.3 7.0 7.0
Inés 7.6 9.2 8.0 8.0 7.5
Luis 5.0 6.5 6.5 7.0 9.0
Andrés 6.0 6.0 7.8 8.9 7.3
Ana 7.8 9.6 7.7 8.0 6.5
Carlos 6.3 6.4 8.2 9.0 7.2
José 7.9 9.7 7.5 8.0 6.0
Sonia 6.0 6.0 6.5 5.5 8.7
Marı́a 6.8 7.2 8.7 9.0 7.0
Análisis en
Componentes
Principales
Javier Trejos
Introducción
Objetivo del
ACP
Solución del
ACP
ACP normado
Ejemplo
Elementos
principales
Representaciones
Gráficas
Indices de
Calidad
Interpretación
de Resultados
Solución del ACP
La solución del Análisis en Componentes Principales se
obtiene al diagonalizar la matriz de correlaciones R, es
decir, el cálculo de sus valores y vectores propios.
Llamaremos A.C.P. normado el caso en que se usan los
datos centrados y estandarizados, lo que corresponde a
usar la métrica de los inversos de las varianzas, en cuyo
caso la solución se obtiene al diagonalizar R,
y llamaremos A.C.P. general cuando la métrica M es
cualquiera, en cuyo caso la solución se obtiene al
diagonalizar VM, producto de la métrica y la matriz de
varianzas–covarianzas.
Análisis en
Componentes
Principales
Javier Trejos
Introducción
Objetivo del
ACP
Solución del
ACP
ACP normado
Ejemplo
Elementos
principales
Representaciones
Gráficas
Indices de
Calidad
Interpretación
de Resultados
Solución del ACP
ACP normado
Dada la tabla de datos Xn×p, procedemos a centrar y
estandarizar las variables, de forma que en adelante todas
tienen media cero y varianza 1.
Estamos en presencia de la nube de puntos
N = (X, Ip, Dp), donde Ip es la identidad p × p y Dp es
la métrica diagonal de pesos.
En este contexto, la matriz de covarianzas V y la matriz
de correlaciones R coinciden.
Se tiene I(N) = traza (V) = traza R = p
Se busca el subespacio H de Rp tal que la proyección de
los individuos se represente lo mejor posible en H.
Esto significa que la inercia de la nube de los puntos
proyectados debe ser máxima
Cualquier individuo xi en Rp puede ser presentado como
xi = PrH(xi) + PrH⊥ (xi) = ai + bi, donde
ai = PrH(xi) ∈ H y bi = PrH⊥ (xi) ∈ H⊥
Análisis en
Componentes
Principales
Javier Trejos
Introducción
Objetivo del
ACP
Solución del
ACP
ACP normado
Ejemplo
Elementos
principales
Representaciones
Gráficas
Indices de
Calidad
Interpretación
de Resultados
Solución del ACP
ACP normado
Figura: Proyección de un punto-individuo sobre un subespacio y su
complemento ortogonal.
Análisis en
Componentes
Principales
Javier Trejos
Introducción
Objetivo del
ACP
Solución del
ACP
ACP normado
Ejemplo
Elementos
principales
Representaciones
Gráficas
Indices de
Calidad
Interpretación
de Resultados
Solución del ACP
ACP normado
En vista de la perpendicularidad entre ai y bi, por el
teorema de Pitágoras se tiene que:
kxik2
= kaik2
+ kbik2
Luego
pikxik2
= pikaik2
+ pikbik2
,
de donde
n
X
i=1
pikxik2
=
n
X
i=1
pikaik2
+
n
X
i=1
pikbik2
.
Si definimos la proximidad entre N y el subespacio H
como
IH(N) =
n
X
i=1
pikxi − aik2
=
n
X
i=1
pikbik2
entonces el objetivo del A.C.P. será encontrar H tal que
Análisis en
Componentes
Principales
Javier Trejos
Introducción
Objetivo del
ACP
Solución del
ACP
ACP normado
Ejemplo
Elementos
principales
Representaciones
Gráficas
Indices de
Calidad
Interpretación
de Resultados
Solución del ACP
ACP normado
Poniendo IH⊥ (N) =
Pn
i=1 pikaik2, entonces es claro que
I(N) = IH(N) + IH⊥ (N), (1)
Por lo que IH⊥ (N) es máxima cuando IH(N) es mı́nima.
Análisis en
Componentes
Principales
Javier Trejos
Introducción
Objetivo del
ACP
Solución del
ACP
ACP normado
Ejemplo
Elementos
principales
Representaciones
Gráficas
Indices de
Calidad
Interpretación
de Resultados
Solución del ACP
ACP normado
Se prueba el teorema de inclusión: el espacio óptimo de
dimensión k está contenido en el espacio óptimo de
dimensión k + 1.
Esto permite seguir como estrategia
1 la búsqueda del espacio óptimo de dimensión uno,
2 enseguida del espacio óptimo de dimensión dos que
contenga al anterior. Para ello, será suficiente hallar el
espacio óptimo de dimensión uno, ortogonal al primer
espacio encontrado, y ası́ se genera el espacio óptimo de
dimensión 2, mediante la suma directa de los dos espacios
encontrados.
Es sabido que un espacio de dimensión uno es generado
por un vector: ponemos ∆u el espacio generado por el
vector u.
Tomaremos los vectores que generan estos espacios de
norma 1.
Análisis en
Componentes
Principales
Javier Trejos
Introducción
Objetivo del
ACP
Solución del
ACP
ACP normado
Ejemplo
Elementos
principales
Representaciones
Gráficas
Indices de
Calidad
Interpretación
de Resultados
Solución del ACP
ACP normado
Se tiene que I∆u (N) es mı́nima si I∆⊥
u
(N) es máxima.
Es más fácil el cálculo de I∆⊥
u
(N).
Por lo tanto, se buscará el vector u de norma 1 tal que
I∆⊥
u
(N) sea máxima.
Ası́, podemos decir que buscamos:
1 El vector u1 tal que ku1k = 1 e I∆⊥
u1
(N) sea máxima.
2 El vector u2 tal que ku2k = 1, u1 ⊥ u2 e I∆⊥
u2
(N) sea
máxima.
3 El vector u3 tal que ku3k = 1, u1 ⊥ u3, u2 ⊥ u3 e
I⊥
∆u3
(N) sea máxima.
4 Etc.
Análisis en
Componentes
Principales
Javier Trejos
Introducción
Objetivo del
ACP
Solución del
ACP
ACP normado
Ejemplo
Elementos
principales
Representaciones
Gráficas
Indices de
Calidad
Interpretación
de Resultados
Solución del ACP
ACP normado
Proposición
Si u es un vector de Rp con norma 1, entonces
I∆⊥
u
(N) = ut
Ru.
Demostración: Sea xi un individuo, es decir, una fila de la
tabla de datos X. Sean ai = Pr∆u (xi) su proyección sobre ∆u
y bi = Pr∆⊥
u
(xi) su proyección sobre ∆⊥
u , de manera que
xi = ai + bi.
Como ai es la proyección sobre la recta generada por u,
entonces existe un coeficiente ci tal que ai = ciu. Es más, se
sabe que
ci = hxi, ui = xt
iu
ya que la métrica es la identidad Ip y kuk = 1.
Análisis en
Componentes
Principales
Javier Trejos
Introducción
Objetivo del
ACP
Solución del
ACP
ACP normado
Ejemplo
Elementos
principales
Representaciones
Gráficas
Indices de
Calidad
Interpretación
de Resultados
Solución del ACP
ACP normado
Proposición
Si u es un vector de Rp con norma 1, entonces
I∆⊥
u
(N) = ut
Ru.
Demostración: (Cont.) Por lo tanto
I∆⊥
u
(N) =
n
X
i=1
pikaik2
=
n
X
i=1
pikciuk2
=
n
X
i=1
pic2
i =
n
X
i=1
pixt
iu xt
i u
= ut
n
X
i=1
pixi xt
i
!
u = ut
Xt
DpXu
= ut
Ru.
Análisis en
Componentes
Principales
Javier Trejos
Introducción
Objetivo del
ACP
Solución del
ACP
ACP normado
Ejemplo
Elementos
principales
Representaciones
Gráficas
Indices de
Calidad
Interpretación
de Resultados
Solución del ACP
ACP normado: El primer Eje
El primer eje que se busca, u1, genera la recta ∆u1 tal que
ku1k = 1 e I∆⊥
u1
(N) = ut
1Ru1 es máxima.
Para ello, se plantea el problema de maximización con
restricciones:
Maximizar F(u) = I∆⊥
u
(N) = utRu
sujeto a kuk2 = utu = 1.
Usando la técnica de multiplicadores de Lagrange, si
L(u, λ) = F(u) − λ(kuk2
− 1)
= ut
Ru − λ(ut
u − 1),
entonces
∂L
∂u
= 2Ru − 2λu = 0,
por lo que
Ru = λu.
Análisis en
Componentes
Principales
Javier Trejos
Introducción
Objetivo del
ACP
Solución del
ACP
ACP normado
Ejemplo
Elementos
principales
Representaciones
Gráficas
Indices de
Calidad
Interpretación
de Resultados
Solución del ACP
ACP normado: El primer Eje
Ru = λu significa que u es vector propio1 de R, asociado al
valor propio λ.
Es más,
F(u) = ut
Ru = ut
(λu) = λut
u = λ.
Por lo tanto, F se maximiza cuando λ es máximo.
Al vector propio u1 asociado al mayor valor propio λ1 de R se
le llama el primer eje del A.C.P. de la nube N.
1
Recuérdese que un escalar λ se llama valor propio de una matriz A si
existe un vector v 6= 0 tal que Av = λv; al vector v se le llama vector
propio de A asociado a λ. Al proceso de obtener todos los valores y
vectores propios de una matriz se le llama diagonalización de la matriz.
Análisis en
Componentes
Principales
Javier Trejos
Introducción
Objetivo del
ACP
Solución del
ACP
ACP normado
Ejemplo
Elementos
principales
Representaciones
Gráficas
Indices de
Calidad
Interpretación
de Resultados
Solución del ACP
ACP normado: El segundo Eje
El segundo eje buscado, u2, debe combinarse con u1 y
formar un subespacio de dimensión 2 (es decir, un plano),
tal que la inercia proyectada de la nube N sea máxima.
Por el teorema de inclusión, como ya tenemos el espacio
óptimo ∆u1 de dimensión 1 y sabemos que éste está
incluido en el espacio óptimo de dimensión 2, entonces
basta con encontrar el vector u —ortogonal a u1— con
I∆⊥
u
(N) máxima.
Esto es,
Maximizar F(u) = I∆⊥
u
(N) = utRu
sujeto a kuk2 = utu = 1,
u1 ⊥ u.
Análisis en
Componentes
Principales
Javier Trejos
Introducción
Objetivo del
ACP
Solución del
ACP
ACP normado
Ejemplo
Elementos
principales
Representaciones
Gráficas
Indices de
Calidad
Interpretación
de Resultados
Solución del ACP
ACP normado: El segundo Eje
Por ello, planteamos el problema de optimización con
multiplicadores de Lagrange en que buscamos el vector u que
maximiza L:
L(u, λ, µ) = F(u) − λ(kuk2
− 1) − µ(hu1, ui = 0)
= ut
Ru − λ(ut
u − 1) − µut
u1,
de donde
∂L
∂u
= 2Ru − 2λu − µu1 = 0. (2)
Análisis en
Componentes
Principales
Javier Trejos
Introducción
Objetivo del
ACP
Solución del
ACP
ACP normado
Ejemplo
Elementos
principales
Representaciones
Gráficas
Indices de
Calidad
Interpretación
de Resultados
Solución del ACP
ACP normado: El segundo Eje
Premultiplicando por ut
1:
ut
1Ru = λut
1u + µut
1u1
y como
ut
1Ru = ut
Ru1 = ut
(λ1u1),
entonces
λ1ut
1u = 0 + µ,
de donde µ = 0, ya que ut
1u = 0. Por lo tanto, en la ecuación
(2) se debe cumplir
2Ru − 2λu = 0
es decir
Ru = λu.
Esto significa que u también es vector propio de R.
Análisis en
Componentes
Principales
Javier Trejos
Introducción
Objetivo del
ACP
Solución del
ACP
ACP normado
Ejemplo
Elementos
principales
Representaciones
Gráficas
Indices de
Calidad
Interpretación
de Resultados
Solución del ACP
ACP normado: El segundo Eje
Como de nuevo F(u) = I∆⊥
u
(N) = λ y este valor debe ser
máximo, entonces λ es el segundo valor propio de R (dados en
orden decreciente), denotado λ2. Ası́, el segundo eje del
A.C.P. de N es el vector propio u2 de R asociado a λ2.
El primer plano principal H1 está generado por los dos
primeros ejes principales:
H1 = ∆u1 ⊕ ∆u2
y tiene inercia IH⊥
1
(N) = λ1 + λ2.
Análisis en
Componentes
Principales
Javier Trejos
Introducción
Objetivo del
ACP
Solución del
ACP
ACP normado
Ejemplo
Elementos
principales
Representaciones
Gráficas
Indices de
Calidad
Interpretación
de Resultados
Solución del ACP
ACP normado: Eje siguientes
En general, siguiendo el mismo procedimiento anterior, los
ejes principales del A.C.P. de la nube N = (X, Ip, Dp)
están generados por los vectores propios de la matriz de
correlaciones R asociados a los valores propios de ésta,
dados en orden decreciente:
λ1 ≥ λ2 ≥ . . . ≥ λp ≥ 0
asociados respectivamente a u1, u2, . . . , up.
Seleccionando cualquier par de ejes principales, se puede
generar un plano principal.
Análisis en
Componentes
Principales
Javier Trejos
Introducción
Objetivo del
ACP
Solución del
ACP
ACP normado
Ejemplo
Elementos
principales
Representaciones
Gráficas
Indices de
Calidad
Interpretación
de Resultados
Solución del ACP
Diagonalización de R
Obsérvese que la matriz R es simétrica y positiva.
Por lo tanto, tiene p valores propios reales.
Como es semidefinida positiva, estos valores propios son
mayores o iguales que cero, pero su suma es p.
La solución al problema del A.C.P. se obtiene al
diagonalizar la matriz R.
Análisis en
Componentes
Principales
Javier Trejos
Introducción
Objetivo del
ACP
Solución del
ACP
ACP normado
Ejemplo
Elementos
principales
Representaciones
Gráficas
Indices de
Calidad
Interpretación
de Resultados
Ejemplo de ACP
Tabla de notas escolares
Estudiante Matemáticas Ciencias Español Historia Ed. Fı́sica
Lucı́a 7.0 6.5 9.2 8.6 8.0
Pedro 7.5 9.4 7.3 7.0 7.0
Inés 7.6 9.2 8.0 8.0 7.5
Luis 5.0 6.5 6.5 7.0 9.0
Andrés 6.0 6.0 7.8 8.9 7.3
Ana 7.8 9.6 7.7 8.0 6.5
Carlos 6.3 6.4 8.2 9.0 7.2
José 7.9 9.7 7.5 8.0 6.0
Sonia 6.0 6.0 6.5 5.5 8.7
Marı́a 6.8 7.2 8.7 9.0 7.0
Análisis en
Componentes
Principales
Javier Trejos
Introducción
Objetivo del
ACP
Solución del
ACP
ACP normado
Ejemplo
Elementos
principales
Representaciones
Gráficas
Indices de
Calidad
Interpretación
de Resultados
Ejemplo ACP
Las notas escolares
Matriz de correlaciones:
Materia Matem. Ciencias Español Historia Ed. Fı́sica
Matemáticas 1.00 0.85 0.38 0.21 −0.79
Ciencias 0.85 1.00 −0.02 −0.02 −0.69
Español 0.38 −0.02 1.00 0.82 −0.37
Historia 0.21 −0.02 0.82 1.00 −0.51
Educ. Fı́sica −0.79 −0.69 −0.37 −0.51 1.00
Tabla: Correlaciones entre las materias de la tabla de notas escolares.
Análisis en
Componentes
Principales
Javier Trejos
Introducción
Objetivo del
ACP
Solución del
ACP
ACP normado
Ejemplo
Elementos
principales
Representaciones
Gráficas
Indices de
Calidad
Interpretación
de Resultados
Ejemplo ACP
Las notas escolares
Matriz de correlaciones:
Materia Matem. Ciencias Español Historia Ed. Fı́sica
Matemáticas 1.00 0.85 0.38 0.21 −0.79
Ciencias 0.85 1.00 −0.02 −0.02 −0.69
Español 0.38 −0.02 1.00 0.82 −0.37
Historia 0.21 −0.02 0.82 1.00 −0.51
Educ. Fı́sica −0.79 −0.69 −0.37 −0.51 1.00
Tabla: Correlaciones entre las materias de la tabla de notas escolares.
Valores propios:
λ1 = 2.89, λ2 = 1.63, λ3 = 0.35, λ4 = 0.12, λ5 = 0.01.
Análisis en
Componentes
Principales
Javier Trejos
Introducción
Objetivo del
ACP
Solución del
ACP
ACP normado
Ejemplo
Elementos
principales
Representaciones
Gráficas
Indices de
Calidad
Interpretación
de Resultados
Solución de ACP
Vectores Principales
Al calcular los q valores propios mayores de la matriz R,
denotados λ1, λ2, . . ., λq (ordenados en orden decreciente), se
obtienen los llamados vectores principales u1, u2, . . . , uq,
donde
u1 es un vector propio normado de R asociado al valor
propio λ1,
u2 es un vector propio normado de R asociado al valor
propio λ2,
.
.
.
uk es un vector propio normado de R asociado al valor
propio λk.
Análisis en
Componentes
Principales
Javier Trejos
Introducción
Objetivo del
ACP
Solución del
ACP
ACP normado
Ejemplo
Elementos
principales
Representaciones
Gráficas
Indices de
Calidad
Interpretación
de Resultados
Solución de ACP
Componentes Principales
Las componentes principales serán las variables
asociadas a estos ejes principales.
Análisis en
Componentes
Principales
Javier Trejos
Introducción
Objetivo del
ACP
Solución del
ACP
ACP normado
Ejemplo
Elementos
principales
Representaciones
Gráficas
Indices de
Calidad
Interpretación
de Resultados
Solución de ACP
Componentes Principales
Las componentes principales serán las variables
asociadas a estos ejes principales.
Ası́, en el A.C.P. normado se define:
c1 = Xu1 la primera componente principal,
c2 = Xu2 la segunda componente principal,
.
.
.
ck = Xuk la k-ésima componente principal, etc.
Por su definición, es claro que las componentes principales
son combinación lineal de las variables originales (que son
las columnas de X).
Por esta razón, su media también es cero.
Análisis en
Componentes
Principales
Javier Trejos
Introducción
Objetivo del
ACP
Solución del
ACP
ACP normado
Ejemplo
Elementos
principales
Representaciones
Gráficas
Indices de
Calidad
Interpretación
de Resultados
Ejemplo de ACP
Las Notas Escolares: Componentes Principales
Estudiante Primera componente Segunda componente
c1 c2
Lucı́a −0.32 −1.77
Pedro −0.67 1.64
Inés −1.00 0.52
Luis 3.17 0.26
Andrés 0.49 −1.37
Ana −1.71 1.02
Carlos −0.07 −1.46
José −2.01 1.28
Sonia 3.04 1.25
Marı́a −0.92 −1.37
Análisis en
Componentes
Principales
Javier Trejos
Introducción
Objetivo del
ACP
Solución del
ACP
ACP normado
Ejemplo
Elementos
principales
Representaciones
Gráficas
Indices de
Calidad
Interpretación
de Resultados
Solución del ACP
Propiedades de las componentes principales
Las componentes principales tienen las siguientes propiedades:
1 Son centradas: ck = 0, para todo k = 1, . . . , p.
2 ck tiene varianza λk: var(ck) = λk, para todo
k = 1, . . . , p.
3 Cada pareja de ellas tiene correlación cero:
∀k, l : r(ck, cl) = 0, para todo k, l = 1, . . . , p.
Análisis en
Componentes
Principales
Javier Trejos
Introducción
Objetivo del
ACP
Solución del
ACP
ACP normado
Ejemplo
Elementos
principales
Representaciones
Gráficas
Indices de
Calidad
Interpretación
de Resultados
Solución del ACP
Propiedades de las componentes principales
Las componentes principales tienen las siguientes propiedades:
1 Son centradas: ck = 0, para todo k = 1, . . . , p.
2 ck tiene varianza λk: var(ck) = λk, para todo
k = 1, . . . , p.
3 Cada pareja de ellas tiene correlación cero:
∀k, l : r(ck, cl) = 0, para todo k, l = 1, . . . , p.
Se puede comprobar que, efectivamente, para las componentes
principales c1 y c2 de la Tabla de Notas Escolares, éstas tienen
media cero y que tienen correlación nula. Además, que la
varianza de c1 es 2.89 y la de c2 es 1.63, que también son los
dos primeros valores propios de la matriz de correlaciones.
Análisis en
Componentes
Principales
Javier Trejos
Introducción
Objetivo del
ACP
Solución del
ACP
ACP normado
Ejemplo
Elementos
principales
Representaciones
Gráficas
Indices de
Calidad
Interpretación
de Resultados
Representaciones Gráficas
Gráficos complementarios
Gráficos más importantes:
Los planos principales, formados por las coordenadas de
los individuos en las componentes principales; aquı́ se
pueden apreciar las principales agrupaciones y dispersiones
de los individuos; el primer plano principal está generado
por c1 y c2.
Los cı́rculos de correlaciones, obtenidos a partir de las
correlaciones entre las variables originales y las
componentes principales normalizadas; aquı́ se pueden
apreciar las agrupaciones de variables y su
comportamiento respecto de las componentes principales.
Análisis en
Componentes
Principales
Javier Trejos
Introducción
Objetivo del
ACP
Solución del
ACP
ACP normado
Ejemplo
Elementos
principales
Representaciones
Gráficas
Indices de
Calidad
Interpretación
de Resultados
Representaciones Gráficas
Planos Principales
Eje 2 (32.57%)
Eje 1
(57.86%)
✻
❄
✲
✛
% Inercia 90.44
•
Lucı́a
•
Pedro
•
Inés
•
Luis
•Andrés
•
Ana
•
Carlos
•
José •
Sonia
•
Marı́a
Figura: Primer plano principal para la tabla de notas escolares,
generado por las dos primeras componentes principales.
Análisis en
Componentes
Principales
Javier Trejos
Introducción
Objetivo del
ACP
Solución del
ACP
ACP normado
Ejemplo
Elementos
principales
Representaciones
Gráficas
Indices de
Calidad
Interpretación
de Resultados
Representaciones Gráficas
Cı́rculo de Correlaciones
Materia Componente 1 Componente 2
c1 c2
Matemáticas −0.90 0.35
Ciencias −0.72 0.65
Español −0.61 −0.72
Historia −0.60 −0.75
Educación Fı́sica 0.91 −0.12
Análisis en
Componentes
Principales
Javier Trejos
Introducción
Objetivo del
ACP
Solución del
ACP
ACP normado
Ejemplo
Elementos
principales
Representaciones
Gráficas
Indices de
Calidad
Interpretación
de Resultados
Representaciones Gráficas
Cı́rculo de Correlaciones
✻
✲
❄
✛
Eje 2 (32.57%)
Eje 1
(57.86%)
% Varianza 90.44
•
Matemáticas
•
Ciencias
•
Español
• Historia
•
Ed. Fı́sica
Figura: Cı́rculo de correlaciones para la tabla de notas escolares
generado por las dos primeras componentes principales.
Análisis en
Componentes
Principales
Javier Trejos
Introducción
Objetivo del
ACP
Solución del
ACP
ACP normado
Ejemplo
Elementos
principales
Representaciones
Gráficas
Indices de
Calidad
Interpretación
de Resultados
Resultados del ACP
Indices de Calidad
Calidad global: porcentaje de inercia
Calidad global del primer plano:
λ1 + λ2
I(N)
× 100
Valor propio Porcentaje de Inercia
inercia acumulada
1 2.89 57.86% (57.86%)
2 1.63 32.57% (90.44%)
3 0.35 6.93% (97.37%)
4 0.12 2.45% (99.82%)
5 0.01 0.18% (100.00%)
Análisis en
Componentes
Principales
Javier Trejos
Introducción
Objetivo del
ACP
Solución del
ACP
ACP normado
Ejemplo
Elementos
principales
Representaciones
Gráficas
Indices de
Calidad
Interpretación
de Resultados
Resultados del ACP
Indices de Calidad
Calidad particular: caso de los individuos – calidad de la
proyección (distancia entre el punto original y el punto
proyectado) – coseno cuadrado
a
b
0
Pr(a) Pr(b)
q
q
q
q
q
α β
cos α =
kPr(a)k
kak
.
Elevando al cuadrado:
cos2
α =
kPr(a)k2
kak2
.
Análisis en
Componentes
Principales
Javier Trejos
Introducción
Objetivo del
ACP
Solución del
ACP
ACP normado
Ejemplo
Elementos
principales
Representaciones
Gráficas
Indices de
Calidad
Interpretación
de Resultados
Interpretación de Resultados del ACP
La interpretación tiene mucho de arte y de experiencia.
Algunas ideas:
Tratar de etiquetar a las componentes principales ck:
Examinar los cosenos cuadrados de los individuos:
cos2
(xi) ≥ 50% en ck
Examinar las comunalidades de las variables:
|r(xj
, ck
)| ≥ 0.7
Examinar las correlaciones en el cı́rculo, según sea el
comportamiento de los ángulos entre las variables
Examinar las agrupaciones en un plano
Los cosenos cuadrados de los individuos en un plano
permiten determinar a los que más contribuyen a la inercia
Se pueden usar elementos suplementarios (variables,
individuos)

Más contenido relacionado

La actualidad más candente

Coeficiente de correlacion.
Coeficiente de correlacion.Coeficiente de correlacion.
Coeficiente de correlacion.christianperezc
 
2 Semana Analisis Multivariante Parte I
2 Semana Analisis Multivariante Parte I2 Semana Analisis Multivariante Parte I
2 Semana Analisis Multivariante Parte Ijpgv84
 
Regresion simple.
Regresion simple.Regresion simple.
Regresion simple.ITCG
 
Intervalo y prueba de hipótesis para la varianza
Intervalo y prueba de hipótesis para la varianzaIntervalo y prueba de hipótesis para la varianza
Intervalo y prueba de hipótesis para la varianzaVictoria Calderón Rob
 
Tutorial Geogebra Polinomios, Newton, Lagrange, Regla Trapezoidal
Tutorial Geogebra Polinomios, Newton, Lagrange, Regla Trapezoidal Tutorial Geogebra Polinomios, Newton, Lagrange, Regla Trapezoidal
Tutorial Geogebra Polinomios, Newton, Lagrange, Regla Trapezoidal Clarissa Argumedo
 
CONTRASTES - COMPARACIONES DE MEDIAS
CONTRASTES - COMPARACIONES DE MEDIASCONTRASTES - COMPARACIONES DE MEDIAS
CONTRASTES - COMPARACIONES DE MEDIASSandra Lucia
 
Prueba de chi cuadrado y pruebas no paraetricas
Prueba de chi cuadrado y pruebas no paraetricasPrueba de chi cuadrado y pruebas no paraetricas
Prueba de chi cuadrado y pruebas no paraetricasGerardo Gomez
 
Ejercicios unidad 5
Ejercicios unidad 5Ejercicios unidad 5
Ejercicios unidad 5thomasbustos
 
Estadística y diseños experimentales aplicados a la educación superior
Estadística y diseños experimentales  aplicados a la educación superiorEstadística y diseños experimentales  aplicados a la educación superior
Estadística y diseños experimentales aplicados a la educación superiorEscuela Militar de Ingeniería (EMI)
 

La actualidad más candente (20)

Coeficiente de correlacion.
Coeficiente de correlacion.Coeficiente de correlacion.
Coeficiente de correlacion.
 
2 Semana Analisis Multivariante Parte I
2 Semana Analisis Multivariante Parte I2 Semana Analisis Multivariante Parte I
2 Semana Analisis Multivariante Parte I
 
Regresion simple.
Regresion simple.Regresion simple.
Regresion simple.
 
Pruebas No Parametricas
Pruebas No ParametricasPruebas No Parametricas
Pruebas No Parametricas
 
Correlación
CorrelaciónCorrelación
Correlación
 
Analisis de la varianza Est ind clase04
Analisis de la varianza Est ind clase04Analisis de la varianza Est ind clase04
Analisis de la varianza Est ind clase04
 
Intervalo y prueba de hipótesis para la varianza
Intervalo y prueba de hipótesis para la varianzaIntervalo y prueba de hipótesis para la varianza
Intervalo y prueba de hipótesis para la varianza
 
02 - Introducción a la teoría de probabilidad
02 - Introducción a la teoría de probabilidad02 - Introducción a la teoría de probabilidad
02 - Introducción a la teoría de probabilidad
 
Presentación ANOVA
Presentación ANOVAPresentación ANOVA
Presentación ANOVA
 
el chi cuadrado
el chi cuadradoel chi cuadrado
el chi cuadrado
 
Tutorial Geogebra Polinomios, Newton, Lagrange, Regla Trapezoidal
Tutorial Geogebra Polinomios, Newton, Lagrange, Regla Trapezoidal Tutorial Geogebra Polinomios, Newton, Lagrange, Regla Trapezoidal
Tutorial Geogebra Polinomios, Newton, Lagrange, Regla Trapezoidal
 
CONTRASTES - COMPARACIONES DE MEDIAS
CONTRASTES - COMPARACIONES DE MEDIASCONTRASTES - COMPARACIONES DE MEDIAS
CONTRASTES - COMPARACIONES DE MEDIAS
 
Distribución normal y t de student
Distribución normal y t de studentDistribución normal y t de student
Distribución normal y t de student
 
Prueba de chi cuadrado y pruebas no paraetricas
Prueba de chi cuadrado y pruebas no paraetricasPrueba de chi cuadrado y pruebas no paraetricas
Prueba de chi cuadrado y pruebas no paraetricas
 
Anova 3
Anova 3Anova 3
Anova 3
 
Muestreo estratificado
Muestreo estratificadoMuestreo estratificado
Muestreo estratificado
 
Distribucion de la diferencia de medias
Distribucion de la diferencia de mediasDistribucion de la diferencia de medias
Distribucion de la diferencia de medias
 
Ejercicios unidad 5
Ejercicios unidad 5Ejercicios unidad 5
Ejercicios unidad 5
 
Estadística y diseños experimentales aplicados a la educación superior
Estadística y diseños experimentales  aplicados a la educación superiorEstadística y diseños experimentales  aplicados a la educación superior
Estadística y diseños experimentales aplicados a la educación superior
 
Distribuciones continuas
Distribuciones continuasDistribuciones continuas
Distribuciones continuas
 

Similar a ACP Análisis en

Diseño de experiencias
Diseño de experienciasDiseño de experiencias
Diseño de experienciasDiego Gomez
 
S02.s1 - Material_EDYP_UTP_HHBL_2022.pdf
S02.s1 - Material_EDYP_UTP_HHBL_2022.pdfS02.s1 - Material_EDYP_UTP_HHBL_2022.pdf
S02.s1 - Material_EDYP_UTP_HHBL_2022.pdfRoyCastroGranda1
 
Criterios de Diseño muestral 28Nov.ppt
Criterios de Diseño muestral 28Nov.pptCriterios de Diseño muestral 28Nov.ppt
Criterios de Diseño muestral 28Nov.pptAnahiCabrera25
 
Estadistica modelos estadisticos
Estadistica modelos estadisticosEstadistica modelos estadisticos
Estadistica modelos estadisticosJorgeRamosBarragn
 
MEDIDAS DE POSICIÓN Y FORMA
MEDIDAS DE POSICIÓN Y FORMAMEDIDAS DE POSICIÓN Y FORMA
MEDIDAS DE POSICIÓN Y FORMAluisenrique636890
 
Reconocimiento de Dígitos Manuscritos usando la Dase de Datos MNIST
Reconocimiento de Dígitos Manuscritos usando la Dase de Datos MNISTReconocimiento de Dígitos Manuscritos usando la Dase de Datos MNIST
Reconocimiento de Dígitos Manuscritos usando la Dase de Datos MNISTEmilio Garcia
 
01 documento calculo_muestra
01 documento calculo_muestra01 documento calculo_muestra
01 documento calculo_muestraFranklin Mejia
 
Expo 05. Medidas Estadisticas
Expo 05.  Medidas EstadisticasExpo 05.  Medidas Estadisticas
Expo 05. Medidas EstadisticasZoraida Pérez S.
 
Estadistica descriptiva1 (1)
Estadistica descriptiva1 (1)Estadistica descriptiva1 (1)
Estadistica descriptiva1 (1)jhonalberto3444
 
Diagrama de dispersión.pptx
Diagrama de dispersión.pptxDiagrama de dispersión.pptx
Diagrama de dispersión.pptxaldair573766
 
Análisis en componentes principales general
Análisis en componentes principales generalAnálisis en componentes principales general
Análisis en componentes principales generalFacultad de Ciencias, UCR
 
2_Descriptive Statistics Numerical I esp.pptx
2_Descriptive Statistics Numerical I esp.pptx2_Descriptive Statistics Numerical I esp.pptx
2_Descriptive Statistics Numerical I esp.pptxRosibellReniz1
 

Similar a ACP Análisis en (20)

Resumen
ResumenResumen
Resumen
 
Diseño de experiencias
Diseño de experienciasDiseño de experiencias
Diseño de experiencias
 
Simulacion con R
Simulacion con RSimulacion con R
Simulacion con R
 
S02.s1 - Material_EDYP_UTP_HHBL_2022.pdf
S02.s1 - Material_EDYP_UTP_HHBL_2022.pdfS02.s1 - Material_EDYP_UTP_HHBL_2022.pdf
S02.s1 - Material_EDYP_UTP_HHBL_2022.pdf
 
Criterios de Diseño muestral 28Nov.ppt
Criterios de Diseño muestral 28Nov.pptCriterios de Diseño muestral 28Nov.ppt
Criterios de Diseño muestral 28Nov.ppt
 
Análisis de correspondencias múltiples
Análisis de correspondencias múltiplesAnálisis de correspondencias múltiples
Análisis de correspondencias múltiples
 
Resumen 1
Resumen 1Resumen 1
Resumen 1
 
Estadistica modelos estadisticos
Estadistica modelos estadisticosEstadistica modelos estadisticos
Estadistica modelos estadisticos
 
CIFJRM20
CIFJRM20CIFJRM20
CIFJRM20
 
S06.s1+-+Material.pdf
S06.s1+-+Material.pdfS06.s1+-+Material.pdf
S06.s1+-+Material.pdf
 
MEDIDAS DE POSICIÓN Y FORMA
MEDIDAS DE POSICIÓN Y FORMAMEDIDAS DE POSICIÓN Y FORMA
MEDIDAS DE POSICIÓN Y FORMA
 
01 presentacion de datos u ap
01 presentacion de datos u ap01 presentacion de datos u ap
01 presentacion de datos u ap
 
Reconocimiento de Dígitos Manuscritos usando la Dase de Datos MNIST
Reconocimiento de Dígitos Manuscritos usando la Dase de Datos MNISTReconocimiento de Dígitos Manuscritos usando la Dase de Datos MNIST
Reconocimiento de Dígitos Manuscritos usando la Dase de Datos MNIST
 
Es tudio de mercado
Es tudio de mercadoEs tudio de mercado
Es tudio de mercado
 
01 documento calculo_muestra
01 documento calculo_muestra01 documento calculo_muestra
01 documento calculo_muestra
 
Expo 05. Medidas Estadisticas
Expo 05.  Medidas EstadisticasExpo 05.  Medidas Estadisticas
Expo 05. Medidas Estadisticas
 
Estadistica descriptiva1 (1)
Estadistica descriptiva1 (1)Estadistica descriptiva1 (1)
Estadistica descriptiva1 (1)
 
Diagrama de dispersión.pptx
Diagrama de dispersión.pptxDiagrama de dispersión.pptx
Diagrama de dispersión.pptx
 
Análisis en componentes principales general
Análisis en componentes principales generalAnálisis en componentes principales general
Análisis en componentes principales general
 
2_Descriptive Statistics Numerical I esp.pptx
2_Descriptive Statistics Numerical I esp.pptx2_Descriptive Statistics Numerical I esp.pptx
2_Descriptive Statistics Numerical I esp.pptx
 

Más de Facultad de Ciencias, UCR (14)

Yield curve estimation in Costa Rica
Yield curve estimation in Costa RicaYield curve estimation in Costa Rica
Yield curve estimation in Costa Rica
 
CART
CARTCART
CART
 
Análisis de correspondencias
Análisis de correspondenciasAnálisis de correspondencias
Análisis de correspondencias
 
Ilustracion de K-medias
Ilustracion de K-mediasIlustracion de K-medias
Ilustracion de K-medias
 
Clasificacion automática (II parte) - clustering.pdf
Clasificacion automática (II parte) - clustering.pdfClasificacion automática (II parte) - clustering.pdf
Clasificacion automática (II parte) - clustering.pdf
 
Clasificacion Automática - clustering (I parte)
Clasificacion Automática - clustering (I parte)Clasificacion Automática - clustering (I parte)
Clasificacion Automática - clustering (I parte)
 
Regresión Lineal Múltiple
Regresión Lineal MúltipleRegresión Lineal Múltiple
Regresión Lineal Múltiple
 
Regresión Logística
Regresión LogísticaRegresión Logística
Regresión Logística
 
7_Discriminacion.pdf
7_Discriminacion.pdf7_Discriminacion.pdf
7_Discriminacion.pdf
 
Analisis Canonico
Analisis CanonicoAnalisis Canonico
Analisis Canonico
 
Clasificación óptima: algoritmo de Fisher
Clasificación óptima: algoritmo de FisherClasificación óptima: algoritmo de Fisher
Clasificación óptima: algoritmo de Fisher
 
Regresión PLS
Regresión PLSRegresión PLS
Regresión PLS
 
Curso(1)-Clasificacion
Curso(1)-ClasificacionCurso(1)-Clasificacion
Curso(1)-Clasificacion
 
Modelos de clasificación
Modelos de clasificaciónModelos de clasificación
Modelos de clasificación
 

Último

inspeccion del pescado.pdfMedicinaveteri
inspeccion del pescado.pdfMedicinaveteriinspeccion del pescado.pdfMedicinaveteri
inspeccion del pescado.pdfMedicinaveteriManrriquezLujanYasbe
 
Ensayo ENRICH (sesión clínica, Servicio de Neurología HUCA)
Ensayo ENRICH (sesión clínica, Servicio de Neurología HUCA)Ensayo ENRICH (sesión clínica, Servicio de Neurología HUCA)
Ensayo ENRICH (sesión clínica, Servicio de Neurología HUCA)s.calleja
 
Plokhi, Serhii. - El último imperio. Los días finales de la Unión Soviética [...
Plokhi, Serhii. - El último imperio. Los días finales de la Unión Soviética [...Plokhi, Serhii. - El último imperio. Los días finales de la Unión Soviética [...
Plokhi, Serhii. - El último imperio. Los días finales de la Unión Soviética [...frank0071
 
LA RADIACTIVIDAD. TRABAJO DE 3º DE LA ESO..pdf
LA RADIACTIVIDAD. TRABAJO DE 3º DE LA ESO..pdfLA RADIACTIVIDAD. TRABAJO DE 3º DE LA ESO..pdf
LA RADIACTIVIDAD. TRABAJO DE 3º DE LA ESO..pdflaurasanchez333854
 
Harris, Marvin. - Caníbales y reyes. Los orígenes de la cultura [ocr] [1986].pdf
Harris, Marvin. - Caníbales y reyes. Los orígenes de la cultura [ocr] [1986].pdfHarris, Marvin. - Caníbales y reyes. Los orígenes de la cultura [ocr] [1986].pdf
Harris, Marvin. - Caníbales y reyes. Los orígenes de la cultura [ocr] [1986].pdffrank0071
 
Mata, S. - Kriegsmarine. La flota de Hitler [2017].pdf
Mata, S. - Kriegsmarine. La flota de Hitler [2017].pdfMata, S. - Kriegsmarine. La flota de Hitler [2017].pdf
Mata, S. - Kriegsmarine. La flota de Hitler [2017].pdffrank0071
 
Un repaso de los ensayos recientes de historia de la ciencia y la tecnología ...
Un repaso de los ensayos recientes de historia de la ciencia y la tecnología ...Un repaso de los ensayos recientes de historia de la ciencia y la tecnología ...
Un repaso de los ensayos recientes de historia de la ciencia y la tecnología ...Juan Carlos Fonseca Mata
 
tecnica de necropsia en bovinos rum.pptx
tecnica de necropsia en bovinos rum.pptxtecnica de necropsia en bovinos rum.pptx
tecnica de necropsia en bovinos rum.pptxJESUSDANIELYONGOLIVE
 
Tema 1. Generalidades de Microbiologia Universidad de Oriente
Tema 1. Generalidades de Microbiologia Universidad de OrienteTema 1. Generalidades de Microbiologia Universidad de Oriente
Tema 1. Generalidades de Microbiologia Universidad de OrienteUnaLuzParaLasNacione
 
RX DE TORAX normal jornadas .............
RX DE TORAX normal jornadas .............RX DE TORAX normal jornadas .............
RX DE TORAX normal jornadas .............claudiasilvera25
 
Harvey, David. - Paris capital de la modernidad [2008].pdf
Harvey, David. - Paris capital de la modernidad [2008].pdfHarvey, David. - Paris capital de la modernidad [2008].pdf
Harvey, David. - Paris capital de la modernidad [2008].pdffrank0071
 
Perfiles NEUROPSI Atención y Memoria 6 a 85 Años (AyM).pdf
Perfiles NEUROPSI Atención y Memoria 6 a 85 Años (AyM).pdfPerfiles NEUROPSI Atención y Memoria 6 a 85 Años (AyM).pdf
Perfiles NEUROPSI Atención y Memoria 6 a 85 Años (AyM).pdfPieroalex1
 
PARES CRANEALES. ORIGEN REAL Y APARENTE, TRAYECTO E INERVACIÓN. CLASIFICACIÓN...
PARES CRANEALES. ORIGEN REAL Y APARENTE, TRAYECTO E INERVACIÓN. CLASIFICACIÓN...PARES CRANEALES. ORIGEN REAL Y APARENTE, TRAYECTO E INERVACIÓN. CLASIFICACIÓN...
PARES CRANEALES. ORIGEN REAL Y APARENTE, TRAYECTO E INERVACIÓN. CLASIFICACIÓN...ocanajuanpablo0
 
Glándulas Salivales.pptx................
Glándulas Salivales.pptx................Glándulas Salivales.pptx................
Glándulas Salivales.pptx................sebascarr467
 
Sucesión de hongos en estiércol de vaca experimento
Sucesión de hongos en estiércol de vaca experimentoSucesión de hongos en estiércol de vaca experimento
Sucesión de hongos en estiércol de vaca experimentoFriasMartnezAlanZuri
 
Diálisis peritoneal en los pacientes delicados de salud
Diálisis peritoneal en los pacientes delicados de saludDiálisis peritoneal en los pacientes delicados de salud
Diálisis peritoneal en los pacientes delicados de saludFernandoACamachoCher
 
TEST BETA III: APLICACIÓN E INTERPRETACIÓN.pptx
TEST BETA III: APLICACIÓN E INTERPRETACIÓN.pptxTEST BETA III: APLICACIÓN E INTERPRETACIÓN.pptx
TEST BETA III: APLICACIÓN E INTERPRETACIÓN.pptxXavierCrdenasGarca
 
Woods, Thomas E. - Cómo la Iglesia construyó la Civilización Occidental [ocr]...
Woods, Thomas E. - Cómo la Iglesia construyó la Civilización Occidental [ocr]...Woods, Thomas E. - Cómo la Iglesia construyó la Civilización Occidental [ocr]...
Woods, Thomas E. - Cómo la Iglesia construyó la Civilización Occidental [ocr]...frank0071
 
PAE ARTITRIS- ENFERMERIA GERIATRICA.pptx
PAE ARTITRIS- ENFERMERIA GERIATRICA.pptxPAE ARTITRIS- ENFERMERIA GERIATRICA.pptx
PAE ARTITRIS- ENFERMERIA GERIATRICA.pptxrenegon1213
 
Características emociones y sentimientos
Características emociones y sentimientosCaracterísticas emociones y sentimientos
Características emociones y sentimientosFiorelaMondragon
 

Último (20)

inspeccion del pescado.pdfMedicinaveteri
inspeccion del pescado.pdfMedicinaveteriinspeccion del pescado.pdfMedicinaveteri
inspeccion del pescado.pdfMedicinaveteri
 
Ensayo ENRICH (sesión clínica, Servicio de Neurología HUCA)
Ensayo ENRICH (sesión clínica, Servicio de Neurología HUCA)Ensayo ENRICH (sesión clínica, Servicio de Neurología HUCA)
Ensayo ENRICH (sesión clínica, Servicio de Neurología HUCA)
 
Plokhi, Serhii. - El último imperio. Los días finales de la Unión Soviética [...
Plokhi, Serhii. - El último imperio. Los días finales de la Unión Soviética [...Plokhi, Serhii. - El último imperio. Los días finales de la Unión Soviética [...
Plokhi, Serhii. - El último imperio. Los días finales de la Unión Soviética [...
 
LA RADIACTIVIDAD. TRABAJO DE 3º DE LA ESO..pdf
LA RADIACTIVIDAD. TRABAJO DE 3º DE LA ESO..pdfLA RADIACTIVIDAD. TRABAJO DE 3º DE LA ESO..pdf
LA RADIACTIVIDAD. TRABAJO DE 3º DE LA ESO..pdf
 
Harris, Marvin. - Caníbales y reyes. Los orígenes de la cultura [ocr] [1986].pdf
Harris, Marvin. - Caníbales y reyes. Los orígenes de la cultura [ocr] [1986].pdfHarris, Marvin. - Caníbales y reyes. Los orígenes de la cultura [ocr] [1986].pdf
Harris, Marvin. - Caníbales y reyes. Los orígenes de la cultura [ocr] [1986].pdf
 
Mata, S. - Kriegsmarine. La flota de Hitler [2017].pdf
Mata, S. - Kriegsmarine. La flota de Hitler [2017].pdfMata, S. - Kriegsmarine. La flota de Hitler [2017].pdf
Mata, S. - Kriegsmarine. La flota de Hitler [2017].pdf
 
Un repaso de los ensayos recientes de historia de la ciencia y la tecnología ...
Un repaso de los ensayos recientes de historia de la ciencia y la tecnología ...Un repaso de los ensayos recientes de historia de la ciencia y la tecnología ...
Un repaso de los ensayos recientes de historia de la ciencia y la tecnología ...
 
tecnica de necropsia en bovinos rum.pptx
tecnica de necropsia en bovinos rum.pptxtecnica de necropsia en bovinos rum.pptx
tecnica de necropsia en bovinos rum.pptx
 
Tema 1. Generalidades de Microbiologia Universidad de Oriente
Tema 1. Generalidades de Microbiologia Universidad de OrienteTema 1. Generalidades de Microbiologia Universidad de Oriente
Tema 1. Generalidades de Microbiologia Universidad de Oriente
 
RX DE TORAX normal jornadas .............
RX DE TORAX normal jornadas .............RX DE TORAX normal jornadas .............
RX DE TORAX normal jornadas .............
 
Harvey, David. - Paris capital de la modernidad [2008].pdf
Harvey, David. - Paris capital de la modernidad [2008].pdfHarvey, David. - Paris capital de la modernidad [2008].pdf
Harvey, David. - Paris capital de la modernidad [2008].pdf
 
Perfiles NEUROPSI Atención y Memoria 6 a 85 Años (AyM).pdf
Perfiles NEUROPSI Atención y Memoria 6 a 85 Años (AyM).pdfPerfiles NEUROPSI Atención y Memoria 6 a 85 Años (AyM).pdf
Perfiles NEUROPSI Atención y Memoria 6 a 85 Años (AyM).pdf
 
PARES CRANEALES. ORIGEN REAL Y APARENTE, TRAYECTO E INERVACIÓN. CLASIFICACIÓN...
PARES CRANEALES. ORIGEN REAL Y APARENTE, TRAYECTO E INERVACIÓN. CLASIFICACIÓN...PARES CRANEALES. ORIGEN REAL Y APARENTE, TRAYECTO E INERVACIÓN. CLASIFICACIÓN...
PARES CRANEALES. ORIGEN REAL Y APARENTE, TRAYECTO E INERVACIÓN. CLASIFICACIÓN...
 
Glándulas Salivales.pptx................
Glándulas Salivales.pptx................Glándulas Salivales.pptx................
Glándulas Salivales.pptx................
 
Sucesión de hongos en estiércol de vaca experimento
Sucesión de hongos en estiércol de vaca experimentoSucesión de hongos en estiércol de vaca experimento
Sucesión de hongos en estiércol de vaca experimento
 
Diálisis peritoneal en los pacientes delicados de salud
Diálisis peritoneal en los pacientes delicados de saludDiálisis peritoneal en los pacientes delicados de salud
Diálisis peritoneal en los pacientes delicados de salud
 
TEST BETA III: APLICACIÓN E INTERPRETACIÓN.pptx
TEST BETA III: APLICACIÓN E INTERPRETACIÓN.pptxTEST BETA III: APLICACIÓN E INTERPRETACIÓN.pptx
TEST BETA III: APLICACIÓN E INTERPRETACIÓN.pptx
 
Woods, Thomas E. - Cómo la Iglesia construyó la Civilización Occidental [ocr]...
Woods, Thomas E. - Cómo la Iglesia construyó la Civilización Occidental [ocr]...Woods, Thomas E. - Cómo la Iglesia construyó la Civilización Occidental [ocr]...
Woods, Thomas E. - Cómo la Iglesia construyó la Civilización Occidental [ocr]...
 
PAE ARTITRIS- ENFERMERIA GERIATRICA.pptx
PAE ARTITRIS- ENFERMERIA GERIATRICA.pptxPAE ARTITRIS- ENFERMERIA GERIATRICA.pptx
PAE ARTITRIS- ENFERMERIA GERIATRICA.pptx
 
Características emociones y sentimientos
Características emociones y sentimientosCaracterísticas emociones y sentimientos
Características emociones y sentimientos
 

ACP Análisis en

  • 1. Análisis en Componentes Principales Javier Trejos Introducción Objetivo del ACP Solución del ACP ACP normado Ejemplo Elementos principales Representaciones Gráficas Indices de Calidad Interpretación de Resultados Análisis en Componentes Principales Javier Trejos Escuela de Matemática – CIMPA Universidad de Costa Rica II ciclo 2020
  • 2. Análisis en Componentes Principales Javier Trejos Introducción Objetivo del ACP Solución del ACP ACP normado Ejemplo Elementos principales Representaciones Gráficas Indices de Calidad Interpretación de Resultados Esquema 1 Introducción 2 Objetivo del ACP 3 Solución del ACP 4 ACP normado 5 Ejemplo 6 Elementos principales 7 Representaciones Gráficas 8 Indices de Calidad 9 Interpretación de Resultados
  • 3. Análisis en Componentes Principales Javier Trejos Introducción Objetivo del ACP Solución del ACP ACP normado Ejemplo Elementos principales Representaciones Gráficas Indices de Calidad Interpretación de Resultados Análisis en Componentes Principales Introducción Se dispone de una tabla de datos X de p variables cuantitativas medidas sobre n individuos
  • 4. Análisis en Componentes Principales Javier Trejos Introducción Objetivo del ACP Solución del ACP ACP normado Ejemplo Elementos principales Representaciones Gráficas Indices de Calidad Interpretación de Resultados Análisis en Componentes Principales Introducción Se dispone de una tabla de datos X de p variables cuantitativas medidas sobre n individuos ACP: técnica de reducción de las dimensiones
  • 5. Análisis en Componentes Principales Javier Trejos Introducción Objetivo del ACP Solución del ACP ACP normado Ejemplo Elementos principales Representaciones Gráficas Indices de Calidad Interpretación de Resultados Análisis en Componentes Principales Introducción Se dispone de una tabla de datos X de p variables cuantitativas medidas sobre n individuos ACP: técnica de reducción de las dimensiones Pearson (1900): encontrar la recta de mejor ajuste en 2 dimensiones
  • 6. Análisis en Componentes Principales Javier Trejos Introducción Objetivo del ACP Solución del ACP ACP normado Ejemplo Elementos principales Representaciones Gráficas Indices de Calidad Interpretación de Resultados Análisis en Componentes Principales Introducción Se dispone de una tabla de datos X de p variables cuantitativas medidas sobre n individuos ACP: técnica de reducción de las dimensiones Pearson (1900): encontrar la recta de mejor ajuste en 2 dimensiones Hotelling (1933): encontrar variables sintéticas independientes de máxima varianza
  • 7. Análisis en Componentes Principales Javier Trejos Introducción Objetivo del ACP Solución del ACP ACP normado Ejemplo Elementos principales Representaciones Gráficas Indices de Calidad Interpretación de Resultados Análisis en Componentes Principales Introducción Se dispone de una tabla de datos X de p variables cuantitativas medidas sobre n individuos ACP: técnica de reducción de las dimensiones Pearson (1900): encontrar la recta de mejor ajuste en 2 dimensiones Hotelling (1933): encontrar variables sintéticas independientes de máxima varianza Pagès (1970): reducir la dimensión del espacio de representación de los individuos perdiendo el mı́nimo de información
  • 8. Análisis en Componentes Principales Javier Trejos Introducción Objetivo del ACP Solución del ACP ACP normado Ejemplo Elementos principales Representaciones Gráficas Indices de Calidad Interpretación de Resultados Análisis en Componentes Principales Introducción Se dispone de una tabla de datos X de p variables cuantitativas medidas sobre n individuos ACP: técnica de reducción de las dimensiones Pearson (1900): encontrar la recta de mejor ajuste en 2 dimensiones Hotelling (1933): encontrar variables sintéticas independientes de máxima varianza Pagès (1970): reducir la dimensión del espacio de representación de los individuos perdiendo el mı́nimo de información Los objetivos son duales y equivalentes
  • 9. Análisis en Componentes Principales Javier Trejos Introducción Objetivo del ACP Solución del ACP ACP normado Ejemplo Elementos principales Representaciones Gráficas Indices de Calidad Interpretación de Resultados Análisis en Componentes Principales Situación Se tiene una tabla de datos cuantitativos n × p.
  • 10. Análisis en Componentes Principales Javier Trejos Introducción Objetivo del ACP Solución del ACP ACP normado Ejemplo Elementos principales Representaciones Gráficas Indices de Calidad Interpretación de Resultados Análisis en Componentes Principales Objetivo Se quiere: obtener una representación en pocas dimensiones de los objetos, perdiendo el mı́nimo de información;
  • 11. Análisis en Componentes Principales Javier Trejos Introducción Objetivo del ACP Solución del ACP ACP normado Ejemplo Elementos principales Representaciones Gráficas Indices de Calidad Interpretación de Resultados Análisis en Componentes Principales Objetivo Se quiere: obtener una representación en pocas dimensiones de los objetos, perdiendo el mı́nimo de información; obtener (pocas) variables sintéticas, basadas en las variables originales y no correlacionadas entre ellas;
  • 12. Análisis en Componentes Principales Javier Trejos Introducción Objetivo del ACP Solución del ACP ACP normado Ejemplo Elementos principales Representaciones Gráficas Indices de Calidad Interpretación de Resultados Análisis en Componentes Principales Objetivo Se quiere: obtener una representación en pocas dimensiones de los objetos, perdiendo el mı́nimo de información; obtener (pocas) variables sintéticas, basadas en las variables originales y no correlacionadas entre ellas; son objetivos equivalentes (y duales).
  • 13. Análisis en Componentes Principales Javier Trejos Introducción Objetivo del ACP Solución del ACP ACP normado Ejemplo Elementos principales Representaciones Gráficas Indices de Calidad Interpretación de Resultados Objetivo del ACP Sean la nube de puntos N = (X, M, Dp), con M la métrica p × p sobre el espacio de individuos y Dp la métrica de pesos (matriz diagonal n × n) sobre el espacio de variables
  • 14. Análisis en Componentes Principales Javier Trejos Introducción Objetivo del ACP Solución del ACP ACP normado Ejemplo Elementos principales Representaciones Gráficas Indices de Calidad Interpretación de Resultados Objetivo del ACP Sean la nube de puntos N = (X, M, Dp), con M la métrica p × p sobre el espacio de individuos y Dp la métrica de pesos (matriz diagonal n × n) sobre el espacio de variables Supondremos que las variables xj están centradas Se busca un espacio de dimensión q, menor que p, de manera que las posiciones relativas de los puntos–individuos sean lo más similares posibles a sus posiciones en el espacio Rp
  • 15. Análisis en Componentes Principales Javier Trejos Introducción Objetivo del ACP Solución del ACP ACP normado Ejemplo Elementos principales Representaciones Gráficas Indices de Calidad Interpretación de Resultados Objetivo del ACP Sean la nube de puntos N = (X, M, Dp), con M la métrica p × p sobre el espacio de individuos y Dp la métrica de pesos (matriz diagonal n × n) sobre el espacio de variables Supondremos que las variables xj están centradas Se busca un espacio de dimensión q, menor que p, de manera que las posiciones relativas de los puntos–individuos sean lo más similares posibles a sus posiciones en el espacio Rp Esto significa que hay una pérdida mı́nima de información al proyectar los n individuos sobre un espacio de dimensión menor
  • 16. Análisis en Componentes Principales Javier Trejos Introducción Objetivo del ACP Solución del ACP ACP normado Ejemplo Elementos principales Representaciones Gráficas Indices de Calidad Interpretación de Resultados Objetivo del ACP Sean la nube de puntos N = (X, M, Dp), con M la métrica p × p sobre el espacio de individuos y Dp la métrica de pesos (matriz diagonal n × n) sobre el espacio de variables Supondremos que las variables xj están centradas Se busca un espacio de dimensión q, menor que p, de manera que las posiciones relativas de los puntos–individuos sean lo más similares posibles a sus posiciones en el espacio Rp Esto significa que hay una pérdida mı́nima de información al proyectar los n individuos sobre un espacio de dimensión menor De esta forma, su dispersión en el espacio proyectado Rq debe ser máxima, de manera que la forma de la nube se asemeje lo mejor posible a su forma original.
  • 17. Análisis en Componentes Principales Javier Trejos Introducción Objetivo del ACP Solución del ACP ACP normado Ejemplo Elementos principales Representaciones Gráficas Indices de Calidad Interpretación de Resultados Objetivo del ACP Objetivo dual Se puede plantear de otra forma el objetivo del ACP, esta vez desde el punto de vista de las variables Dada la tabla Xn×p, se busca un conjunto de q variables sintéticas c1, c2, . . . , cq, donde q < p (las componentes principales), tal que: 1 Cada componente principal ck debe ser combinación lineal de las variables originales xj ; esto significa que la información contenida en las xj también está reflejada en las ck . 2 Las componentes principales deben ser no correlacionadas dos a dos; esto significa que las ck no tienen información redundante. 3 Las componentes principales deben tener varianza máxima; esto significa que contendrán el máximo de información posible. Todo lo anterior se puede deducir del objetivo inicial: reducción de la dimensión del espacio de individuos
  • 18. Análisis en Componentes Principales Javier Trejos Introducción Objetivo del ACP Solución del ACP ACP normado Ejemplo Elementos principales Representaciones Gráficas Indices de Calidad Interpretación de Resultados Objetivo del ACP Ejemplo: Tabla de notas escolares Sea la tabla de datos de notas escolares, que contiene las notas obtenidas por 10 estudiantes en cinco materias. Todas las notas están en la escala de 0 a 10. Estudiante Matemáticas Ciencias Español Historia Ed. Fı́sica Lucı́a 7.0 6.5 9.2 8.6 8.0 Pedro 7.5 9.4 7.3 7.0 7.0 Inés 7.6 9.2 8.0 8.0 7.5 Luis 5.0 6.5 6.5 7.0 9.0 Andrés 6.0 6.0 7.8 8.9 7.3 Ana 7.8 9.6 7.7 8.0 6.5 Carlos 6.3 6.4 8.2 9.0 7.2 José 7.9 9.7 7.5 8.0 6.0 Sonia 6.0 6.0 6.5 5.5 8.7 Marı́a 6.8 7.2 8.7 9.0 7.0
  • 19. Análisis en Componentes Principales Javier Trejos Introducción Objetivo del ACP Solución del ACP ACP normado Ejemplo Elementos principales Representaciones Gráficas Indices de Calidad Interpretación de Resultados Solución del ACP La solución del Análisis en Componentes Principales se obtiene al diagonalizar la matriz de correlaciones R, es decir, el cálculo de sus valores y vectores propios. Llamaremos A.C.P. normado el caso en que se usan los datos centrados y estandarizados, lo que corresponde a usar la métrica de los inversos de las varianzas, en cuyo caso la solución se obtiene al diagonalizar R, y llamaremos A.C.P. general cuando la métrica M es cualquiera, en cuyo caso la solución se obtiene al diagonalizar VM, producto de la métrica y la matriz de varianzas–covarianzas.
  • 20. Análisis en Componentes Principales Javier Trejos Introducción Objetivo del ACP Solución del ACP ACP normado Ejemplo Elementos principales Representaciones Gráficas Indices de Calidad Interpretación de Resultados Solución del ACP ACP normado Dada la tabla de datos Xn×p, procedemos a centrar y estandarizar las variables, de forma que en adelante todas tienen media cero y varianza 1. Estamos en presencia de la nube de puntos N = (X, Ip, Dp), donde Ip es la identidad p × p y Dp es la métrica diagonal de pesos. En este contexto, la matriz de covarianzas V y la matriz de correlaciones R coinciden. Se tiene I(N) = traza (V) = traza R = p Se busca el subespacio H de Rp tal que la proyección de los individuos se represente lo mejor posible en H. Esto significa que la inercia de la nube de los puntos proyectados debe ser máxima Cualquier individuo xi en Rp puede ser presentado como xi = PrH(xi) + PrH⊥ (xi) = ai + bi, donde ai = PrH(xi) ∈ H y bi = PrH⊥ (xi) ∈ H⊥
  • 21. Análisis en Componentes Principales Javier Trejos Introducción Objetivo del ACP Solución del ACP ACP normado Ejemplo Elementos principales Representaciones Gráficas Indices de Calidad Interpretación de Resultados Solución del ACP ACP normado Figura: Proyección de un punto-individuo sobre un subespacio y su complemento ortogonal.
  • 22. Análisis en Componentes Principales Javier Trejos Introducción Objetivo del ACP Solución del ACP ACP normado Ejemplo Elementos principales Representaciones Gráficas Indices de Calidad Interpretación de Resultados Solución del ACP ACP normado En vista de la perpendicularidad entre ai y bi, por el teorema de Pitágoras se tiene que: kxik2 = kaik2 + kbik2 Luego pikxik2 = pikaik2 + pikbik2 , de donde n X i=1 pikxik2 = n X i=1 pikaik2 + n X i=1 pikbik2 . Si definimos la proximidad entre N y el subespacio H como IH(N) = n X i=1 pikxi − aik2 = n X i=1 pikbik2 entonces el objetivo del A.C.P. será encontrar H tal que
  • 23. Análisis en Componentes Principales Javier Trejos Introducción Objetivo del ACP Solución del ACP ACP normado Ejemplo Elementos principales Representaciones Gráficas Indices de Calidad Interpretación de Resultados Solución del ACP ACP normado Poniendo IH⊥ (N) = Pn i=1 pikaik2, entonces es claro que I(N) = IH(N) + IH⊥ (N), (1) Por lo que IH⊥ (N) es máxima cuando IH(N) es mı́nima.
  • 24. Análisis en Componentes Principales Javier Trejos Introducción Objetivo del ACP Solución del ACP ACP normado Ejemplo Elementos principales Representaciones Gráficas Indices de Calidad Interpretación de Resultados Solución del ACP ACP normado Se prueba el teorema de inclusión: el espacio óptimo de dimensión k está contenido en el espacio óptimo de dimensión k + 1. Esto permite seguir como estrategia 1 la búsqueda del espacio óptimo de dimensión uno, 2 enseguida del espacio óptimo de dimensión dos que contenga al anterior. Para ello, será suficiente hallar el espacio óptimo de dimensión uno, ortogonal al primer espacio encontrado, y ası́ se genera el espacio óptimo de dimensión 2, mediante la suma directa de los dos espacios encontrados. Es sabido que un espacio de dimensión uno es generado por un vector: ponemos ∆u el espacio generado por el vector u. Tomaremos los vectores que generan estos espacios de norma 1.
  • 25. Análisis en Componentes Principales Javier Trejos Introducción Objetivo del ACP Solución del ACP ACP normado Ejemplo Elementos principales Representaciones Gráficas Indices de Calidad Interpretación de Resultados Solución del ACP ACP normado Se tiene que I∆u (N) es mı́nima si I∆⊥ u (N) es máxima. Es más fácil el cálculo de I∆⊥ u (N). Por lo tanto, se buscará el vector u de norma 1 tal que I∆⊥ u (N) sea máxima. Ası́, podemos decir que buscamos: 1 El vector u1 tal que ku1k = 1 e I∆⊥ u1 (N) sea máxima. 2 El vector u2 tal que ku2k = 1, u1 ⊥ u2 e I∆⊥ u2 (N) sea máxima. 3 El vector u3 tal que ku3k = 1, u1 ⊥ u3, u2 ⊥ u3 e I⊥ ∆u3 (N) sea máxima. 4 Etc.
  • 26. Análisis en Componentes Principales Javier Trejos Introducción Objetivo del ACP Solución del ACP ACP normado Ejemplo Elementos principales Representaciones Gráficas Indices de Calidad Interpretación de Resultados Solución del ACP ACP normado Proposición Si u es un vector de Rp con norma 1, entonces I∆⊥ u (N) = ut Ru. Demostración: Sea xi un individuo, es decir, una fila de la tabla de datos X. Sean ai = Pr∆u (xi) su proyección sobre ∆u y bi = Pr∆⊥ u (xi) su proyección sobre ∆⊥ u , de manera que xi = ai + bi. Como ai es la proyección sobre la recta generada por u, entonces existe un coeficiente ci tal que ai = ciu. Es más, se sabe que ci = hxi, ui = xt iu ya que la métrica es la identidad Ip y kuk = 1.
  • 27. Análisis en Componentes Principales Javier Trejos Introducción Objetivo del ACP Solución del ACP ACP normado Ejemplo Elementos principales Representaciones Gráficas Indices de Calidad Interpretación de Resultados Solución del ACP ACP normado Proposición Si u es un vector de Rp con norma 1, entonces I∆⊥ u (N) = ut Ru. Demostración: (Cont.) Por lo tanto I∆⊥ u (N) = n X i=1 pikaik2 = n X i=1 pikciuk2 = n X i=1 pic2 i = n X i=1 pixt iu xt i u = ut n X i=1 pixi xt i ! u = ut Xt DpXu = ut Ru.
  • 28. Análisis en Componentes Principales Javier Trejos Introducción Objetivo del ACP Solución del ACP ACP normado Ejemplo Elementos principales Representaciones Gráficas Indices de Calidad Interpretación de Resultados Solución del ACP ACP normado: El primer Eje El primer eje que se busca, u1, genera la recta ∆u1 tal que ku1k = 1 e I∆⊥ u1 (N) = ut 1Ru1 es máxima. Para ello, se plantea el problema de maximización con restricciones: Maximizar F(u) = I∆⊥ u (N) = utRu sujeto a kuk2 = utu = 1. Usando la técnica de multiplicadores de Lagrange, si L(u, λ) = F(u) − λ(kuk2 − 1) = ut Ru − λ(ut u − 1), entonces ∂L ∂u = 2Ru − 2λu = 0, por lo que Ru = λu.
  • 29. Análisis en Componentes Principales Javier Trejos Introducción Objetivo del ACP Solución del ACP ACP normado Ejemplo Elementos principales Representaciones Gráficas Indices de Calidad Interpretación de Resultados Solución del ACP ACP normado: El primer Eje Ru = λu significa que u es vector propio1 de R, asociado al valor propio λ. Es más, F(u) = ut Ru = ut (λu) = λut u = λ. Por lo tanto, F se maximiza cuando λ es máximo. Al vector propio u1 asociado al mayor valor propio λ1 de R se le llama el primer eje del A.C.P. de la nube N. 1 Recuérdese que un escalar λ se llama valor propio de una matriz A si existe un vector v 6= 0 tal que Av = λv; al vector v se le llama vector propio de A asociado a λ. Al proceso de obtener todos los valores y vectores propios de una matriz se le llama diagonalización de la matriz.
  • 30. Análisis en Componentes Principales Javier Trejos Introducción Objetivo del ACP Solución del ACP ACP normado Ejemplo Elementos principales Representaciones Gráficas Indices de Calidad Interpretación de Resultados Solución del ACP ACP normado: El segundo Eje El segundo eje buscado, u2, debe combinarse con u1 y formar un subespacio de dimensión 2 (es decir, un plano), tal que la inercia proyectada de la nube N sea máxima. Por el teorema de inclusión, como ya tenemos el espacio óptimo ∆u1 de dimensión 1 y sabemos que éste está incluido en el espacio óptimo de dimensión 2, entonces basta con encontrar el vector u —ortogonal a u1— con I∆⊥ u (N) máxima. Esto es, Maximizar F(u) = I∆⊥ u (N) = utRu sujeto a kuk2 = utu = 1, u1 ⊥ u.
  • 31. Análisis en Componentes Principales Javier Trejos Introducción Objetivo del ACP Solución del ACP ACP normado Ejemplo Elementos principales Representaciones Gráficas Indices de Calidad Interpretación de Resultados Solución del ACP ACP normado: El segundo Eje Por ello, planteamos el problema de optimización con multiplicadores de Lagrange en que buscamos el vector u que maximiza L: L(u, λ, µ) = F(u) − λ(kuk2 − 1) − µ(hu1, ui = 0) = ut Ru − λ(ut u − 1) − µut u1, de donde ∂L ∂u = 2Ru − 2λu − µu1 = 0. (2)
  • 32. Análisis en Componentes Principales Javier Trejos Introducción Objetivo del ACP Solución del ACP ACP normado Ejemplo Elementos principales Representaciones Gráficas Indices de Calidad Interpretación de Resultados Solución del ACP ACP normado: El segundo Eje Premultiplicando por ut 1: ut 1Ru = λut 1u + µut 1u1 y como ut 1Ru = ut Ru1 = ut (λ1u1), entonces λ1ut 1u = 0 + µ, de donde µ = 0, ya que ut 1u = 0. Por lo tanto, en la ecuación (2) se debe cumplir 2Ru − 2λu = 0 es decir Ru = λu. Esto significa que u también es vector propio de R.
  • 33. Análisis en Componentes Principales Javier Trejos Introducción Objetivo del ACP Solución del ACP ACP normado Ejemplo Elementos principales Representaciones Gráficas Indices de Calidad Interpretación de Resultados Solución del ACP ACP normado: El segundo Eje Como de nuevo F(u) = I∆⊥ u (N) = λ y este valor debe ser máximo, entonces λ es el segundo valor propio de R (dados en orden decreciente), denotado λ2. Ası́, el segundo eje del A.C.P. de N es el vector propio u2 de R asociado a λ2. El primer plano principal H1 está generado por los dos primeros ejes principales: H1 = ∆u1 ⊕ ∆u2 y tiene inercia IH⊥ 1 (N) = λ1 + λ2.
  • 34. Análisis en Componentes Principales Javier Trejos Introducción Objetivo del ACP Solución del ACP ACP normado Ejemplo Elementos principales Representaciones Gráficas Indices de Calidad Interpretación de Resultados Solución del ACP ACP normado: Eje siguientes En general, siguiendo el mismo procedimiento anterior, los ejes principales del A.C.P. de la nube N = (X, Ip, Dp) están generados por los vectores propios de la matriz de correlaciones R asociados a los valores propios de ésta, dados en orden decreciente: λ1 ≥ λ2 ≥ . . . ≥ λp ≥ 0 asociados respectivamente a u1, u2, . . . , up. Seleccionando cualquier par de ejes principales, se puede generar un plano principal.
  • 35. Análisis en Componentes Principales Javier Trejos Introducción Objetivo del ACP Solución del ACP ACP normado Ejemplo Elementos principales Representaciones Gráficas Indices de Calidad Interpretación de Resultados Solución del ACP Diagonalización de R Obsérvese que la matriz R es simétrica y positiva. Por lo tanto, tiene p valores propios reales. Como es semidefinida positiva, estos valores propios son mayores o iguales que cero, pero su suma es p. La solución al problema del A.C.P. se obtiene al diagonalizar la matriz R.
  • 36. Análisis en Componentes Principales Javier Trejos Introducción Objetivo del ACP Solución del ACP ACP normado Ejemplo Elementos principales Representaciones Gráficas Indices de Calidad Interpretación de Resultados Ejemplo de ACP Tabla de notas escolares Estudiante Matemáticas Ciencias Español Historia Ed. Fı́sica Lucı́a 7.0 6.5 9.2 8.6 8.0 Pedro 7.5 9.4 7.3 7.0 7.0 Inés 7.6 9.2 8.0 8.0 7.5 Luis 5.0 6.5 6.5 7.0 9.0 Andrés 6.0 6.0 7.8 8.9 7.3 Ana 7.8 9.6 7.7 8.0 6.5 Carlos 6.3 6.4 8.2 9.0 7.2 José 7.9 9.7 7.5 8.0 6.0 Sonia 6.0 6.0 6.5 5.5 8.7 Marı́a 6.8 7.2 8.7 9.0 7.0
  • 37. Análisis en Componentes Principales Javier Trejos Introducción Objetivo del ACP Solución del ACP ACP normado Ejemplo Elementos principales Representaciones Gráficas Indices de Calidad Interpretación de Resultados Ejemplo ACP Las notas escolares Matriz de correlaciones: Materia Matem. Ciencias Español Historia Ed. Fı́sica Matemáticas 1.00 0.85 0.38 0.21 −0.79 Ciencias 0.85 1.00 −0.02 −0.02 −0.69 Español 0.38 −0.02 1.00 0.82 −0.37 Historia 0.21 −0.02 0.82 1.00 −0.51 Educ. Fı́sica −0.79 −0.69 −0.37 −0.51 1.00 Tabla: Correlaciones entre las materias de la tabla de notas escolares.
  • 38. Análisis en Componentes Principales Javier Trejos Introducción Objetivo del ACP Solución del ACP ACP normado Ejemplo Elementos principales Representaciones Gráficas Indices de Calidad Interpretación de Resultados Ejemplo ACP Las notas escolares Matriz de correlaciones: Materia Matem. Ciencias Español Historia Ed. Fı́sica Matemáticas 1.00 0.85 0.38 0.21 −0.79 Ciencias 0.85 1.00 −0.02 −0.02 −0.69 Español 0.38 −0.02 1.00 0.82 −0.37 Historia 0.21 −0.02 0.82 1.00 −0.51 Educ. Fı́sica −0.79 −0.69 −0.37 −0.51 1.00 Tabla: Correlaciones entre las materias de la tabla de notas escolares. Valores propios: λ1 = 2.89, λ2 = 1.63, λ3 = 0.35, λ4 = 0.12, λ5 = 0.01.
  • 39. Análisis en Componentes Principales Javier Trejos Introducción Objetivo del ACP Solución del ACP ACP normado Ejemplo Elementos principales Representaciones Gráficas Indices de Calidad Interpretación de Resultados Solución de ACP Vectores Principales Al calcular los q valores propios mayores de la matriz R, denotados λ1, λ2, . . ., λq (ordenados en orden decreciente), se obtienen los llamados vectores principales u1, u2, . . . , uq, donde u1 es un vector propio normado de R asociado al valor propio λ1, u2 es un vector propio normado de R asociado al valor propio λ2, . . . uk es un vector propio normado de R asociado al valor propio λk.
  • 40. Análisis en Componentes Principales Javier Trejos Introducción Objetivo del ACP Solución del ACP ACP normado Ejemplo Elementos principales Representaciones Gráficas Indices de Calidad Interpretación de Resultados Solución de ACP Componentes Principales Las componentes principales serán las variables asociadas a estos ejes principales.
  • 41. Análisis en Componentes Principales Javier Trejos Introducción Objetivo del ACP Solución del ACP ACP normado Ejemplo Elementos principales Representaciones Gráficas Indices de Calidad Interpretación de Resultados Solución de ACP Componentes Principales Las componentes principales serán las variables asociadas a estos ejes principales. Ası́, en el A.C.P. normado se define: c1 = Xu1 la primera componente principal, c2 = Xu2 la segunda componente principal, . . . ck = Xuk la k-ésima componente principal, etc. Por su definición, es claro que las componentes principales son combinación lineal de las variables originales (que son las columnas de X). Por esta razón, su media también es cero.
  • 42. Análisis en Componentes Principales Javier Trejos Introducción Objetivo del ACP Solución del ACP ACP normado Ejemplo Elementos principales Representaciones Gráficas Indices de Calidad Interpretación de Resultados Ejemplo de ACP Las Notas Escolares: Componentes Principales Estudiante Primera componente Segunda componente c1 c2 Lucı́a −0.32 −1.77 Pedro −0.67 1.64 Inés −1.00 0.52 Luis 3.17 0.26 Andrés 0.49 −1.37 Ana −1.71 1.02 Carlos −0.07 −1.46 José −2.01 1.28 Sonia 3.04 1.25 Marı́a −0.92 −1.37
  • 43. Análisis en Componentes Principales Javier Trejos Introducción Objetivo del ACP Solución del ACP ACP normado Ejemplo Elementos principales Representaciones Gráficas Indices de Calidad Interpretación de Resultados Solución del ACP Propiedades de las componentes principales Las componentes principales tienen las siguientes propiedades: 1 Son centradas: ck = 0, para todo k = 1, . . . , p. 2 ck tiene varianza λk: var(ck) = λk, para todo k = 1, . . . , p. 3 Cada pareja de ellas tiene correlación cero: ∀k, l : r(ck, cl) = 0, para todo k, l = 1, . . . , p.
  • 44. Análisis en Componentes Principales Javier Trejos Introducción Objetivo del ACP Solución del ACP ACP normado Ejemplo Elementos principales Representaciones Gráficas Indices de Calidad Interpretación de Resultados Solución del ACP Propiedades de las componentes principales Las componentes principales tienen las siguientes propiedades: 1 Son centradas: ck = 0, para todo k = 1, . . . , p. 2 ck tiene varianza λk: var(ck) = λk, para todo k = 1, . . . , p. 3 Cada pareja de ellas tiene correlación cero: ∀k, l : r(ck, cl) = 0, para todo k, l = 1, . . . , p. Se puede comprobar que, efectivamente, para las componentes principales c1 y c2 de la Tabla de Notas Escolares, éstas tienen media cero y que tienen correlación nula. Además, que la varianza de c1 es 2.89 y la de c2 es 1.63, que también son los dos primeros valores propios de la matriz de correlaciones.
  • 45. Análisis en Componentes Principales Javier Trejos Introducción Objetivo del ACP Solución del ACP ACP normado Ejemplo Elementos principales Representaciones Gráficas Indices de Calidad Interpretación de Resultados Representaciones Gráficas Gráficos complementarios Gráficos más importantes: Los planos principales, formados por las coordenadas de los individuos en las componentes principales; aquı́ se pueden apreciar las principales agrupaciones y dispersiones de los individuos; el primer plano principal está generado por c1 y c2. Los cı́rculos de correlaciones, obtenidos a partir de las correlaciones entre las variables originales y las componentes principales normalizadas; aquı́ se pueden apreciar las agrupaciones de variables y su comportamiento respecto de las componentes principales.
  • 46. Análisis en Componentes Principales Javier Trejos Introducción Objetivo del ACP Solución del ACP ACP normado Ejemplo Elementos principales Representaciones Gráficas Indices de Calidad Interpretación de Resultados Representaciones Gráficas Planos Principales Eje 2 (32.57%) Eje 1 (57.86%) ✻ ❄ ✲ ✛ % Inercia 90.44 • Lucı́a • Pedro • Inés • Luis •Andrés • Ana • Carlos • José • Sonia • Marı́a Figura: Primer plano principal para la tabla de notas escolares, generado por las dos primeras componentes principales.
  • 47. Análisis en Componentes Principales Javier Trejos Introducción Objetivo del ACP Solución del ACP ACP normado Ejemplo Elementos principales Representaciones Gráficas Indices de Calidad Interpretación de Resultados Representaciones Gráficas Cı́rculo de Correlaciones Materia Componente 1 Componente 2 c1 c2 Matemáticas −0.90 0.35 Ciencias −0.72 0.65 Español −0.61 −0.72 Historia −0.60 −0.75 Educación Fı́sica 0.91 −0.12
  • 48. Análisis en Componentes Principales Javier Trejos Introducción Objetivo del ACP Solución del ACP ACP normado Ejemplo Elementos principales Representaciones Gráficas Indices de Calidad Interpretación de Resultados Representaciones Gráficas Cı́rculo de Correlaciones ✻ ✲ ❄ ✛ Eje 2 (32.57%) Eje 1 (57.86%) % Varianza 90.44 • Matemáticas • Ciencias • Español • Historia • Ed. Fı́sica Figura: Cı́rculo de correlaciones para la tabla de notas escolares generado por las dos primeras componentes principales.
  • 49. Análisis en Componentes Principales Javier Trejos Introducción Objetivo del ACP Solución del ACP ACP normado Ejemplo Elementos principales Representaciones Gráficas Indices de Calidad Interpretación de Resultados Resultados del ACP Indices de Calidad Calidad global: porcentaje de inercia Calidad global del primer plano: λ1 + λ2 I(N) × 100 Valor propio Porcentaje de Inercia inercia acumulada 1 2.89 57.86% (57.86%) 2 1.63 32.57% (90.44%) 3 0.35 6.93% (97.37%) 4 0.12 2.45% (99.82%) 5 0.01 0.18% (100.00%)
  • 50. Análisis en Componentes Principales Javier Trejos Introducción Objetivo del ACP Solución del ACP ACP normado Ejemplo Elementos principales Representaciones Gráficas Indices de Calidad Interpretación de Resultados Resultados del ACP Indices de Calidad Calidad particular: caso de los individuos – calidad de la proyección (distancia entre el punto original y el punto proyectado) – coseno cuadrado a b 0 Pr(a) Pr(b) q q q q q α β cos α = kPr(a)k kak . Elevando al cuadrado: cos2 α = kPr(a)k2 kak2 .
  • 51. Análisis en Componentes Principales Javier Trejos Introducción Objetivo del ACP Solución del ACP ACP normado Ejemplo Elementos principales Representaciones Gráficas Indices de Calidad Interpretación de Resultados Interpretación de Resultados del ACP La interpretación tiene mucho de arte y de experiencia. Algunas ideas: Tratar de etiquetar a las componentes principales ck: Examinar los cosenos cuadrados de los individuos: cos2 (xi) ≥ 50% en ck Examinar las comunalidades de las variables: |r(xj , ck )| ≥ 0.7 Examinar las correlaciones en el cı́rculo, según sea el comportamiento de los ángulos entre las variables Examinar las agrupaciones en un plano Los cosenos cuadrados de los individuos en un plano permiten determinar a los que más contribuyen a la inercia Se pueden usar elementos suplementarios (variables, individuos)