SlideShare una empresa de Scribd logo
Análisis en
Componentes
Principales
Caso General
Javier Trejos
Introducción al
ACP general
Solución del ACP
Inercia Proyectada
Teorema de
Inclusón
Estrategia de
Solución
Primer Eje
Segundo Eje
Solución Final
Propiedades
Análisis en Componentes Principales
Caso General
Javier Trejos
Escuela de Matemática – CIMPA
Universidad de Costa Rica
II semestre 2020
Análisis en
Componentes
Principales
Caso General
Javier Trejos
Introducción al
ACP general
Solución del ACP
Inercia Proyectada
Teorema de
Inclusón
Estrategia de
Solución
Primer Eje
Segundo Eje
Solución Final
Propiedades
Esquema
Introducción al ACP general
Solución del ACP
Inercia Proyectada
Teorema de Inclusón
Estrategia de Solución
Primer Eje
Segundo Eje
Solución Final
Propiedades
Análisis en
Componentes
Principales
Caso General
Javier Trejos
Introducción al
ACP general
Solución del ACP
Inercia Proyectada
Teorema de
Inclusón
Estrategia de
Solución
Primer Eje
Segundo Eje
Solución Final
Propiedades
Análisis en Componentes Principales General
Objetivo del ACP General
◮ Sean la nube de puntos N = (X, M, D), con X la
tabla de datos n × p con variables cuantitativas, M la
métrica cualquiera p × p sobre el espacio de individuos
Rp, y D = diag (pi) la métrica de pesos (matriz
diagonal n × n) sobre el espacio de variables Rn.
◮ Supondremos que las variables xj están centradas, pero
no estandarizadas.
◮ Se busca un espacio de dimensión q, menor que p, de
manera que las posiciones relativas de los
puntos–individuos sean lo más similares posibles a sus
posiciones en el espacio Rp; es decir, la inercia de la
nube de puntos proyectada debe ser lo más similar a la
inercia de los puntos en Rp
◮ Esto significa que hay una pérdida mı́nima de
información al proyectar los n individuos sobre un
espacio de dimensión menor
Análisis en
Componentes
Principales
Caso General
Javier Trejos
Introducción al
ACP general
Solución del ACP
Inercia Proyectada
Teorema de
Inclusón
Estrategia de
Solución
Primer Eje
Segundo Eje
Solución Final
Propiedades
Objetivo del ACP
Objetivo dual
◮ Se puede plantear de otra forma el objetivo del ACP,
esta vez desde el punto de vista de las variables.
◮ Dada la tabla de datos X, se busca un conjunto de q
variables sintéticas c1, c2, . . . , cq, donde q < p, que más
adelante se llamarán componentes principales, tal que:
1. Cada componente principal ck
debe ser combinación
lineal de las variables originales xj
; esto significa que la
información contenida en las xj
también está reflejada
en las ck
.
2. Las componentes principales deben ser no
correlacionadas dos a dos; esto significa que las ck
no
tienen información redundante.
3. Las componentes principales deben tener varianza
máxima; esto significa que contendrán el máximo de
información posible.
◮ Las tres condiciones anteriores se pueden deducir del
objetivo inicial, de reducción de la dimensión del espacio
de individuos.
Análisis en
Componentes
Principales
Caso General
Javier Trejos
Introducción al
ACP general
Solución del ACP
Inercia Proyectada
Teorema de
Inclusón
Estrategia de
Solución
Primer Eje
Segundo Eje
Solución Final
Propiedades
ACP General
Esquema de Dualidad
✲
✛
❄
✻
❄
✻
X
Xt
W D
M V
Rp
(Rp)∗
Rn
(Rn)∗ Xn×p : tabla de datos
centrados
V = XtDX
W = XMXt
D: métrica de pesos
M: métrica general
Análisis en
Componentes
Principales
Caso General
Javier Trejos
Introducción al
ACP general
Solución del ACP
Inercia Proyectada
Teorema de
Inclusón
Estrategia de
Solución
Primer Eje
Segundo Eje
Solución Final
Propiedades
Solución del ACP
Inercia Proyectada
◮ Si H es un subespacio vectorial de Rp, entonces existe
un subespacio de Rp denotado H⊥ y llamado el
complemento ortogonal de H, tal que Rp = H ⊕ H⊥;
Análisis en
Componentes
Principales
Caso General
Javier Trejos
Introducción al
ACP general
Solución del ACP
Inercia Proyectada
Teorema de
Inclusón
Estrategia de
Solución
Primer Eje
Segundo Eje
Solución Final
Propiedades
Solución del ACP
Inercia Proyectada
◮ Si H es un subespacio vectorial de Rp, entonces existe
un subespacio de Rp denotado H⊥ y llamado el
complemento ortogonal de H, tal que Rp = H ⊕ H⊥;
◮ se cumple que para todo ∀h ∈ H y ∀h̄ ∈ H⊥:
M(h, h̄) = hh, h̄iM = 0.
◮ Por lo tanto, ∀xi ∈ Rp, ∃ai ∈ H, bi ∈ H⊥ tales que
xi = ai + bi, y esta descomposición es única.
Análisis en
Componentes
Principales
Caso General
Javier Trejos
Introducción al
ACP general
Solución del ACP
Inercia Proyectada
Teorema de
Inclusón
Estrategia de
Solución
Primer Eje
Segundo Eje
Solución Final
Propiedades
Solución del ACP
Inercia Proyectada
◮ Se define la inercia de la nube N respecto a H como:
IH(N) =
n
X
i=1
pikbik2
.
Análisis en
Componentes
Principales
Caso General
Javier Trejos
Introducción al
ACP general
Solución del ACP
Inercia Proyectada
Teorema de
Inclusón
Estrategia de
Solución
Primer Eje
Segundo Eje
Solución Final
Propiedades
Solución del ACP
Inercia Proyectada
◮ Se define la inercia de la nube N respecto a H como:
IH(N) =
n
X
i=1
pikbik2
.
◮ Ası́ mismo, la inercia de N respecto a H⊥ es:
IH⊥ (N) =
n
X
i=1
pikaik2
.
◮ Esto es, IH⊥ (N) es la inercia de la nube proyectada
sobre el espacio H.
Análisis en
Componentes
Principales
Caso General
Javier Trejos
Introducción al
ACP general
Solución del ACP
Inercia Proyectada
Teorema de
Inclusón
Estrategia de
Solución
Primer Eje
Segundo Eje
Solución Final
Propiedades
Solución del ACP
Inercia Proyectada
◮ Se define la inercia de la nube N respecto a H como:
IH(N) =
n
X
i=1
pikbik2
.
◮ Ası́ mismo, la inercia de N respecto a H⊥ es:
IH⊥ (N) =
n
X
i=1
pikaik2
.
◮ Esto es, IH⊥ (N) es la inercia de la nube proyectada
sobre el espacio H.
◮ Cuando H está generado por un vector unitario v, es
decir H = ∆v con kvk = 1, entonces se tiene
ai = hv, xiiMv = (vtMxi)v.
Análisis en
Componentes
Principales
Caso General
Javier Trejos
Introducción al
ACP general
Solución del ACP
Inercia Proyectada
Teorema de
Inclusón
Estrategia de
Solución
Primer Eje
Segundo Eje
Solución Final
Propiedades
Solución del ACP
Inercia Proyectada
◮ Por lo tanto
I∆⊥
v
(N) =
n
X
i=1
pikaik2
=
n
X
i=1
pi(vt
Mxi)2
kvk2
=
n
X
i=1
pivt
Mxixt
iMv
◮
I∆⊥
v
(N) = vt
M
 n
X
i=1
pixixt
i

Mv = vt
MVMv.
◮ Debido a que E = H ⊕ H⊥ y al teorema de Pitágoras,
se tiene la importante relación:
I(N) = IH(N) + IH⊥ (N).
◮ Se busca el espacio Eq tal que la inercia IE⊥
q
(N) de la
nube proyectada sobre ese espacio sea máxima (lo que
es equivalente a pedir que la inercia IEq (N) sea
mı́nima).
Análisis en
Componentes
Principales
Caso General
Javier Trejos
Introducción al
ACP general
Solución del ACP
Inercia Proyectada
Teorema de
Inclusón
Estrategia de
Solución
Primer Eje
Segundo Eje
Solución Final
Propiedades
Solución del ACP
Teorema de Inclusión
Teorema (De inclusión)
Si Ek−1 es un subespacio vectorial óptimo de Rp de
dimensión k − 1, entonces existe un subespacio vectorial
óptimo de Rp de dimensión k que contiene a Ek−1.
Análisis en
Componentes
Principales
Caso General
Javier Trejos
Introducción al
ACP general
Solución del ACP
Inercia Proyectada
Teorema de
Inclusón
Estrategia de
Solución
Primer Eje
Segundo Eje
Solución Final
Propiedades
Solución del ACP
Teorema de Inclusión
Teorema (De inclusión)
Si Ek−1 es un subespacio vectorial óptimo de Rp de
dimensión k − 1, entonces existe un subespacio vectorial
óptimo de Rp de dimensión k que contiene a Ek−1.
Demostración:
Sea Fk un subespacio vectorial de Rp de dimensión k y se
denota
H = Fk + E⊥
k−1.
Análisis en
Componentes
Principales
Caso General
Javier Trejos
Introducción al
ACP general
Solución del ACP
Inercia Proyectada
Teorema de
Inclusón
Estrategia de
Solución
Primer Eje
Segundo Eje
Solución Final
Propiedades
Solución del ACP
Teorema de Inclusión
Teorema (De inclusión)
Si Ek−1 es un subespacio vectorial óptimo de Rp de
dimensión k − 1, entonces existe un subespacio vectorial
óptimo de Rp de dimensión k que contiene a Ek−1.
Demostración:
Sea Fk un subespacio vectorial de Rp de dimensión k y se
denota
H = Fk + E⊥
k−1.
Si Fk ∩ E⊥
k−1 = {0} entonces se tendrı́a H = Fk ⊕ E⊥
k−1 y
dim(H) = k + (p − (k − 1)) = p + 1, lo cual es absurdo
pues H ⊆ Rp.
Análisis en
Componentes
Principales
Caso General
Javier Trejos
Introducción al
ACP general
Solución del ACP
Inercia Proyectada
Teorema de
Inclusón
Estrategia de
Solución
Primer Eje
Segundo Eje
Solución Final
Propiedades
Solución del ACP
Teorema de Inclusión
Teorema (De inclusión)
Si Ek−1 es un subespacio vectorial óptimo de Rp de
dimensión k − 1, entonces existe un subespacio vectorial
óptimo de Rp de dimensión k que contiene a Ek−1.
Demostración:
Sea Fk un subespacio vectorial de Rp de dimensión k y se
denota
H = Fk + E⊥
k−1.
Si Fk ∩ E⊥
k−1 = {0} entonces se tendrı́a H = Fk ⊕ E⊥
k−1 y
dim(H) = k + (p − (k − 1)) = p + 1, lo cual es absurdo
pues H ⊆ Rp.
Por lo tanto existe un vector no nulo v ∈ Fk ∩ E⊥
k−1 y se
denota ∆v el eje (espacio vectorial de dimensión uno)
generado por v. (Sigue)
Análisis en
Componentes
Principales
Caso General
Javier Trejos
Introducción al
ACP general
Solución del ACP
Inercia Proyectada
Teorema de
Inclusón
Estrategia de
Solución
Primer Eje
Segundo Eje
Solución Final
Propiedades
Solución del ACP
Teorema de Inclusión
Sea G el espacio suplementario M-ortogonal a ∆v en Fk: es
decir, tal que Fk = G ⊕ ∆v; y sea Ek la suma directa
Ek = Ek−1 ⊕ ∆v.
Análisis en
Componentes
Principales
Caso General
Javier Trejos
Introducción al
ACP general
Solución del ACP
Inercia Proyectada
Teorema de
Inclusón
Estrategia de
Solución
Primer Eje
Segundo Eje
Solución Final
Propiedades
Solución del ACP
Teorema de Inclusión
Sea G el espacio suplementario M-ortogonal a ∆v en Fk: es
decir, tal que Fk = G ⊕ ∆v; y sea Ek la suma directa
Ek = Ek−1 ⊕ ∆v.
Debido a la ortogonalidad entre G y ∆v se tiene
IFk
(N) = IG(N) + I∆v (N),
y a la ortogonalidad entre Ek−1 y ∆v se tiene
Análisis en
Componentes
Principales
Caso General
Javier Trejos
Introducción al
ACP general
Solución del ACP
Inercia Proyectada
Teorema de
Inclusón
Estrategia de
Solución
Primer Eje
Segundo Eje
Solución Final
Propiedades
Solución del ACP
Teorema de Inclusión
Sea G el espacio suplementario M-ortogonal a ∆v en Fk: es
decir, tal que Fk = G ⊕ ∆v; y sea Ek la suma directa
Ek = Ek−1 ⊕ ∆v.
Debido a la ortogonalidad entre G y ∆v se tiene
IFk
(N) = IG(N) + I∆v (N),
y a la ortogonalidad entre Ek−1 y ∆v se tiene
IEk
(N) = IEk−1
(N) + I∆v (N).
Análisis en
Componentes
Principales
Caso General
Javier Trejos
Introducción al
ACP general
Solución del ACP
Inercia Proyectada
Teorema de
Inclusón
Estrategia de
Solución
Primer Eje
Segundo Eje
Solución Final
Propiedades
Solución del ACP
Teorema de Inclusión
Sea G el espacio suplementario M-ortogonal a ∆v en Fk: es
decir, tal que Fk = G ⊕ ∆v; y sea Ek la suma directa
Ek = Ek−1 ⊕ ∆v.
Debido a la ortogonalidad entre G y ∆v se tiene
IFk
(N) = IG(N) + I∆v (N),
y a la ortogonalidad entre Ek−1 y ∆v se tiene
IEk
(N) = IEk−1
(N) + I∆v (N).
Sin embargo, por hipótesis Ek−1 es óptimo entre los
subespacios vectoriales de dimensión k − 1, esto es
IEk−1
(N) ≤ IG(N), por lo tanto
Análisis en
Componentes
Principales
Caso General
Javier Trejos
Introducción al
ACP general
Solución del ACP
Inercia Proyectada
Teorema de
Inclusón
Estrategia de
Solución
Primer Eje
Segundo Eje
Solución Final
Propiedades
Solución del ACP
Teorema de Inclusión
Sea G el espacio suplementario M-ortogonal a ∆v en Fk: es
decir, tal que Fk = G ⊕ ∆v; y sea Ek la suma directa
Ek = Ek−1 ⊕ ∆v.
Debido a la ortogonalidad entre G y ∆v se tiene
IFk
(N) = IG(N) + I∆v (N),
y a la ortogonalidad entre Ek−1 y ∆v se tiene
IEk
(N) = IEk−1
(N) + I∆v (N).
Sin embargo, por hipótesis Ek−1 es óptimo entre los
subespacios vectoriales de dimensión k − 1, esto es
IEk−1
(N) ≤ IG(N), por lo tantoIEk
(N) ≤ IFk
(N) y
entonces Ek es óptimo entre los subespacios vectoriales de
Rp de dimensión k.
Análisis en
Componentes
Principales
Caso General
Javier Trejos
Introducción al
ACP general
Solución del ACP
Inercia Proyectada
Teorema de
Inclusón
Estrategia de
Solución
Primer Eje
Segundo Eje
Solución Final
Propiedades
Solución del ACP
Teorema de Inclusión
Sea G el espacio suplementario M-ortogonal a ∆v en Fk: es
decir, tal que Fk = G ⊕ ∆v; y sea Ek la suma directa
Ek = Ek−1 ⊕ ∆v.
Debido a la ortogonalidad entre G y ∆v se tiene
IFk
(N) = IG(N) + I∆v (N),
y a la ortogonalidad entre Ek−1 y ∆v se tiene
IEk
(N) = IEk−1
(N) + I∆v (N).
Sin embargo, por hipótesis Ek−1 es óptimo entre los
subespacios vectoriales de dimensión k − 1, esto es
IEk−1
(N) ≤ IG(N), por lo tantoIEk
(N) ≤ IFk
(N) y
entonces Ek es óptimo entre los subespacios vectoriales de
Rp de dimensión k.
Como Ek−1 es subespacio de Ek, por la forma de definir Ek,
entonces se tiene el resultado.
Análisis en
Componentes
Principales
Caso General
Javier Trejos
Introducción al
ACP general
Solución del ACP
Inercia Proyectada
Teorema de
Inclusón
Estrategia de
Solución
Primer Eje
Segundo Eje
Solución Final
Propiedades
Solución del ACP
Propiedad Importante
Proposición
Sea Ek−1 un subespacio vectorial de Rp óptimo de
dimensión k − 1. Si el vector v genera un eje ∆v
M–ortogonal a Ek−1 tal que I∆v (N) es mı́nima, entonces el
espacio Ek = Ek−1 ⊕ ∆v minimiza la inercia proyectada de
N sobre todos los subespacios de Rp de dimensión k.
Análisis en
Componentes
Principales
Caso General
Javier Trejos
Introducción al
ACP general
Solución del ACP
Inercia Proyectada
Teorema de
Inclusón
Estrategia de
Solución
Primer Eje
Segundo Eje
Solución Final
Propiedades
Solución del ACP
Propiedad Importante
Proposición
Sea Ek−1 un subespacio vectorial de Rp óptimo de
dimensión k − 1. Si el vector v genera un eje ∆v
M–ortogonal a Ek−1 tal que I∆v (N) es mı́nima, entonces el
espacio Ek = Ek−1 ⊕ ∆v minimiza la inercia proyectada de
N sobre todos los subespacios de Rp de dimensión k.
Demostración:
Sea v ∈ Rp tal que ∆v ⊥ Ek−1, entonces sea
Ek = Ek−1 ⊕ ∆v.
Análisis en
Componentes
Principales
Caso General
Javier Trejos
Introducción al
ACP general
Solución del ACP
Inercia Proyectada
Teorema de
Inclusón
Estrategia de
Solución
Primer Eje
Segundo Eje
Solución Final
Propiedades
Solución del ACP
Propiedad Importante
Proposición
Sea Ek−1 un subespacio vectorial de Rp óptimo de
dimensión k − 1. Si el vector v genera un eje ∆v
M–ortogonal a Ek−1 tal que I∆v (N) es mı́nima, entonces el
espacio Ek = Ek−1 ⊕ ∆v minimiza la inercia proyectada de
N sobre todos los subespacios de Rp de dimensión k.
Demostración:
Sea v ∈ Rp tal que ∆v ⊥ Ek−1, entonces sea
Ek = Ek−1 ⊕ ∆v.
Luego, por el teorema de Pitágoras,
IEk
(N) = IEk−1
(N) + I∆v (N).
Análisis en
Componentes
Principales
Caso General
Javier Trejos
Introducción al
ACP general
Solución del ACP
Inercia Proyectada
Teorema de
Inclusón
Estrategia de
Solución
Primer Eje
Segundo Eje
Solución Final
Propiedades
Solución del ACP
Propiedad Importante
Proposición
Sea Ek−1 un subespacio vectorial de Rp óptimo de
dimensión k − 1. Si el vector v genera un eje ∆v
M–ortogonal a Ek−1 tal que I∆v (N) es mı́nima, entonces el
espacio Ek = Ek−1 ⊕ ∆v minimiza la inercia proyectada de
N sobre todos los subespacios de Rp de dimensión k.
Demostración:
Sea v ∈ Rp tal que ∆v ⊥ Ek−1, entonces sea
Ek = Ek−1 ⊕ ∆v.
Luego, por el teorema de Pitágoras,
IEk
(N) = IEk−1
(N) + I∆v (N).
Como IEk−1
(N) es constante, minimizar IEk
(N) se reduce a
minimizar I∆v (N).
Análisis en
Componentes
Principales
Caso General
Javier Trejos
Introducción al
ACP general
Solución del ACP
Inercia Proyectada
Teorema de
Inclusón
Estrategia de
Solución
Primer Eje
Segundo Eje
Solución Final
Propiedades
Solución del ACP
Estrategia de Solución
Los dos resultados anteriores permiten seguir la siguiente
estrategia para obtener la solución del A.C.P.:
Análisis en
Componentes
Principales
Caso General
Javier Trejos
Introducción al
ACP general
Solución del ACP
Inercia Proyectada
Teorema de
Inclusón
Estrategia de
Solución
Primer Eje
Segundo Eje
Solución Final
Propiedades
Solución del ACP
Estrategia de Solución
Los dos resultados anteriores permiten seguir la siguiente
estrategia para obtener la solución del A.C.P.:
1. Buscar el eje E1 = ∆v1 con inercia mı́nima, v1 es un
vector unitario que genera a ∆v1 .
Análisis en
Componentes
Principales
Caso General
Javier Trejos
Introducción al
ACP general
Solución del ACP
Inercia Proyectada
Teorema de
Inclusón
Estrategia de
Solución
Primer Eje
Segundo Eje
Solución Final
Propiedades
Solución del ACP
Estrategia de Solución
Los dos resultados anteriores permiten seguir la siguiente
estrategia para obtener la solución del A.C.P.:
1. Buscar el eje E1 = ∆v1 con inercia mı́nima, v1 es un
vector unitario que genera a ∆v1 .
2. Buscar el eje ∆v2 , M–ortogonal a ∆v1 y con inercia
mı́nima; sea E2 = ∆v1 ⊕ ∆v2 , E2 es un subespacio
óptimo de dimensión 2.
Análisis en
Componentes
Principales
Caso General
Javier Trejos
Introducción al
ACP general
Solución del ACP
Inercia Proyectada
Teorema de
Inclusón
Estrategia de
Solución
Primer Eje
Segundo Eje
Solución Final
Propiedades
Solución del ACP
Estrategia de Solución
Los dos resultados anteriores permiten seguir la siguiente
estrategia para obtener la solución del A.C.P.:
1. Buscar el eje E1 = ∆v1 con inercia mı́nima, v1 es un
vector unitario que genera a ∆v1 .
2. Buscar el eje ∆v2 , M–ortogonal a ∆v1 y con inercia
mı́nima; sea E2 = ∆v1 ⊕ ∆v2 , E2 es un subespacio
óptimo de dimensión 2.
k. Buscar un eje ∆vk
, M–ortogonal a Ek−1 y con inercia
mı́nima; sea Ek = Ek−1 ⊕ ∆vk
, Ek es un subespacio
óptimo de dimensión k.
Análisis en
Componentes
Principales
Caso General
Javier Trejos
Introducción al
ACP general
Solución del ACP
Inercia Proyectada
Teorema de
Inclusón
Estrategia de
Solución
Primer Eje
Segundo Eje
Solución Final
Propiedades
Solución del ACP
Estrategia de Solución
Los dos resultados anteriores permiten seguir la siguiente
estrategia para obtener la solución del A.C.P.:
1. Buscar el eje E1 = ∆v1 con inercia mı́nima, v1 es un
vector unitario que genera a ∆v1 .
2. Buscar el eje ∆v2 , M–ortogonal a ∆v1 y con inercia
mı́nima; sea E2 = ∆v1 ⊕ ∆v2 , E2 es un subespacio
óptimo de dimensión 2.
k. Buscar un eje ∆vk
, M–ortogonal a Ek−1 y con inercia
mı́nima; sea Ek = Ek−1 ⊕ ∆vk
, Ek es un subespacio
óptimo de dimensión k.
Se tiene entonces Ek = ∆v1 ⊕ ∆v2 ⊕ . . . ⊕ ∆vk
. Los ejes
∆v1 , ∆v2 , . . . son llamados los ejes factoriales.
Análisis en
Componentes
Principales
Caso General
Javier Trejos
Introducción al
ACP general
Solución del ACP
Inercia Proyectada
Teorema de
Inclusón
Estrategia de
Solución
Primer Eje
Segundo Eje
Solución Final
Propiedades
Solución del ACP
Estrategia de Solución
◮ Recuérdese que M es una matriz simétrica definida
positiva y que V es una matriz simétrica positiva.
◮ Además, VM es M–simétrica, esto es1,
(VM)tM = M(VM).
◮ Por lo tanto se deduce que los valores propios de VM
son reales, positivos o nulos, y que existe una base
M–ortonormada de Rp formada por vectores propios de
VM.
◮ Denótense λ1, λ2, . . . , λp los valores propios de VM
ordenados de mayor a menor, y denótense
{u1, u2, . . . , up} una base de vectores propios asociados
respectivamente a los λj.
1
Una matriz A es M–simétrica si At
M = MA.
Análisis en
Componentes
Principales
Caso General
Javier Trejos
Introducción al
ACP general
Solución del ACP
Inercia Proyectada
Teorema de
Inclusón
Estrategia de
Solución
Primer Eje
Segundo Eje
Solución Final
Propiedades
Solución del ACP
Estrategia de Solución
◮ Para obtener la solución del A.C.P.
1. se comienza por buscar el eje ∆v1
que minimice la
inercia I∆v1
(N) con kv1kM = 1,
2. luego el eje ∆v2
que minimice la inercia I∆v2
(N) con
kv2kM = 1 y M–ortogonal a v1,
3. y ası́ sucesivamente:
Análisis en
Componentes
Principales
Caso General
Javier Trejos
Introducción al
ACP general
Solución del ACP
Inercia Proyectada
Teorema de
Inclusón
Estrategia de
Solución
Primer Eje
Segundo Eje
Solución Final
Propiedades
Solución del ACP
Primer Eje
◮ Se quiere encontrar v1 tal que maximice
I∆⊥
v1
(N) = vt
1MVMv1 con la restricción
kv1k2
M = vt
1Mv1 = 1.
Análisis en
Componentes
Principales
Caso General
Javier Trejos
Introducción al
ACP general
Solución del ACP
Inercia Proyectada
Teorema de
Inclusón
Estrategia de
Solución
Primer Eje
Segundo Eje
Solución Final
Propiedades
Solución del ACP
Primer Eje
◮ Se quiere encontrar v1 tal que maximice
I∆⊥
v1
(N) = vt
1MVMv1 con la restricción
kv1k2
M = vt
1Mv1 = 1.
◮ Sea {u1, . . . , up} una base de vectores propios
M–ortonormados de VM, el vector v1 tiene una
expresión en esta base de la forma: v1 =
Pp
j=1 αjuj.
Análisis en
Componentes
Principales
Caso General
Javier Trejos
Introducción al
ACP general
Solución del ACP
Inercia Proyectada
Teorema de
Inclusón
Estrategia de
Solución
Primer Eje
Segundo Eje
Solución Final
Propiedades
Solución del ACP
Primer Eje
◮ Se quiere encontrar v1 tal que maximice
I∆⊥
v1
(N) = vt
1MVMv1 con la restricción
kv1k2
M = vt
1Mv1 = 1.
◮ Sea {u1, . . . , up} una base de vectores propios
M–ortonormados de VM, el vector v1 tiene una
expresión en esta base de la forma: v1 =
Pp
j=1 αjuj.
◮ Luego, la restricción kv1k2
M = 1 se escribe:
1 = vt
1Mv1 =
 p
X
j=1
αjuj
t
M
 p
X
k=1
αkuk

=
p
X
j=1
p
X
k=1
αjαkut
jMuk =
p
X
j=1
p
X
k=1
αjαkδjk,
donde δjk = 1 si j = k y es cero si no, pues la base es
ortonormada.
Análisis en
Componentes
Principales
Caso General
Javier Trejos
Introducción al
ACP general
Solución del ACP
Inercia Proyectada
Teorema de
Inclusón
Estrategia de
Solución
Primer Eje
Segundo Eje
Solución Final
Propiedades
Solución del ACP
Primer Eje
◮ Luego, la restricción se traduce en:
kv1k2
=
p
X
j=1
α2
j = 1,
por lo tanto se tiene:
Análisis en
Componentes
Principales
Caso General
Javier Trejos
Introducción al
ACP general
Solución del ACP
Inercia Proyectada
Teorema de
Inclusón
Estrategia de
Solución
Primer Eje
Segundo Eje
Solución Final
Propiedades
Solución del ACP
Primer Eje
◮ Luego, la restricción se traduce en:
kv1k2
=
p
X
j=1
α2
j = 1,
por lo tanto se tiene:
vt
1MVMv1 = h
p
X
j=1
αjuj, VM
 p
X
k=1
αkuk

iM
= h
p
X
j=1
αjuj,
p
X
k=1
λkαkukiM,
de donde vt
1MVMv1 =
Pp
j=1 λjα2
j .
Análisis en
Componentes
Principales
Caso General
Javier Trejos
Introducción al
ACP general
Solución del ACP
Inercia Proyectada
Teorema de
Inclusón
Estrategia de
Solución
Primer Eje
Segundo Eje
Solución Final
Propiedades
Solución del ACP
Primer Eje
◮ Luego, la restricción se traduce en:
kv1k2
=
p
X
j=1
α2
j = 1,
por lo tanto se tiene:
vt
1MVMv1 = h
p
X
j=1
αjuj, VM
 p
X
k=1
αkuk

iM
= h
p
X
j=1
αjuj,
p
X
k=1
λkαkukiM,
de donde vt
1MVMv1 =
Pp
j=1 λjα2
j .
◮ Se debe por lo tanto maximizar
Pp
j=1 λjα2
j bajo la
restricción
Pp
j=1 α2
j = 1.
Análisis en
Componentes
Principales
Caso General
Javier Trejos
Introducción al
ACP general
Solución del ACP
Inercia Proyectada
Teorema de
Inclusón
Estrategia de
Solución
Primer Eje
Segundo Eje
Solución Final
Propiedades
Solución del ACP
Primer Eje
◮ Debido a que los λj están ordenados de manera
decreciente, se tiene
p
X
j=1
λjα2
j ≤ λ1
p
X
j=1
α2
j = λ1.
Análisis en
Componentes
Principales
Caso General
Javier Trejos
Introducción al
ACP general
Solución del ACP
Inercia Proyectada
Teorema de
Inclusón
Estrategia de
Solución
Primer Eje
Segundo Eje
Solución Final
Propiedades
Solución del ACP
Primer Eje
◮ Debido a que los λj están ordenados de manera
decreciente, se tiene
p
X
j=1
λjα2
j ≤ λ1
p
X
j=1
α2
j = λ1.
◮ Basta por lo tanto tomar α1 = 1 y αj = 0 para todo
j ≥ 2.
Análisis en
Componentes
Principales
Caso General
Javier Trejos
Introducción al
ACP general
Solución del ACP
Inercia Proyectada
Teorema de
Inclusón
Estrategia de
Solución
Primer Eje
Segundo Eje
Solución Final
Propiedades
Solución del ACP
Primer Eje
◮ Debido a que los λj están ordenados de manera
decreciente, se tiene
p
X
j=1
λjα2
j ≤ λ1
p
X
j=1
α2
j = λ1.
◮ Basta por lo tanto tomar α1 = 1 y αj = 0 para todo
j ≥ 2.
◮ Ası́, si v1 = u1, entonces se alcanza el valor λ1 que
mayoriza el criterio a maximizar, por lo que se toma el
vector propio unitario u1 de VM asociado al mayor
valor propio λ1.
Análisis en
Componentes
Principales
Caso General
Javier Trejos
Introducción al
ACP general
Solución del ACP
Inercia Proyectada
Teorema de
Inclusón
Estrategia de
Solución
Primer Eje
Segundo Eje
Solución Final
Propiedades
Solución del ACP
Segundo Eje
◮ Se quiere encontrar v2 tal que maximice
I∆⊥
v2
(N) = vt
2MVMv2 con las restricciones
kv2k2 = vt
2Mv2 = 1 y vt
2Mu1 = 0.
Análisis en
Componentes
Principales
Caso General
Javier Trejos
Introducción al
ACP general
Solución del ACP
Inercia Proyectada
Teorema de
Inclusón
Estrategia de
Solución
Primer Eje
Segundo Eje
Solución Final
Propiedades
Solución del ACP
Segundo Eje
◮ Se quiere encontrar v2 tal que maximice
I∆⊥
v2
(N) = vt
2MVMv2 con las restricciones
kv2k2 = vt
2Mv2 = 1 y vt
2Mu1 = 0.
◮ A partir de la escritura v2 =
Pp
j=1 αjuj de v2 en la
base de vectores propios de VM, con la restricción
Pp
j=1 α2
j = 1, se muestra que la primera restricción es
Pp
j=1 α2
j = 1, mientras que la segunda restricción lleva
a:
0 = vt
2Mv1 =


p
X
j=1
αjuj


t
Mu1
=
p
X
j=1
αjut
jMu1
= α1ut
1Mu1 = α1.
Análisis en
Componentes
Principales
Caso General
Javier Trejos
Introducción al
ACP general
Solución del ACP
Inercia Proyectada
Teorema de
Inclusón
Estrategia de
Solución
Primer Eje
Segundo Eje
Solución Final
Propiedades
Solución del ACP
Segundo Eje
◮ Es decir, v2 =
Pp
j=2 αjuj pues α1 = 0. La restricción
kv2k2 = 1 se traduce en
Pp
j=2 α2
j = 1.
Análisis en
Componentes
Principales
Caso General
Javier Trejos
Introducción al
ACP general
Solución del ACP
Inercia Proyectada
Teorema de
Inclusón
Estrategia de
Solución
Primer Eje
Segundo Eje
Solución Final
Propiedades
Solución del ACP
Segundo Eje
◮ Es decir, v2 =
Pp
j=2 αjuj pues α1 = 0. La restricción
kv2k2 = 1 se traduce en
Pp
j=2 α2
j = 1.
◮ Luego,
I∆⊥
v2
(N) = vt
2MVMv2 =
X
j=2
λjα2
j ≤ λ2
p
X
j=2
α2
j = λ2.
Análisis en
Componentes
Principales
Caso General
Javier Trejos
Introducción al
ACP general
Solución del ACP
Inercia Proyectada
Teorema de
Inclusón
Estrategia de
Solución
Primer Eje
Segundo Eje
Solución Final
Propiedades
Solución del ACP
Segundo Eje
◮ Es decir, v2 =
Pp
j=2 αjuj pues α1 = 0. La restricción
kv2k2 = 1 se traduce en
Pp
j=2 α2
j = 1.
◮ Luego,
I∆⊥
v2
(N) = vt
2MVMv2 =
X
j=2
λjα2
j ≤ λ2
p
X
j=2
α2
j = λ2.
◮ Ası́, el valor a maximizar se encuentra mayorado por λ2,
y este valor se alcanza cuando α2 = 1 y αj = 0 para
todo j ≥ 3; esto es, cuando v2 = u2, por lo que una
solución es tomar el vector propio unitario u2 de VM
asociado al segundo valor propio más grande de VM.
Análisis en
Componentes
Principales
Caso General
Javier Trejos
Introducción al
ACP general
Solución del ACP
Inercia Proyectada
Teorema de
Inclusón
Estrategia de
Solución
Primer Eje
Segundo Eje
Solución Final
Propiedades
Solución del ACP
Solución Final
◮ La búsqueda del k-ésimo eje factorial ∆vk
se hace
análogamente y se encuentra que vk = uk.
Análisis en
Componentes
Principales
Caso General
Javier Trejos
Introducción al
ACP general
Solución del ACP
Inercia Proyectada
Teorema de
Inclusón
Estrategia de
Solución
Primer Eje
Segundo Eje
Solución Final
Propiedades
Solución del ACP
Solución Final
◮ La búsqueda del k-ésimo eje factorial ∆vk
se hace
análogamente y se encuentra que vk = uk.
◮ Obsérvese que los vectores uk que definen los ejes
principales ∆uk
pertenecen al espacio de individuos Rp,
mientras que las componentes principales ck = XMuk
pertenecen al espacio de variables Rn, y que son las
proyecciones por dualidad de los primeros, esto es, la
transformación mediante XM de Rp en Rn.
✲
✛
❄
✻
❄
✻
X
Xt
W D
M V
Rp
(Rp)∗
Rn
(Rn)∗ Xn×p : tabla de datos
centrados
uk ∈ Rp
ck = XMuk ∈ Rn
VMuk = λkuk
WDck = λkck
Análisis en
Componentes
Principales
Caso General
Javier Trejos
Introducción al
ACP general
Solución del ACP
Inercia Proyectada
Teorema de
Inclusón
Estrategia de
Solución
Primer Eje
Segundo Eje
Solución Final
Propiedades
Solución del ACP
Propiedades
◮ La inercia de la nube proyectada sobre el primer eje
principal:
λ1 = I∆⊥
u1
(N)
Análisis en
Componentes
Principales
Caso General
Javier Trejos
Introducción al
ACP general
Solución del ACP
Inercia Proyectada
Teorema de
Inclusón
Estrategia de
Solución
Primer Eje
Segundo Eje
Solución Final
Propiedades
Solución del ACP
Propiedades
◮ La inercia de la nube proyectada sobre el primer eje
principal:
λ1 = I∆⊥
u1
(N)
◮ Parte de inercia explicada por el primer eje principal:
λ1+λ2
tr(VM)
Análisis en
Componentes
Principales
Caso General
Javier Trejos
Introducción al
ACP general
Solución del ACP
Inercia Proyectada
Teorema de
Inclusón
Estrategia de
Solución
Primer Eje
Segundo Eje
Solución Final
Propiedades
Solución del ACP
Propiedades
◮ La inercia de la nube proyectada sobre el primer eje
principal:
λ1 = I∆⊥
u1
(N)
◮ Parte de inercia explicada por el primer eje principal:
λ1+λ2
tr(VM)
◮ λ1+λ2+...+λk
tr(VM) es la parte de inercia explicada por el
subespacio principal Ek de dimensión k generado por
u1, u2, . . . , uk, es decir Ek = ∆u1 ⊕ ∆u2 ⊕ . . . ⊕ ∆uk
.
Análisis en
Componentes
Principales
Caso General
Javier Trejos
Introducción al
ACP general
Solución del ACP
Inercia Proyectada
Teorema de
Inclusón
Estrategia de
Solución
Primer Eje
Segundo Eje
Solución Final
Propiedades
Solución del ACP
Propiedades
Las componentes principales del A.C.P. general de la nube
N = (X, M, D) tiene las siguientes propiedades:
Análisis en
Componentes
Principales
Caso General
Javier Trejos
Introducción al
ACP general
Solución del ACP
Inercia Proyectada
Teorema de
Inclusón
Estrategia de
Solución
Primer Eje
Segundo Eje
Solución Final
Propiedades
Solución del ACP
Propiedades
Las componentes principales del A.C.P. general de la nube
N = (X, M, D) tiene las siguientes propiedades:
1. Son centradas:
ck = 0.
Análisis en
Componentes
Principales
Caso General
Javier Trejos
Introducción al
ACP general
Solución del ACP
Inercia Proyectada
Teorema de
Inclusón
Estrategia de
Solución
Primer Eje
Segundo Eje
Solución Final
Propiedades
Solución del ACP
Propiedades
Las componentes principales del A.C.P. general de la nube
N = (X, M, D) tiene las siguientes propiedades:
1. Son centradas:
ck = 0.
2. ck tiene varianza λk:
var (ck
) = λk.
Análisis en
Componentes
Principales
Caso General
Javier Trejos
Introducción al
ACP general
Solución del ACP
Inercia Proyectada
Teorema de
Inclusón
Estrategia de
Solución
Primer Eje
Segundo Eje
Solución Final
Propiedades
Solución del ACP
Propiedades
Las componentes principales del A.C.P. general de la nube
N = (X, M, D) tiene las siguientes propiedades:
1. Son centradas:
ck = 0.
2. ck tiene varianza λk:
var (ck
) = λk.
3. Cada par de ellas tiene correlación cero:
∀k, l : r(ck
, cl
) = 0.

Más contenido relacionado

Similar a Análisis en componentes principales general

Funciones Exponenciales y Logarítmicas
Funciones Exponenciales y Logarítmicas Funciones Exponenciales y Logarítmicas
Funciones Exponenciales y Logarítmicas
Karen Yaruquí
 
Informe
InformeInforme
Prueba 1
Prueba 1Prueba 1
2 integracion
2 integracion2 integracion
2 integracion
Ricardo Lome
 
Integralindefinida
IntegralindefinidaIntegralindefinida
Integralindefinida
wbaldo londoño
 
Calculo ca tema5ateoria(09-10)
Calculo ca tema5ateoria(09-10)Calculo ca tema5ateoria(09-10)
Calculo ca tema5ateoria(09-10)
ing_eliali4748
 
Analisis de Algoritmos
Analisis de AlgoritmosAnalisis de Algoritmos
Analisis de Algoritmos
zygdiaz
 
Optimizacion_Robusta_II
Optimizacion_Robusta_IIOptimizacion_Robusta_II
Optimizacion_Robusta_II
Luis Reyes-Castro
 
Fundamentos de Computación Cuántica
Fundamentos de Computación CuánticaFundamentos de Computación Cuántica
Fundamentos de Computación Cuántica
nuestrocanto
 
Analisis de Algoritmos tarea 1
Analisis de Algoritmos tarea 1Analisis de Algoritmos tarea 1
Analisis de Algoritmos tarea 1
Velmuz Buzz
 
Richard granda presentacion integrales matematica3
Richard granda presentacion integrales matematica3Richard granda presentacion integrales matematica3
Richard granda presentacion integrales matematica3
Richard Granda latorraca
 
No lineal
No linealNo lineal
No lineal
Claudio Aballay
 
2. Teorema fundamental del cálculo
2. Teorema fundamental del cálculo2. Teorema fundamental del cálculo
2. Teorema fundamental del cálculo
Alfonso Cubillos Delgado
 
Tesis matematica
Tesis matematicaTesis matematica
Tesis matematica
Boris Lara Martinez
 
Tema 8 integrales
Tema 8 integralesTema 8 integrales
Tema 8 integrales
ANGELA ARENILLA
 
T1preliminaresrcalculofeb Jun2009uc
T1preliminaresrcalculofeb Jun2009ucT1preliminaresrcalculofeb Jun2009uc
T1preliminaresrcalculofeb Jun2009uc
EFRAIN VASQUEZ MILLAN
 
Aplicacion de derivadas.
Aplicacion de derivadas.Aplicacion de derivadas.
Aplicacion de derivadas.
YusmarRamirez
 
Met iterativos
Met iterativosMet iterativos
Dynamic programming ejercicio_i
Dynamic programming ejercicio_iDynamic programming ejercicio_i
Dynamic programming ejercicio_i
JacquesLartigueMendo
 
Algoritmos
AlgoritmosAlgoritmos

Similar a Análisis en componentes principales general (20)

Funciones Exponenciales y Logarítmicas
Funciones Exponenciales y Logarítmicas Funciones Exponenciales y Logarítmicas
Funciones Exponenciales y Logarítmicas
 
Informe
InformeInforme
Informe
 
Prueba 1
Prueba 1Prueba 1
Prueba 1
 
2 integracion
2 integracion2 integracion
2 integracion
 
Integralindefinida
IntegralindefinidaIntegralindefinida
Integralindefinida
 
Calculo ca tema5ateoria(09-10)
Calculo ca tema5ateoria(09-10)Calculo ca tema5ateoria(09-10)
Calculo ca tema5ateoria(09-10)
 
Analisis de Algoritmos
Analisis de AlgoritmosAnalisis de Algoritmos
Analisis de Algoritmos
 
Optimizacion_Robusta_II
Optimizacion_Robusta_IIOptimizacion_Robusta_II
Optimizacion_Robusta_II
 
Fundamentos de Computación Cuántica
Fundamentos de Computación CuánticaFundamentos de Computación Cuántica
Fundamentos de Computación Cuántica
 
Analisis de Algoritmos tarea 1
Analisis de Algoritmos tarea 1Analisis de Algoritmos tarea 1
Analisis de Algoritmos tarea 1
 
Richard granda presentacion integrales matematica3
Richard granda presentacion integrales matematica3Richard granda presentacion integrales matematica3
Richard granda presentacion integrales matematica3
 
No lineal
No linealNo lineal
No lineal
 
2. Teorema fundamental del cálculo
2. Teorema fundamental del cálculo2. Teorema fundamental del cálculo
2. Teorema fundamental del cálculo
 
Tesis matematica
Tesis matematicaTesis matematica
Tesis matematica
 
Tema 8 integrales
Tema 8 integralesTema 8 integrales
Tema 8 integrales
 
T1preliminaresrcalculofeb Jun2009uc
T1preliminaresrcalculofeb Jun2009ucT1preliminaresrcalculofeb Jun2009uc
T1preliminaresrcalculofeb Jun2009uc
 
Aplicacion de derivadas.
Aplicacion de derivadas.Aplicacion de derivadas.
Aplicacion de derivadas.
 
Met iterativos
Met iterativosMet iterativos
Met iterativos
 
Dynamic programming ejercicio_i
Dynamic programming ejercicio_iDynamic programming ejercicio_i
Dynamic programming ejercicio_i
 
Algoritmos
AlgoritmosAlgoritmos
Algoritmos
 

Más de Facultad de Ciencias, UCR

Yield curve estimation in Costa Rica
Yield curve estimation in Costa RicaYield curve estimation in Costa Rica
Yield curve estimation in Costa Rica
Facultad de Ciencias, UCR
 
CART
CARTCART
Análisis en componentes principales
Análisis en componentes principalesAnálisis en componentes principales
Análisis en componentes principales
Facultad de Ciencias, UCR
 
Análisis de correspondencias
Análisis de correspondenciasAnálisis de correspondencias
Análisis de correspondencias
Facultad de Ciencias, UCR
 
Análisis de correspondencias múltiples
Análisis de correspondencias múltiplesAnálisis de correspondencias múltiples
Análisis de correspondencias múltiples
Facultad de Ciencias, UCR
 
Ilustracion de K-medias
Ilustracion de K-mediasIlustracion de K-medias
Ilustracion de K-medias
Facultad de Ciencias, UCR
 
Clasificacion automática (II parte) - clustering.pdf
Clasificacion automática (II parte) - clustering.pdfClasificacion automática (II parte) - clustering.pdf
Clasificacion automática (II parte) - clustering.pdf
Facultad de Ciencias, UCR
 
Clasificacion Automática - clustering (I parte)
Clasificacion Automática - clustering (I parte)Clasificacion Automática - clustering (I parte)
Clasificacion Automática - clustering (I parte)
Facultad de Ciencias, UCR
 
Regresión Lineal Múltiple
Regresión Lineal MúltipleRegresión Lineal Múltiple
Regresión Lineal Múltiple
Facultad de Ciencias, UCR
 
Regresión Logística
Regresión LogísticaRegresión Logística
Regresión Logística
Facultad de Ciencias, UCR
 
7_Discriminacion.pdf
7_Discriminacion.pdf7_Discriminacion.pdf
7_Discriminacion.pdf
Facultad de Ciencias, UCR
 
Analisis Canonico
Analisis CanonicoAnalisis Canonico
Analisis Canonico
Facultad de Ciencias, UCR
 
Clasificación óptima: algoritmo de Fisher
Clasificación óptima: algoritmo de FisherClasificación óptima: algoritmo de Fisher
Clasificación óptima: algoritmo de Fisher
Facultad de Ciencias, UCR
 
Regresión PLS
Regresión PLSRegresión PLS
Curso(1)-Clasificacion
Curso(1)-ClasificacionCurso(1)-Clasificacion
Curso(1)-Clasificacion
Facultad de Ciencias, UCR
 
Modelos de clasificación
Modelos de clasificaciónModelos de clasificación
Modelos de clasificación
Facultad de Ciencias, UCR
 

Más de Facultad de Ciencias, UCR (16)

Yield curve estimation in Costa Rica
Yield curve estimation in Costa RicaYield curve estimation in Costa Rica
Yield curve estimation in Costa Rica
 
CART
CARTCART
CART
 
Análisis en componentes principales
Análisis en componentes principalesAnálisis en componentes principales
Análisis en componentes principales
 
Análisis de correspondencias
Análisis de correspondenciasAnálisis de correspondencias
Análisis de correspondencias
 
Análisis de correspondencias múltiples
Análisis de correspondencias múltiplesAnálisis de correspondencias múltiples
Análisis de correspondencias múltiples
 
Ilustracion de K-medias
Ilustracion de K-mediasIlustracion de K-medias
Ilustracion de K-medias
 
Clasificacion automática (II parte) - clustering.pdf
Clasificacion automática (II parte) - clustering.pdfClasificacion automática (II parte) - clustering.pdf
Clasificacion automática (II parte) - clustering.pdf
 
Clasificacion Automática - clustering (I parte)
Clasificacion Automática - clustering (I parte)Clasificacion Automática - clustering (I parte)
Clasificacion Automática - clustering (I parte)
 
Regresión Lineal Múltiple
Regresión Lineal MúltipleRegresión Lineal Múltiple
Regresión Lineal Múltiple
 
Regresión Logística
Regresión LogísticaRegresión Logística
Regresión Logística
 
7_Discriminacion.pdf
7_Discriminacion.pdf7_Discriminacion.pdf
7_Discriminacion.pdf
 
Analisis Canonico
Analisis CanonicoAnalisis Canonico
Analisis Canonico
 
Clasificación óptima: algoritmo de Fisher
Clasificación óptima: algoritmo de FisherClasificación óptima: algoritmo de Fisher
Clasificación óptima: algoritmo de Fisher
 
Regresión PLS
Regresión PLSRegresión PLS
Regresión PLS
 
Curso(1)-Clasificacion
Curso(1)-ClasificacionCurso(1)-Clasificacion
Curso(1)-Clasificacion
 
Modelos de clasificación
Modelos de clasificaciónModelos de clasificación
Modelos de clasificación
 

Último

El origen de la vida en la Tierra. Teorías.
El origen de la vida en la Tierra. Teorías.El origen de la vida en la Tierra. Teorías.
El origen de la vida en la Tierra. Teorías.
ProfPabloBerta
 
MAPA CONCEPTUAL DE OTITIS MEDIA AGUDA Y CRONICA.pdf
MAPA CONCEPTUAL DE OTITIS MEDIA AGUDA Y CRONICA.pdfMAPA CONCEPTUAL DE OTITIS MEDIA AGUDA Y CRONICA.pdf
MAPA CONCEPTUAL DE OTITIS MEDIA AGUDA Y CRONICA.pdf
John144454
 
NEUROQUIMICA es la informacion de como funciona la neuroquimica
NEUROQUIMICA es la informacion de como funciona la neuroquimicaNEUROQUIMICA es la informacion de como funciona la neuroquimica
NEUROQUIMICA es la informacion de como funciona la neuroquimica
DanielNava80
 
terapia hormonal de la menopausia.......
terapia hormonal de la menopausia.......terapia hormonal de la menopausia.......
terapia hormonal de la menopausia.......
JosalbertoLpezLpez
 
Embarazo postermino - UptDate actualizado
Embarazo postermino - UptDate actualizadoEmbarazo postermino - UptDate actualizado
Embarazo postermino - UptDate actualizado
ANtony MV
 
Los enigmáticos priones en la naturales, características y ejemplos
Los enigmáticos priones en la naturales, características y ejemplosLos enigmáticos priones en la naturales, características y ejemplos
Los enigmáticos priones en la naturales, características y ejemplos
alexandrajunchaya3
 
Heterociclos; pequeñas y maravillosas estructuras-Química
Heterociclos; pequeñas y maravillosas estructuras-QuímicaHeterociclos; pequeñas y maravillosas estructuras-Química
Heterociclos; pequeñas y maravillosas estructuras-Química
PriyaQuijano
 
8VO - ESTUDIOS SOCIALES - 1ER - TRIMESTRE.docx
8VO - ESTUDIOS SOCIALES - 1ER - TRIMESTRE.docx8VO - ESTUDIOS SOCIALES - 1ER - TRIMESTRE.docx
8VO - ESTUDIOS SOCIALES - 1ER - TRIMESTRE.docx
YULI557869
 
La doble vida del ATP. DIEGO GOMEZ.pdf 123
La doble vida del ATP. DIEGO GOMEZ.pdf 123La doble vida del ATP. DIEGO GOMEZ.pdf 123
La doble vida del ATP. DIEGO GOMEZ.pdf 123
DiegoGomez400963
 
Introduccion a las teorias de acidos y bases.pptx
Introduccion a las teorias de acidos y bases.pptxIntroduccion a las teorias de acidos y bases.pptx
Introduccion a las teorias de acidos y bases.pptx
NicoleArequipa
 
geologia de venezuela. TEMA PRECAMBRICO.pdf
geologia de venezuela. TEMA PRECAMBRICO.pdfgeologia de venezuela. TEMA PRECAMBRICO.pdf
geologia de venezuela. TEMA PRECAMBRICO.pdf
DanielaAlvarez728528
 
MÉTODO SIMPLEX EN PROBLEMAS DE MAXIMIZACIÓN Y MINIMIZACIÓN.pptx
MÉTODO SIMPLEX EN PROBLEMAS DE MAXIMIZACIÓN Y MINIMIZACIÓN.pptxMÉTODO SIMPLEX EN PROBLEMAS DE MAXIMIZACIÓN Y MINIMIZACIÓN.pptx
MÉTODO SIMPLEX EN PROBLEMAS DE MAXIMIZACIÓN Y MINIMIZACIÓN.pptx
KEIKOFABIANAZETATEMO
 
1891 - Primera discusión semicientífica sobre Una Nave Espacial Propulsada po...
1891 - Primera discusión semicientífica sobre Una Nave Espacial Propulsada po...1891 - Primera discusión semicientífica sobre Una Nave Espacial Propulsada po...
1891 - Primera discusión semicientífica sobre Una Nave Espacial Propulsada po...
Champs Elysee Roldan
 
0.1 SEMIOLOGIA neurologica.ppjjjjjjjjjjk
0.1 SEMIOLOGIA neurologica.ppjjjjjjjjjjk0.1 SEMIOLOGIA neurologica.ppjjjjjjjjjjk
0.1 SEMIOLOGIA neurologica.ppjjjjjjjjjjk
AugustoBrizola
 
CLASE FRUTOS clase frutos clase frutos ABRIL 2021.pptx
CLASE FRUTOS clase frutos clase frutos ABRIL 2021.pptxCLASE FRUTOS clase frutos clase frutos ABRIL 2021.pptx
CLASE FRUTOS clase frutos clase frutos ABRIL 2021.pptx
damiancarganarazb
 
ANTRAX.pdf historia natural del antrax epidemiologia
ANTRAX.pdf historia natural del antrax epidemiologiaANTRAX.pdf historia natural del antrax epidemiologia
ANTRAX.pdf historia natural del antrax epidemiologia
Daniellaticona
 
Algebra trigonometria y geometri analitica 3ra Edicio Dennis G. Zill.pdf
Algebra trigonometria y geometri analitica 3ra Edicio Dennis G. Zill.pdfAlgebra trigonometria y geometri analitica 3ra Edicio Dennis G. Zill.pdf
Algebra trigonometria y geometri analitica 3ra Edicio Dennis G. Zill.pdf
alejandro esteban concha leiva
 
Teoría del prión y enfermedades relacionadas
Teoría del prión y  enfermedades relacionadasTeoría del prión y  enfermedades relacionadas
Teoría del prión y enfermedades relacionadas
alexandrajunchaya3
 
Nodulo tiroideo presentacion de power point
Nodulo tiroideo presentacion de power pointNodulo tiroideo presentacion de power point
Nodulo tiroideo presentacion de power point
iansam1319
 
oso panda vida reproducción hábitat y hábitos
oso panda vida reproducción hábitat y hábitososo panda vida reproducción hábitat y hábitos
oso panda vida reproducción hábitat y hábitos
olswaldso62
 

Último (20)

El origen de la vida en la Tierra. Teorías.
El origen de la vida en la Tierra. Teorías.El origen de la vida en la Tierra. Teorías.
El origen de la vida en la Tierra. Teorías.
 
MAPA CONCEPTUAL DE OTITIS MEDIA AGUDA Y CRONICA.pdf
MAPA CONCEPTUAL DE OTITIS MEDIA AGUDA Y CRONICA.pdfMAPA CONCEPTUAL DE OTITIS MEDIA AGUDA Y CRONICA.pdf
MAPA CONCEPTUAL DE OTITIS MEDIA AGUDA Y CRONICA.pdf
 
NEUROQUIMICA es la informacion de como funciona la neuroquimica
NEUROQUIMICA es la informacion de como funciona la neuroquimicaNEUROQUIMICA es la informacion de como funciona la neuroquimica
NEUROQUIMICA es la informacion de como funciona la neuroquimica
 
terapia hormonal de la menopausia.......
terapia hormonal de la menopausia.......terapia hormonal de la menopausia.......
terapia hormonal de la menopausia.......
 
Embarazo postermino - UptDate actualizado
Embarazo postermino - UptDate actualizadoEmbarazo postermino - UptDate actualizado
Embarazo postermino - UptDate actualizado
 
Los enigmáticos priones en la naturales, características y ejemplos
Los enigmáticos priones en la naturales, características y ejemplosLos enigmáticos priones en la naturales, características y ejemplos
Los enigmáticos priones en la naturales, características y ejemplos
 
Heterociclos; pequeñas y maravillosas estructuras-Química
Heterociclos; pequeñas y maravillosas estructuras-QuímicaHeterociclos; pequeñas y maravillosas estructuras-Química
Heterociclos; pequeñas y maravillosas estructuras-Química
 
8VO - ESTUDIOS SOCIALES - 1ER - TRIMESTRE.docx
8VO - ESTUDIOS SOCIALES - 1ER - TRIMESTRE.docx8VO - ESTUDIOS SOCIALES - 1ER - TRIMESTRE.docx
8VO - ESTUDIOS SOCIALES - 1ER - TRIMESTRE.docx
 
La doble vida del ATP. DIEGO GOMEZ.pdf 123
La doble vida del ATP. DIEGO GOMEZ.pdf 123La doble vida del ATP. DIEGO GOMEZ.pdf 123
La doble vida del ATP. DIEGO GOMEZ.pdf 123
 
Introduccion a las teorias de acidos y bases.pptx
Introduccion a las teorias de acidos y bases.pptxIntroduccion a las teorias de acidos y bases.pptx
Introduccion a las teorias de acidos y bases.pptx
 
geologia de venezuela. TEMA PRECAMBRICO.pdf
geologia de venezuela. TEMA PRECAMBRICO.pdfgeologia de venezuela. TEMA PRECAMBRICO.pdf
geologia de venezuela. TEMA PRECAMBRICO.pdf
 
MÉTODO SIMPLEX EN PROBLEMAS DE MAXIMIZACIÓN Y MINIMIZACIÓN.pptx
MÉTODO SIMPLEX EN PROBLEMAS DE MAXIMIZACIÓN Y MINIMIZACIÓN.pptxMÉTODO SIMPLEX EN PROBLEMAS DE MAXIMIZACIÓN Y MINIMIZACIÓN.pptx
MÉTODO SIMPLEX EN PROBLEMAS DE MAXIMIZACIÓN Y MINIMIZACIÓN.pptx
 
1891 - Primera discusión semicientífica sobre Una Nave Espacial Propulsada po...
1891 - Primera discusión semicientífica sobre Una Nave Espacial Propulsada po...1891 - Primera discusión semicientífica sobre Una Nave Espacial Propulsada po...
1891 - Primera discusión semicientífica sobre Una Nave Espacial Propulsada po...
 
0.1 SEMIOLOGIA neurologica.ppjjjjjjjjjjk
0.1 SEMIOLOGIA neurologica.ppjjjjjjjjjjk0.1 SEMIOLOGIA neurologica.ppjjjjjjjjjjk
0.1 SEMIOLOGIA neurologica.ppjjjjjjjjjjk
 
CLASE FRUTOS clase frutos clase frutos ABRIL 2021.pptx
CLASE FRUTOS clase frutos clase frutos ABRIL 2021.pptxCLASE FRUTOS clase frutos clase frutos ABRIL 2021.pptx
CLASE FRUTOS clase frutos clase frutos ABRIL 2021.pptx
 
ANTRAX.pdf historia natural del antrax epidemiologia
ANTRAX.pdf historia natural del antrax epidemiologiaANTRAX.pdf historia natural del antrax epidemiologia
ANTRAX.pdf historia natural del antrax epidemiologia
 
Algebra trigonometria y geometri analitica 3ra Edicio Dennis G. Zill.pdf
Algebra trigonometria y geometri analitica 3ra Edicio Dennis G. Zill.pdfAlgebra trigonometria y geometri analitica 3ra Edicio Dennis G. Zill.pdf
Algebra trigonometria y geometri analitica 3ra Edicio Dennis G. Zill.pdf
 
Teoría del prión y enfermedades relacionadas
Teoría del prión y  enfermedades relacionadasTeoría del prión y  enfermedades relacionadas
Teoría del prión y enfermedades relacionadas
 
Nodulo tiroideo presentacion de power point
Nodulo tiroideo presentacion de power pointNodulo tiroideo presentacion de power point
Nodulo tiroideo presentacion de power point
 
oso panda vida reproducción hábitat y hábitos
oso panda vida reproducción hábitat y hábitososo panda vida reproducción hábitat y hábitos
oso panda vida reproducción hábitat y hábitos
 

Análisis en componentes principales general

  • 1. Análisis en Componentes Principales Caso General Javier Trejos Introducción al ACP general Solución del ACP Inercia Proyectada Teorema de Inclusón Estrategia de Solución Primer Eje Segundo Eje Solución Final Propiedades Análisis en Componentes Principales Caso General Javier Trejos Escuela de Matemática – CIMPA Universidad de Costa Rica II semestre 2020
  • 2. Análisis en Componentes Principales Caso General Javier Trejos Introducción al ACP general Solución del ACP Inercia Proyectada Teorema de Inclusón Estrategia de Solución Primer Eje Segundo Eje Solución Final Propiedades Esquema Introducción al ACP general Solución del ACP Inercia Proyectada Teorema de Inclusón Estrategia de Solución Primer Eje Segundo Eje Solución Final Propiedades
  • 3. Análisis en Componentes Principales Caso General Javier Trejos Introducción al ACP general Solución del ACP Inercia Proyectada Teorema de Inclusón Estrategia de Solución Primer Eje Segundo Eje Solución Final Propiedades Análisis en Componentes Principales General Objetivo del ACP General ◮ Sean la nube de puntos N = (X, M, D), con X la tabla de datos n × p con variables cuantitativas, M la métrica cualquiera p × p sobre el espacio de individuos Rp, y D = diag (pi) la métrica de pesos (matriz diagonal n × n) sobre el espacio de variables Rn. ◮ Supondremos que las variables xj están centradas, pero no estandarizadas. ◮ Se busca un espacio de dimensión q, menor que p, de manera que las posiciones relativas de los puntos–individuos sean lo más similares posibles a sus posiciones en el espacio Rp; es decir, la inercia de la nube de puntos proyectada debe ser lo más similar a la inercia de los puntos en Rp ◮ Esto significa que hay una pérdida mı́nima de información al proyectar los n individuos sobre un espacio de dimensión menor
  • 4. Análisis en Componentes Principales Caso General Javier Trejos Introducción al ACP general Solución del ACP Inercia Proyectada Teorema de Inclusón Estrategia de Solución Primer Eje Segundo Eje Solución Final Propiedades Objetivo del ACP Objetivo dual ◮ Se puede plantear de otra forma el objetivo del ACP, esta vez desde el punto de vista de las variables. ◮ Dada la tabla de datos X, se busca un conjunto de q variables sintéticas c1, c2, . . . , cq, donde q < p, que más adelante se llamarán componentes principales, tal que: 1. Cada componente principal ck debe ser combinación lineal de las variables originales xj ; esto significa que la información contenida en las xj también está reflejada en las ck . 2. Las componentes principales deben ser no correlacionadas dos a dos; esto significa que las ck no tienen información redundante. 3. Las componentes principales deben tener varianza máxima; esto significa que contendrán el máximo de información posible. ◮ Las tres condiciones anteriores se pueden deducir del objetivo inicial, de reducción de la dimensión del espacio de individuos.
  • 5. Análisis en Componentes Principales Caso General Javier Trejos Introducción al ACP general Solución del ACP Inercia Proyectada Teorema de Inclusón Estrategia de Solución Primer Eje Segundo Eje Solución Final Propiedades ACP General Esquema de Dualidad ✲ ✛ ❄ ✻ ❄ ✻ X Xt W D M V Rp (Rp)∗ Rn (Rn)∗ Xn×p : tabla de datos centrados V = XtDX W = XMXt D: métrica de pesos M: métrica general
  • 6. Análisis en Componentes Principales Caso General Javier Trejos Introducción al ACP general Solución del ACP Inercia Proyectada Teorema de Inclusón Estrategia de Solución Primer Eje Segundo Eje Solución Final Propiedades Solución del ACP Inercia Proyectada ◮ Si H es un subespacio vectorial de Rp, entonces existe un subespacio de Rp denotado H⊥ y llamado el complemento ortogonal de H, tal que Rp = H ⊕ H⊥;
  • 7. Análisis en Componentes Principales Caso General Javier Trejos Introducción al ACP general Solución del ACP Inercia Proyectada Teorema de Inclusón Estrategia de Solución Primer Eje Segundo Eje Solución Final Propiedades Solución del ACP Inercia Proyectada ◮ Si H es un subespacio vectorial de Rp, entonces existe un subespacio de Rp denotado H⊥ y llamado el complemento ortogonal de H, tal que Rp = H ⊕ H⊥; ◮ se cumple que para todo ∀h ∈ H y ∀h̄ ∈ H⊥: M(h, h̄) = hh, h̄iM = 0. ◮ Por lo tanto, ∀xi ∈ Rp, ∃ai ∈ H, bi ∈ H⊥ tales que xi = ai + bi, y esta descomposición es única.
  • 8. Análisis en Componentes Principales Caso General Javier Trejos Introducción al ACP general Solución del ACP Inercia Proyectada Teorema de Inclusón Estrategia de Solución Primer Eje Segundo Eje Solución Final Propiedades Solución del ACP Inercia Proyectada ◮ Se define la inercia de la nube N respecto a H como: IH(N) = n X i=1 pikbik2 .
  • 9. Análisis en Componentes Principales Caso General Javier Trejos Introducción al ACP general Solución del ACP Inercia Proyectada Teorema de Inclusón Estrategia de Solución Primer Eje Segundo Eje Solución Final Propiedades Solución del ACP Inercia Proyectada ◮ Se define la inercia de la nube N respecto a H como: IH(N) = n X i=1 pikbik2 . ◮ Ası́ mismo, la inercia de N respecto a H⊥ es: IH⊥ (N) = n X i=1 pikaik2 . ◮ Esto es, IH⊥ (N) es la inercia de la nube proyectada sobre el espacio H.
  • 10. Análisis en Componentes Principales Caso General Javier Trejos Introducción al ACP general Solución del ACP Inercia Proyectada Teorema de Inclusón Estrategia de Solución Primer Eje Segundo Eje Solución Final Propiedades Solución del ACP Inercia Proyectada ◮ Se define la inercia de la nube N respecto a H como: IH(N) = n X i=1 pikbik2 . ◮ Ası́ mismo, la inercia de N respecto a H⊥ es: IH⊥ (N) = n X i=1 pikaik2 . ◮ Esto es, IH⊥ (N) es la inercia de la nube proyectada sobre el espacio H. ◮ Cuando H está generado por un vector unitario v, es decir H = ∆v con kvk = 1, entonces se tiene ai = hv, xiiMv = (vtMxi)v.
  • 11. Análisis en Componentes Principales Caso General Javier Trejos Introducción al ACP general Solución del ACP Inercia Proyectada Teorema de Inclusón Estrategia de Solución Primer Eje Segundo Eje Solución Final Propiedades Solución del ACP Inercia Proyectada ◮ Por lo tanto I∆⊥ v (N) = n X i=1 pikaik2 = n X i=1 pi(vt Mxi)2 kvk2 = n X i=1 pivt Mxixt iMv ◮ I∆⊥ v (N) = vt M n X i=1 pixixt i Mv = vt MVMv. ◮ Debido a que E = H ⊕ H⊥ y al teorema de Pitágoras, se tiene la importante relación: I(N) = IH(N) + IH⊥ (N). ◮ Se busca el espacio Eq tal que la inercia IE⊥ q (N) de la nube proyectada sobre ese espacio sea máxima (lo que es equivalente a pedir que la inercia IEq (N) sea mı́nima).
  • 12. Análisis en Componentes Principales Caso General Javier Trejos Introducción al ACP general Solución del ACP Inercia Proyectada Teorema de Inclusón Estrategia de Solución Primer Eje Segundo Eje Solución Final Propiedades Solución del ACP Teorema de Inclusión Teorema (De inclusión) Si Ek−1 es un subespacio vectorial óptimo de Rp de dimensión k − 1, entonces existe un subespacio vectorial óptimo de Rp de dimensión k que contiene a Ek−1.
  • 13. Análisis en Componentes Principales Caso General Javier Trejos Introducción al ACP general Solución del ACP Inercia Proyectada Teorema de Inclusón Estrategia de Solución Primer Eje Segundo Eje Solución Final Propiedades Solución del ACP Teorema de Inclusión Teorema (De inclusión) Si Ek−1 es un subespacio vectorial óptimo de Rp de dimensión k − 1, entonces existe un subespacio vectorial óptimo de Rp de dimensión k que contiene a Ek−1. Demostración: Sea Fk un subespacio vectorial de Rp de dimensión k y se denota H = Fk + E⊥ k−1.
  • 14. Análisis en Componentes Principales Caso General Javier Trejos Introducción al ACP general Solución del ACP Inercia Proyectada Teorema de Inclusón Estrategia de Solución Primer Eje Segundo Eje Solución Final Propiedades Solución del ACP Teorema de Inclusión Teorema (De inclusión) Si Ek−1 es un subespacio vectorial óptimo de Rp de dimensión k − 1, entonces existe un subespacio vectorial óptimo de Rp de dimensión k que contiene a Ek−1. Demostración: Sea Fk un subespacio vectorial de Rp de dimensión k y se denota H = Fk + E⊥ k−1. Si Fk ∩ E⊥ k−1 = {0} entonces se tendrı́a H = Fk ⊕ E⊥ k−1 y dim(H) = k + (p − (k − 1)) = p + 1, lo cual es absurdo pues H ⊆ Rp.
  • 15. Análisis en Componentes Principales Caso General Javier Trejos Introducción al ACP general Solución del ACP Inercia Proyectada Teorema de Inclusón Estrategia de Solución Primer Eje Segundo Eje Solución Final Propiedades Solución del ACP Teorema de Inclusión Teorema (De inclusión) Si Ek−1 es un subespacio vectorial óptimo de Rp de dimensión k − 1, entonces existe un subespacio vectorial óptimo de Rp de dimensión k que contiene a Ek−1. Demostración: Sea Fk un subespacio vectorial de Rp de dimensión k y se denota H = Fk + E⊥ k−1. Si Fk ∩ E⊥ k−1 = {0} entonces se tendrı́a H = Fk ⊕ E⊥ k−1 y dim(H) = k + (p − (k − 1)) = p + 1, lo cual es absurdo pues H ⊆ Rp. Por lo tanto existe un vector no nulo v ∈ Fk ∩ E⊥ k−1 y se denota ∆v el eje (espacio vectorial de dimensión uno) generado por v. (Sigue)
  • 16. Análisis en Componentes Principales Caso General Javier Trejos Introducción al ACP general Solución del ACP Inercia Proyectada Teorema de Inclusón Estrategia de Solución Primer Eje Segundo Eje Solución Final Propiedades Solución del ACP Teorema de Inclusión Sea G el espacio suplementario M-ortogonal a ∆v en Fk: es decir, tal que Fk = G ⊕ ∆v; y sea Ek la suma directa Ek = Ek−1 ⊕ ∆v.
  • 17. Análisis en Componentes Principales Caso General Javier Trejos Introducción al ACP general Solución del ACP Inercia Proyectada Teorema de Inclusón Estrategia de Solución Primer Eje Segundo Eje Solución Final Propiedades Solución del ACP Teorema de Inclusión Sea G el espacio suplementario M-ortogonal a ∆v en Fk: es decir, tal que Fk = G ⊕ ∆v; y sea Ek la suma directa Ek = Ek−1 ⊕ ∆v. Debido a la ortogonalidad entre G y ∆v se tiene IFk (N) = IG(N) + I∆v (N), y a la ortogonalidad entre Ek−1 y ∆v se tiene
  • 18. Análisis en Componentes Principales Caso General Javier Trejos Introducción al ACP general Solución del ACP Inercia Proyectada Teorema de Inclusón Estrategia de Solución Primer Eje Segundo Eje Solución Final Propiedades Solución del ACP Teorema de Inclusión Sea G el espacio suplementario M-ortogonal a ∆v en Fk: es decir, tal que Fk = G ⊕ ∆v; y sea Ek la suma directa Ek = Ek−1 ⊕ ∆v. Debido a la ortogonalidad entre G y ∆v se tiene IFk (N) = IG(N) + I∆v (N), y a la ortogonalidad entre Ek−1 y ∆v se tiene IEk (N) = IEk−1 (N) + I∆v (N).
  • 19. Análisis en Componentes Principales Caso General Javier Trejos Introducción al ACP general Solución del ACP Inercia Proyectada Teorema de Inclusón Estrategia de Solución Primer Eje Segundo Eje Solución Final Propiedades Solución del ACP Teorema de Inclusión Sea G el espacio suplementario M-ortogonal a ∆v en Fk: es decir, tal que Fk = G ⊕ ∆v; y sea Ek la suma directa Ek = Ek−1 ⊕ ∆v. Debido a la ortogonalidad entre G y ∆v se tiene IFk (N) = IG(N) + I∆v (N), y a la ortogonalidad entre Ek−1 y ∆v se tiene IEk (N) = IEk−1 (N) + I∆v (N). Sin embargo, por hipótesis Ek−1 es óptimo entre los subespacios vectoriales de dimensión k − 1, esto es IEk−1 (N) ≤ IG(N), por lo tanto
  • 20. Análisis en Componentes Principales Caso General Javier Trejos Introducción al ACP general Solución del ACP Inercia Proyectada Teorema de Inclusón Estrategia de Solución Primer Eje Segundo Eje Solución Final Propiedades Solución del ACP Teorema de Inclusión Sea G el espacio suplementario M-ortogonal a ∆v en Fk: es decir, tal que Fk = G ⊕ ∆v; y sea Ek la suma directa Ek = Ek−1 ⊕ ∆v. Debido a la ortogonalidad entre G y ∆v se tiene IFk (N) = IG(N) + I∆v (N), y a la ortogonalidad entre Ek−1 y ∆v se tiene IEk (N) = IEk−1 (N) + I∆v (N). Sin embargo, por hipótesis Ek−1 es óptimo entre los subespacios vectoriales de dimensión k − 1, esto es IEk−1 (N) ≤ IG(N), por lo tantoIEk (N) ≤ IFk (N) y entonces Ek es óptimo entre los subespacios vectoriales de Rp de dimensión k.
  • 21. Análisis en Componentes Principales Caso General Javier Trejos Introducción al ACP general Solución del ACP Inercia Proyectada Teorema de Inclusón Estrategia de Solución Primer Eje Segundo Eje Solución Final Propiedades Solución del ACP Teorema de Inclusión Sea G el espacio suplementario M-ortogonal a ∆v en Fk: es decir, tal que Fk = G ⊕ ∆v; y sea Ek la suma directa Ek = Ek−1 ⊕ ∆v. Debido a la ortogonalidad entre G y ∆v se tiene IFk (N) = IG(N) + I∆v (N), y a la ortogonalidad entre Ek−1 y ∆v se tiene IEk (N) = IEk−1 (N) + I∆v (N). Sin embargo, por hipótesis Ek−1 es óptimo entre los subespacios vectoriales de dimensión k − 1, esto es IEk−1 (N) ≤ IG(N), por lo tantoIEk (N) ≤ IFk (N) y entonces Ek es óptimo entre los subespacios vectoriales de Rp de dimensión k. Como Ek−1 es subespacio de Ek, por la forma de definir Ek, entonces se tiene el resultado.
  • 22. Análisis en Componentes Principales Caso General Javier Trejos Introducción al ACP general Solución del ACP Inercia Proyectada Teorema de Inclusón Estrategia de Solución Primer Eje Segundo Eje Solución Final Propiedades Solución del ACP Propiedad Importante Proposición Sea Ek−1 un subespacio vectorial de Rp óptimo de dimensión k − 1. Si el vector v genera un eje ∆v M–ortogonal a Ek−1 tal que I∆v (N) es mı́nima, entonces el espacio Ek = Ek−1 ⊕ ∆v minimiza la inercia proyectada de N sobre todos los subespacios de Rp de dimensión k.
  • 23. Análisis en Componentes Principales Caso General Javier Trejos Introducción al ACP general Solución del ACP Inercia Proyectada Teorema de Inclusón Estrategia de Solución Primer Eje Segundo Eje Solución Final Propiedades Solución del ACP Propiedad Importante Proposición Sea Ek−1 un subespacio vectorial de Rp óptimo de dimensión k − 1. Si el vector v genera un eje ∆v M–ortogonal a Ek−1 tal que I∆v (N) es mı́nima, entonces el espacio Ek = Ek−1 ⊕ ∆v minimiza la inercia proyectada de N sobre todos los subespacios de Rp de dimensión k. Demostración: Sea v ∈ Rp tal que ∆v ⊥ Ek−1, entonces sea Ek = Ek−1 ⊕ ∆v.
  • 24. Análisis en Componentes Principales Caso General Javier Trejos Introducción al ACP general Solución del ACP Inercia Proyectada Teorema de Inclusón Estrategia de Solución Primer Eje Segundo Eje Solución Final Propiedades Solución del ACP Propiedad Importante Proposición Sea Ek−1 un subespacio vectorial de Rp óptimo de dimensión k − 1. Si el vector v genera un eje ∆v M–ortogonal a Ek−1 tal que I∆v (N) es mı́nima, entonces el espacio Ek = Ek−1 ⊕ ∆v minimiza la inercia proyectada de N sobre todos los subespacios de Rp de dimensión k. Demostración: Sea v ∈ Rp tal que ∆v ⊥ Ek−1, entonces sea Ek = Ek−1 ⊕ ∆v. Luego, por el teorema de Pitágoras, IEk (N) = IEk−1 (N) + I∆v (N).
  • 25. Análisis en Componentes Principales Caso General Javier Trejos Introducción al ACP general Solución del ACP Inercia Proyectada Teorema de Inclusón Estrategia de Solución Primer Eje Segundo Eje Solución Final Propiedades Solución del ACP Propiedad Importante Proposición Sea Ek−1 un subespacio vectorial de Rp óptimo de dimensión k − 1. Si el vector v genera un eje ∆v M–ortogonal a Ek−1 tal que I∆v (N) es mı́nima, entonces el espacio Ek = Ek−1 ⊕ ∆v minimiza la inercia proyectada de N sobre todos los subespacios de Rp de dimensión k. Demostración: Sea v ∈ Rp tal que ∆v ⊥ Ek−1, entonces sea Ek = Ek−1 ⊕ ∆v. Luego, por el teorema de Pitágoras, IEk (N) = IEk−1 (N) + I∆v (N). Como IEk−1 (N) es constante, minimizar IEk (N) se reduce a minimizar I∆v (N).
  • 26. Análisis en Componentes Principales Caso General Javier Trejos Introducción al ACP general Solución del ACP Inercia Proyectada Teorema de Inclusón Estrategia de Solución Primer Eje Segundo Eje Solución Final Propiedades Solución del ACP Estrategia de Solución Los dos resultados anteriores permiten seguir la siguiente estrategia para obtener la solución del A.C.P.:
  • 27. Análisis en Componentes Principales Caso General Javier Trejos Introducción al ACP general Solución del ACP Inercia Proyectada Teorema de Inclusón Estrategia de Solución Primer Eje Segundo Eje Solución Final Propiedades Solución del ACP Estrategia de Solución Los dos resultados anteriores permiten seguir la siguiente estrategia para obtener la solución del A.C.P.: 1. Buscar el eje E1 = ∆v1 con inercia mı́nima, v1 es un vector unitario que genera a ∆v1 .
  • 28. Análisis en Componentes Principales Caso General Javier Trejos Introducción al ACP general Solución del ACP Inercia Proyectada Teorema de Inclusón Estrategia de Solución Primer Eje Segundo Eje Solución Final Propiedades Solución del ACP Estrategia de Solución Los dos resultados anteriores permiten seguir la siguiente estrategia para obtener la solución del A.C.P.: 1. Buscar el eje E1 = ∆v1 con inercia mı́nima, v1 es un vector unitario que genera a ∆v1 . 2. Buscar el eje ∆v2 , M–ortogonal a ∆v1 y con inercia mı́nima; sea E2 = ∆v1 ⊕ ∆v2 , E2 es un subespacio óptimo de dimensión 2.
  • 29. Análisis en Componentes Principales Caso General Javier Trejos Introducción al ACP general Solución del ACP Inercia Proyectada Teorema de Inclusón Estrategia de Solución Primer Eje Segundo Eje Solución Final Propiedades Solución del ACP Estrategia de Solución Los dos resultados anteriores permiten seguir la siguiente estrategia para obtener la solución del A.C.P.: 1. Buscar el eje E1 = ∆v1 con inercia mı́nima, v1 es un vector unitario que genera a ∆v1 . 2. Buscar el eje ∆v2 , M–ortogonal a ∆v1 y con inercia mı́nima; sea E2 = ∆v1 ⊕ ∆v2 , E2 es un subespacio óptimo de dimensión 2. k. Buscar un eje ∆vk , M–ortogonal a Ek−1 y con inercia mı́nima; sea Ek = Ek−1 ⊕ ∆vk , Ek es un subespacio óptimo de dimensión k.
  • 30. Análisis en Componentes Principales Caso General Javier Trejos Introducción al ACP general Solución del ACP Inercia Proyectada Teorema de Inclusón Estrategia de Solución Primer Eje Segundo Eje Solución Final Propiedades Solución del ACP Estrategia de Solución Los dos resultados anteriores permiten seguir la siguiente estrategia para obtener la solución del A.C.P.: 1. Buscar el eje E1 = ∆v1 con inercia mı́nima, v1 es un vector unitario que genera a ∆v1 . 2. Buscar el eje ∆v2 , M–ortogonal a ∆v1 y con inercia mı́nima; sea E2 = ∆v1 ⊕ ∆v2 , E2 es un subespacio óptimo de dimensión 2. k. Buscar un eje ∆vk , M–ortogonal a Ek−1 y con inercia mı́nima; sea Ek = Ek−1 ⊕ ∆vk , Ek es un subespacio óptimo de dimensión k. Se tiene entonces Ek = ∆v1 ⊕ ∆v2 ⊕ . . . ⊕ ∆vk . Los ejes ∆v1 , ∆v2 , . . . son llamados los ejes factoriales.
  • 31. Análisis en Componentes Principales Caso General Javier Trejos Introducción al ACP general Solución del ACP Inercia Proyectada Teorema de Inclusón Estrategia de Solución Primer Eje Segundo Eje Solución Final Propiedades Solución del ACP Estrategia de Solución ◮ Recuérdese que M es una matriz simétrica definida positiva y que V es una matriz simétrica positiva. ◮ Además, VM es M–simétrica, esto es1, (VM)tM = M(VM). ◮ Por lo tanto se deduce que los valores propios de VM son reales, positivos o nulos, y que existe una base M–ortonormada de Rp formada por vectores propios de VM. ◮ Denótense λ1, λ2, . . . , λp los valores propios de VM ordenados de mayor a menor, y denótense {u1, u2, . . . , up} una base de vectores propios asociados respectivamente a los λj. 1 Una matriz A es M–simétrica si At M = MA.
  • 32. Análisis en Componentes Principales Caso General Javier Trejos Introducción al ACP general Solución del ACP Inercia Proyectada Teorema de Inclusón Estrategia de Solución Primer Eje Segundo Eje Solución Final Propiedades Solución del ACP Estrategia de Solución ◮ Para obtener la solución del A.C.P. 1. se comienza por buscar el eje ∆v1 que minimice la inercia I∆v1 (N) con kv1kM = 1, 2. luego el eje ∆v2 que minimice la inercia I∆v2 (N) con kv2kM = 1 y M–ortogonal a v1, 3. y ası́ sucesivamente:
  • 33. Análisis en Componentes Principales Caso General Javier Trejos Introducción al ACP general Solución del ACP Inercia Proyectada Teorema de Inclusón Estrategia de Solución Primer Eje Segundo Eje Solución Final Propiedades Solución del ACP Primer Eje ◮ Se quiere encontrar v1 tal que maximice I∆⊥ v1 (N) = vt 1MVMv1 con la restricción kv1k2 M = vt 1Mv1 = 1.
  • 34. Análisis en Componentes Principales Caso General Javier Trejos Introducción al ACP general Solución del ACP Inercia Proyectada Teorema de Inclusón Estrategia de Solución Primer Eje Segundo Eje Solución Final Propiedades Solución del ACP Primer Eje ◮ Se quiere encontrar v1 tal que maximice I∆⊥ v1 (N) = vt 1MVMv1 con la restricción kv1k2 M = vt 1Mv1 = 1. ◮ Sea {u1, . . . , up} una base de vectores propios M–ortonormados de VM, el vector v1 tiene una expresión en esta base de la forma: v1 = Pp j=1 αjuj.
  • 35. Análisis en Componentes Principales Caso General Javier Trejos Introducción al ACP general Solución del ACP Inercia Proyectada Teorema de Inclusón Estrategia de Solución Primer Eje Segundo Eje Solución Final Propiedades Solución del ACP Primer Eje ◮ Se quiere encontrar v1 tal que maximice I∆⊥ v1 (N) = vt 1MVMv1 con la restricción kv1k2 M = vt 1Mv1 = 1. ◮ Sea {u1, . . . , up} una base de vectores propios M–ortonormados de VM, el vector v1 tiene una expresión en esta base de la forma: v1 = Pp j=1 αjuj. ◮ Luego, la restricción kv1k2 M = 1 se escribe: 1 = vt 1Mv1 = p X j=1 αjuj t M p X k=1 αkuk = p X j=1 p X k=1 αjαkut jMuk = p X j=1 p X k=1 αjαkδjk, donde δjk = 1 si j = k y es cero si no, pues la base es ortonormada.
  • 36. Análisis en Componentes Principales Caso General Javier Trejos Introducción al ACP general Solución del ACP Inercia Proyectada Teorema de Inclusón Estrategia de Solución Primer Eje Segundo Eje Solución Final Propiedades Solución del ACP Primer Eje ◮ Luego, la restricción se traduce en: kv1k2 = p X j=1 α2 j = 1, por lo tanto se tiene:
  • 37. Análisis en Componentes Principales Caso General Javier Trejos Introducción al ACP general Solución del ACP Inercia Proyectada Teorema de Inclusón Estrategia de Solución Primer Eje Segundo Eje Solución Final Propiedades Solución del ACP Primer Eje ◮ Luego, la restricción se traduce en: kv1k2 = p X j=1 α2 j = 1, por lo tanto se tiene: vt 1MVMv1 = h p X j=1 αjuj, VM p X k=1 αkuk iM = h p X j=1 αjuj, p X k=1 λkαkukiM, de donde vt 1MVMv1 = Pp j=1 λjα2 j .
  • 38. Análisis en Componentes Principales Caso General Javier Trejos Introducción al ACP general Solución del ACP Inercia Proyectada Teorema de Inclusón Estrategia de Solución Primer Eje Segundo Eje Solución Final Propiedades Solución del ACP Primer Eje ◮ Luego, la restricción se traduce en: kv1k2 = p X j=1 α2 j = 1, por lo tanto se tiene: vt 1MVMv1 = h p X j=1 αjuj, VM p X k=1 αkuk iM = h p X j=1 αjuj, p X k=1 λkαkukiM, de donde vt 1MVMv1 = Pp j=1 λjα2 j . ◮ Se debe por lo tanto maximizar Pp j=1 λjα2 j bajo la restricción Pp j=1 α2 j = 1.
  • 39. Análisis en Componentes Principales Caso General Javier Trejos Introducción al ACP general Solución del ACP Inercia Proyectada Teorema de Inclusón Estrategia de Solución Primer Eje Segundo Eje Solución Final Propiedades Solución del ACP Primer Eje ◮ Debido a que los λj están ordenados de manera decreciente, se tiene p X j=1 λjα2 j ≤ λ1 p X j=1 α2 j = λ1.
  • 40. Análisis en Componentes Principales Caso General Javier Trejos Introducción al ACP general Solución del ACP Inercia Proyectada Teorema de Inclusón Estrategia de Solución Primer Eje Segundo Eje Solución Final Propiedades Solución del ACP Primer Eje ◮ Debido a que los λj están ordenados de manera decreciente, se tiene p X j=1 λjα2 j ≤ λ1 p X j=1 α2 j = λ1. ◮ Basta por lo tanto tomar α1 = 1 y αj = 0 para todo j ≥ 2.
  • 41. Análisis en Componentes Principales Caso General Javier Trejos Introducción al ACP general Solución del ACP Inercia Proyectada Teorema de Inclusón Estrategia de Solución Primer Eje Segundo Eje Solución Final Propiedades Solución del ACP Primer Eje ◮ Debido a que los λj están ordenados de manera decreciente, se tiene p X j=1 λjα2 j ≤ λ1 p X j=1 α2 j = λ1. ◮ Basta por lo tanto tomar α1 = 1 y αj = 0 para todo j ≥ 2. ◮ Ası́, si v1 = u1, entonces se alcanza el valor λ1 que mayoriza el criterio a maximizar, por lo que se toma el vector propio unitario u1 de VM asociado al mayor valor propio λ1.
  • 42. Análisis en Componentes Principales Caso General Javier Trejos Introducción al ACP general Solución del ACP Inercia Proyectada Teorema de Inclusón Estrategia de Solución Primer Eje Segundo Eje Solución Final Propiedades Solución del ACP Segundo Eje ◮ Se quiere encontrar v2 tal que maximice I∆⊥ v2 (N) = vt 2MVMv2 con las restricciones kv2k2 = vt 2Mv2 = 1 y vt 2Mu1 = 0.
  • 43. Análisis en Componentes Principales Caso General Javier Trejos Introducción al ACP general Solución del ACP Inercia Proyectada Teorema de Inclusón Estrategia de Solución Primer Eje Segundo Eje Solución Final Propiedades Solución del ACP Segundo Eje ◮ Se quiere encontrar v2 tal que maximice I∆⊥ v2 (N) = vt 2MVMv2 con las restricciones kv2k2 = vt 2Mv2 = 1 y vt 2Mu1 = 0. ◮ A partir de la escritura v2 = Pp j=1 αjuj de v2 en la base de vectores propios de VM, con la restricción Pp j=1 α2 j = 1, se muestra que la primera restricción es Pp j=1 α2 j = 1, mientras que la segunda restricción lleva a: 0 = vt 2Mv1 =   p X j=1 αjuj   t Mu1 = p X j=1 αjut jMu1 = α1ut 1Mu1 = α1.
  • 44. Análisis en Componentes Principales Caso General Javier Trejos Introducción al ACP general Solución del ACP Inercia Proyectada Teorema de Inclusón Estrategia de Solución Primer Eje Segundo Eje Solución Final Propiedades Solución del ACP Segundo Eje ◮ Es decir, v2 = Pp j=2 αjuj pues α1 = 0. La restricción kv2k2 = 1 se traduce en Pp j=2 α2 j = 1.
  • 45. Análisis en Componentes Principales Caso General Javier Trejos Introducción al ACP general Solución del ACP Inercia Proyectada Teorema de Inclusón Estrategia de Solución Primer Eje Segundo Eje Solución Final Propiedades Solución del ACP Segundo Eje ◮ Es decir, v2 = Pp j=2 αjuj pues α1 = 0. La restricción kv2k2 = 1 se traduce en Pp j=2 α2 j = 1. ◮ Luego, I∆⊥ v2 (N) = vt 2MVMv2 = X j=2 λjα2 j ≤ λ2 p X j=2 α2 j = λ2.
  • 46. Análisis en Componentes Principales Caso General Javier Trejos Introducción al ACP general Solución del ACP Inercia Proyectada Teorema de Inclusón Estrategia de Solución Primer Eje Segundo Eje Solución Final Propiedades Solución del ACP Segundo Eje ◮ Es decir, v2 = Pp j=2 αjuj pues α1 = 0. La restricción kv2k2 = 1 se traduce en Pp j=2 α2 j = 1. ◮ Luego, I∆⊥ v2 (N) = vt 2MVMv2 = X j=2 λjα2 j ≤ λ2 p X j=2 α2 j = λ2. ◮ Ası́, el valor a maximizar se encuentra mayorado por λ2, y este valor se alcanza cuando α2 = 1 y αj = 0 para todo j ≥ 3; esto es, cuando v2 = u2, por lo que una solución es tomar el vector propio unitario u2 de VM asociado al segundo valor propio más grande de VM.
  • 47. Análisis en Componentes Principales Caso General Javier Trejos Introducción al ACP general Solución del ACP Inercia Proyectada Teorema de Inclusón Estrategia de Solución Primer Eje Segundo Eje Solución Final Propiedades Solución del ACP Solución Final ◮ La búsqueda del k-ésimo eje factorial ∆vk se hace análogamente y se encuentra que vk = uk.
  • 48. Análisis en Componentes Principales Caso General Javier Trejos Introducción al ACP general Solución del ACP Inercia Proyectada Teorema de Inclusón Estrategia de Solución Primer Eje Segundo Eje Solución Final Propiedades Solución del ACP Solución Final ◮ La búsqueda del k-ésimo eje factorial ∆vk se hace análogamente y se encuentra que vk = uk. ◮ Obsérvese que los vectores uk que definen los ejes principales ∆uk pertenecen al espacio de individuos Rp, mientras que las componentes principales ck = XMuk pertenecen al espacio de variables Rn, y que son las proyecciones por dualidad de los primeros, esto es, la transformación mediante XM de Rp en Rn. ✲ ✛ ❄ ✻ ❄ ✻ X Xt W D M V Rp (Rp)∗ Rn (Rn)∗ Xn×p : tabla de datos centrados uk ∈ Rp ck = XMuk ∈ Rn VMuk = λkuk WDck = λkck
  • 49. Análisis en Componentes Principales Caso General Javier Trejos Introducción al ACP general Solución del ACP Inercia Proyectada Teorema de Inclusón Estrategia de Solución Primer Eje Segundo Eje Solución Final Propiedades Solución del ACP Propiedades ◮ La inercia de la nube proyectada sobre el primer eje principal: λ1 = I∆⊥ u1 (N)
  • 50. Análisis en Componentes Principales Caso General Javier Trejos Introducción al ACP general Solución del ACP Inercia Proyectada Teorema de Inclusón Estrategia de Solución Primer Eje Segundo Eje Solución Final Propiedades Solución del ACP Propiedades ◮ La inercia de la nube proyectada sobre el primer eje principal: λ1 = I∆⊥ u1 (N) ◮ Parte de inercia explicada por el primer eje principal: λ1+λ2 tr(VM)
  • 51. Análisis en Componentes Principales Caso General Javier Trejos Introducción al ACP general Solución del ACP Inercia Proyectada Teorema de Inclusón Estrategia de Solución Primer Eje Segundo Eje Solución Final Propiedades Solución del ACP Propiedades ◮ La inercia de la nube proyectada sobre el primer eje principal: λ1 = I∆⊥ u1 (N) ◮ Parte de inercia explicada por el primer eje principal: λ1+λ2 tr(VM) ◮ λ1+λ2+...+λk tr(VM) es la parte de inercia explicada por el subespacio principal Ek de dimensión k generado por u1, u2, . . . , uk, es decir Ek = ∆u1 ⊕ ∆u2 ⊕ . . . ⊕ ∆uk .
  • 52. Análisis en Componentes Principales Caso General Javier Trejos Introducción al ACP general Solución del ACP Inercia Proyectada Teorema de Inclusón Estrategia de Solución Primer Eje Segundo Eje Solución Final Propiedades Solución del ACP Propiedades Las componentes principales del A.C.P. general de la nube N = (X, M, D) tiene las siguientes propiedades:
  • 53. Análisis en Componentes Principales Caso General Javier Trejos Introducción al ACP general Solución del ACP Inercia Proyectada Teorema de Inclusón Estrategia de Solución Primer Eje Segundo Eje Solución Final Propiedades Solución del ACP Propiedades Las componentes principales del A.C.P. general de la nube N = (X, M, D) tiene las siguientes propiedades: 1. Son centradas: ck = 0.
  • 54. Análisis en Componentes Principales Caso General Javier Trejos Introducción al ACP general Solución del ACP Inercia Proyectada Teorema de Inclusón Estrategia de Solución Primer Eje Segundo Eje Solución Final Propiedades Solución del ACP Propiedades Las componentes principales del A.C.P. general de la nube N = (X, M, D) tiene las siguientes propiedades: 1. Son centradas: ck = 0. 2. ck tiene varianza λk: var (ck ) = λk.
  • 55. Análisis en Componentes Principales Caso General Javier Trejos Introducción al ACP general Solución del ACP Inercia Proyectada Teorema de Inclusón Estrategia de Solución Primer Eje Segundo Eje Solución Final Propiedades Solución del ACP Propiedades Las componentes principales del A.C.P. general de la nube N = (X, M, D) tiene las siguientes propiedades: 1. Son centradas: ck = 0. 2. ck tiene varianza λk: var (ck ) = λk. 3. Cada par de ellas tiene correlación cero: ∀k, l : r(ck , cl ) = 0.