Problema XOR con 3 neuronas
Nuestra primera red neuronal: Un perceptrón multicapa con 3 neuronas
Perceptrón multicapa: regiones de decisión y arquitectura
Propagación hacia atrás: caso general y capa de salida
Propagación hacia atrás: capas ocultas
32. Inteligencia Computacional - FICH - UNL
Arquitectura del perceptrón multicapa
x1
x2
x3
x4
y1
y2
Capa
oculta
Capa de
entrada
Capa de
salida
33. Inteligencia Computacional - FICH - UNL
Arquitectura del perceptrón multicapa
x1
x2
x3
x4
y1
y2
WII
yII
WI
yI
WIII
yIII
34. Inteligencia Computacional - FICH - UNL
Cálculo de las salidas en cada capa
• Capa I:
vI
j =
D
wI
j , x
E
=
N
P
i=0
wI
jixi (completo vI = WIx)
35. Inteligencia Computacional - FICH - UNL
Cálculo de las salidas en cada capa
• Capa I:
vI
j =
D
wI
j , x
E
=
N
P
i=0
wI
jixi (completo vI = WIx)
yI
j = φ(vI
j ) =
2
1 + e−bvI
j
− 1 (simétrica ± 1)
36. Inteligencia Computacional - FICH - UNL
Cálculo de las salidas en cada capa
• Capa I:
vI
j =
D
wI
j , x
E
=
N
P
i=0
wI
jixi (completo vI = WIx)
yI
j = φ(vI
j ) =
2
1 + e−bvI
j
− 1 (simétrica ± 1)
• Capa II:
vII
j =
D
wII
j , yI
E
→ yII
j = φ(vII
j )
• Capa III:
vIII
j =
D
wIII
j , yII
E
→ yIII
j = φ(vIII
j ) = yj
37. Propagación hacia atrás:
caso general y capa de salida
Diego Milone
Inteligencia Computacional
Departamento de Informática
FICH-UNL
38. Inteligencia Computacional - FICH - UNL
Criterio de error
Suma del error cuadrático instantáneo
ξ(n) =
1
2
M
X
j=1
e2
j (n)
59. Inteligencia Computacional - FICH - UNL
Retropropagación en la capa II (oculta)
δII
j (n) = −
X
k
ek(n)
∂ek(n)
∂yIII
k (n)
∂yIII
k (n)
∂vIII
k (n)
∂vIII
k (n)
∂yII
j (n)
1
2
(1+yII
j (n))(1−yII
j (n))
60. Inteligencia Computacional - FICH - UNL
Retropropagación en la capa II (oculta)
δII
j (n) = −
X
k
ek(n)
∂ek(n)
∂yIII
k (n)
∂yIII
k (n)
∂vIII
k (n)
∂vIII
k (n)
∂yII
j (n)
1
2
(1+yII
j (n))(1−yII
j (n))
δII
j (n) = −
X
k
ek(n)·
∂
dIII
k (n) − yIII
k (n)
∂yIII
k (n)
·
1
2
(1 + yIII
k (n))(1 − yIII
k (n)) ·
·
∂
nP
j wIII
kj yII
j (n)
o
∂yII
j (n)
·
1
2
(1 + yII
j (n))(1 − yII
j (n))
61. Inteligencia Computacional - FICH - UNL
Retropropagación en la capa II (oculta)
δII
j (n) = −
X
k
ek(n)
∂ek(n)
∂yIII
k (n)
∂yIII
k (n)
∂vIII
k (n)
∂vIII
k (n)
∂yII
j (n)
1
2
(1+yII
j (n))(1−yII
j (n))
δII
j (n) = −
X
k
ek(n)·
∂
dIII
k (n) − yIII
k (n)
∂yIII
k (n)
·
1
2
(1 + yIII
k (n))(1 − yIII
k (n)) ·
·
∂
nP
j wIII
kj yII
j (n)
o
∂yII
j (n)
·
1
2
(1 + yII
j (n))(1 − yII
j (n))
δII
j (n) = −
X
k
ek(n)·(−1) ·
1
2
(1 + yIII
k (n))(1 − yIII
k (n)) ·
·wIII
kj ·
1
2
(1 + yII
j (n))(1 − yII
j (n))
62. Inteligencia Computacional - FICH - UNL
Retropropagación en la capa II (oculta)
δII
j (n) =
X
k
ek(n) ·
1
2
(1 + yIII
k (n))(1 − yIII
k (n)) · wIII
kj ·
·
1
2
(1 + yII
j (n))(1 − yII
j (n))
63. Inteligencia Computacional - FICH - UNL
Retropropagación en la capa II (oculta)
δII
j (n) =
X
k
ek(n) ·
1
2
(1 + yIII
k (n))(1 − yIII
k (n)) · wIII
kj ·
·
1
2
(1 + yII
j (n))(1 − yII
j (n))
Pero de la capa IIIF sabemos que:
δIII
k (n) = 1
2ek(n)(1 + yIII
k (n))(1 − yIII
k (n))
64. Inteligencia Computacional - FICH - UNL
Retropropagación en la capa II (oculta)
δII
j (n) =
X
k
ek(n) ·
1
2
(1 + yIII
k (n))(1 − yIII
k (n)) · wIII
kj ·
·
1
2
(1 + yII
j (n))(1 − yII
j (n))
Pero de la capa IIIF sabemos que:
δIII
k (n) = 1
2ek(n)(1 + yIII
k (n))(1 − yIII
k (n))
Reemplzando:
δII
j (n) =
X
k
δIII
k (n)wIII
kj ·
1
2
(1 + yII
j (n))(1 − yII
j (n))
65. Inteligencia Computacional - FICH - UNL
Retropropagación en la capa II (oculta)
Volviendo a:
∆wII
ji (n) = µδII
j (n)yI
i (n)
66. Inteligencia Computacional - FICH - UNL
Retropropagación en la capa II (oculta)
Volviendo a:
∆wII
ji (n) = µδII
j (n)yI
i (n)
Por lo tanto:
∆wII
ji (n) = η
P
k
δIII
k wIII
kj (n)
(1 + yII
j (n))(1 − yII
j (n))yI
i (n)
67. Inteligencia Computacional - FICH - UNL
Generalizando para la capa “p”
∆wII
ji (n) = η
X
k
δIII
k wIII
kj (n)
#
(1 + yII
j (n))(1 − yII
j (n))yI
i (n)
⇓
∆w
(p)
ji (n) = η
D
δ(p+1), w
(p+1)
j
E
(1 + y
(p)
j (n))(1 − y
(p)
j (n))y
(p−1)
i (n)
68. Inteligencia Computacional - FICH - UNL
Resumen del algoritmo de retropropagación (BP)
1. Inicialización aleatoria
2. Propagación hacia adelante
3. Propagación hacia atras
4. Adaptación de los pesos
5. Iteración: vuelve a 2 hasta convergencia o finalización