SlideShare una empresa de Scribd logo
1 de 90
Descargar para leer sin conexión
Problema XOR con 3 neuronas
Diego Milone
Inteligencia Computacional
Departamento de Informática
FICH-UNL
Inteligencia Computacional - FICH - UNL
¿Cómo podríamos resolver el problema XOR?
x1
x2
−1
+1
+1
−1
Inteligencia Computacional - FICH - UNL
Primera capa: perceptrones A y B
x1
x2
−1
+1
+1
−1
x1
x2
−1
+1
+1
−1
Inteligencia Computacional - FICH - UNL
Primera capa: perceptrones A y B
x1
x2
−1
+1
+1
−1
A
x1
x2
−1
+1
+1
−1
A
Inteligencia Computacional - FICH - UNL
Primera capa: perceptrones A y B
x1
x2
−1
+1
+1
−1
A
x1
x2
−1
+1
+1
−1
A
B
Inteligencia Computacional - FICH - UNL
Segunda capa: perceptron C
x1
x2
−1
+1
+1
−1
A
x1
x2
−1
+1
+1
−1
A
B
x1
x2
−1
+1
+1
−1
Inteligencia Computacional - FICH - UNL
Tabla de verdad para el perceptron C
x1
x2
−1
+1
+1
−1
A
B
Inteligencia Computacional - FICH - UNL
Tabla de verdad para el perceptron C
yB
yA
−1
+1
−1
Inteligencia Computacional - FICH - UNL
Tabla de verdad para el perceptron C
yB
yA
−1
+1
−1 X
Inteligencia Computacional - FICH - UNL
Tabla de verdad para el perceptron C
yB
yA
−1
+1
−1 X
C
Nuestra primera red neuronal
Un perceptrón multicapa con 3 neuronas
Diego Milone
Inteligencia Computacional
Departamento de Informática
FICH-UNL
Inteligencia Computacional - FICH - UNL
Combinación de perceptrones simples: A
x1
x2
−1
+1
+1
−1
A
Inteligencia Computacional - FICH - UNL
Combinación de perceptrones simples: A
x1
x2
−1
+1
+1
−1
A
Perceptrón A: x2 = −1 − x1
Inteligencia Computacional - FICH - UNL
Combinación de perceptrones simples: A
x1
x2
−1
+1
+1
−1
A
Perceptrón A: x2 = −1 − x1 = wA0
wA2
− wA1
wA2
x1
Inteligencia Computacional - FICH - UNL
Combinación de perceptrones simples: A
x1
x2
−1
+1
+1
−1
A
Perceptrón A: x2 = −1 − x1 = wA0
wA2
− wA1
wA2
x1
→



wA0 = −1
wA1 = +1
wA2 = +1



→ yA = sgn(x2 + x1 + 1)
Inteligencia Computacional - FICH - UNL
Combinación de perceptrones simples: B
x1
x2
−1
+1
+1
−1
A
B
Inteligencia Computacional - FICH - UNL
Combinación de perceptrones simples: B
x1
x2
−1
+1
+1
−1
A
B
Perceptrón B: x2 = +1 − x1
Inteligencia Computacional - FICH - UNL
Combinación de perceptrones simples: B
x1
x2
−1
+1
+1
−1
A
B
Perceptrón B: x2 = +1 − x1
→



wB0 = +1
wB1 = +1
wB2 = +1



→ yB = sgn(x2 + x1 − 1)
Inteligencia Computacional - FICH - UNL
Combinación de perceptrones simples: C
yB
yA
−1
+1
−1 X
A
C
Inteligencia Computacional - FICH - UNL
Combinación de perceptrones simples: C
yB
yA
−1
+1
−1 X
A
C
Perceptrón C: yA = +1 + yB
Inteligencia Computacional - FICH - UNL
Combinación de perceptrones simples: C
yB
yA
−1
+1
−1 X
A
C
Perceptrón C: yA = +1 + yB
→



wC0 = +1
wC1 = −1
wC2 = +1



→ yC = sgn(yA − yB − 1)
Inteligencia Computacional - FICH - UNL
¿Cómo es la arquitectura de esta red neuronal?



wC0 = +1
wC1 = −1
wC2 = +1






wA0 = −1
wA1 = +1
wA2 = +1






wB0 = +1
wB1 = +1
wB2 = +1



yA = sgn(x2 + x1 + 1)
yB = sgn(x2 + x1 − 1)

→ yC = sgn(yA − yB − 1)
Inteligencia Computacional - FICH - UNL
Y... ¿resolverá el XOR?
Inteligencia Computacional - FICH - UNL
Y... ¿resolverá el XOR?
x1
x2
A
B
C y
Inteligencia Computacional - FICH - UNL
Y... ¿resolverá el XOR?
x1
x2
A
B
C y
1
1
1
1
1
−1
Inteligencia Computacional - FICH - UNL
Y... ¿resolverá el XOR?
x1
x2
A
B
C y
1
1
1
1
1
−1
x0 = −1
Inteligencia Computacional - FICH - UNL
Y... ¿resolverá el XOR?
x1
x2
A
B
C y
1
1
1
1
1
−1
x0 = −1
−1
1
1
Inteligencia Computacional - FICH - UNL
Y... ¿resolverá el XOR?
x1
x2
A
B
C y
1
1
1
1
1
−1
x0 = −1 −1
1
1
Inteligencia Computacional - FICH - UNL
Y... ¿resolverá el XOR?
x1
x2
A
B
C y
1
1
1
1
1
−1
x0 = −1 −1
1
1
yA = sgn(x2 + x1 + 1)
yB = sgn(x2 + x1 − 1)

→ yC = sgn(yA−yB−1)
Perceptrón multicapa:
regiones de decisión y arquitectura
Diego Milone
Inteligencia Computacional
Departamento de Informática
FICH-UNL
Inteligencia Computacional - FICH - UNL
Regiones de decisión
Inteligencia Computacional - FICH - UNL
Arquitectura del perceptrón multicapa
x1
x2
x3
x4
y1
y2
Capa
oculta
Capa de
entrada
Capa de
salida
Inteligencia Computacional - FICH - UNL
Arquitectura del perceptrón multicapa
x1
x2
x3
x4
y1
y2
WII
yII
WI
yI
WIII
yIII
Inteligencia Computacional - FICH - UNL
Cálculo de las salidas en cada capa
• Capa I:
vI
j =
D
wI
j , x
E
=
N
P
i=0
wI
jixi (completo vI = WIx)
Inteligencia Computacional - FICH - UNL
Cálculo de las salidas en cada capa
• Capa I:
vI
j =
D
wI
j , x
E
=
N
P
i=0
wI
jixi (completo vI = WIx)
yI
j = φ(vI
j ) =
2
1 + e−bvI
j
− 1 (simétrica ± 1)
Inteligencia Computacional - FICH - UNL
Cálculo de las salidas en cada capa
• Capa I:
vI
j =
D
wI
j , x
E
=
N
P
i=0
wI
jixi (completo vI = WIx)
yI
j = φ(vI
j ) =
2
1 + e−bvI
j
− 1 (simétrica ± 1)
• Capa II:
vII
j =
D
wII
j , yI
E
→ yII
j = φ(vII
j )
• Capa III:
vIII
j =
D
wIII
j , yII
E
→ yIII
j = φ(vIII
j ) = yj
Propagación hacia atrás:
caso general y capa de salida
Diego Milone
Inteligencia Computacional
Departamento de Informática
FICH-UNL
Inteligencia Computacional - FICH - UNL
Criterio de error
Suma del error cuadrático instantáneo
ξ(n) =
1
2
M
X
j=1
e2
j (n)
Inteligencia Computacional - FICH - UNL
Aplicación del gradiente (caso general)
∆wji(n) = −µ ∂ξ(n)
∂wji(n)
Inteligencia Computacional - FICH - UNL
Aplicación del gradiente (caso general)
∆wji(n) = −µ ∂ξ(n)
∂wji(n)
∂ξ(n)
∂wji(n)
=
∂ξ(n)
∂ej(n)
∂ej(n)
∂yj(n)
∂yj(n)
∂vj(n)
∂vj(n)
∂wji(n)
Inteligencia Computacional - FICH - UNL
Aplicación del gradiente (caso general)
∆wji(n) = −µ ∂ξ(n)
∂wji(n)
∂ξ(n)
∂wji(n)
=
∂ξ(n)
∂ej(n)
∂ej(n)
∂yj(n)
∂yj(n)
∂vj(n)
∂vj(n)
∂wji(n)
∂vj(n)
∂wji(n)
=
∂
N
P
i=0
wji(n)yi(n)
∂wji(n)
= yi(n)
Inteligencia Computacional - FICH - UNL
Aplicación del gradiente (caso general)
∆wji(n) = −µ ∂ξ(n)
∂wji(n)
∂ξ(n)
∂wji(n)
=
∂ξ(n)
∂ej(n)
∂ej(n)
∂yj(n)
∂yj(n)
∂vj(n)
yi(n)
Gradiente de error local instantáneo: δj =
∂ξ(n)
∂yj(n)
∂yj(n)
∂vj(n)
Inteligencia Computacional - FICH - UNL
Aplicación del gradiente (caso general)
∆wji(n) = µδj(n)yi(n)
∂ξ(n)
∂wji(n)
=
∂ξ(n)
∂ej(n)
∂ej(n)
∂yj(n)
∂yj(n)
∂vj(n)
yi(n)
Gradiente de error local instantáneo: δj =
∂ξ(n)
∂yj(n)
∂yj(n)
∂vj(n)
Inteligencia Computacional - FICH - UNL
Derivada de la función de activación simétrica (1/2)
∂yj(n)
∂vj(n)
=
∂
n
2
1+e−vj(n) − 1
o
∂vj(n)
= 2
e−vj(n)
1 + e−vj(n)
2
= 2
1
1 + e−vj(n)
e−vj(n)
1 + e−vj(n)
= 2
1
1 + e−vj(n)
0
z }| {
−1 + 1 +e−vj(n)
1 + e−vj(n)
= 2
1
1 + e−vj(n)
−1
1 + e−vj(n)
+
1 + e−vj(n)
1 + e−vj(n)
!
Inteligencia Computacional - FICH - UNL
Derivada de la función de activación simétrica (2/2)
∂yj(n)
∂vj(n)
= 2
1
1 + e−vj(n)

1 −
1
1 + e−vj(n)

= 2
yj(n) + 1
2

1 −
yj(n) + 1
2

= (yj(n) + 1)

1 −
yj(n) + 1
2

= (yj(n) + 1)

2 − yj(n) − 1
2

=
1
2
(yj(n) + 1)(yj(n) − 1)
Inteligencia Computacional - FICH - UNL
Aplicación del gradiente (caso general)
∆wji(n) = µδj(n)yi(n)
∂ξ(n)
∂wji(n)
=
∂ξ(n)
∂ej(n)
∂ej(n)
∂yj(n)
∂yj(n)
∂vj(n)
yi(n)
Gradiente de error local instantáneo: δj = −
∂ξ(n)
∂yj(n)
∂yj(n)
∂vj(n)
δj =
∂ξ(n)
∂yj(n)
1
2
(1 + yj(n))(1 − yj(n))
Inteligencia Computacional - FICH - UNL
Retropropagación en la capa III (salida)
∆wIII
ji (n) = µδIII
j (n)yII
i (n)
Inteligencia Computacional - FICH - UNL
Retropropagación en la capa III (salida)
∆wIII
ji (n) = µδIII
j (n)yII
i (n)
δIII
j (n) = −
∂ξ(n)
∂yIII
j (n)
1
2
(1 + yIII
j (n))(1 − yIII
j (n))
Inteligencia Computacional - FICH - UNL
Retropropagación en la capa III (salida)
∆wIII
ji (n) = µδIII
j (n)yII
i (n)
δIII
j (n) = −
∂ξ(n)
∂yIII
j (n)
1
2
(1 + yIII
j (n))(1 − yIII
j (n))
δIII
j (n) = −
∂ξ(n)
∂ej(n)
∂ej(n)
∂yIII
j (n)
1
2
(1 + yIII
j (n))(1 − yIII
j (n))
Inteligencia Computacional - FICH - UNL
Retropropagación en la capa III (salida)
δIII
j (n) = −
∂
n
1
2
P
j e2
j (n)
o
∂ej(n)
·
∂
n
dIII
j (n) − yIII
j (n)
o
∂yIII
j (n)
·
·
1
2
(1 + yIII
j (n))(1 − yIII
j (n))
Inteligencia Computacional - FICH - UNL
Retropropagación en la capa III (salida)
δIII
j (n) = −
∂
n
1
2
P
j e2
j (n)
o
∂ej(n)
·
∂
n
dIII
j (n) − yIII
j (n)
o
∂yIII
j (n)
·
·
1
2
(1 + yIII
j (n))(1 − yIII
j (n))
δIII
j (n) = 1
2ej(n)(1 + yIII
j (n))(1 − yIII
j (n))F
Inteligencia Computacional - FICH - UNL
Retropropagación en la capa III (salida)
δIII
j (n) = −
∂
n
1
2
P
j e2
j (n)
o
∂ej(n)
·
∂
n
dIII
j (n) − yIII
j (n)
o
∂yIII
j (n)
·
·
1
2
(1 + yIII
j (n))(1 − yIII
j (n))
δIII
j (n) = 1
2ej(n)(1 + yIII
j (n))(1 − yIII
j (n))F
∆wIII
ji (n) = ηej(n)(1 + yIII
j (n))(1 − yIII
j (n))yII
i (n)
Propagación hacia atrás:
capas ocultas
Diego Milone
Inteligencia Computacional
Departamento de Informática
FICH-UNL
Inteligencia Computacional - FICH - UNL
Retropropagación en la capa II (oculta)
∆wII
ji (n) = µδII
j (n)yI
i (n)
Inteligencia Computacional - FICH - UNL
Retropropagación en la capa II (oculta)
∆wII
ji (n) = µδII
j (n)yI
i (n)
δII
j (n) = −
∂ξ(n)
∂yII
j (n)
1
2
(1 + yII
j (n))(1 − yII
j (n))
Inteligencia Computacional - FICH - UNL
Retropropagación en la capa II (oculta)
∆wII
ji (n) = µδII
j (n)yI
i (n)
δII
j (n) = −
∂ξ(n)
∂yII
j (n)
1
2
(1 + yII
j (n))(1 − yII
j (n))
δII
j (n) = −
∂
1
2
P
k e2
k(n)
	
∂yII
j (n)
1
2
(1 + yII
j (n))(1 − yII
j (n))
Inteligencia Computacional - FICH - UNL
Retropropagación en la capa II (oculta)
∆wII
ji (n) = µδII
j (n)yI
i (n)
δII
j (n) = −
∂ξ(n)
∂yII
j (n)
1
2
(1 + yII
j (n))(1 − yII
j (n))
δII
j (n) = −
∂
1
2
P
k e2
k(n)
	
∂yII
j (n)
1
2
(1 + yII
j (n))(1 − yII
j (n))
δII
j (n) = −
1
2
X
k
∂e2
k(n)
∂yII
j (n)
1
2
(1 + yII
j (n))(1 − yII
j (n))
Inteligencia Computacional - FICH - UNL
Retropropagación en la capa II (oculta)
∆wII
ji (n) = µδII
j (n)yI
i (n)
δII
j (n) = −
∂ξ(n)
∂yII
j (n)
1
2
(1 + yII
j (n))(1 − yII
j (n))
δII
j (n) = −
∂
1
2
P
k e2
k(n)
	
∂yII
j (n)
1
2
(1 + yII
j (n))(1 − yII
j (n))
δII
j (n) = −
1
2
X
k
∂e2
k(n)
∂yII
j (n)
1
2
(1 + yII
j (n))(1 − yII
j (n))
δII
j (n) = −
X
k
ek(n)
∂ek(n)
∂yII
j (n)
1
2
(1 + yII
j (n))(1 − yII
j (n))
Inteligencia Computacional - FICH - UNL
Retropropagación en la capa II (oculta)
δII
j (n) = −
X
k
ek(n)
∂ek(n)
∂yIII
k (n)
∂yIII
k (n)
∂vIII
k (n)
∂vIII
k (n)
∂yII
j (n)
1
2
(1+yII
j (n))(1−yII
j (n))
Inteligencia Computacional - FICH - UNL
Retropropagación en la capa II (oculta)
δII
j (n) = −
X
k
ek(n)
∂ek(n)
∂yIII
k (n)
∂yIII
k (n)
∂vIII
k (n)
∂vIII
k (n)
∂yII
j (n)
1
2
(1+yII
j (n))(1−yII
j (n))
δII
j (n) = −
X
k
ek(n)·
∂

dIII
k (n) − yIII
k (n)
	
∂yIII
k (n)
·
1
2
(1 + yIII
k (n))(1 − yIII
k (n)) ·
·
∂
nP
j wIII
kj yII
j (n)
o
∂yII
j (n)
·
1
2
(1 + yII
j (n))(1 − yII
j (n))
Inteligencia Computacional - FICH - UNL
Retropropagación en la capa II (oculta)
δII
j (n) = −
X
k
ek(n)
∂ek(n)
∂yIII
k (n)
∂yIII
k (n)
∂vIII
k (n)
∂vIII
k (n)
∂yII
j (n)
1
2
(1+yII
j (n))(1−yII
j (n))
δII
j (n) = −
X
k
ek(n)·
∂

dIII
k (n) − yIII
k (n)
	
∂yIII
k (n)
·
1
2
(1 + yIII
k (n))(1 − yIII
k (n)) ·
·
∂
nP
j wIII
kj yII
j (n)
o
∂yII
j (n)
·
1
2
(1 + yII
j (n))(1 − yII
j (n))
δII
j (n) = −
X
k
ek(n)·(−1) ·
1
2
(1 + yIII
k (n))(1 − yIII
k (n)) ·
·wIII
kj ·
1
2
(1 + yII
j (n))(1 − yII
j (n))
Inteligencia Computacional - FICH - UNL
Retropropagación en la capa II (oculta)
δII
j (n) =
X
k
ek(n) ·
1
2
(1 + yIII
k (n))(1 − yIII
k (n)) · wIII
kj ·
·
1
2
(1 + yII
j (n))(1 − yII
j (n))
Inteligencia Computacional - FICH - UNL
Retropropagación en la capa II (oculta)
δII
j (n) =
X
k
ek(n) ·
1
2
(1 + yIII
k (n))(1 − yIII
k (n)) · wIII
kj ·
·
1
2
(1 + yII
j (n))(1 − yII
j (n))
Pero de la capa IIIF sabemos que:
δIII
k (n) = 1
2ek(n)(1 + yIII
k (n))(1 − yIII
k (n))
Inteligencia Computacional - FICH - UNL
Retropropagación en la capa II (oculta)
δII
j (n) =
X
k
ek(n) ·
1
2
(1 + yIII
k (n))(1 − yIII
k (n)) · wIII
kj ·
·
1
2
(1 + yII
j (n))(1 − yII
j (n))
Pero de la capa IIIF sabemos que:
δIII
k (n) = 1
2ek(n)(1 + yIII
k (n))(1 − yIII
k (n))
Reemplzando:
δII
j (n) =
X
k
δIII
k (n)wIII
kj ·
1
2
(1 + yII
j (n))(1 − yII
j (n))
Inteligencia Computacional - FICH - UNL
Retropropagación en la capa II (oculta)
Volviendo a:
∆wII
ji (n) = µδII
j (n)yI
i (n)
Inteligencia Computacional - FICH - UNL
Retropropagación en la capa II (oculta)
Volviendo a:
∆wII
ji (n) = µδII
j (n)yI
i (n)
Por lo tanto:
∆wII
ji (n) = η

P
k
δIII
k wIII
kj (n)

(1 + yII
j (n))(1 − yII
j (n))yI
i (n)
Inteligencia Computacional - FICH - UNL
Generalizando para la capa “p”
∆wII
ji (n) = η

X
k
δIII
k wIII
kj (n)
#
(1 + yII
j (n))(1 − yII
j (n))yI
i (n)
⇓
∆w
(p)
ji (n) = η
D
δ(p+1), w
(p+1)
j
E
(1 + y
(p)
j (n))(1 − y
(p)
j (n))y
(p−1)
i (n)
Inteligencia Computacional - FICH - UNL
Resumen del algoritmo de retropropagación (BP)
1. Inicialización aleatoria
2. Propagación hacia adelante
3. Propagación hacia atras
4. Adaptación de los pesos
5. Iteración: vuelve a 2 hasta convergencia o finalización
Inteligencia Computacional - FICH - UNL
Resumen: propagación hacia adelante
φ(vI
1)
φ(vI
2)
φ(vI
3)
φ(vII
1 )
φ(vII
2 )
φ(vIII
1 )
x1
x2
y
Inteligencia Computacional - FICH - UNL
Resumen: propagación hacia adelante
φ(vI
1)
φ(vI
2)
φ(vI
3)
φ(vII
1 )
φ(vII
2 )
φ(vIII
1 )
x1
x2
y
wI
11
wI
12
yI
1 = φ(wI
11x1 + wI
12x2 + wI
10(−1))
Inteligencia Computacional - FICH - UNL
Resumen: propagación hacia adelante
φ(vI
1)
φ(vI
2)
φ(vI
3)
φ(vII
1 )
φ(vII
2 )
φ(vIII
1 )
x1
x2
y
wI
11
wI
12
yI
1 = φ(wI
11x1 + wI
12x2 + wI
10(−1))
x0 = −1 wI
10
Inteligencia Computacional - FICH - UNL
Resumen: propagación hacia adelante
φ(vI
1)
φ(vI
2)
φ(vI
3)
φ(vII
1 )
φ(vII
2 )
φ(vIII
1 )
x1
x2
y
wI
21
wI
22
yI
2
Inteligencia Computacional - FICH - UNL
Resumen: propagación hacia adelante
φ(vI
1)
φ(vI
2)
φ(vI
3)
φ(vII
1 )
φ(vII
2 )
φ(vIII
1 )
x1
x2
y
wI
31
wI
32
yI
3
Inteligencia Computacional - FICH - UNL
Resumen: propagación hacia adelante
φ(vI
1)
φ(vI
2)
φ(vI
3)
φ(vII
1 )
φ(vII
2 )
φ(vIII
1 )
x1
x2
y
yII
1 = φ(wII
11yI
1 + wII
12yI
2+
+wII
13yI
3 − wII
10)
yII
2
Inteligencia Computacional - FICH - UNL
Resumen: propagación hacia adelante
φ(vI
1)
φ(vI
2)
φ(vI
3)
φ(vII
1 )
φ(vII
2 )
φ(vIII
1 )
x1
x2
y
yIII = φ(wIII
11yII
1 +
+wIII
12yII
2 +
−wIII
10)
Inteligencia Computacional - FICH - UNL
Resumen: propagación hacia atras
φ(vI
1)
φ(vI
2)
φ(vI
3)
φ(vII
1 )
φ(vII
2 )
φ(vIII
1 )
x1
x2
y
Inteligencia Computacional - FICH - UNL
Resumen: propagación hacia atras
φ(vI
1)
φ(vI
2)
φ(vI
3)
φ(vII
1 )
φ(vII
2 )
φ(vIII
1 )
x1
x2
e
δIII = (d − y)
1
2 (1 + yIII)
(1 − yIII)
Inteligencia Computacional - FICH - UNL
Resumen: propagación hacia atras
φ(vI
1)
φ(vI
2)
φ(vI
3)
φ(vII
1 )
φ(vII
2 )
φ(vIII
1 )
x1
x2
e
δIII
δII
1 = δIIIwIII
11
1
2 (1 + yII
1 )(1 − yII
1 )
Inteligencia Computacional - FICH - UNL
Resumen: propagación hacia atras
φ(vI
1)
φ(vI
2)
φ(vI
3)
φ(vII
1 )
φ(vII
2 )
φ(vIII
1 )
x1
x2
e
δIII
δII
1 = δIIIwIII
11
1
2 (1 + yII
1 )(1 − yII
1 )
δII
2
Inteligencia Computacional - FICH - UNL
Resumen: propagación hacia atras
φ(vI
1)
φ(vI
2)
φ(vI
3)
φ(vII
1 )
φ(vII
2 )
φ(vIII
1 )
x1
x2
e
δIII
δII
1
δII
2
δI
1 = (wII
11δII
1 + wII
12δII
2 )1
2 (1 + yI
1)(1 − yI
1)
Inteligencia Computacional - FICH - UNL
Resumen: propagación hacia atras
φ(vI
1)
φ(vI
2)
φ(vI
3)
φ(vII
1 )
φ(vII
2 )
φ(vIII
1 )
x1
x2
e
δIII
δII
1
δII
2
δI
1
δI
2
δI
3
Inteligencia Computacional - FICH - UNL
Resumen: ajuste de pesos
φ(vI
1)
φ(vI
2)
φ(vI
3)
φ(vII
1 )
φ(vII
2 )
φ(vIII
1 )
x1
x2
y
δI
1
δI
2
δI
3
δII
1
δII
2
δIII
Inteligencia Computacional - FICH - UNL
Resumen: ajuste de pesos
φ(vI
1)
φ(vI
2)
φ(vI
3)
φ(vII
1 )
φ(vII
2 )
φ(vIII
1 )
x1
x2
y
δI
1
δI
2
δI
3
δII
1
δII
2
δIII
∆wI
11 = µδI
1x1
Inteligencia Computacional - FICH - UNL
Resumen: ajuste de pesos
φ(vI
1)
φ(vI
2)
φ(vI
3)
φ(vII
1 )
φ(vII
2 )
φ(vIII
1 )
x1
x2
y
δI
1
δI
2
δI
3
δII
1
δII
2
δIII
∆wI
11
∆wI
12 = µδI
1x2
Inteligencia Computacional - FICH - UNL
Resumen: ajuste de pesos
φ(vI
1)
φ(vI
2)
φ(vI
3)
φ(vII
1 )
φ(vII
2 )
φ(vIII
1 )
x1
x2
y
δI
1
δI
2
δI
3
δII
1
δII
2
δIII
∆wI
11
∆wI
12
x0 = −1
∆wI
10 = µδI
1(−1)
Inteligencia Computacional - FICH - UNL
Resumen: ajuste de pesos
φ(vI
1)
φ(vI
2)
φ(vI
3)
φ(vII
1 )
φ(vII
2 )
φ(vIII
1 )
x1
x2
y
δI
1
δI
2
δI
3
δII
1
δII
2
δIII
∆wI
21
∆wI
22
Inteligencia Computacional - FICH - UNL
Resumen: ajuste de pesos
φ(vI
1)
φ(vI
2)
φ(vI
3)
φ(vII
1 )
φ(vII
2 )
φ(vIII
1 )
x1
x2
y
δII
1
δII
2
δIII
∆wI
31
∆wI
32
δI
3
Inteligencia Computacional - FICH - UNL
Resumen: ajuste de pesos
φ(vI
1)
φ(vI
2)
φ(vI
3)
φ(vII
1 )
φ(vII
2 )
φ(vIII
1 )
x1
x2
y
δII
1
δII
2
δIII
Inteligencia Computacional - FICH - UNL
Resumen: ajuste de pesos
φ(vI
1)
φ(vI
2)
φ(vI
3)
φ(vII
1 )
φ(vII
2 )
φ(vIII
1 )
x1
x2
y
δIII
Inteligencia Computacional - FICH - UNL
Resumen: ajuste de pesos
φ(vI
1)
φ(vI
2)
φ(vI
3)
φ(vII
1 )
φ(vII
2 )
φ(vIII
1 )
x1
x2
y

Más contenido relacionado

La actualidad más candente (17)

Asintotas1
Asintotas1Asintotas1
Asintotas1
 
18131735 interpolacion-newton
18131735 interpolacion-newton18131735 interpolacion-newton
18131735 interpolacion-newton
 
Representacionfunciones
RepresentacionfuncionesRepresentacionfunciones
Representacionfunciones
 
Ejercicios de Calculo Multivariable
Ejercicios de Calculo MultivariableEjercicios de Calculo Multivariable
Ejercicios de Calculo Multivariable
 
Integral doble temas1011
Integral doble temas1011Integral doble temas1011
Integral doble temas1011
 
Matematicas 1
Matematicas 1Matematicas 1
Matematicas 1
 
Reales
RealesReales
Reales
 
Taller 1 -_sistemas_lineales
Taller 1 -_sistemas_linealesTaller 1 -_sistemas_lineales
Taller 1 -_sistemas_lineales
 
Taller1
Taller1Taller1
Taller1
 
Solucionario demidovich tomo III
Solucionario demidovich tomo IIISolucionario demidovich tomo III
Solucionario demidovich tomo III
 
Guia ecuacion cuadratica
Guia ecuacion cuadraticaGuia ecuacion cuadratica
Guia ecuacion cuadratica
 
Derivadas
DerivadasDerivadas
Derivadas
 
Asintotas2
Asintotas2Asintotas2
Asintotas2
 
Integracion multiple
Integracion multipleIntegracion multiple
Integracion multiple
 
Ejercicios derivadas 1
Ejercicios derivadas 1Ejercicios derivadas 1
Ejercicios derivadas 1
 
Ejercicios 1º bchs
Ejercicios 1º bchsEjercicios 1º bchs
Ejercicios 1º bchs
 
Taller edo
Taller edoTaller edo
Taller edo
 

Similar a Multicapa y backpropagation

Utp pds_sl2_señales con mat_lab
 Utp pds_sl2_señales con mat_lab Utp pds_sl2_señales con mat_lab
Utp pds_sl2_señales con mat_lab
jcbenitezp
 
Utp pds_sl2_señales con mat_lab
 Utp pds_sl2_señales con mat_lab Utp pds_sl2_señales con mat_lab
Utp pds_sl2_señales con mat_lab
jcbenitezp
 
Utp pds_s_lab3_señales con mat_lab
 Utp pds_s_lab3_señales con mat_lab Utp pds_s_lab3_señales con mat_lab
Utp pds_s_lab3_señales con mat_lab
jcbenitezp
 
Problemas & Soluciones De Ejercicios De Programacion Lineal
Problemas & Soluciones De Ejercicios De Programacion LinealProblemas & Soluciones De Ejercicios De Programacion Lineal
Problemas & Soluciones De Ejercicios De Programacion Lineal
Instituto Tecnologico De Pachuca
 
Pds 2011 3-balotario de preguntas pc3_b
Pds 2011 3-balotario de preguntas pc3_bPds 2011 3-balotario de preguntas pc3_b
Pds 2011 3-balotario de preguntas pc3_b
jcbenitezp
 

Similar a Multicapa y backpropagation (20)

Newton
NewtonNewton
Newton
 
Ejercicios de ecuaciones diferenciales
Ejercicios de ecuaciones diferencialesEjercicios de ecuaciones diferenciales
Ejercicios de ecuaciones diferenciales
 
Newtondf
NewtondfNewtondf
Newtondf
 
calculo en fenómenos naturales y procesos sociales
calculo en fenómenos naturales y procesos socialescalculo en fenómenos naturales y procesos sociales
calculo en fenómenos naturales y procesos sociales
 
Utp pds_sl2_señales con mat_lab
 Utp pds_sl2_señales con mat_lab Utp pds_sl2_señales con mat_lab
Utp pds_sl2_señales con mat_lab
 
Utp pds_sl2_señales con mat_lab
 Utp pds_sl2_señales con mat_lab Utp pds_sl2_señales con mat_lab
Utp pds_sl2_señales con mat_lab
 
Ecuaciones Diferenciales y problemas con valores en la frontera
Ecuaciones Diferenciales y problemas con valores en la fronteraEcuaciones Diferenciales y problemas con valores en la frontera
Ecuaciones Diferenciales y problemas con valores en la frontera
 
Utp pds_s_lab3_señales con mat_lab
 Utp pds_s_lab3_señales con mat_lab Utp pds_s_lab3_señales con mat_lab
Utp pds_s_lab3_señales con mat_lab
 
P5 paez
P5 paezP5 paez
P5 paez
 
Problemas & Soluciones De Ejercicios De Programacion Lineal
Problemas & Soluciones De Ejercicios De Programacion LinealProblemas & Soluciones De Ejercicios De Programacion Lineal
Problemas & Soluciones De Ejercicios De Programacion Lineal
 
Asd
AsdAsd
Asd
 
Ecuaciones Diferenciales y problemas con valores en la frontera
Ecuaciones Diferenciales y problemas con valores en la fronteraEcuaciones Diferenciales y problemas con valores en la frontera
Ecuaciones Diferenciales y problemas con valores en la frontera
 
Integracion por partes
Integracion por partesIntegracion por partes
Integracion por partes
 
Guía Variable Compleja
Guía Variable ComplejaGuía Variable Compleja
Guía Variable Compleja
 
Ejercicios resueltos 2011 series de fourier
Ejercicios resueltos 2011 series de fourierEjercicios resueltos 2011 series de fourier
Ejercicios resueltos 2011 series de fourier
 
Funciones, limites y continuidad
Funciones, limites y continuidadFunciones, limites y continuidad
Funciones, limites y continuidad
 
¿Sueñan los crackers con ordenadores cuánticos?
¿Sueñan los crackers con ordenadores cuánticos?¿Sueñan los crackers con ordenadores cuánticos?
¿Sueñan los crackers con ordenadores cuánticos?
 
¿Sueñan los crackers con ordenadores cuánticos
¿Sueñan los crackers con ordenadores cuánticos¿Sueñan los crackers con ordenadores cuánticos
¿Sueñan los crackers con ordenadores cuánticos
 
Pds 2011 3-balotario de preguntas pc3_b
Pds 2011 3-balotario de preguntas pc3_bPds 2011 3-balotario de preguntas pc3_b
Pds 2011 3-balotario de preguntas pc3_b
 
Paralela6
Paralela6Paralela6
Paralela6
 

Más de Spacetoshare

Más de Spacetoshare (20)

EL HUECO.pdf
EL HUECO.pdfEL HUECO.pdf
EL HUECO.pdf
 
Probles on Algorithms
Probles on AlgorithmsProbles on Algorithms
Probles on Algorithms
 
Sums ADA
Sums ADASums ADA
Sums ADA
 
Manual de análisis y diseño de algoritmos
Manual de análisis y diseño de algoritmosManual de análisis y diseño de algoritmos
Manual de análisis y diseño de algoritmos
 
Inducción matemática
Inducción matemáticaInducción matemática
Inducción matemática
 
Fórmulas ADA
Fórmulas ADAFórmulas ADA
Fórmulas ADA
 
Ejercicios Investigación de operaciones
Ejercicios Investigación de operacionesEjercicios Investigación de operaciones
Ejercicios Investigación de operaciones
 
Algoritmos de ordenamiento
Algoritmos de ordenamientoAlgoritmos de ordenamiento
Algoritmos de ordenamiento
 
Ejercicios jess
Ejercicios jessEjercicios jess
Ejercicios jess
 
Sistemas Expertos
Sistemas ExpertosSistemas Expertos
Sistemas Expertos
 
Como escribir tesis
Como escribir tesisComo escribir tesis
Como escribir tesis
 
COMPONENTES BÁSICOS DE UN SISTEMA MS-DOS
COMPONENTES BÁSICOS DE UN SISTEMA MS-DOSCOMPONENTES BÁSICOS DE UN SISTEMA MS-DOS
COMPONENTES BÁSICOS DE UN SISTEMA MS-DOS
 
Curso básico de Ensamblador
Curso básico de EnsambladorCurso básico de Ensamblador
Curso básico de Ensamblador
 
Ejercicios álgebra superior
Ejercicios álgebra superiorEjercicios álgebra superior
Ejercicios álgebra superior
 
INDUCCIÓN MATEMÁTICA
INDUCCIÓN MATEMÁTICA INDUCCIÓN MATEMÁTICA
INDUCCIÓN MATEMÁTICA
 
Sistemas de ecuaciones
Sistemas de ecuacionesSistemas de ecuaciones
Sistemas de ecuaciones
 
Determinantes
DeterminantesDeterminantes
Determinantes
 
Inducción matemática
Inducción matemáticaInducción matemática
Inducción matemática
 
Tareas números complejos
Tareas números complejosTareas números complejos
Tareas números complejos
 
Ejer
EjerEjer
Ejer
 

Último

Criterios ESG: fundamentos, aplicaciones y beneficios
Criterios ESG: fundamentos, aplicaciones y beneficiosCriterios ESG: fundamentos, aplicaciones y beneficios
Criterios ESG: fundamentos, aplicaciones y beneficios
JonathanCovena1
 
5.- Doerr-Mide-lo-que-importa-DESARROLLO PERSONAL
5.- Doerr-Mide-lo-que-importa-DESARROLLO PERSONAL5.- Doerr-Mide-lo-que-importa-DESARROLLO PERSONAL
5.- Doerr-Mide-lo-que-importa-DESARROLLO PERSONAL
MiNeyi1
 
Curso = Metodos Tecnicas y Modelos de Enseñanza.pdf
Curso = Metodos Tecnicas y Modelos de Enseñanza.pdfCurso = Metodos Tecnicas y Modelos de Enseñanza.pdf
Curso = Metodos Tecnicas y Modelos de Enseñanza.pdf
Francisco158360
 

Último (20)

Programacion Anual Matemática5 MPG 2024 Ccesa007.pdf
Programacion Anual Matemática5    MPG 2024  Ccesa007.pdfProgramacion Anual Matemática5    MPG 2024  Ccesa007.pdf
Programacion Anual Matemática5 MPG 2024 Ccesa007.pdf
 
ACTIVIDAD DIA DE LA MADRE FICHA DE TRABAJO
ACTIVIDAD DIA DE LA MADRE FICHA DE TRABAJOACTIVIDAD DIA DE LA MADRE FICHA DE TRABAJO
ACTIVIDAD DIA DE LA MADRE FICHA DE TRABAJO
 
OCTAVO SEGUNDO PERIODO. EMPRENDIEMIENTO VS
OCTAVO SEGUNDO PERIODO. EMPRENDIEMIENTO VSOCTAVO SEGUNDO PERIODO. EMPRENDIEMIENTO VS
OCTAVO SEGUNDO PERIODO. EMPRENDIEMIENTO VS
 
Unidad 3 | Metodología de la Investigación
Unidad 3 | Metodología de la InvestigaciónUnidad 3 | Metodología de la Investigación
Unidad 3 | Metodología de la Investigación
 
BIOMETANO SÍ, PERO NO ASÍ. LA NUEVA BURBUJA ENERGÉTICA
BIOMETANO SÍ, PERO NO ASÍ. LA NUEVA BURBUJA ENERGÉTICABIOMETANO SÍ, PERO NO ASÍ. LA NUEVA BURBUJA ENERGÉTICA
BIOMETANO SÍ, PERO NO ASÍ. LA NUEVA BURBUJA ENERGÉTICA
 
Registro Auxiliar - Primaria 2024 (1).pptx
Registro Auxiliar - Primaria  2024 (1).pptxRegistro Auxiliar - Primaria  2024 (1).pptx
Registro Auxiliar - Primaria 2024 (1).pptx
 
PINTURA DEL RENACIMIENTO EN ESPAÑA (SIGLO XVI).ppt
PINTURA DEL RENACIMIENTO EN ESPAÑA (SIGLO XVI).pptPINTURA DEL RENACIMIENTO EN ESPAÑA (SIGLO XVI).ppt
PINTURA DEL RENACIMIENTO EN ESPAÑA (SIGLO XVI).ppt
 
Medición del Movimiento Online 2024.pptx
Medición del Movimiento Online 2024.pptxMedición del Movimiento Online 2024.pptx
Medición del Movimiento Online 2024.pptx
 
Tema 8.- PROTECCION DE LOS SISTEMAS DE INFORMACIÓN.pdf
Tema 8.- PROTECCION DE LOS SISTEMAS DE INFORMACIÓN.pdfTema 8.- PROTECCION DE LOS SISTEMAS DE INFORMACIÓN.pdf
Tema 8.- PROTECCION DE LOS SISTEMAS DE INFORMACIÓN.pdf
 
Caja de herramientas de inteligencia artificial para la academia y la investi...
Caja de herramientas de inteligencia artificial para la academia y la investi...Caja de herramientas de inteligencia artificial para la academia y la investi...
Caja de herramientas de inteligencia artificial para la academia y la investi...
 
proyecto de mayo inicial 5 añitos aprender es bueno para tu niño
proyecto de mayo inicial 5 añitos aprender es bueno para tu niñoproyecto de mayo inicial 5 añitos aprender es bueno para tu niño
proyecto de mayo inicial 5 añitos aprender es bueno para tu niño
 
Criterios ESG: fundamentos, aplicaciones y beneficios
Criterios ESG: fundamentos, aplicaciones y beneficiosCriterios ESG: fundamentos, aplicaciones y beneficios
Criterios ESG: fundamentos, aplicaciones y beneficios
 
Lecciones 05 Esc. Sabática. Fe contra todo pronóstico.
Lecciones 05 Esc. Sabática. Fe contra todo pronóstico.Lecciones 05 Esc. Sabática. Fe contra todo pronóstico.
Lecciones 05 Esc. Sabática. Fe contra todo pronóstico.
 
5.- Doerr-Mide-lo-que-importa-DESARROLLO PERSONAL
5.- Doerr-Mide-lo-que-importa-DESARROLLO PERSONAL5.- Doerr-Mide-lo-que-importa-DESARROLLO PERSONAL
5.- Doerr-Mide-lo-que-importa-DESARROLLO PERSONAL
 
Estrategia de prompts, primeras ideas para su construcción
Estrategia de prompts, primeras ideas para su construcciónEstrategia de prompts, primeras ideas para su construcción
Estrategia de prompts, primeras ideas para su construcción
 
Power Point: Fe contra todo pronóstico.pptx
Power Point: Fe contra todo pronóstico.pptxPower Point: Fe contra todo pronóstico.pptx
Power Point: Fe contra todo pronóstico.pptx
 
LA LITERATURA DEL BARROCO 2023-2024pptx.pptx
LA LITERATURA DEL BARROCO 2023-2024pptx.pptxLA LITERATURA DEL BARROCO 2023-2024pptx.pptx
LA LITERATURA DEL BARROCO 2023-2024pptx.pptx
 
ACERTIJO DE POSICIÓN DE CORREDORES EN LA OLIMPIADA. Por JAVIER SOLIS NOYOLA
ACERTIJO DE POSICIÓN DE CORREDORES EN LA OLIMPIADA. Por JAVIER SOLIS NOYOLAACERTIJO DE POSICIÓN DE CORREDORES EN LA OLIMPIADA. Por JAVIER SOLIS NOYOLA
ACERTIJO DE POSICIÓN DE CORREDORES EN LA OLIMPIADA. Por JAVIER SOLIS NOYOLA
 
Curso = Metodos Tecnicas y Modelos de Enseñanza.pdf
Curso = Metodos Tecnicas y Modelos de Enseñanza.pdfCurso = Metodos Tecnicas y Modelos de Enseñanza.pdf
Curso = Metodos Tecnicas y Modelos de Enseñanza.pdf
 
GUIA DE CIRCUNFERENCIA Y ELIPSE UNDÉCIMO 2024.pdf
GUIA DE CIRCUNFERENCIA Y ELIPSE UNDÉCIMO 2024.pdfGUIA DE CIRCUNFERENCIA Y ELIPSE UNDÉCIMO 2024.pdf
GUIA DE CIRCUNFERENCIA Y ELIPSE UNDÉCIMO 2024.pdf
 

Multicapa y backpropagation

  • 1. Problema XOR con 3 neuronas Diego Milone Inteligencia Computacional Departamento de Informática FICH-UNL
  • 2. Inteligencia Computacional - FICH - UNL ¿Cómo podríamos resolver el problema XOR? x1 x2 −1 +1 +1 −1
  • 3. Inteligencia Computacional - FICH - UNL Primera capa: perceptrones A y B x1 x2 −1 +1 +1 −1 x1 x2 −1 +1 +1 −1
  • 4. Inteligencia Computacional - FICH - UNL Primera capa: perceptrones A y B x1 x2 −1 +1 +1 −1 A x1 x2 −1 +1 +1 −1 A
  • 5. Inteligencia Computacional - FICH - UNL Primera capa: perceptrones A y B x1 x2 −1 +1 +1 −1 A x1 x2 −1 +1 +1 −1 A B
  • 6. Inteligencia Computacional - FICH - UNL Segunda capa: perceptron C x1 x2 −1 +1 +1 −1 A x1 x2 −1 +1 +1 −1 A B x1 x2 −1 +1 +1 −1
  • 7. Inteligencia Computacional - FICH - UNL Tabla de verdad para el perceptron C x1 x2 −1 +1 +1 −1 A B
  • 8. Inteligencia Computacional - FICH - UNL Tabla de verdad para el perceptron C yB yA −1 +1 −1
  • 9. Inteligencia Computacional - FICH - UNL Tabla de verdad para el perceptron C yB yA −1 +1 −1 X
  • 10. Inteligencia Computacional - FICH - UNL Tabla de verdad para el perceptron C yB yA −1 +1 −1 X C
  • 11. Nuestra primera red neuronal Un perceptrón multicapa con 3 neuronas Diego Milone Inteligencia Computacional Departamento de Informática FICH-UNL
  • 12. Inteligencia Computacional - FICH - UNL Combinación de perceptrones simples: A x1 x2 −1 +1 +1 −1 A
  • 13. Inteligencia Computacional - FICH - UNL Combinación de perceptrones simples: A x1 x2 −1 +1 +1 −1 A Perceptrón A: x2 = −1 − x1
  • 14. Inteligencia Computacional - FICH - UNL Combinación de perceptrones simples: A x1 x2 −1 +1 +1 −1 A Perceptrón A: x2 = −1 − x1 = wA0 wA2 − wA1 wA2 x1
  • 15. Inteligencia Computacional - FICH - UNL Combinación de perceptrones simples: A x1 x2 −1 +1 +1 −1 A Perceptrón A: x2 = −1 − x1 = wA0 wA2 − wA1 wA2 x1 →    wA0 = −1 wA1 = +1 wA2 = +1    → yA = sgn(x2 + x1 + 1)
  • 16. Inteligencia Computacional - FICH - UNL Combinación de perceptrones simples: B x1 x2 −1 +1 +1 −1 A B
  • 17. Inteligencia Computacional - FICH - UNL Combinación de perceptrones simples: B x1 x2 −1 +1 +1 −1 A B Perceptrón B: x2 = +1 − x1
  • 18. Inteligencia Computacional - FICH - UNL Combinación de perceptrones simples: B x1 x2 −1 +1 +1 −1 A B Perceptrón B: x2 = +1 − x1 →    wB0 = +1 wB1 = +1 wB2 = +1    → yB = sgn(x2 + x1 − 1)
  • 19. Inteligencia Computacional - FICH - UNL Combinación de perceptrones simples: C yB yA −1 +1 −1 X A C
  • 20. Inteligencia Computacional - FICH - UNL Combinación de perceptrones simples: C yB yA −1 +1 −1 X A C Perceptrón C: yA = +1 + yB
  • 21. Inteligencia Computacional - FICH - UNL Combinación de perceptrones simples: C yB yA −1 +1 −1 X A C Perceptrón C: yA = +1 + yB →    wC0 = +1 wC1 = −1 wC2 = +1    → yC = sgn(yA − yB − 1)
  • 22. Inteligencia Computacional - FICH - UNL ¿Cómo es la arquitectura de esta red neuronal?    wC0 = +1 wC1 = −1 wC2 = +1       wA0 = −1 wA1 = +1 wA2 = +1       wB0 = +1 wB1 = +1 wB2 = +1    yA = sgn(x2 + x1 + 1) yB = sgn(x2 + x1 − 1) → yC = sgn(yA − yB − 1)
  • 23. Inteligencia Computacional - FICH - UNL Y... ¿resolverá el XOR?
  • 24. Inteligencia Computacional - FICH - UNL Y... ¿resolverá el XOR? x1 x2 A B C y
  • 25. Inteligencia Computacional - FICH - UNL Y... ¿resolverá el XOR? x1 x2 A B C y 1 1 1 1 1 −1
  • 26. Inteligencia Computacional - FICH - UNL Y... ¿resolverá el XOR? x1 x2 A B C y 1 1 1 1 1 −1 x0 = −1
  • 27. Inteligencia Computacional - FICH - UNL Y... ¿resolverá el XOR? x1 x2 A B C y 1 1 1 1 1 −1 x0 = −1 −1 1 1
  • 28. Inteligencia Computacional - FICH - UNL Y... ¿resolverá el XOR? x1 x2 A B C y 1 1 1 1 1 −1 x0 = −1 −1 1 1
  • 29. Inteligencia Computacional - FICH - UNL Y... ¿resolverá el XOR? x1 x2 A B C y 1 1 1 1 1 −1 x0 = −1 −1 1 1 yA = sgn(x2 + x1 + 1) yB = sgn(x2 + x1 − 1) → yC = sgn(yA−yB−1)
  • 30. Perceptrón multicapa: regiones de decisión y arquitectura Diego Milone Inteligencia Computacional Departamento de Informática FICH-UNL
  • 31. Inteligencia Computacional - FICH - UNL Regiones de decisión
  • 32. Inteligencia Computacional - FICH - UNL Arquitectura del perceptrón multicapa x1 x2 x3 x4 y1 y2 Capa oculta Capa de entrada Capa de salida
  • 33. Inteligencia Computacional - FICH - UNL Arquitectura del perceptrón multicapa x1 x2 x3 x4 y1 y2 WII yII WI yI WIII yIII
  • 34. Inteligencia Computacional - FICH - UNL Cálculo de las salidas en cada capa • Capa I: vI j = D wI j , x E = N P i=0 wI jixi (completo vI = WIx)
  • 35. Inteligencia Computacional - FICH - UNL Cálculo de las salidas en cada capa • Capa I: vI j = D wI j , x E = N P i=0 wI jixi (completo vI = WIx) yI j = φ(vI j ) = 2 1 + e−bvI j − 1 (simétrica ± 1)
  • 36. Inteligencia Computacional - FICH - UNL Cálculo de las salidas en cada capa • Capa I: vI j = D wI j , x E = N P i=0 wI jixi (completo vI = WIx) yI j = φ(vI j ) = 2 1 + e−bvI j − 1 (simétrica ± 1) • Capa II: vII j = D wII j , yI E → yII j = φ(vII j ) • Capa III: vIII j = D wIII j , yII E → yIII j = φ(vIII j ) = yj
  • 37. Propagación hacia atrás: caso general y capa de salida Diego Milone Inteligencia Computacional Departamento de Informática FICH-UNL
  • 38. Inteligencia Computacional - FICH - UNL Criterio de error Suma del error cuadrático instantáneo ξ(n) = 1 2 M X j=1 e2 j (n)
  • 39. Inteligencia Computacional - FICH - UNL Aplicación del gradiente (caso general) ∆wji(n) = −µ ∂ξ(n) ∂wji(n)
  • 40. Inteligencia Computacional - FICH - UNL Aplicación del gradiente (caso general) ∆wji(n) = −µ ∂ξ(n) ∂wji(n) ∂ξ(n) ∂wji(n) = ∂ξ(n) ∂ej(n) ∂ej(n) ∂yj(n) ∂yj(n) ∂vj(n) ∂vj(n) ∂wji(n)
  • 41. Inteligencia Computacional - FICH - UNL Aplicación del gradiente (caso general) ∆wji(n) = −µ ∂ξ(n) ∂wji(n) ∂ξ(n) ∂wji(n) = ∂ξ(n) ∂ej(n) ∂ej(n) ∂yj(n) ∂yj(n) ∂vj(n) ∂vj(n) ∂wji(n) ∂vj(n) ∂wji(n) = ∂ N P i=0 wji(n)yi(n) ∂wji(n) = yi(n)
  • 42. Inteligencia Computacional - FICH - UNL Aplicación del gradiente (caso general) ∆wji(n) = −µ ∂ξ(n) ∂wji(n) ∂ξ(n) ∂wji(n) = ∂ξ(n) ∂ej(n) ∂ej(n) ∂yj(n) ∂yj(n) ∂vj(n) yi(n) Gradiente de error local instantáneo: δj = ∂ξ(n) ∂yj(n) ∂yj(n) ∂vj(n)
  • 43. Inteligencia Computacional - FICH - UNL Aplicación del gradiente (caso general) ∆wji(n) = µδj(n)yi(n) ∂ξ(n) ∂wji(n) = ∂ξ(n) ∂ej(n) ∂ej(n) ∂yj(n) ∂yj(n) ∂vj(n) yi(n) Gradiente de error local instantáneo: δj = ∂ξ(n) ∂yj(n) ∂yj(n) ∂vj(n)
  • 44. Inteligencia Computacional - FICH - UNL Derivada de la función de activación simétrica (1/2) ∂yj(n) ∂vj(n) = ∂ n 2 1+e−vj(n) − 1 o ∂vj(n) = 2 e−vj(n) 1 + e−vj(n) 2 = 2 1 1 + e−vj(n) e−vj(n) 1 + e−vj(n) = 2 1 1 + e−vj(n) 0 z }| { −1 + 1 +e−vj(n) 1 + e−vj(n) = 2 1 1 + e−vj(n) −1 1 + e−vj(n) + 1 + e−vj(n) 1 + e−vj(n) !
  • 45. Inteligencia Computacional - FICH - UNL Derivada de la función de activación simétrica (2/2) ∂yj(n) ∂vj(n) = 2 1 1 + e−vj(n) 1 − 1 1 + e−vj(n) = 2 yj(n) + 1 2 1 − yj(n) + 1 2 = (yj(n) + 1) 1 − yj(n) + 1 2 = (yj(n) + 1) 2 − yj(n) − 1 2 = 1 2 (yj(n) + 1)(yj(n) − 1)
  • 46. Inteligencia Computacional - FICH - UNL Aplicación del gradiente (caso general) ∆wji(n) = µδj(n)yi(n) ∂ξ(n) ∂wji(n) = ∂ξ(n) ∂ej(n) ∂ej(n) ∂yj(n) ∂yj(n) ∂vj(n) yi(n) Gradiente de error local instantáneo: δj = − ∂ξ(n) ∂yj(n) ∂yj(n) ∂vj(n) δj = ∂ξ(n) ∂yj(n) 1 2 (1 + yj(n))(1 − yj(n))
  • 47. Inteligencia Computacional - FICH - UNL Retropropagación en la capa III (salida) ∆wIII ji (n) = µδIII j (n)yII i (n)
  • 48. Inteligencia Computacional - FICH - UNL Retropropagación en la capa III (salida) ∆wIII ji (n) = µδIII j (n)yII i (n) δIII j (n) = − ∂ξ(n) ∂yIII j (n) 1 2 (1 + yIII j (n))(1 − yIII j (n))
  • 49. Inteligencia Computacional - FICH - UNL Retropropagación en la capa III (salida) ∆wIII ji (n) = µδIII j (n)yII i (n) δIII j (n) = − ∂ξ(n) ∂yIII j (n) 1 2 (1 + yIII j (n))(1 − yIII j (n)) δIII j (n) = − ∂ξ(n) ∂ej(n) ∂ej(n) ∂yIII j (n) 1 2 (1 + yIII j (n))(1 − yIII j (n))
  • 50. Inteligencia Computacional - FICH - UNL Retropropagación en la capa III (salida) δIII j (n) = − ∂ n 1 2 P j e2 j (n) o ∂ej(n) · ∂ n dIII j (n) − yIII j (n) o ∂yIII j (n) · · 1 2 (1 + yIII j (n))(1 − yIII j (n))
  • 51. Inteligencia Computacional - FICH - UNL Retropropagación en la capa III (salida) δIII j (n) = − ∂ n 1 2 P j e2 j (n) o ∂ej(n) · ∂ n dIII j (n) − yIII j (n) o ∂yIII j (n) · · 1 2 (1 + yIII j (n))(1 − yIII j (n)) δIII j (n) = 1 2ej(n)(1 + yIII j (n))(1 − yIII j (n))F
  • 52. Inteligencia Computacional - FICH - UNL Retropropagación en la capa III (salida) δIII j (n) = − ∂ n 1 2 P j e2 j (n) o ∂ej(n) · ∂ n dIII j (n) − yIII j (n) o ∂yIII j (n) · · 1 2 (1 + yIII j (n))(1 − yIII j (n)) δIII j (n) = 1 2ej(n)(1 + yIII j (n))(1 − yIII j (n))F ∆wIII ji (n) = ηej(n)(1 + yIII j (n))(1 − yIII j (n))yII i (n)
  • 53. Propagación hacia atrás: capas ocultas Diego Milone Inteligencia Computacional Departamento de Informática FICH-UNL
  • 54. Inteligencia Computacional - FICH - UNL Retropropagación en la capa II (oculta) ∆wII ji (n) = µδII j (n)yI i (n)
  • 55. Inteligencia Computacional - FICH - UNL Retropropagación en la capa II (oculta) ∆wII ji (n) = µδII j (n)yI i (n) δII j (n) = − ∂ξ(n) ∂yII j (n) 1 2 (1 + yII j (n))(1 − yII j (n))
  • 56. Inteligencia Computacional - FICH - UNL Retropropagación en la capa II (oculta) ∆wII ji (n) = µδII j (n)yI i (n) δII j (n) = − ∂ξ(n) ∂yII j (n) 1 2 (1 + yII j (n))(1 − yII j (n)) δII j (n) = − ∂ 1 2 P k e2 k(n) ∂yII j (n) 1 2 (1 + yII j (n))(1 − yII j (n))
  • 57. Inteligencia Computacional - FICH - UNL Retropropagación en la capa II (oculta) ∆wII ji (n) = µδII j (n)yI i (n) δII j (n) = − ∂ξ(n) ∂yII j (n) 1 2 (1 + yII j (n))(1 − yII j (n)) δII j (n) = − ∂ 1 2 P k e2 k(n) ∂yII j (n) 1 2 (1 + yII j (n))(1 − yII j (n)) δII j (n) = − 1 2 X k ∂e2 k(n) ∂yII j (n) 1 2 (1 + yII j (n))(1 − yII j (n))
  • 58. Inteligencia Computacional - FICH - UNL Retropropagación en la capa II (oculta) ∆wII ji (n) = µδII j (n)yI i (n) δII j (n) = − ∂ξ(n) ∂yII j (n) 1 2 (1 + yII j (n))(1 − yII j (n)) δII j (n) = − ∂ 1 2 P k e2 k(n) ∂yII j (n) 1 2 (1 + yII j (n))(1 − yII j (n)) δII j (n) = − 1 2 X k ∂e2 k(n) ∂yII j (n) 1 2 (1 + yII j (n))(1 − yII j (n)) δII j (n) = − X k ek(n) ∂ek(n) ∂yII j (n) 1 2 (1 + yII j (n))(1 − yII j (n))
  • 59. Inteligencia Computacional - FICH - UNL Retropropagación en la capa II (oculta) δII j (n) = − X k ek(n) ∂ek(n) ∂yIII k (n) ∂yIII k (n) ∂vIII k (n) ∂vIII k (n) ∂yII j (n) 1 2 (1+yII j (n))(1−yII j (n))
  • 60. Inteligencia Computacional - FICH - UNL Retropropagación en la capa II (oculta) δII j (n) = − X k ek(n) ∂ek(n) ∂yIII k (n) ∂yIII k (n) ∂vIII k (n) ∂vIII k (n) ∂yII j (n) 1 2 (1+yII j (n))(1−yII j (n)) δII j (n) = − X k ek(n)· ∂ dIII k (n) − yIII k (n) ∂yIII k (n) · 1 2 (1 + yIII k (n))(1 − yIII k (n)) · · ∂ nP j wIII kj yII j (n) o ∂yII j (n) · 1 2 (1 + yII j (n))(1 − yII j (n))
  • 61. Inteligencia Computacional - FICH - UNL Retropropagación en la capa II (oculta) δII j (n) = − X k ek(n) ∂ek(n) ∂yIII k (n) ∂yIII k (n) ∂vIII k (n) ∂vIII k (n) ∂yII j (n) 1 2 (1+yII j (n))(1−yII j (n)) δII j (n) = − X k ek(n)· ∂ dIII k (n) − yIII k (n) ∂yIII k (n) · 1 2 (1 + yIII k (n))(1 − yIII k (n)) · · ∂ nP j wIII kj yII j (n) o ∂yII j (n) · 1 2 (1 + yII j (n))(1 − yII j (n)) δII j (n) = − X k ek(n)·(−1) · 1 2 (1 + yIII k (n))(1 − yIII k (n)) · ·wIII kj · 1 2 (1 + yII j (n))(1 − yII j (n))
  • 62. Inteligencia Computacional - FICH - UNL Retropropagación en la capa II (oculta) δII j (n) = X k ek(n) · 1 2 (1 + yIII k (n))(1 − yIII k (n)) · wIII kj · · 1 2 (1 + yII j (n))(1 − yII j (n))
  • 63. Inteligencia Computacional - FICH - UNL Retropropagación en la capa II (oculta) δII j (n) = X k ek(n) · 1 2 (1 + yIII k (n))(1 − yIII k (n)) · wIII kj · · 1 2 (1 + yII j (n))(1 − yII j (n)) Pero de la capa IIIF sabemos que: δIII k (n) = 1 2ek(n)(1 + yIII k (n))(1 − yIII k (n))
  • 64. Inteligencia Computacional - FICH - UNL Retropropagación en la capa II (oculta) δII j (n) = X k ek(n) · 1 2 (1 + yIII k (n))(1 − yIII k (n)) · wIII kj · · 1 2 (1 + yII j (n))(1 − yII j (n)) Pero de la capa IIIF sabemos que: δIII k (n) = 1 2ek(n)(1 + yIII k (n))(1 − yIII k (n)) Reemplzando: δII j (n) = X k δIII k (n)wIII kj · 1 2 (1 + yII j (n))(1 − yII j (n))
  • 65. Inteligencia Computacional - FICH - UNL Retropropagación en la capa II (oculta) Volviendo a: ∆wII ji (n) = µδII j (n)yI i (n)
  • 66. Inteligencia Computacional - FICH - UNL Retropropagación en la capa II (oculta) Volviendo a: ∆wII ji (n) = µδII j (n)yI i (n) Por lo tanto: ∆wII ji (n) = η P k δIII k wIII kj (n) (1 + yII j (n))(1 − yII j (n))yI i (n)
  • 67. Inteligencia Computacional - FICH - UNL Generalizando para la capa “p” ∆wII ji (n) = η X k δIII k wIII kj (n) # (1 + yII j (n))(1 − yII j (n))yI i (n) ⇓ ∆w (p) ji (n) = η D δ(p+1), w (p+1) j E (1 + y (p) j (n))(1 − y (p) j (n))y (p−1) i (n)
  • 68. Inteligencia Computacional - FICH - UNL Resumen del algoritmo de retropropagación (BP) 1. Inicialización aleatoria 2. Propagación hacia adelante 3. Propagación hacia atras 4. Adaptación de los pesos 5. Iteración: vuelve a 2 hasta convergencia o finalización
  • 69. Inteligencia Computacional - FICH - UNL Resumen: propagación hacia adelante φ(vI 1) φ(vI 2) φ(vI 3) φ(vII 1 ) φ(vII 2 ) φ(vIII 1 ) x1 x2 y
  • 70. Inteligencia Computacional - FICH - UNL Resumen: propagación hacia adelante φ(vI 1) φ(vI 2) φ(vI 3) φ(vII 1 ) φ(vII 2 ) φ(vIII 1 ) x1 x2 y wI 11 wI 12 yI 1 = φ(wI 11x1 + wI 12x2 + wI 10(−1))
  • 71. Inteligencia Computacional - FICH - UNL Resumen: propagación hacia adelante φ(vI 1) φ(vI 2) φ(vI 3) φ(vII 1 ) φ(vII 2 ) φ(vIII 1 ) x1 x2 y wI 11 wI 12 yI 1 = φ(wI 11x1 + wI 12x2 + wI 10(−1)) x0 = −1 wI 10
  • 72. Inteligencia Computacional - FICH - UNL Resumen: propagación hacia adelante φ(vI 1) φ(vI 2) φ(vI 3) φ(vII 1 ) φ(vII 2 ) φ(vIII 1 ) x1 x2 y wI 21 wI 22 yI 2
  • 73. Inteligencia Computacional - FICH - UNL Resumen: propagación hacia adelante φ(vI 1) φ(vI 2) φ(vI 3) φ(vII 1 ) φ(vII 2 ) φ(vIII 1 ) x1 x2 y wI 31 wI 32 yI 3
  • 74. Inteligencia Computacional - FICH - UNL Resumen: propagación hacia adelante φ(vI 1) φ(vI 2) φ(vI 3) φ(vII 1 ) φ(vII 2 ) φ(vIII 1 ) x1 x2 y yII 1 = φ(wII 11yI 1 + wII 12yI 2+ +wII 13yI 3 − wII 10) yII 2
  • 75. Inteligencia Computacional - FICH - UNL Resumen: propagación hacia adelante φ(vI 1) φ(vI 2) φ(vI 3) φ(vII 1 ) φ(vII 2 ) φ(vIII 1 ) x1 x2 y yIII = φ(wIII 11yII 1 + +wIII 12yII 2 + −wIII 10)
  • 76. Inteligencia Computacional - FICH - UNL Resumen: propagación hacia atras φ(vI 1) φ(vI 2) φ(vI 3) φ(vII 1 ) φ(vII 2 ) φ(vIII 1 ) x1 x2 y
  • 77. Inteligencia Computacional - FICH - UNL Resumen: propagación hacia atras φ(vI 1) φ(vI 2) φ(vI 3) φ(vII 1 ) φ(vII 2 ) φ(vIII 1 ) x1 x2 e δIII = (d − y) 1 2 (1 + yIII) (1 − yIII)
  • 78. Inteligencia Computacional - FICH - UNL Resumen: propagación hacia atras φ(vI 1) φ(vI 2) φ(vI 3) φ(vII 1 ) φ(vII 2 ) φ(vIII 1 ) x1 x2 e δIII δII 1 = δIIIwIII 11 1 2 (1 + yII 1 )(1 − yII 1 )
  • 79. Inteligencia Computacional - FICH - UNL Resumen: propagación hacia atras φ(vI 1) φ(vI 2) φ(vI 3) φ(vII 1 ) φ(vII 2 ) φ(vIII 1 ) x1 x2 e δIII δII 1 = δIIIwIII 11 1 2 (1 + yII 1 )(1 − yII 1 ) δII 2
  • 80. Inteligencia Computacional - FICH - UNL Resumen: propagación hacia atras φ(vI 1) φ(vI 2) φ(vI 3) φ(vII 1 ) φ(vII 2 ) φ(vIII 1 ) x1 x2 e δIII δII 1 δII 2 δI 1 = (wII 11δII 1 + wII 12δII 2 )1 2 (1 + yI 1)(1 − yI 1)
  • 81. Inteligencia Computacional - FICH - UNL Resumen: propagación hacia atras φ(vI 1) φ(vI 2) φ(vI 3) φ(vII 1 ) φ(vII 2 ) φ(vIII 1 ) x1 x2 e δIII δII 1 δII 2 δI 1 δI 2 δI 3
  • 82. Inteligencia Computacional - FICH - UNL Resumen: ajuste de pesos φ(vI 1) φ(vI 2) φ(vI 3) φ(vII 1 ) φ(vII 2 ) φ(vIII 1 ) x1 x2 y δI 1 δI 2 δI 3 δII 1 δII 2 δIII
  • 83. Inteligencia Computacional - FICH - UNL Resumen: ajuste de pesos φ(vI 1) φ(vI 2) φ(vI 3) φ(vII 1 ) φ(vII 2 ) φ(vIII 1 ) x1 x2 y δI 1 δI 2 δI 3 δII 1 δII 2 δIII ∆wI 11 = µδI 1x1
  • 84. Inteligencia Computacional - FICH - UNL Resumen: ajuste de pesos φ(vI 1) φ(vI 2) φ(vI 3) φ(vII 1 ) φ(vII 2 ) φ(vIII 1 ) x1 x2 y δI 1 δI 2 δI 3 δII 1 δII 2 δIII ∆wI 11 ∆wI 12 = µδI 1x2
  • 85. Inteligencia Computacional - FICH - UNL Resumen: ajuste de pesos φ(vI 1) φ(vI 2) φ(vI 3) φ(vII 1 ) φ(vII 2 ) φ(vIII 1 ) x1 x2 y δI 1 δI 2 δI 3 δII 1 δII 2 δIII ∆wI 11 ∆wI 12 x0 = −1 ∆wI 10 = µδI 1(−1)
  • 86. Inteligencia Computacional - FICH - UNL Resumen: ajuste de pesos φ(vI 1) φ(vI 2) φ(vI 3) φ(vII 1 ) φ(vII 2 ) φ(vIII 1 ) x1 x2 y δI 1 δI 2 δI 3 δII 1 δII 2 δIII ∆wI 21 ∆wI 22
  • 87. Inteligencia Computacional - FICH - UNL Resumen: ajuste de pesos φ(vI 1) φ(vI 2) φ(vI 3) φ(vII 1 ) φ(vII 2 ) φ(vIII 1 ) x1 x2 y δII 1 δII 2 δIII ∆wI 31 ∆wI 32 δI 3
  • 88. Inteligencia Computacional - FICH - UNL Resumen: ajuste de pesos φ(vI 1) φ(vI 2) φ(vI 3) φ(vII 1 ) φ(vII 2 ) φ(vIII 1 ) x1 x2 y δII 1 δII 2 δIII
  • 89. Inteligencia Computacional - FICH - UNL Resumen: ajuste de pesos φ(vI 1) φ(vI 2) φ(vI 3) φ(vII 1 ) φ(vII 2 ) φ(vIII 1 ) x1 x2 y δIII
  • 90. Inteligencia Computacional - FICH - UNL Resumen: ajuste de pesos φ(vI 1) φ(vI 2) φ(vI 3) φ(vII 1 ) φ(vII 2 ) φ(vIII 1 ) x1 x2 y