Este documento presenta varios temas relacionados con sistemas adaptativos, incluyendo: 1) un ejemplo de entrenamiento de una red neuronal perceptrón, 2) un ejemplo de lógica difusa, 3) información sobre subastas y el protocolo Contract Net aplicado a un ejemplo de fútbol.
2. Ruta: Dobreta, Craiova, RimicaVilcea, Pitesti y Bucarest.
Redes neuronales. Dados los ejemplos de la Tabla 1, realiza la primer corrida de
entrenamiento para un perceptrón con la siguiente función de activación
escalonada:
f(u)= [ 1 si u >= 0, 0 de otra forma ]
Asume que todos los pesos inicialmente son 0, excepto el asociado al sesgo, que
tendrá valorinicial w0=1; la tasa de aprendizaje n=0.1. Recuerda también que x0=-
1.
Entradas Salidas
X0 X1 X2 X3 X4 X5 X6 Y u F(u)
1 -1 1 0 1 0 0 0 1 1 1
2 -1 1 0 1 1 0 0 1 1 1
3 -1 1 0 1 0 1 0 1 1 1
4 -1 1 1 0 0 1 1 1 1 1
5 -1 1 1 1 1 0 0 1 1 1
6 -1 1 0 0 0 1 1 1 1 1
7 -1 1 0 0 0 1 0 0 0 1
8 -1 0 1 1 1 0 1 1
9 -1 0 1 1 0 1 1 0
10 -1 0 0 0 1 1 0 0
11 -1 0 1 0 1 0 1 0
12 -1 0 0 0 1 0 1 0
13 -1 0 1 1 0 1 1 0
14 -1 0 1 1 1 0 0 0
Tabla 1. Ejemplos entrada—salida para un perceptrón.
Actualizar pesos
e= d(k) – y(k)
e= 1-1
e=0
Wnuevo= Wactual(k) + nx(k) e(k)
W = 0+ 0.1(1) (0)
W=0
Da el mismo peso del 1-6.
3. X0 X1 X2 X3 X4 X5 X6 Y u F(u)
7 -1 1 0 0 0 1 0 0 0 1
Actualizar pesos
e= d(k) – y(k)
e= 0-1
e=-1
W(nuevo)= Wactual(k) + nx(k) e(k)
Wx1 = 0+ 0.1(1) (-1)
Wx1= -0.1
W(nuevo)= Wactual(k) + nx(k) e(k)
Wx2 = 0+ 0.1(0) (-1)
Wx2= 0
W(nuevo)= Wactual(k) + nx(k) e(k)
Wx0 = 0+ 0.1(-1) (-1)
Wx0=0.1
Se modifican los pesos a -0.1, solo los que tengan como entrada 1 de la fila 7 y
peso de X0= 0.1.
Siguiente sustitución.
X0 X1 X2 X3 X4 X5 X6 Y u F(u)
7 -1 1 0 0 0 1 0 0 -0.1 0
Los pesos quedan igual.
Siguiente sustitución.
X0 X1 X2 X3 X4 X5 X6 Y u F(u)
8 -1 0 1 1 1 0 1 1 0.1 1
9 -1 0 1 1 0 1 1 0 0 1
Actualizar pesos
4. e= d(k) – y(k)
e= 0-1
e= -1
W(nuevo)= Wactual(k) + nx(k) e(k)
Wx1 = 0+ 0.1(0) (-1)
Wx1= 0
W(nuevo)= Wactual(k) + nx(k) e(k)
Wx2 = 0+ 0.1(1) (-1)
Wx2= -0.1
W(nuevo)= Wactual(k) + nx(k) e(k)
Wx0 = 0+ 0.1(-1) (-1)
Wx0=0.1
Los pesos de las entrada 1y 4 se modifica el peso a 0, X0 queda igual y los demás
e les modifica el peso a 0.1.
Siguiente sustitución.
X0 X1 X2 X3 X4 X5 X6 Y u F(u)
9 -1 0 1 1 0 1 1 0 -0.5 0
Los pesos quedan igual.
Siguiente sustitución.
X0 X1 X2 X3 X4 X5 X6 Y u F(u)
10 -1 0 0 0 1 1 0 0 0 1
Actualizar pesos
e= d(k) – y(k)
e= 0-1
e= -1
W(nuevo)= Wactual(k) + nx(k) e(k)
Wx1 = 0+ 0.1(0) (-1)
Wx1= 0
W(nuevo)= Wactual(k) + nx(k) e(k)
Wx4 = 0+ 0.1(1) (-1)
Wx4= -0.1
W(nuevo)= Wactual(k) + nx(k) e(k)
5. Wx0 = 0+ 0.1(-1) (-1)
Wx0=0.1
Se modifica el peso de X1,2,3,6 a 0, y x4 ; x5 quedan en -0.1 y X0 queda igual.
Siguiente sustitución.
X0 X1 X2 X3 X4 X5 X6 Y u F(u)
10 -1 0 0 0 1 1 0 0 -0.1 0
Los pesos quedan igual.
X0 X1 X2 X3 X4 X5 X6 Y u F(u)
11 -1 0 1 0 1 0 1 0 0 1
Actualizar pesos
e= d(k) – y(k)
e= 0-1
e= -1
W(nuevo)= Wactual(k) + nx(k) e(k)
Wx2 = 0+ 0.1(1) (-1)
Wx2= -0.1
W(nuevo)= Wactual(k) + nx(k) e(k)
Wx5 = 0+ 0.1(0) (-1)
Wx5= 0
W(nuevo)= Wactual(k) + nx(k) e(k)
Wx0 = 0+ 0.1(-1) (-1)
W=0.1
Los pesos quedaron en 0 para x1,3 y 5 ; para X0 quda igual y para x2,4 y 6 el
peso es .0.1.
Siguiente sustitución.
X0 X1 X2 X3 X4 X5 X6 Y u F(u)
11 -1 0 1 0 1 0 1 0 -0.2 0
Siguiente sustitución.
6. X0 X1 X2 X3 X4 X5 X6 Y u F(u)
12 -1 0 0 0 1 0 1 0 -0.1 0
13 -1 0 1 1 0 1 1 0 -0.1 0
14 -1 0 1 1 1 0 0 0 -0.1 0
LOGICA DIFUSA
U { 10,15,20,40} V { 1,5,10,25}
FRÍO { (10, 0.8),(15, 0.6),(20,0.3), (40,0.1)}
ALTO { (1,0.1), (5,0.2),(10, 0.5),(25,0.9)}
Implicación Mamdani
[ ((10,1),0.8), ((10,5),0.8), ((10,10),0.8), ((10,25),0.8)
((15,1),0.6), ((15,5),0.6), ((15,10),0.6), ((15,25),0.6)
((20,1),0.3), ((20,5),0.3), ((20,10),0.3), ((20,25).0.6)
((25,1),0.1), ((25,5),0.1), ((25,10),0.1), ((25,25),0.1)]
SISTEMA MULTIAGENTE
Subastas. Completa la siguiente tabla:
Subasta Precio que Estrategia Privacidad de Vulnerabilidad
paga ganador dominante ofertas
Inglesa El mas alto Incrementar A grito abierto Todos
oferta más conocen
alta. oferta.
Holandesa El menor Oferta A grito abierto Todos
descendiente conocen
ofertas
Vickey El más alto Ofrecer el Sobre cerrado No se
valor interno conocen otras
ofertas
CONTRACT NET.
En un juego de futbol, el agente jugador (J) desea realizar un centro. Para ello, se
vale del protocolo Contract Net y publica una tarea para los delanteros de su
7. equipo (D); cada agente delantero contesta indicando su distancia con respecto al
agente jugador, su distancia con respecto a la portería (P) y la cantidad de
defensas (F) adyacentes(considera 8-vecindad). Para escoger al delantero, el
jugador suma estas tres cantidades y prefiere la suma menor. Considera que las
distancias son Manhattan.
Contesta lo siguiente:
1. ¿Cuál es el agente contratante y cuáles son los agentes postores en este
caso?
R= Agente contratante J y postores D1,D2 y D3.
2. ¿Qué agentes responden a la publicación del agente jugador?
R=los tres
3. ¿Qué capacidades tienen los agentes delanteros?
R= D1-6.39, D2-6.23, D3-7.76.
4. ¿Cuál de los agentes es finalmente escogido para llevar a cabo la tarea?
R= D2
J (2,5)
D3 (5,4)
D2(3,3) F
D1 (1,2) F
P (3,1)
x
Delanteros Distancia a Distancia a Defensas Suma Total
Jugador (J) Portería (P) adyacentes (F)
D1 3.16 2.23 1 6.39
D2 2.23 2 2 6.23
D3 3.16 3.6 1 7.76