2011 sma-slides-02

Arquitectura Agentes Reactivos Agentes con estado Agentes l´gicos
o Agentes y metas Agentes y utilidad Referencias

Agentes y Sistemas Multi-Agentes
Arquitecturas y Programas Agente

Dr. Alejandro Guerra-Hernńdez
a

Departamento de Inteligencia Artificial
Facultad de F´ısica e Inteligencia Artificial
Universidad Veracruzana
aguerra@uv.mx
http://www.uv.mx/aguerra

Maestr´ en Inteligencia Artificial 2011
ıa


Arquitectura abstracta (Wooldridge, 2002)

El ambiente puede caracterizarse por medio de un conjunto
finito de estados discretos posibles, definido como:

E = {e, e , . . . }
La aptitud de un agente, se define como el conjunto finito de
acciones que ´ste puede ejecutar:
e

Ac = {α, α , . . . }
Una corrida de un agente en un ambiente se define como una
secuencia finita de estados y acciones intercalados:

0 α1 2 3α α α αu−1
r = e0 −→ e1 −→ e2 −→ e3 −→ · · · −→ eu


Corridas

Sea R el conjunto de todas las posibles secuencias finitas
sobre E y Ac.
Definimos R Ac como el subconjunto de las corridas que
terminan en una acciń
o
y R E como el subconjunto de las corridas que terminan en un
estado del ambiente.
Para modelar el efecto de una acciń en el ambiente, usamos
o
una funciń de transiciń (Fagin et al., 1995):
o o

τ : R Ac → ℘(E )

Si τ (r ) = ∅ para todo r ∈ R Ac , se dice que el sistema ha
terminado su corrida.


Ambiente y Agentes

Un ambiente se define como una tripleta Env = E , e0 , τ
donde E es el conjunto de los posibles estados del ambiente,
e0 ∈ E es un estado inicial y τ es la funciń de transiciń de
o o
estados.
Los agentes se modelan como funciones que mapean corridas
que terminan en un estado del ambiente, a acciones:

Ag : R E → Ac


Sistema Agente

Un sistema agente es una tupla conformada por un agente y
un ambiente.
El conjunto de posibles corridas del agente Ag en el ambiente
Env se denota como R(Ag , Env )
Una secuencia de la forma: (e0 , α0 , e1 , α1 , e2 , . . . ) representa
una corrida del agente Ag en el ambiente Env si y s´lo si o
Env = E , e0 , τ ; α0 = Ag (e0 ); y para u > 0:

eu ∈ τ ((e0 , α0 , . . . , αu−1 ))
y
αu = Ag ((e0 , α0 , . . . , eu ))


Programa de agente

Puesto que nuestra tarea es implementar programas de
agente, podemos usar la formalizaciń propuesta para definir
o
un programa de agente que acepte percepciones de su
ambiente y regrese acciones sobre ´ste.
e
Agente basado en mapeo ideal
1: function Agente-Mapeo-Ideal(p) p es una percepciń.
o
2: percepciones ← percepciones ∪ p
3: acci o n ← busca(percepciones, mapeo)
´ mapeo predefinido.
4: return acci o n
´
5: end function


Programa de ambiente

Un programa b´sico de ambiente ilustra la relaciń entre ´ste
a o e
y los agentes situados en ´l.
e
Ambiente
1: procedure Ambiente(e, τ, ags, fin) e Estado incial del ambiente.
2: repeat
3: for all ag ∈ ags do ags Conjunto de agentes.
4: p(ag ) ← percibir (ag , e)
5: end for
6: for all ag ∈ ags do
7: acci o n(ag ) ← ag (p(ag ))
´
8: end for
9: e ← τ ( ag ∈ags acci o n(ag ))
´ τ Funciń de transiciń.
o o
10: until fin(e) fin Predicado de fin de corrida.
11: end procedure


Percepciń y acciń
o o

Sea Per un conjunto no vac´ de percepciones, la funciń
ıo o
percibir/2 se define como el mapeo del conjunto de estados
del ambiente E al conjunto de percepciones posibles Per :

percibir : E → Per

La funciń acciń/1 se define entonces como el mapeo entre
o o
conjuntos de percepciones y el conjunto de acciones posibles
del agente:
acci o n : Per → Ac
´
Un agente puede definirse ahora como la tupla:

Ag = percibir , acci o n
´


Propiedades de la percepci´n
o

Sean e ∈ E y e ∈ E , tal que e = e pero
percibir (e) = percibir (e ). Desde el punto de vista del agente,
e y e son indistinguibles.
Dados dos estados del ambiente e, e ∈ E ,
percibir (e) = percibir (e ) ser´ denotado como e ∼ e .
a
El ambiente es accesible para el agente, si y s´lo si |E | = | ∼ |
o
y entonces se dice que el agente es omnisciente.
Si | ∼ | = 1 entonces se dice que el agente no tiene capacidad
de percepci´n, es decir, el ambiente es percibido por el agente
o
como si tuviera un estado unico.
´


Agentes reactivos

Los agentes reactivos, o reﬂex, seleccionan sus acciones
basados en su percepci´n actual del ambiente, ignorando el
o
resto de su historia perceptual.
Agente

percepción acción

sensado actuación

Ambiente


Agentes reactivos

Basados en reglas percepciń - acciń.
o o
Programa de agente reactivo
1: function Agente-Reactivo(e)
2: estado ← percibir (e)
3: regla ← selecci o nAcci o n(estado, reglas)
´ ´ reglas predefinidas.
4: acci o n ← acci o nRegla(regla)
´ ´
5: return acci o n
´
6: end function


Limitaciones de los agentes reactivos

Aunque hay otras maneras de implementar agentes reactivos
(arquitectura subsumida, redes de comportamiento, etc.),
todos comparten una limitaciń formal: producen un
o
comportamiento racional, s´lo si la decisiń correcta puede
o o
obtenerse a partir de la percepciń actual del agente.
o
Esto es, su comportamiento es correcto si, y s´lo si, el
o
ambiente es observable o efectivamente observable.


Estado interno

La forma m´s eficiente de enfrentar un ambiente inaccesible
a
es llevando un registro de lo percibido, de forma que el agente
tenga acceso mediante este registro, a lo que en cierto
momento ya no puede percibir.
Sea I el conjunto de estados internos posibles de un agente.
Redefinimos la funciń acciń para mapear estados internos a
o o
acciones posibles:
acci o n : I → Ac
´
Una nueva funciń siguiente/2, mapea estados internos y
o
percepciones a estados internos. Se usa para actualizar el
estado interno del agente:

siguiente : I × Per → I


Agentes con estado interno

Un agente con estado interno interactua con su ambiente
como se muestra.
Ambiente actuación

sensado
Agente

percepción acción

Siguiente Estado


Programa de agente con estado

El programa de un agente con estado es muy parecido al de
un agente reactivo:
Programa de agente con estado
1: function Agente-Con-Estado(e) e∈E
2: p ← percibir (e)
3: estado ← siguiente(estado, p)
4: regla ← selecci o nAcci o n(estado, reglas)
´ ´ reglas predeﬁnidas.
5: acci o n ← Acci o nRegla(regla)
´ ´
6: return acci o n
´
7: end function


Enfoque IA tradicional

El comportamiento racional puede obtenerse a partir de una
representaciń simb´lica del ambiente y el comportamiento
o o
deseado.
El agente manipular´ sintćticamente esta representaciń para
a a o
actuar.
Llevada al extremo, esta aproximaciń nos lleva a formular el
o
estado de un agente como un conjunto f´rmulas l´gicas y la
o o
selecciń de acciń como demostraciń de teoremas o
o o o
deducciń l´gica.
o o


Agentes e inferencia

Sea L el conjunto de f´rmulas bien formadas en la l´gica de
o o
primer orden cl´sica.
a
El conjunto de bases de conocimiento en L se define como
D = ℘(L), es decir, el conjunto de conjuntos de fbf en L. Los
elementos de D se denotan ∆, ∆1 , . . .
El estado interno del agente es siempre un miembro de D. El
proceso de decisiń del agente especifica mediante un
o
conjunto de reglas de inferencia ρ.
Escribimos ∆ ρ ψ si la fbf ψ puede ser validada en ∆.
Definimos la funciń siguiente/2 del agente como:
o

siguiente : D × Per → D


Selecciń de acciń como inferencia
o o

La inferencia se usa para computar la selecciń de acciń de
o o
los agentes l´gicos:
o
Selecciń de acciń para agente l´gico
o o o
1: function Seleccion-Accion(∆ : D, Ac)
´ ´ Ac Acciones.
2: for all a ∈ Ac do
3: if ∆ ρ ejecuta(a) then ρ predefinida.
4: return a
5: end if
6: end for
7: for all a ∈ Ac do
8: if ∆ ρ ¬ejecuta(a) then
9: return a
10: end if
11: end for
12: return null
13: end function


Metas

Las metas describen situaciones deseables para un agente, y
se definen como cuerpos de conocimiento.
Esta concepciń de las metas est´ relacionada con el concepto
o a
de espacio de estados de un problema compuesto por un
estado inicial del ambiente, e0 ∈ E ; por un conjunto de
operadores o acciones que el agente puede ejecutar para
cambiar de estado; y un espacio de estados deseables.
Impl´ıcita en la arquitectura del agente, est´ su “intenciń” de
a o
ejecutar las acciones que el “cree” le garantizan satisfacer
cualquiera de sus metas. Esto se conoce en filosof´ como
ıa
silogismo prćtico.
a


Las metas de un agente

Especificaciń basada en predicados:
o

Ψ : R → {0, 1}

Una corrida r ∈ R satisface la especificaciń ssi Ψ(r ) = 1.
o
Un ambiente de tareas se define entonces como el par
Env , Ψ .
Dado un ambiente de tareas, la siguiente expresiń:
o

RΨ (Ag , Env ) = {r |r ∈ R(Ag , Env ) ∧ Ψ(r )}

denota el conjunto de todas las corridas del agente Ag en
el ambiente Env que satisfacen la tarea especificada
por Ψ.


Metas y ´xito
e

Podemos expresar que un agente Ag tiene ´xito en el
e
ambiente de tareas Env , Ψ de dos maneras diferentes:
∀r ∈ R(Ag , Env ) tenemos que Ψ(r ), lo que puede verse como
una especificaciń pesimista de ´xito, puesto que el agente
o e
tiene ´xito unicamente si todas sus corridas satisfacen Ψ;
e ´
∃r ∈ R(Ag , Env ) tal que Ψ(r ), lo cual es una versiń optimista
o
de la definiciń de ´xito, puesto que especifica que el agente
o e
tiene ´xito si al menos una de sus corridas safisface Ψ.
e


Utilidad

Una utilidad es un valor num´rico que denota la bondad de un
e
estado del ambiente.
Impl´
ıcitamente, un agente tiene la “intenciń” de alcanzar
o
aquellos estados que maximizan su utilidad a largo t´rmino.
e
La especificaciń de una tarea en este enfoque corresponde
o
simplemente a una funciń utilidad u : E → la cual asocia
o
valores reales a cada estado del ambiente.
Por ejemplo, la utilidad para una corrida r de un agente filtro
de spam, puede definirse como:

SpamFiltrado(r )
u(r ) =
SpamRecibido(r )


Agentes ´ptimos
o

Si la funciń de utilidad u tiene algń l´
o u ımite superior, por ej.,
∃k k ∈ tal que ∀r ∈ R.u(r ) ≤ k, entonces es posible hablar
de agentes que maximizan la utilidad esperada.
Definamos P(r |Ag , Env ), es evidente que:

P(r |Ag , Env ) = 1
r ∈R(Ag ,Env )

Entonces el agente ´ptimo Agopt entre el conjunto de agentes
o
posibles AG en el ambiente Env est´ definido como:
a

Agopt = arg m´x
a u(r )P(r |Ag , Env )
Ag ∈AG
r ∈R(Ag ,Env )


Racionalidad acotada

Los agentes enfrentan limitaciones temporales y tienen
capacidades limitadas de deliberaci´n, por lo que propone el
o
estudio de una racionalidad acotada.
Stuart Russell et al., introducen el concepto de agente ´ptimo
o
acotado, donde AGm representa el conjunto de agentes que
pueden ser implementados en una m´quina m.
a
Esta conceptualizaci´n de agente racional nos dice las
o
propiedades del agente deseable Agopt , pero no nos dice c´mo
o
implementar tal agente.


Referencias

Fagin, R., Halpern, J. Y., Moses, Y., & Vardi, M. Y. (1995). Reasoning about
Knowledge. Cambridge, MA., USA: MIT Press.
Wooldridge, M. (2002). An Introduction to MultiAgent Systems. West Sussex,
England: John Wiley & Sons, LTD.

2011 sma-slides-02

Recomendados

Recomendados

Más contenido relacionado

Similar a 2011 sma-slides-02

Similar a 2011 sma-slides-02 (20)

2011 sma-slides-02