SlideShare una empresa de Scribd logo
Arquitectura   Agentes Reactivos   Agentes con estado   Agentes l´gicos
                                                                 o        Agentes y metas   Agentes y utilidad   Referencias




                         Agentes y Sistemas Multi-Agentes
                         Arquitecturas y Programas Agente

                                   Dr. Alejandro Guerra-Hern´ndez
                                                            a

                                    Departamento de Inteligencia Artificial
                                   Facultad de F´ısica e Inteligencia Artificial
                                           Universidad Veracruzana
                                                aguerra@uv.mx
                                          http://www.uv.mx/aguerra


                              Maestr´ en Inteligencia Artificial 2011
                                    ıa
Arquitectura   Agentes Reactivos   Agentes con estado   Agentes l´gicos
                                                                 o        Agentes y metas    Agentes y utilidad   Referencias



Arquitectura abstracta (Wooldridge, 2002)


               El ambiente puede caracterizarse por medio de un conjunto
               finito de estados discretos posibles, definido como:

                                                    E = {e, e , . . . }
               La aptitud de un agente, se define como el conjunto finito de
               acciones que ´ste puede ejecutar:
                            e

                                                  Ac = {α, α , . . . }
               Una corrida de un agente en un ambiente se define como una
               secuencia finita de estados y acciones intercalados:

                                     0    α1     2     3α         α           α             αu−1
                             r = e0 −→ e1 −→ e2 −→ e3 −→ · · · −→ eu
Arquitectura   Agentes Reactivos   Agentes con estado   Agentes l´gicos
                                                                 o        Agentes y metas   Agentes y utilidad   Referencias



Corridas


               Sea R el conjunto de todas las posibles secuencias finitas
               sobre E y Ac.
               Definimos R Ac como el subconjunto de las corridas que
               terminan en una acci´n
                                   o
               y R E como el subconjunto de las corridas que terminan en un
               estado del ambiente.
               Para modelar el efecto de una acci´n en el ambiente, usamos
                                                 o
               una funci´n de transici´n (Fagin et al., 1995):
                        o             o

                                                   τ : R Ac → ℘(E )

               Si τ (r ) = ∅ para todo r ∈ R Ac , se dice que el sistema ha
               terminado su corrida.
Arquitectura   Agentes Reactivos   Agentes con estado    Agentes l´gicos
                                                                  o        Agentes y metas   Agentes y utilidad   Referencias



Ambiente y Agentes



               Un ambiente se define como una tripleta Env = E , e0 , τ
               donde E es el conjunto de los posibles estados del ambiente,
               e0 ∈ E es un estado inicial y τ es la funci´n de transici´n de
                                                          o             o
               estados.
               Los agentes se modelan como funciones que mapean corridas
               que terminan en un estado del ambiente, a acciones:

                                                        Ag : R E → Ac
Arquitectura   Agentes Reactivos   Agentes con estado   Agentes l´gicos
                                                                 o        Agentes y metas   Agentes y utilidad   Referencias



Sistema Agente


               Un sistema agente es una tupla conformada por un agente y
               un ambiente.
               El conjunto de posibles corridas del agente Ag en el ambiente
               Env se denota como R(Ag , Env )
               Una secuencia de la forma: (e0 , α0 , e1 , α1 , e2 , . . . ) representa
               una corrida del agente Ag en el ambiente Env si y s´lo si      o
               Env = E , e0 , τ ; α0 = Ag (e0 ); y para u > 0:

                                           eu ∈ τ ((e0 , α0 , . . . , αu−1 ))
               y
                                            αu = Ag ((e0 , α0 , . . . , eu ))
Arquitectura   Agentes Reactivos   Agentes con estado   Agentes l´gicos
                                                                 o        Agentes y metas   Agentes y utilidad   Referencias



Programa de agente



               Puesto que nuestra tarea es implementar programas de
               agente, podemos usar la formalizaci´n propuesta para definir
                                                   o
               un programa de agente que acepte percepciones de su
               ambiente y regrese acciones sobre ´ste.
                                                 e
                Agente basado en mapeo ideal
                 1: function Agente-Mapeo-Ideal(p)                              p es una percepci´n.
                                                                                                 o
                 2:    percepciones ← percepciones ∪ p
                 3:    acci o n ← busca(percepciones, mapeo)
                            ´                                                     mapeo predefinido.
                 4:    return acci o n
                                   ´
                 5: end function
Arquitectura   Agentes Reactivos   Agentes con estado   Agentes l´gicos
                                                                 o        Agentes y metas   Agentes y utilidad   Referencias



Programa de ambiente


               Un programa b´sico de ambiente ilustra la relaci´n entre ´ste
                               a                               o        e
               y los agentes situados en ´l.
                                         e
                Ambiente
                 1: procedure Ambiente(e, τ, ags, fin)        e Estado incial del ambiente.
                 2:    repeat
                 3:        for all ag ∈ ags do                  ags Conjunto de agentes.
                 4:            p(ag ) ← percibir (ag , e)
                 5:        end for
                 6:        for all ag ∈ ags do
                 7:            acci o n(ag ) ← ag (p(ag ))
                                    ´
                 8:        end for
                 9:        e ← τ ( ag ∈ags acci o n(ag ))
                                                ´                 τ Funci´n de transici´n.
                                                                         o             o
                10:     until fin(e)                        fin Predicado de fin de corrida.
                11: end procedure
Arquitectura   Agentes Reactivos   Agentes con estado   Agentes l´gicos
                                                                 o        Agentes y metas   Agentes y utilidad   Referencias



Percepci´n y acci´n
        o        o

               Sea Per un conjunto no vac´ de percepciones, la funci´n
                                          ıo                        o
               percibir/2 se define como el mapeo del conjunto de estados
               del ambiente E al conjunto de percepciones posibles Per :

                                                 percibir : E → Per

               La funci´n acci´n/1 se define entonces como el mapeo entre
                       o      o
               conjuntos de percepciones y el conjunto de acciones posibles
               del agente:
                                    acci o n : Per → Ac
                                         ´
               Un agente puede definirse ahora como la tupla:

                                              Ag = percibir , acci o n
                                                                   ´
Arquitectura   Agentes Reactivos   Agentes con estado   Agentes l´gicos
                                                                 o        Agentes y metas   Agentes y utilidad   Referencias



Propiedades de la percepci´n
                          o



               Sean e ∈ E y e ∈ E , tal que e = e pero
               percibir (e) = percibir (e ). Desde el punto de vista del agente,
               e y e son indistinguibles.
               Dados dos estados del ambiente e, e ∈ E ,
               percibir (e) = percibir (e ) ser´ denotado como e ∼ e .
                                               a
               El ambiente es accesible para el agente, si y s´lo si |E | = | ∼ |
                                                              o
               y entonces se dice que el agente es omnisciente.
               Si | ∼ | = 1 entonces se dice que el agente no tiene capacidad
               de percepci´n, es decir, el ambiente es percibido por el agente
                           o
               como si tuviera un estado unico.
                                           ´
Arquitectura   Agentes Reactivos   Agentes con estado   Agentes l´gicos
                                                                 o        Agentes y metas   Agentes y utilidad   Referencias



Agentes reactivos


               Los agentes reactivos, o reflex, seleccionan sus acciones
               basados en su percepci´n actual del ambiente, ignorando el
                                       o
               resto de su historia perceptual.
                                                               Agente

                                                  percepción              acción




                                           sensado                            actuación


                                                            Ambiente
Arquitectura   Agentes Reactivos   Agentes con estado   Agentes l´gicos
                                                                 o        Agentes y metas   Agentes y utilidad   Referencias



Agentes reactivos




               Basados en reglas percepci´n - acci´n.
                                         o        o
                Programa de agente reactivo
                 1: function Agente-Reactivo(e)
                 2:    estado ← percibir (e)
                 3:    regla ← selecci o nAcci o n(estado, reglas)
                                        ´      ´                                  reglas predefinidas.
                 4:    acci o n ← acci o nRegla(regla)
                            ´          ´
                 5:    return acci o n
                                   ´
                 6: end function
Arquitectura   Agentes Reactivos   Agentes con estado   Agentes l´gicos
                                                                 o        Agentes y metas   Agentes y utilidad   Referencias



Limitaciones de los agentes reactivos




               Aunque hay otras maneras de implementar agentes reactivos
               (arquitectura subsumida, redes de comportamiento, etc.),
               todos comparten una limitaci´n formal: producen un
                                             o
               comportamiento racional, s´lo si la decisi´n correcta puede
                                           o             o
               obtenerse a partir de la percepci´n actual del agente.
                                                o
               Esto es, su comportamiento es correcto si, y s´lo si, el
                                                             o
               ambiente es observable o efectivamente observable.
Arquitectura   Agentes Reactivos   Agentes con estado   Agentes l´gicos
                                                                 o        Agentes y metas   Agentes y utilidad   Referencias



Estado interno

               La forma m´s eficiente de enfrentar un ambiente inaccesible
                           a
               es llevando un registro de lo percibido, de forma que el agente
               tenga acceso mediante este registro, a lo que en cierto
               momento ya no puede percibir.
               Sea I el conjunto de estados internos posibles de un agente.
               Redefinimos la funci´n acci´n para mapear estados internos a
                                   o       o
               acciones posibles:
                                      acci o n : I → Ac
                                           ´
               Una nueva funci´n siguiente/2, mapea estados internos y
                               o
               percepciones a estados internos. Se usa para actualizar el
               estado interno del agente:

                                              siguiente : I × Per → I
Arquitectura   Agentes Reactivos   Agentes con estado   Agentes l´gicos
                                                                 o         Agentes y metas     Agentes y utilidad   Referencias



Agentes con estado interno


               Un agente con estado interno interactua con su ambiente
               como se muestra.
                                                              Ambiente             actuación

                                     sensado
                                                               Agente

                                                 percepción                      acción



                                                  Siguiente             Estado
Arquitectura   Agentes Reactivos   Agentes con estado   Agentes l´gicos
                                                                 o        Agentes y metas   Agentes y utilidad   Referencias



Programa de agente con estado



               El programa de un agente con estado es muy parecido al de
               un agente reactivo:
                Programa de agente con estado
                 1: function Agente-Con-Estado(e)                                                  e∈E
                 2:    p ← percibir (e)
                 3:    estado ← siguiente(estado, p)
                 4:    regla ← selecci o nAcci o n(estado, reglas)
                                       ´       ´                                  reglas predefinidas.
                 5:    acci o n ← Acci o nRegla(regla)
                            ´          ´
                 6:    return acci o n
                                   ´
                 7: end function
Arquitectura   Agentes Reactivos   Agentes con estado   Agentes l´gicos
                                                                 o        Agentes y metas   Agentes y utilidad   Referencias



Enfoque IA tradicional



               El comportamiento racional puede obtenerse a partir de una
               representaci´n simb´lica del ambiente y el comportamiento
                           o      o
               deseado.
               El agente manipular´ sint´cticamente esta representaci´n para
                                  a     a                            o
               actuar.
               Llevada al extremo, esta aproximaci´n nos lleva a formular el
                                                  o
               estado de un agente como un conjunto f´rmulas l´gicas y la
                                                      o         o
               selecci´n de acci´n como demostraci´n de teoremas o
                      o         o                  o
               deducci´n l´gica.
                       o o
Arquitectura   Agentes Reactivos   Agentes con estado   Agentes l´gicos
                                                                 o        Agentes y metas   Agentes y utilidad   Referencias



Agentes e inferencia


               Sea L el conjunto de f´rmulas bien formadas en la l´gica de
                                     o                            o
               primer orden cl´sica.
                              a
               El conjunto de bases de conocimiento en L se define como
               D = ℘(L), es decir, el conjunto de conjuntos de fbf en L. Los
               elementos de D se denotan ∆, ∆1 , . . .
               El estado interno del agente es siempre un miembro de D. El
               proceso de decisi´n del agente especifica mediante un
                                o
               conjunto de reglas de inferencia ρ.
               Escribimos ∆            ρ   ψ si la fbf ψ puede ser validada en ∆.
               Definimos la funci´n siguiente/2 del agente como:
                                o

                                             siguiente : D × Per → D
Arquitectura   Agentes Reactivos   Agentes con estado   Agentes l´gicos
                                                                 o        Agentes y metas   Agentes y utilidad   Referencias



Selecci´n de acci´n como inferencia
       o         o


               La inferencia se usa para computar la selecci´n de acci´n de
                                                            o         o
               los agentes l´gicos:
                            o
                  Selecci´n de acci´n para agente l´gico
                         o         o               o
                   1: function Seleccion-Accion(∆ : D, Ac)
                                        ´      ´                                       Ac Acciones.
                   2:    for all a ∈ Ac do
                   3:        if ∆ ρ ejecuta(a) then                                    ρ predefinida.
                   4:            return a
                   5:        end if
                   6:    end for
                   7:    for all a ∈ Ac do
                   8:        if ∆ ρ ¬ejecuta(a) then
                   9:            return a
                  10:         end if
                  11:     end for
                  12:     return null
                  13: end function
Arquitectura   Agentes Reactivos   Agentes con estado   Agentes l´gicos
                                                                 o        Agentes y metas   Agentes y utilidad   Referencias



Metas


               Las metas describen situaciones deseables para un agente, y
               se definen como cuerpos de conocimiento.
               Esta concepci´n de las metas est´ relacionada con el concepto
                              o                  a
               de espacio de estados de un problema compuesto por un
               estado inicial del ambiente, e0 ∈ E ; por un conjunto de
               operadores o acciones que el agente puede ejecutar para
               cambiar de estado; y un espacio de estados deseables.
               Impl´ıcita en la arquitectura del agente, est´ su “intenci´n” de
                                                            a            o
               ejecutar las acciones que el “cree” le garantizan satisfacer
               cualquiera de sus metas. Esto se conoce en filosof´ como
                                                                    ıa
               silogismo pr´ctico.
                            a
Arquitectura   Agentes Reactivos   Agentes con estado   Agentes l´gicos
                                                                 o        Agentes y metas   Agentes y utilidad   Referencias



Las metas de un agente

               Especificaci´n basada en predicados:
                          o

                                                    Ψ : R → {0, 1}

               Una corrida r ∈ R satisface la especificaci´n ssi Ψ(r ) = 1.
                                                         o
               Un ambiente de tareas se define entonces como el par
                Env , Ψ .
               Dado un ambiente de tareas, la siguiente expresi´n:
                                                               o

                              RΨ (Ag , Env ) = {r |r ∈ R(Ag , Env ) ∧ Ψ(r )}

               denota el conjunto de todas las corridas del agente Ag en
               el ambiente Env que satisfacen la tarea especificada
               por Ψ.
Arquitectura   Agentes Reactivos   Agentes con estado   Agentes l´gicos
                                                                 o        Agentes y metas   Agentes y utilidad   Referencias



Metas y ´xito
        e




               Podemos expresar que un agente Ag tiene ´xito en el
                                                       e
               ambiente de tareas Env , Ψ de dos maneras diferentes:
                      ∀r ∈ R(Ag , Env ) tenemos que Ψ(r ), lo que puede verse como
                      una especificaci´n pesimista de ´xito, puesto que el agente
                                       o               e
                      tiene ´xito unicamente si todas sus corridas satisfacen Ψ;
                            e     ´
                      ∃r ∈ R(Ag , Env ) tal que Ψ(r ), lo cual es una versi´n optimista
                                                                           o
                      de la definici´n de ´xito, puesto que especifica que el agente
                                    o     e
                      tiene ´xito si al menos una de sus corridas safisface Ψ.
                            e
Arquitectura   Agentes Reactivos   Agentes con estado   Agentes l´gicos
                                                                 o        Agentes y metas   Agentes y utilidad   Referencias



Utilidad


               Una utilidad es un valor num´rico que denota la bondad de un
                                           e
               estado del ambiente.
               Impl´
                   ıcitamente, un agente tiene la “intenci´n” de alcanzar
                                                          o
               aquellos estados que maximizan su utilidad a largo t´rmino.
                                                                   e
               La especificaci´n de una tarea en este enfoque corresponde
                              o
               simplemente a una funci´n utilidad u : E → la cual asocia
                                        o
               valores reales a cada estado del ambiente.
               Por ejemplo, la utilidad para una corrida r de un agente filtro
               de spam, puede definirse como:

                                                         SpamFiltrado(r )
                                            u(r ) =
                                                         SpamRecibido(r )
Arquitectura   Agentes Reactivos   Agentes con estado   Agentes l´gicos
                                                                 o        Agentes y metas   Agentes y utilidad   Referencias



Agentes ´ptimos
        o


               Si la funci´n de utilidad u tiene alg´n l´
                          o                         u ımite superior, por ej.,
               ∃k k ∈ tal que ∀r ∈ R.u(r ) ≤ k, entonces es posible hablar
               de agentes que maximizan la utilidad esperada.
               Definamos P(r |Ag , Env ), es evidente que:

                                                           P(r |Ag , Env ) = 1
                                         r ∈R(Ag ,Env )

               Entonces el agente ´ptimo Agopt entre el conjunto de agentes
                                  o
               posibles AG en el ambiente Env est´ definido como:
                                                 a

                          Agopt = arg m´x
                                       a                                   u(r )P(r |Ag , Env )
                                              Ag ∈AG
                                                        r ∈R(Ag ,Env )
Arquitectura   Agentes Reactivos   Agentes con estado   Agentes l´gicos
                                                                 o        Agentes y metas   Agentes y utilidad   Referencias



Racionalidad acotada



               Los agentes enfrentan limitaciones temporales y tienen
               capacidades limitadas de deliberaci´n, por lo que propone el
                                                  o
               estudio de una racionalidad acotada.
               Stuart Russell et al., introducen el concepto de agente ´ptimo
                                                                       o
               acotado, donde AGm representa el conjunto de agentes que
               pueden ser implementados en una m´quina m.
                                                     a
               Esta conceptualizaci´n de agente racional nos dice las
                                   o
               propiedades del agente deseable Agopt , pero no nos dice c´mo
                                                                         o
               implementar tal agente.
Arquitectura   Agentes Reactivos   Agentes con estado   Agentes l´gicos
                                                                 o        Agentes y metas   Agentes y utilidad   Referencias



Referencias

       Fagin, R., Halpern, J. Y., Moses, Y., & Vardi, M. Y. (1995). Reasoning about
          Knowledge. Cambridge, MA., USA: MIT Press.
       Wooldridge, M. (2002). An Introduction to MultiAgent Systems. West Sussex,
         England: John Wiley & Sons, LTD.

Más contenido relacionado

Similar a 2011 sma-slides-02

Funciones trascendentes
Funciones trascendentes Funciones trascendentes
Funciones trascendentes
Maria Jose Abello
 
Funcionestrascendentesmatematica 160522004625
Funcionestrascendentesmatematica 160522004625Funcionestrascendentesmatematica 160522004625
Funcionestrascendentesmatematica 160522004625
beto7500
 
Composición de funciones - composición de funciones - composición de funciones
Composición de funciones - composición de funciones - composición de funcionesComposición de funciones - composición de funciones - composición de funciones
Composición de funciones - composición de funciones - composición de funciones
Gilder3
 
Estudio del espín mediante la notación de Dirac
Estudio del espín mediante la notación de DiracEstudio del espín mediante la notación de Dirac
Estudio del espín mediante la notación de Dirac
Javier García Molleja
 
AEP19. Presentación 4: Funciones de variables aleatorias
AEP19. Presentación 4: Funciones de variables aleatoriasAEP19. Presentación 4: Funciones de variables aleatorias
AEP19. Presentación 4: Funciones de variables aleatorias
Francisco Sandoval
 
4 funciones variables_aleatorias
4 funciones variables_aleatorias4 funciones variables_aleatorias
4 funciones variables_aleatorias
Francisco Sandoval
 
Funciones reales de variable real.
Funciones reales de variable real.Funciones reales de variable real.
Funciones reales de variable real.
Omar Suarez
 
Funciones Reales 1 Clases Matematicas I.pptx
Funciones Reales 1 Clases Matematicas I.pptxFunciones Reales 1 Clases Matematicas I.pptx
Funciones Reales 1 Clases Matematicas I.pptx
MichelleRojas57
 
FUNCIONES Y GRÁFICAS
FUNCIONES Y GRÁFICAS FUNCIONES Y GRÁFICAS
FUNCIONES Y GRÁFICAS
Alfredo Cabrera Ordaz
 
Unidad 4 funciones reales de varias variables
Unidad 4 funciones reales de varias variablesUnidad 4 funciones reales de varias variables
Unidad 4 funciones reales de varias variables
Tezca8723
 
Practica 08
Practica 08Practica 08
Practica 08
Arnold Rodriguez
 
Whinstone
WhinstoneWhinstone
Funciones de una Variable Real ccesa007
Funciones de una Variable Real  ccesa007Funciones de una Variable Real  ccesa007
Funciones de una Variable Real ccesa007
Demetrio Ccesa Rayme
 
Whinstone
WhinstoneWhinstone
Teoria y Problemas de Funciones de una Variable Real ccesa007
Teoria y Problemas de Funciones de una Variable Real  ccesa007Teoria y Problemas de Funciones de una Variable Real  ccesa007
Teoria y Problemas de Funciones de una Variable Real ccesa007
Demetrio Ccesa Rayme
 
clase de matlab
clase  de   matlabclase  de   matlab
clase de matlab
Fernando Vallejo
 
Didactica critica funciones reales
Didactica critica funciones realesDidactica critica funciones reales
Didactica critica funciones reales
Leo Monroy
 
sistema de ecuaciones con transformada de Laplace MG
sistema de ecuaciones con transformada de Laplace MGsistema de ecuaciones con transformada de Laplace MG
sistema de ecuaciones con transformada de Laplace MG
maiyelingh
 
R manual
R manualR manual
R manual
fre1305
 
Tp1 2006
Tp1 2006Tp1 2006
Tp1 2006
Luis Raigoso
 

Similar a 2011 sma-slides-02 (20)

Funciones trascendentes
Funciones trascendentes Funciones trascendentes
Funciones trascendentes
 
Funcionestrascendentesmatematica 160522004625
Funcionestrascendentesmatematica 160522004625Funcionestrascendentesmatematica 160522004625
Funcionestrascendentesmatematica 160522004625
 
Composición de funciones - composición de funciones - composición de funciones
Composición de funciones - composición de funciones - composición de funcionesComposición de funciones - composición de funciones - composición de funciones
Composición de funciones - composición de funciones - composición de funciones
 
Estudio del espín mediante la notación de Dirac
Estudio del espín mediante la notación de DiracEstudio del espín mediante la notación de Dirac
Estudio del espín mediante la notación de Dirac
 
AEP19. Presentación 4: Funciones de variables aleatorias
AEP19. Presentación 4: Funciones de variables aleatoriasAEP19. Presentación 4: Funciones de variables aleatorias
AEP19. Presentación 4: Funciones de variables aleatorias
 
4 funciones variables_aleatorias
4 funciones variables_aleatorias4 funciones variables_aleatorias
4 funciones variables_aleatorias
 
Funciones reales de variable real.
Funciones reales de variable real.Funciones reales de variable real.
Funciones reales de variable real.
 
Funciones Reales 1 Clases Matematicas I.pptx
Funciones Reales 1 Clases Matematicas I.pptxFunciones Reales 1 Clases Matematicas I.pptx
Funciones Reales 1 Clases Matematicas I.pptx
 
FUNCIONES Y GRÁFICAS
FUNCIONES Y GRÁFICAS FUNCIONES Y GRÁFICAS
FUNCIONES Y GRÁFICAS
 
Unidad 4 funciones reales de varias variables
Unidad 4 funciones reales de varias variablesUnidad 4 funciones reales de varias variables
Unidad 4 funciones reales de varias variables
 
Practica 08
Practica 08Practica 08
Practica 08
 
Whinstone
WhinstoneWhinstone
Whinstone
 
Funciones de una Variable Real ccesa007
Funciones de una Variable Real  ccesa007Funciones de una Variable Real  ccesa007
Funciones de una Variable Real ccesa007
 
Whinstone
WhinstoneWhinstone
Whinstone
 
Teoria y Problemas de Funciones de una Variable Real ccesa007
Teoria y Problemas de Funciones de una Variable Real  ccesa007Teoria y Problemas de Funciones de una Variable Real  ccesa007
Teoria y Problemas de Funciones de una Variable Real ccesa007
 
clase de matlab
clase  de   matlabclase  de   matlab
clase de matlab
 
Didactica critica funciones reales
Didactica critica funciones realesDidactica critica funciones reales
Didactica critica funciones reales
 
sistema de ecuaciones con transformada de Laplace MG
sistema de ecuaciones con transformada de Laplace MGsistema de ecuaciones con transformada de Laplace MG
sistema de ecuaciones con transformada de Laplace MG
 
R manual
R manualR manual
R manual
 
Tp1 2006
Tp1 2006Tp1 2006
Tp1 2006
 

2011 sma-slides-02

  • 1. Arquitectura Agentes Reactivos Agentes con estado Agentes l´gicos o Agentes y metas Agentes y utilidad Referencias Agentes y Sistemas Multi-Agentes Arquitecturas y Programas Agente Dr. Alejandro Guerra-Hern´ndez a Departamento de Inteligencia Artificial Facultad de F´ısica e Inteligencia Artificial Universidad Veracruzana aguerra@uv.mx http://www.uv.mx/aguerra Maestr´ en Inteligencia Artificial 2011 ıa
  • 2. Arquitectura Agentes Reactivos Agentes con estado Agentes l´gicos o Agentes y metas Agentes y utilidad Referencias Arquitectura abstracta (Wooldridge, 2002) El ambiente puede caracterizarse por medio de un conjunto finito de estados discretos posibles, definido como: E = {e, e , . . . } La aptitud de un agente, se define como el conjunto finito de acciones que ´ste puede ejecutar: e Ac = {α, α , . . . } Una corrida de un agente en un ambiente se define como una secuencia finita de estados y acciones intercalados: 0 α1 2 3α α α αu−1 r = e0 −→ e1 −→ e2 −→ e3 −→ · · · −→ eu
  • 3. Arquitectura Agentes Reactivos Agentes con estado Agentes l´gicos o Agentes y metas Agentes y utilidad Referencias Corridas Sea R el conjunto de todas las posibles secuencias finitas sobre E y Ac. Definimos R Ac como el subconjunto de las corridas que terminan en una acci´n o y R E como el subconjunto de las corridas que terminan en un estado del ambiente. Para modelar el efecto de una acci´n en el ambiente, usamos o una funci´n de transici´n (Fagin et al., 1995): o o τ : R Ac → ℘(E ) Si τ (r ) = ∅ para todo r ∈ R Ac , se dice que el sistema ha terminado su corrida.
  • 4. Arquitectura Agentes Reactivos Agentes con estado Agentes l´gicos o Agentes y metas Agentes y utilidad Referencias Ambiente y Agentes Un ambiente se define como una tripleta Env = E , e0 , τ donde E es el conjunto de los posibles estados del ambiente, e0 ∈ E es un estado inicial y τ es la funci´n de transici´n de o o estados. Los agentes se modelan como funciones que mapean corridas que terminan en un estado del ambiente, a acciones: Ag : R E → Ac
  • 5. Arquitectura Agentes Reactivos Agentes con estado Agentes l´gicos o Agentes y metas Agentes y utilidad Referencias Sistema Agente Un sistema agente es una tupla conformada por un agente y un ambiente. El conjunto de posibles corridas del agente Ag en el ambiente Env se denota como R(Ag , Env ) Una secuencia de la forma: (e0 , α0 , e1 , α1 , e2 , . . . ) representa una corrida del agente Ag en el ambiente Env si y s´lo si o Env = E , e0 , τ ; α0 = Ag (e0 ); y para u > 0: eu ∈ τ ((e0 , α0 , . . . , αu−1 )) y αu = Ag ((e0 , α0 , . . . , eu ))
  • 6. Arquitectura Agentes Reactivos Agentes con estado Agentes l´gicos o Agentes y metas Agentes y utilidad Referencias Programa de agente Puesto que nuestra tarea es implementar programas de agente, podemos usar la formalizaci´n propuesta para definir o un programa de agente que acepte percepciones de su ambiente y regrese acciones sobre ´ste. e Agente basado en mapeo ideal 1: function Agente-Mapeo-Ideal(p) p es una percepci´n. o 2: percepciones ← percepciones ∪ p 3: acci o n ← busca(percepciones, mapeo) ´ mapeo predefinido. 4: return acci o n ´ 5: end function
  • 7. Arquitectura Agentes Reactivos Agentes con estado Agentes l´gicos o Agentes y metas Agentes y utilidad Referencias Programa de ambiente Un programa b´sico de ambiente ilustra la relaci´n entre ´ste a o e y los agentes situados en ´l. e Ambiente 1: procedure Ambiente(e, τ, ags, fin) e Estado incial del ambiente. 2: repeat 3: for all ag ∈ ags do ags Conjunto de agentes. 4: p(ag ) ← percibir (ag , e) 5: end for 6: for all ag ∈ ags do 7: acci o n(ag ) ← ag (p(ag )) ´ 8: end for 9: e ← τ ( ag ∈ags acci o n(ag )) ´ τ Funci´n de transici´n. o o 10: until fin(e) fin Predicado de fin de corrida. 11: end procedure
  • 8. Arquitectura Agentes Reactivos Agentes con estado Agentes l´gicos o Agentes y metas Agentes y utilidad Referencias Percepci´n y acci´n o o Sea Per un conjunto no vac´ de percepciones, la funci´n ıo o percibir/2 se define como el mapeo del conjunto de estados del ambiente E al conjunto de percepciones posibles Per : percibir : E → Per La funci´n acci´n/1 se define entonces como el mapeo entre o o conjuntos de percepciones y el conjunto de acciones posibles del agente: acci o n : Per → Ac ´ Un agente puede definirse ahora como la tupla: Ag = percibir , acci o n ´
  • 9. Arquitectura Agentes Reactivos Agentes con estado Agentes l´gicos o Agentes y metas Agentes y utilidad Referencias Propiedades de la percepci´n o Sean e ∈ E y e ∈ E , tal que e = e pero percibir (e) = percibir (e ). Desde el punto de vista del agente, e y e son indistinguibles. Dados dos estados del ambiente e, e ∈ E , percibir (e) = percibir (e ) ser´ denotado como e ∼ e . a El ambiente es accesible para el agente, si y s´lo si |E | = | ∼ | o y entonces se dice que el agente es omnisciente. Si | ∼ | = 1 entonces se dice que el agente no tiene capacidad de percepci´n, es decir, el ambiente es percibido por el agente o como si tuviera un estado unico. ´
  • 10. Arquitectura Agentes Reactivos Agentes con estado Agentes l´gicos o Agentes y metas Agentes y utilidad Referencias Agentes reactivos Los agentes reactivos, o reflex, seleccionan sus acciones basados en su percepci´n actual del ambiente, ignorando el o resto de su historia perceptual. Agente percepción acción sensado actuación Ambiente
  • 11. Arquitectura Agentes Reactivos Agentes con estado Agentes l´gicos o Agentes y metas Agentes y utilidad Referencias Agentes reactivos Basados en reglas percepci´n - acci´n. o o Programa de agente reactivo 1: function Agente-Reactivo(e) 2: estado ← percibir (e) 3: regla ← selecci o nAcci o n(estado, reglas) ´ ´ reglas predefinidas. 4: acci o n ← acci o nRegla(regla) ´ ´ 5: return acci o n ´ 6: end function
  • 12. Arquitectura Agentes Reactivos Agentes con estado Agentes l´gicos o Agentes y metas Agentes y utilidad Referencias Limitaciones de los agentes reactivos Aunque hay otras maneras de implementar agentes reactivos (arquitectura subsumida, redes de comportamiento, etc.), todos comparten una limitaci´n formal: producen un o comportamiento racional, s´lo si la decisi´n correcta puede o o obtenerse a partir de la percepci´n actual del agente. o Esto es, su comportamiento es correcto si, y s´lo si, el o ambiente es observable o efectivamente observable.
  • 13. Arquitectura Agentes Reactivos Agentes con estado Agentes l´gicos o Agentes y metas Agentes y utilidad Referencias Estado interno La forma m´s eficiente de enfrentar un ambiente inaccesible a es llevando un registro de lo percibido, de forma que el agente tenga acceso mediante este registro, a lo que en cierto momento ya no puede percibir. Sea I el conjunto de estados internos posibles de un agente. Redefinimos la funci´n acci´n para mapear estados internos a o o acciones posibles: acci o n : I → Ac ´ Una nueva funci´n siguiente/2, mapea estados internos y o percepciones a estados internos. Se usa para actualizar el estado interno del agente: siguiente : I × Per → I
  • 14. Arquitectura Agentes Reactivos Agentes con estado Agentes l´gicos o Agentes y metas Agentes y utilidad Referencias Agentes con estado interno Un agente con estado interno interactua con su ambiente como se muestra. Ambiente actuación sensado Agente percepción acción Siguiente Estado
  • 15. Arquitectura Agentes Reactivos Agentes con estado Agentes l´gicos o Agentes y metas Agentes y utilidad Referencias Programa de agente con estado El programa de un agente con estado es muy parecido al de un agente reactivo: Programa de agente con estado 1: function Agente-Con-Estado(e) e∈E 2: p ← percibir (e) 3: estado ← siguiente(estado, p) 4: regla ← selecci o nAcci o n(estado, reglas) ´ ´ reglas predefinidas. 5: acci o n ← Acci o nRegla(regla) ´ ´ 6: return acci o n ´ 7: end function
  • 16. Arquitectura Agentes Reactivos Agentes con estado Agentes l´gicos o Agentes y metas Agentes y utilidad Referencias Enfoque IA tradicional El comportamiento racional puede obtenerse a partir de una representaci´n simb´lica del ambiente y el comportamiento o o deseado. El agente manipular´ sint´cticamente esta representaci´n para a a o actuar. Llevada al extremo, esta aproximaci´n nos lleva a formular el o estado de un agente como un conjunto f´rmulas l´gicas y la o o selecci´n de acci´n como demostraci´n de teoremas o o o o deducci´n l´gica. o o
  • 17. Arquitectura Agentes Reactivos Agentes con estado Agentes l´gicos o Agentes y metas Agentes y utilidad Referencias Agentes e inferencia Sea L el conjunto de f´rmulas bien formadas en la l´gica de o o primer orden cl´sica. a El conjunto de bases de conocimiento en L se define como D = ℘(L), es decir, el conjunto de conjuntos de fbf en L. Los elementos de D se denotan ∆, ∆1 , . . . El estado interno del agente es siempre un miembro de D. El proceso de decisi´n del agente especifica mediante un o conjunto de reglas de inferencia ρ. Escribimos ∆ ρ ψ si la fbf ψ puede ser validada en ∆. Definimos la funci´n siguiente/2 del agente como: o siguiente : D × Per → D
  • 18. Arquitectura Agentes Reactivos Agentes con estado Agentes l´gicos o Agentes y metas Agentes y utilidad Referencias Selecci´n de acci´n como inferencia o o La inferencia se usa para computar la selecci´n de acci´n de o o los agentes l´gicos: o Selecci´n de acci´n para agente l´gico o o o 1: function Seleccion-Accion(∆ : D, Ac) ´ ´ Ac Acciones. 2: for all a ∈ Ac do 3: if ∆ ρ ejecuta(a) then ρ predefinida. 4: return a 5: end if 6: end for 7: for all a ∈ Ac do 8: if ∆ ρ ¬ejecuta(a) then 9: return a 10: end if 11: end for 12: return null 13: end function
  • 19. Arquitectura Agentes Reactivos Agentes con estado Agentes l´gicos o Agentes y metas Agentes y utilidad Referencias Metas Las metas describen situaciones deseables para un agente, y se definen como cuerpos de conocimiento. Esta concepci´n de las metas est´ relacionada con el concepto o a de espacio de estados de un problema compuesto por un estado inicial del ambiente, e0 ∈ E ; por un conjunto de operadores o acciones que el agente puede ejecutar para cambiar de estado; y un espacio de estados deseables. Impl´ıcita en la arquitectura del agente, est´ su “intenci´n” de a o ejecutar las acciones que el “cree” le garantizan satisfacer cualquiera de sus metas. Esto se conoce en filosof´ como ıa silogismo pr´ctico. a
  • 20. Arquitectura Agentes Reactivos Agentes con estado Agentes l´gicos o Agentes y metas Agentes y utilidad Referencias Las metas de un agente Especificaci´n basada en predicados: o Ψ : R → {0, 1} Una corrida r ∈ R satisface la especificaci´n ssi Ψ(r ) = 1. o Un ambiente de tareas se define entonces como el par Env , Ψ . Dado un ambiente de tareas, la siguiente expresi´n: o RΨ (Ag , Env ) = {r |r ∈ R(Ag , Env ) ∧ Ψ(r )} denota el conjunto de todas las corridas del agente Ag en el ambiente Env que satisfacen la tarea especificada por Ψ.
  • 21. Arquitectura Agentes Reactivos Agentes con estado Agentes l´gicos o Agentes y metas Agentes y utilidad Referencias Metas y ´xito e Podemos expresar que un agente Ag tiene ´xito en el e ambiente de tareas Env , Ψ de dos maneras diferentes: ∀r ∈ R(Ag , Env ) tenemos que Ψ(r ), lo que puede verse como una especificaci´n pesimista de ´xito, puesto que el agente o e tiene ´xito unicamente si todas sus corridas satisfacen Ψ; e ´ ∃r ∈ R(Ag , Env ) tal que Ψ(r ), lo cual es una versi´n optimista o de la definici´n de ´xito, puesto que especifica que el agente o e tiene ´xito si al menos una de sus corridas safisface Ψ. e
  • 22. Arquitectura Agentes Reactivos Agentes con estado Agentes l´gicos o Agentes y metas Agentes y utilidad Referencias Utilidad Una utilidad es un valor num´rico que denota la bondad de un e estado del ambiente. Impl´ ıcitamente, un agente tiene la “intenci´n” de alcanzar o aquellos estados que maximizan su utilidad a largo t´rmino. e La especificaci´n de una tarea en este enfoque corresponde o simplemente a una funci´n utilidad u : E → la cual asocia o valores reales a cada estado del ambiente. Por ejemplo, la utilidad para una corrida r de un agente filtro de spam, puede definirse como: SpamFiltrado(r ) u(r ) = SpamRecibido(r )
  • 23. Arquitectura Agentes Reactivos Agentes con estado Agentes l´gicos o Agentes y metas Agentes y utilidad Referencias Agentes ´ptimos o Si la funci´n de utilidad u tiene alg´n l´ o u ımite superior, por ej., ∃k k ∈ tal que ∀r ∈ R.u(r ) ≤ k, entonces es posible hablar de agentes que maximizan la utilidad esperada. Definamos P(r |Ag , Env ), es evidente que: P(r |Ag , Env ) = 1 r ∈R(Ag ,Env ) Entonces el agente ´ptimo Agopt entre el conjunto de agentes o posibles AG en el ambiente Env est´ definido como: a Agopt = arg m´x a u(r )P(r |Ag , Env ) Ag ∈AG r ∈R(Ag ,Env )
  • 24. Arquitectura Agentes Reactivos Agentes con estado Agentes l´gicos o Agentes y metas Agentes y utilidad Referencias Racionalidad acotada Los agentes enfrentan limitaciones temporales y tienen capacidades limitadas de deliberaci´n, por lo que propone el o estudio de una racionalidad acotada. Stuart Russell et al., introducen el concepto de agente ´ptimo o acotado, donde AGm representa el conjunto de agentes que pueden ser implementados en una m´quina m. a Esta conceptualizaci´n de agente racional nos dice las o propiedades del agente deseable Agopt , pero no nos dice c´mo o implementar tal agente.
  • 25. Arquitectura Agentes Reactivos Agentes con estado Agentes l´gicos o Agentes y metas Agentes y utilidad Referencias Referencias Fagin, R., Halpern, J. Y., Moses, Y., & Vardi, M. Y. (1995). Reasoning about Knowledge. Cambridge, MA., USA: MIT Press. Wooldridge, M. (2002). An Introduction to MultiAgent Systems. West Sussex, England: John Wiley & Sons, LTD.