takahasi m

協調荷押し問題の複雑性に関する考察
複合情報学専攻複雑系工学講座
調和系工学研究室修士２年高橋春樹
Complexity of Cooperative Package Pushing Problem

背景
MASの設計技術を向上させるため，適切な難易度の問題設定が必要
MAS設計技術
適用問題の難易度
問題の難易度を正しく測る指標が必要
現状：「評価関数 = 問題の難易度」
創発(GAなどによるMAS設計)
評価関数に現れない性質も多く，問題の難易度を正しく表しているとはいえない
評価関数による難易度

目的
既存の問題群の複雑性や難易度の順序関係を求め複雑さの新しい指標の知見を得る
問題の難易度
既存の問題群
発現したエージェント群の複雑性
順序関係を導く
新しい指標
知見

システムの複雑性の指標
情報エントロピーと相互情報量
自己組織化するシステムにおける情報エントロピー
・エントロピーの低い状態：情報を獲得して行動が自己組織化
・エントロピーが増える : 情報を獲得していない，異なる安定状態に移行
散逸構造論、非平衡開放系
・エージェントと環境のエントロピーのやりとり[Parunak 2001]
・非平衡開放系としてのMASにおけるエントロピーのふるまい[Guerin 2004]
エージェントにとっての情報の価値を定量化する相互情報量
・相互情報量が大きい : 情報がエージェントにとって意味のあるものとなっている
・相互情報量が小さい : 情報がエージェントにとって意味のないものとなっている
・エージェントの相互作用の定量化[西川 2004]
・セルオートマトンの複雑さと計算能力の指標[Langton 1990]
こうした指標を用いたシステム間の比較は行われていない

問題の難易度
既存の問題群
新しい指標
知見
研究概要

協調荷押し問題概要
MASの協調行動を促す問題設定 [大倉2008][片田2008][伍賀2007]
均一な自律エージェント
様々な設定 : エージェント数 , 荷の数，配置
設定により，難易度がどのように変化するかは不明
荷の数字は押すために必要なエージェント数
ゴール
5
3
2
シミュレータとしてODEを使用

問題一覧
下図のようなエージェント数，荷の配置でシミュレーション
1
1A1P
2
2A1P
1
2A2P
1
3A1P
3
3A2P
1
2
3A3P
1
1
1
4A1P
4
4A2P
2
2
4A4P
1
1
1
1
5A1P
5
5A2P
4
1
5A3P
3
1
1
5A5P
1
1
1
1
1
6A1P
6
6A2P
3
3
6A3P
2
3
1
1
1
1
1
1
1
6A6P
エージェント数n体，荷の数m個の設定をnAmPと表記する

針路
x
y
α
β
γ
最近のエージェント
最近の荷
Input0~7
0or1
IRセンサ
Input8
-1~1
エージェントとの距離(2m以下)
Input9
-1~1
〃(2m~5m)
Input10
-1~1
〃(5m~)
Input11
-1~1
エージェントとの角度sinα
Input12
-1~1
〃cosα
Input13
-1~1
荷との距離(2m以下)
Input14
-1~1
〃(2m～5m)
Input15
-1~1
〃(5m～)
Input16
-1~1
最近の荷との角度sinβ
Input17
-1~1
〃cosβ
Input18
-1~1
エージェントの針路sinγ
Input19
-1~1
〃cosγ
Output0
-1~1
左モータの出力(目標角速度)
Output1
-1~1
右モータの出力
エージェントの入出力
GAによって学習

各エージェント毎に観測された入出力の確率分布から
情報エントロピーと相互情報量を計算
入力
出力
IN={input0,input1,
・・・,input19}
OUT={out0,out1}
PIN POUT
H(OUT)  P(out) log P(out)
情報エントロピー相互情報量
( ) ( | )
( ) ( )
( , )
( ; ) ( , ) log
H OUT H OUT IN
P out P input
p out input
I OUT IN p out input
out in
 
 
情報量の計算
出力のエントロピー = 行動の多様性入力と出力の相互情報量 =センサの重要性
出力のエントロピーで割ることで入力が
出力に与える割合を算出

各設定毎の情報量
個別の設定毎に適用 (エージェント2体荷１個の例)
エージェント1の相互情報量
エージェント2の相互情報量
相互情報量から，各エージェントの入力の処理の違いを比較
2A1P

設定毎に発現したエージェント差
各エージェントの相互情報量をベクトルとして捉え距離を算出
A1 = {IR 1, Ar1 , Ad1 , Pr 1, Pd1 , D1} A2 = {IR2 , Ar2 , Ad2 , Pr2 , Pd2 , D2}
「タスク達成に要求されるエージェントの多様さ」＝設定の複雑性
とすると
「一つの設定で発生したエージェントの差」＝設定の複雑性
2
1 2
2
1 2
2
1 2
2
1 2
2
1 2
2
1 2
( ) ( )
( ) (Pr Pr )
( ) ( )
Pd Pd d d
Ad Ad
IR IR Ar Ar
  
   
   
エージェント間の距離＝
エージェント1の各相互情報量エージェント2の各相互情報量

設定毎に現れるエージェントの違い
各設定
エージェント間の差が大きかった問題設定順に並べたもの
エージェントや荷の数に応じて差が大きくなっていない
エージェント間の距離

組み合わせとの照合
荷に対してエージェントを割り当てる組み合わせの数で並べ替えたもの
荷にエージェントを割り当てる組み合わせの数≠問題の複雑さ

動作からの考察
エージェント2
エージェント5
最も相互情報量に差のあったエージェントを比較
Goal Line
2体のエージェントでは挙動やセンサの使い方に差が見られる
5Agents 3Packagesのデータ
1つのニューラルネットワークに多様な計算を要求される設定

出力のエントロピーと相互情報量から見る性質
(行動の多様性)
(センサの重要性)
行動の多様性が求められる問題ほど入力の情報の価値が高い
設定に応じた自己組織化
全エージェントのエントロピーと相互情報量

問題の難易度
既存の問題群
新しい指標
知見
まとめ
エージェントの数や荷の数では決まらない
エージェントの差が大きいほど多様な計算を要求され，複雑

takahasi m

Recommended

Recommended

More Related Content

Viewers also liked

Viewers also liked (20)

Similar to takahasi m

Similar to takahasi m (8)

More from harmonylab

More from harmonylab (20)

takahasi m