SlideShare a Scribd company logo
1 of 17
Download to read offline
協調荷押し問題の複雑性に関する考察 
複合情報学専攻 複雑系工学講座 
調和系工学研究室 修士2年 高橋 春樹 
Complexity of Cooperative Package Pushing Problem
背景 
MASの設計技術を向上させるため,適切な難易度の問題設定が必要 
MAS設 計 技 術 
適用問題の難易度 
問題の難易度を正しく測る指標が必要 
現状:「評価関数 = 問題の難易度」 
創発(GAなどによるMAS設計) 
評価関数に現れない性質も多く, 問題の難易度を正しく表しているとはいえない 
評価関数による難易度
目的 
既存の問題群の複雑性や難易度の順序関係を求め 複雑さの新しい指標の知見を得る 
問題の難易度 
既存の問題群 
発現したエージェント群の複雑性 
順序関係を導く 
新しい指標 
知見
システムの複雑性の指標 
情報エントロピーと相互情報量 
自己組織化するシステムにおける情報エントロピー 
・エントロピーの低い状態 : 情報を獲得して行動が自己組織化 
・エントロピーが増える : 情報を獲得していない,異なる安定状態に移行 
散逸構造論、非平衡開放系 
・エージェントと環境のエントロピーのやりとり[Parunak 2001] 
・非平衡開放系としてのMASにおけるエントロピーのふるまい[Guerin 2004] 
エージェントにとっての情報の価値を定量化する相互情報量 
・相互情報量が大きい : 情報がエージェントにとって意味のあるものとなっている 
・相互情報量が小さい : 情報がエージェントにとって意味のないものとなっている 
・エージェントの相互作用の定量化[西川 2004] 
・セルオートマトンの複雑さと計算能力の指標[Langton 1990] 
こうした指標を用いたシステム間の比較は行われていない
問題の難易度 
既存の問題群 
発現したエージェント群の複雑性 
順序関係を導く 
新しい指標 
知見 
研究概要
協調荷押し問題 概要 
MASの協調行動を促す問題設定 [大倉2008][片田2008][伍賀2007] 
均一な自律エージェント 
様々な設定 : エージェント数 , 荷の数 , 配置 
設定により,難易度がどのように変化するかは不明 
荷の数字は押すために必要なエージェント数 
ゴール 
5 
3 
2 
シミュレータとしてODEを使用
問題一覧 
下図のようなエージェント数,荷の配置でシミュレーション 
1 
1A1P 
2 
2A1P 
1 
2A2P 
1 
3A1P 
3 
3A2P 
1 
2 
3A3P 
1 
1 
1 
4A1P 
4 
4A2P 
2 
2 
4A4P 
1 
1 
1 
1 
5A1P 
5 
5A2P 
4 
1 
5A3P 
3 
1 
1 
5A5P 
1 
1 
1 
1 
1 
6A1P 
6 
6A2P 
3 
3 
6A3P 
2 
3 
1 
1 
1 
1 
1 
1 
1 
6A6P 
エージェント数n体,荷の数m個の設定をnAmPと表記する
針路 
x 
y 
α 
β 
γ 
最近のエージェント 
最近の荷 
Input0~7 
0or1 
IRセンサ 
Input8 
-1~1 
エージェントとの距離(2m以下) 
Input9 
-1~1 
〃(2m~5m) 
Input10 
-1~1 
〃(5m~) 
Input11 
-1~1 
エージェントとの角度sinα 
Input12 
-1~1 
〃cosα 
Input13 
-1~1 
荷との距離(2m以下) 
Input14 
-1~1 
〃(2m~5m) 
Input15 
-1~1 
〃(5m~) 
Input16 
-1~1 
最近の荷との角度sinβ 
Input17 
-1~1 
〃cosβ 
Input18 
-1~1 
エージェントの針路sinγ 
Input19 
-1~1 
〃cosγ 
Output0 
-1~1 
左モータの出力(目標角速度) 
Output1 
-1~1 
右モータの出力 
エージェントの入出力 
GAによって学習
各エージェント毎に観測された入出力の確率分布から 
情報エントロピーと相互情報量を計算 
入力 
出力 
IN={input0,input1, 
・・・,input19} 
OUT={out0,out1} 
PIN POUT 
H(OUT)  P(out) log P(out) 
情報エントロピー 相互情報量 
( ) ( | ) 
( ) ( ) 
( , ) 
( ; ) ( , ) log 
H OUT H OUT IN 
P out P input 
p out input 
I OUT IN p out input 
out in 
  
  
情報量の計算 
出力のエントロピー = 行動の多様性 入力と出力の相互情報量 =センサの重要性 
出力のエントロピーで割ることで入力が 
出力に与える割合を算出
各設定毎の情報量 
個別の設定毎に適用 (エージェント2体 荷1個の例) 
エージェント1の相互情報量 
エージェント2の相互情報量 
相互情報量から,各エージェントの 入力の処理の違いを比較 
2A1P
問題の難易度 
既存の問題群 
発現したエージェント群の複雑性 
順序関係を導く 
新しい指標 
知見 
研究概要
設定毎に発現したエージェント差 
各エージェントの相互情報量をベクトルとして捉え距離を算出 
A1 = {IR 1, Ar1 , Ad1 , Pr 1, Pd1 , D1} A2 = {IR2 , Ar2 , Ad2 , Pr2 , Pd2 , D2} 
「タスク達成に要求されるエージェントの多様さ」 =設定の複雑性 
とすると 
「一つの設定で発生したエージェントの差」=設定の複雑性 
2 
1 2 
2 
1 2 
2 
1 2 
2 
1 2 
2 
1 2 
2 
1 2 
( ) ( ) 
( ) (Pr Pr ) 
( ) ( ) 
Pd Pd d d 
Ad Ad 
IR IR Ar Ar 
   
    
    
エージェント間の距離= 
エージェント1の各相互情報量 エージェント2の各相互情報量
設定毎に現れるエージェントの違い 
各設定 
エージェント間の差が大きかった問題設定順に並べたもの 
エージェントや荷の数に応じて差が大きくなっていない 
エー ジェント間 の距 離
組み合わせとの照合 
荷に対してエージェントを割り当てる組み合わせの数で並べ替えたもの 
荷にエージェントを割り当てる組み合わせの数≠問題の複雑さ
動作からの考察 
エージェント2 
エージェント5 
最も相互情報量に差のあったエージェントを比較 
Goal Line 
2体のエージェントでは挙動やセンサ の使い方に差が見られる 
5Agents 3Packagesのデータ 
1つのニューラルネットワークに多様な 計算を要求される設定
出力のエントロピーと相互情報量から見る性質 
(行動の多様性) 
(センサの重要性) 
行動の多様性が求められる問題ほど入力の情報の価値が高い 
設定に応じた自己組織化 
全エージェントのエントロピーと相互情報量
問題の難易度 
既存の問題群 
発現したエージェント群の複雑性 
順序関係を導く 
新しい指標 
知見 
まとめ 
エージェントの数や荷の数で は決まらない 
エージェントの差が大きいほど 多様な計算を要求され,複雑

More Related Content

Viewers also liked (20)

teranishi m
teranishi mteranishi m
teranishi m
 
segawa_b
segawa_bsegawa_b
segawa_b
 
fukui b
fukui bfukui b
fukui b
 
matsuo m
matsuo mmatsuo m
matsuo m
 
kanehira m
kanehira mkanehira m
kanehira m
 
mori b
mori bmori b
mori b
 
okuyama b
okuyama bokuyama b
okuyama b
 
hayasaka b
hayasaka bhayasaka b
hayasaka b
 
nakano b
nakano bnakano b
nakano b
 
takadou m
takadou mtakadou m
takadou m
 
umeda_b
umeda_bumeda_b
umeda_b
 
yamauchi b
yamauchi byamauchi b
yamauchi b
 
kobayashi_m
kobayashi_mkobayashi_m
kobayashi_m
 
kobayashi b
kobayashi bkobayashi b
kobayashi b
 
tsuji m
tsuji mtsuji m
tsuji m
 
touya m
touya mtouya m
touya m
 
kin_m
kin_mkin_m
kin_m
 
touya b
touya btouya b
touya b
 
tsuji b
tsuji btsuji b
tsuji b
 
sugawara m
sugawara msugawara m
sugawara m
 

Similar to takahasi m

Ⅰ. Rの基礎 2017
Ⅰ. Rの基礎 2017Ⅰ. Rの基礎 2017
Ⅰ. Rの基礎 2017wada, kazumi
 
第1回R勉強会@東京
第1回R勉強会@東京第1回R勉強会@東京
第1回R勉強会@東京Yohei Sato
 
Rプログラミング02 データ入出力編
Rプログラミング02 データ入出力編Rプログラミング02 データ入出力編
Rプログラミング02 データ入出力編wada, kazumi
 
今さら聞けないHadoop勉強会第3回 セントラルソフト株式会社(20120327)
今さら聞けないHadoop勉強会第3回 セントラルソフト株式会社(20120327)今さら聞けないHadoop勉強会第3回 セントラルソフト株式会社(20120327)
今さら聞けないHadoop勉強会第3回 セントラルソフト株式会社(20120327)YoheiOkuyama
 
実行トレース間のデータの差異に基づくデータフロー解析手法の提案
実行トレース間のデータの差異に基づくデータフロー解析手法の提案実行トレース間のデータの差異に基づくデータフロー解析手法の提案
実行トレース間のデータの差異に基づくデータフロー解析手法の提案Kamiya Toshihiro
 
深層学習フレームワーク Chainer の開発と今後の展開
深層学習フレームワーク Chainer の開発と今後の展開深層学習フレームワーク Chainer の開発と今後の展開
深層学習フレームワーク Chainer の開発と今後の展開Seiya Tokui
 

Similar to takahasi m (8)

Ⅰ. Rの基礎 2017
Ⅰ. Rの基礎 2017Ⅰ. Rの基礎 2017
Ⅰ. Rの基礎 2017
 
第1回R勉強会@東京
第1回R勉強会@東京第1回R勉強会@東京
第1回R勉強会@東京
 
分類分析 (taxometric analysis)
分類分析 (taxometric analysis)分類分析 (taxometric analysis)
分類分析 (taxometric analysis)
 
Rプログラミング02 データ入出力編
Rプログラミング02 データ入出力編Rプログラミング02 データ入出力編
Rプログラミング02 データ入出力編
 
今さら聞けないHadoop勉強会第3回 セントラルソフト株式会社(20120327)
今さら聞けないHadoop勉強会第3回 セントラルソフト株式会社(20120327)今さら聞けないHadoop勉強会第3回 セントラルソフト株式会社(20120327)
今さら聞けないHadoop勉強会第3回 セントラルソフト株式会社(20120327)
 
W8PRML5.1-5.3
W8PRML5.1-5.3W8PRML5.1-5.3
W8PRML5.1-5.3
 
実行トレース間のデータの差異に基づくデータフロー解析手法の提案
実行トレース間のデータの差異に基づくデータフロー解析手法の提案実行トレース間のデータの差異に基づくデータフロー解析手法の提案
実行トレース間のデータの差異に基づくデータフロー解析手法の提案
 
深層学習フレームワーク Chainer の開発と今後の展開
深層学習フレームワーク Chainer の開発と今後の展開深層学習フレームワーク Chainer の開発と今後の展開
深層学習フレームワーク Chainer の開発と今後の展開
 

More from harmonylab

【修士論文】代替出勤者の選定業務における依頼順決定方法に関する研究   千坂知也
【修士論文】代替出勤者の選定業務における依頼順決定方法に関する研究   千坂知也【修士論文】代替出勤者の選定業務における依頼順決定方法に関する研究   千坂知也
【修士論文】代替出勤者の選定業務における依頼順決定方法に関する研究   千坂知也harmonylab
 
【修士論文】経路探索のための媒介中心性に基づく道路ネットワーク階層化手法に関する研究
【修士論文】経路探索のための媒介中心性に基づく道路ネットワーク階層化手法に関する研究【修士論文】経路探索のための媒介中心性に基づく道路ネットワーク階層化手法に関する研究
【修士論文】経路探索のための媒介中心性に基づく道路ネットワーク階層化手法に関する研究harmonylab
 
A Study on Decision Support System for Snow Removal Dispatch using Road Surfa...
A Study on Decision Support System for Snow Removal Dispatch using Road Surfa...A Study on Decision Support System for Snow Removal Dispatch using Road Surfa...
A Study on Decision Support System for Snow Removal Dispatch using Road Surfa...harmonylab
 
【卒業論文】印象タグを用いた衣服画像生成システムに関する研究
【卒業論文】印象タグを用いた衣服画像生成システムに関する研究【卒業論文】印象タグを用いた衣服画像生成システムに関する研究
【卒業論文】印象タグを用いた衣服画像生成システムに関する研究harmonylab
 
【卒業論文】大規模言語モデルを用いたマニュアル文章修正手法に関する研究
【卒業論文】大規模言語モデルを用いたマニュアル文章修正手法に関する研究【卒業論文】大規模言語モデルを用いたマニュアル文章修正手法に関する研究
【卒業論文】大規模言語モデルを用いたマニュアル文章修正手法に関する研究harmonylab
 
DLゼミ:Primitive Generation and Semantic-related Alignment for Universal Zero-S...
DLゼミ:Primitive Generation and Semantic-related Alignment for Universal Zero-S...DLゼミ:Primitive Generation and Semantic-related Alignment for Universal Zero-S...
DLゼミ:Primitive Generation and Semantic-related Alignment for Universal Zero-S...harmonylab
 
DLゼミ: MobileOne: An Improved One millisecond Mobile Backbone
DLゼミ: MobileOne: An Improved One millisecond Mobile BackboneDLゼミ: MobileOne: An Improved One millisecond Mobile Backbone
DLゼミ: MobileOne: An Improved One millisecond Mobile Backboneharmonylab
 
DLゼミ: Llama 2: Open Foundation and Fine-Tuned Chat Models
DLゼミ: Llama 2: Open Foundation and Fine-Tuned Chat ModelsDLゼミ: Llama 2: Open Foundation and Fine-Tuned Chat Models
DLゼミ: Llama 2: Open Foundation and Fine-Tuned Chat Modelsharmonylab
 
DLゼミ: ViTPose: Simple Vision Transformer Baselines for Human Pose Estimation
DLゼミ: ViTPose: Simple Vision Transformer Baselines for Human Pose EstimationDLゼミ: ViTPose: Simple Vision Transformer Baselines for Human Pose Estimation
DLゼミ: ViTPose: Simple Vision Transformer Baselines for Human Pose Estimationharmonylab
 
Voyager: An Open-Ended Embodied Agent with Large Language Models
Voyager: An Open-Ended Embodied Agent with Large Language ModelsVoyager: An Open-Ended Embodied Agent with Large Language Models
Voyager: An Open-Ended Embodied Agent with Large Language Modelsharmonylab
 
DLゼミ: Ego-Body Pose Estimation via Ego-Head Pose Estimation
DLゼミ: Ego-Body Pose Estimation via Ego-Head Pose EstimationDLゼミ: Ego-Body Pose Estimation via Ego-Head Pose Estimation
DLゼミ: Ego-Body Pose Estimation via Ego-Head Pose Estimationharmonylab
 
ReAct: Synergizing Reasoning and Acting in Language Models
ReAct: Synergizing Reasoning and Acting in Language ModelsReAct: Synergizing Reasoning and Acting in Language Models
ReAct: Synergizing Reasoning and Acting in Language Modelsharmonylab
 
形態素解析を用いた帝国議会議事速記録の変遷に関する研究
形態素解析を用いた帝国議会議事速記録の変遷に関する研究形態素解析を用いた帝国議会議事速記録の変遷に関する研究
形態素解析を用いた帝国議会議事速記録の変遷に関する研究harmonylab
 
【卒業論文】深層生成モデルを用いたユーザ意図に基づく衣服画像の生成に関する研究
【卒業論文】深層生成モデルを用いたユーザ意図に基づく衣服画像の生成に関する研究【卒業論文】深層生成モデルを用いたユーザ意図に基づく衣服画像の生成に関する研究
【卒業論文】深層生成モデルを用いたユーザ意図に基づく衣服画像の生成に関する研究harmonylab
 
灯油タンク内の液面高計測を用いた 灯油残量推定システムに関する研究
灯油タンク内の液面高計測を用いた灯油残量推定システムに関する研究灯油タンク内の液面高計測を用いた灯油残量推定システムに関する研究
灯油タンク内の液面高計測を用いた 灯油残量推定システムに関する研究harmonylab
 
深層自己回帰モデルを用いた俳句の生成と評価に関する研究
深層自己回帰モデルを用いた俳句の生成と評価に関する研究深層自己回帰モデルを用いた俳句の生成と評価に関する研究
深層自己回帰モデルを用いた俳句の生成と評価に関する研究harmonylab
 
競輪におけるレーティングシステムを用いた予想記事生成に関する研究
競輪におけるレーティングシステムを用いた予想記事生成に関する研究競輪におけるレーティングシステムを用いた予想記事生成に関する研究
競輪におけるレーティングシステムを用いた予想記事生成に関する研究harmonylab
 
【卒業論文】B2Bオークションにおけるユーザ別 入札行動予測に関する研究
【卒業論文】B2Bオークションにおけるユーザ別 入札行動予測に関する研究【卒業論文】B2Bオークションにおけるユーザ別 入札行動予測に関する研究
【卒業論文】B2Bオークションにおけるユーザ別 入札行動予測に関する研究harmonylab
 
A Study on Estimation of Household Kerosene Consumption for Optimization of D...
A Study on Estimation of Household Kerosene Consumption for Optimization of D...A Study on Estimation of Household Kerosene Consumption for Optimization of D...
A Study on Estimation of Household Kerosene Consumption for Optimization of D...harmonylab
 
マルチエージェント深層強化学習による自動運転車両の追越行動の獲得に関する研究
マルチエージェント深層強化学習による自動運転車両の追越行動の獲得に関する研究マルチエージェント深層強化学習による自動運転車両の追越行動の獲得に関する研究
マルチエージェント深層強化学習による自動運転車両の追越行動の獲得に関する研究harmonylab
 

More from harmonylab (20)

【修士論文】代替出勤者の選定業務における依頼順決定方法に関する研究   千坂知也
【修士論文】代替出勤者の選定業務における依頼順決定方法に関する研究   千坂知也【修士論文】代替出勤者の選定業務における依頼順決定方法に関する研究   千坂知也
【修士論文】代替出勤者の選定業務における依頼順決定方法に関する研究   千坂知也
 
【修士論文】経路探索のための媒介中心性に基づく道路ネットワーク階層化手法に関する研究
【修士論文】経路探索のための媒介中心性に基づく道路ネットワーク階層化手法に関する研究【修士論文】経路探索のための媒介中心性に基づく道路ネットワーク階層化手法に関する研究
【修士論文】経路探索のための媒介中心性に基づく道路ネットワーク階層化手法に関する研究
 
A Study on Decision Support System for Snow Removal Dispatch using Road Surfa...
A Study on Decision Support System for Snow Removal Dispatch using Road Surfa...A Study on Decision Support System for Snow Removal Dispatch using Road Surfa...
A Study on Decision Support System for Snow Removal Dispatch using Road Surfa...
 
【卒業論文】印象タグを用いた衣服画像生成システムに関する研究
【卒業論文】印象タグを用いた衣服画像生成システムに関する研究【卒業論文】印象タグを用いた衣服画像生成システムに関する研究
【卒業論文】印象タグを用いた衣服画像生成システムに関する研究
 
【卒業論文】大規模言語モデルを用いたマニュアル文章修正手法に関する研究
【卒業論文】大規模言語モデルを用いたマニュアル文章修正手法に関する研究【卒業論文】大規模言語モデルを用いたマニュアル文章修正手法に関する研究
【卒業論文】大規模言語モデルを用いたマニュアル文章修正手法に関する研究
 
DLゼミ:Primitive Generation and Semantic-related Alignment for Universal Zero-S...
DLゼミ:Primitive Generation and Semantic-related Alignment for Universal Zero-S...DLゼミ:Primitive Generation and Semantic-related Alignment for Universal Zero-S...
DLゼミ:Primitive Generation and Semantic-related Alignment for Universal Zero-S...
 
DLゼミ: MobileOne: An Improved One millisecond Mobile Backbone
DLゼミ: MobileOne: An Improved One millisecond Mobile BackboneDLゼミ: MobileOne: An Improved One millisecond Mobile Backbone
DLゼミ: MobileOne: An Improved One millisecond Mobile Backbone
 
DLゼミ: Llama 2: Open Foundation and Fine-Tuned Chat Models
DLゼミ: Llama 2: Open Foundation and Fine-Tuned Chat ModelsDLゼミ: Llama 2: Open Foundation and Fine-Tuned Chat Models
DLゼミ: Llama 2: Open Foundation and Fine-Tuned Chat Models
 
DLゼミ: ViTPose: Simple Vision Transformer Baselines for Human Pose Estimation
DLゼミ: ViTPose: Simple Vision Transformer Baselines for Human Pose EstimationDLゼミ: ViTPose: Simple Vision Transformer Baselines for Human Pose Estimation
DLゼミ: ViTPose: Simple Vision Transformer Baselines for Human Pose Estimation
 
Voyager: An Open-Ended Embodied Agent with Large Language Models
Voyager: An Open-Ended Embodied Agent with Large Language ModelsVoyager: An Open-Ended Embodied Agent with Large Language Models
Voyager: An Open-Ended Embodied Agent with Large Language Models
 
DLゼミ: Ego-Body Pose Estimation via Ego-Head Pose Estimation
DLゼミ: Ego-Body Pose Estimation via Ego-Head Pose EstimationDLゼミ: Ego-Body Pose Estimation via Ego-Head Pose Estimation
DLゼミ: Ego-Body Pose Estimation via Ego-Head Pose Estimation
 
ReAct: Synergizing Reasoning and Acting in Language Models
ReAct: Synergizing Reasoning and Acting in Language ModelsReAct: Synergizing Reasoning and Acting in Language Models
ReAct: Synergizing Reasoning and Acting in Language Models
 
形態素解析を用いた帝国議会議事速記録の変遷に関する研究
形態素解析を用いた帝国議会議事速記録の変遷に関する研究形態素解析を用いた帝国議会議事速記録の変遷に関する研究
形態素解析を用いた帝国議会議事速記録の変遷に関する研究
 
【卒業論文】深層生成モデルを用いたユーザ意図に基づく衣服画像の生成に関する研究
【卒業論文】深層生成モデルを用いたユーザ意図に基づく衣服画像の生成に関する研究【卒業論文】深層生成モデルを用いたユーザ意図に基づく衣服画像の生成に関する研究
【卒業論文】深層生成モデルを用いたユーザ意図に基づく衣服画像の生成に関する研究
 
灯油タンク内の液面高計測を用いた 灯油残量推定システムに関する研究
灯油タンク内の液面高計測を用いた灯油残量推定システムに関する研究灯油タンク内の液面高計測を用いた灯油残量推定システムに関する研究
灯油タンク内の液面高計測を用いた 灯油残量推定システムに関する研究
 
深層自己回帰モデルを用いた俳句の生成と評価に関する研究
深層自己回帰モデルを用いた俳句の生成と評価に関する研究深層自己回帰モデルを用いた俳句の生成と評価に関する研究
深層自己回帰モデルを用いた俳句の生成と評価に関する研究
 
競輪におけるレーティングシステムを用いた予想記事生成に関する研究
競輪におけるレーティングシステムを用いた予想記事生成に関する研究競輪におけるレーティングシステムを用いた予想記事生成に関する研究
競輪におけるレーティングシステムを用いた予想記事生成に関する研究
 
【卒業論文】B2Bオークションにおけるユーザ別 入札行動予測に関する研究
【卒業論文】B2Bオークションにおけるユーザ別 入札行動予測に関する研究【卒業論文】B2Bオークションにおけるユーザ別 入札行動予測に関する研究
【卒業論文】B2Bオークションにおけるユーザ別 入札行動予測に関する研究
 
A Study on Estimation of Household Kerosene Consumption for Optimization of D...
A Study on Estimation of Household Kerosene Consumption for Optimization of D...A Study on Estimation of Household Kerosene Consumption for Optimization of D...
A Study on Estimation of Household Kerosene Consumption for Optimization of D...
 
マルチエージェント深層強化学習による自動運転車両の追越行動の獲得に関する研究
マルチエージェント深層強化学習による自動運転車両の追越行動の獲得に関する研究マルチエージェント深層強化学習による自動運転車両の追越行動の獲得に関する研究
マルチエージェント深層強化学習による自動運転車両の追越行動の獲得に関する研究
 

takahasi m