SlideShare una empresa de Scribd logo
1 de 31
Descargar para leer sin conexión
TSPに基づく共有資源の社会的
  利用モデルに関する研究
     北海道大学 工学部
     情報エレクトロニクス系
  情報工学コース 調和系工学研究室
     学部4年 小野 良太
背景
• インフラ、交通設備などの公共性が高い資源の利用法を考える
 ⇒共有資源




     例:渋滞
                   ハンチング現象




        本当にそうなのか?問題の構造を調査して
      どのような問題なのか分析する必要があるのでは?
関連研究
           A        A
            R       R
                R
            R       R
            Et Ex
テーマパーク問題[2003 川村]        道路交通における協調カーナビ[2006 山下]
共有資源と社会的利用
•   エージェント集合                                                 Eのべき集合
            A={ak| k = 1,2,...,m}
                                                                   E*
•   共有資源    E={ei| i = 1,2,...,n}
•   エージェントの取りうる戦略集合
            E*=2E
•   エージェントkの戦略
                     ek  E *
                      *                                        *         *
                                                              ek        e k
•   エージェントkのコスト
                         *    *
                    Ck (ek , ek )
•   ek  ek  
     *    *


    ① C (ek ,  )  C (ek , ek )  C I
          *             *    *
                                                       ek  ek
                                                        *    *

                                                                        ak以外の戦略
    ② C (e ,  )  C (e , e )  C
             *
             k
                           *
                           k
                                *
                                k
                                          D
                                                                           の集合
        | C (ek , ek )  C (ek ,  ) || ek  ek |
              *    *          *            *    *
共有資源利用におけるハイパーゲーム

• エージェントkが受けるサービス
      *
  S (ek )
• エージェントkの利得関数
 Pk  S (ek )  C (ek , ek )
          *         *    *


 PkI  S (ek )  C I (ek , ek )
           *           *    *

                                        エージェントが参加して
 PkD  S (ek )  C D (ek , ek )
           *           *    *
                                        いるゲーム
                                   考エ
            他の全エージェントの関            えー         PkI   PkD
            数であるので観測が困難            方ジ         PII   PID
                                    ェ   PkI
                                    ン
                                    ト
                                    の   PkD   PDI   PDD
目的
• ゲーム理論の観点から共有資源の利用問題の解の構造を分析する
           仮説
                 P
                 PID
           PII



                       PDD
     PDI



• そのために…                       TSPを拡張した
  – シミュレーションで扱いやすい数理モデルを構築      モデルにより
  – ハイパーゲームを統一的に扱える問題
                                   実現
  – エージェント及び共有資源に対するスケーラビリティ
TSPの定式化
•   都市集合V
•   エッジ集合E   E={eij| i,j = 1,2,...,n}
•   コスト行列C
•   巡回路行列X



• 目的関数
共有資源型TSP
• エージェント集合A                               全都市を巡回する経路


• エージェントkの目的:     PkD  C D (ek , ek )
                              *    *
                                            最小化

                          共有資源のコスト


                                          同時にijを使うエージェント
 – |A|=1の時、従来型TSPと一致                      の数により変動
共有資源型TSPの定式化
• 時間t (t=1,2,…,n)       • tにおける追加コスト
• 巡回路行列X


                        • 追加コスト行列G
                     G  {g kij | i, j  1,2,..., n k  1,2,..., m}
                     g kij  dij (t )  cij


              目的関数
実験設計
•   目的:ゲーム理論の観点から共有資源の利用問題の解の構造を分析する
             仮説
                    P            ナッシュ均衡解
                    PID
                                 パレート解
              PII
                                   両方


                          PDD
       PDI




             全ての解を列挙し構造を調査する必要がある

    全探索が可能な規模の問題をシミュレーションにより分析
実験
• 4都市5エージェントの問題を全探索でコスト行列を列挙する
  ことにより解空間の構造を分析する
 – ナッシュ均衡、パレート効率的な解はどれくらいあるのか
 – 解の評価値及びTSPの最適解との差
 – 個人最適化だけでは本当に社会的利用はできないのか
結果1
             0.012
                     ナッシュ均衡、パレート最適となる解の割合
                                                             • 解の特徴が都市構造に
                                                               よって異なる
解の全数に対する割合




              0.01

             0.008

             0.006
                                                             • 都市集合{1・2},
                                               nash
             0.004                             pareto          {3・5},{4}の3つのタイプ
             0.002                             nash&pareto
                                                               に分類できる
                0
                      1   2     3      4   5

                              都市集合番号
結果2
                      TSPの最適解とそれぞれの解の比較
                  2                                                                  • ナッシュ均衡解、パレー
TSPの最適解との比率




                                                                                       ト解のコストの平均値は
              1.5                                                        nash
                  1                                                      pareto
              0.5                                                        nash&pareto   ほぼ同じとなった
                       1           2     3       4         5             PID ID
                                                                           P
                                       都市集合番号
                  PIDのうちナッシュ均衡解かつパレート解になる解の割合                                       • PIDのうちナッシュ均衡解
                                                                         0.032959     かつパレート解となる解
                                                                                      は数パーセントしか存在
                  0            0             0
                                                         0.0101273
                                                                                      しない
              1            2             3           4               5

                                       都市集合番号
まとめ
• 共有資源型TSPのモデル化を行った

• 小規模な例題を解き、その都市構造と解の関
  係がどのようになっているか分析を行った


   課題
共有資源と社会的利用
•   共有資源     E={eij| i,j = 1,2,...,n}
•   エージェント集合 A={ak| k = 1,2,...,m}
•   時間       t (t=1,2,...,n) エージェントは1ステップごとに1つ資源を使える

•   エージェントの資源利用情報
                     1                        akが時刻tにeijを使う時
             xijtk 
              a

                                    0         otherwise
•   資源eijを使うコスト
               D={dij | i,j = 1,2,...,n}
•   tにおいて資源eijを使うコスト
                    bij (t )  d ij  xijtk
                                       a

                                   ak
•   エージェントがt=nまでにかかったコスト
                                   
           Cak   xijtk  bij (t )
                       a
                                                
•   社会的利用        t i j

          min  Cak を満たすように資源を利用すること
                   ak
•   エージェントakの目的関数
           min Cak
ゲーム理論的分析
•   エージェントの資源利用情報行列を
                         x ak  {xijtk | i, j  1,2,..., n}
                                  a

    エージェントが取りうる
             xa                 k           の集合を
                     X ak
    と定義するとCakは x a に依存しているので x a の関数として
                                    k                                 k
                ijt

                    Cak ( x a1 , x a2 ,..., x am )
    と書くことができる。
    エージェントakをプレイヤー、a
                     をakの戦略、 a a           a
                                              をプレイヤーakが戦略
                 x       Ca ( x , x ,..., x )
    をとったときに得られる利得と考えることでナッシュ均衡解、パレート解を定義することがで
                                            k
                                                       xa         k
                                                                          1   2       m   k



    き、
        Cak ( x* )  min[Cak ( x*a1 , x*a2 ,..., x ak ,..., x*am ) : x ak  X ak ]
    を満たす解、x*  ( x*a1 , x*a2 ,..., x*am ) がナッシュ均衡解、
    利得ベクトル C  (Ca ,..., Ca ), C  (Ca ,..., Ca ) において
                                              
                             となる利得ベクトルx’が存在しないときxがパレート効率的な解となる。
                                1       m            1        m

          
    Ca  Ca (i  1,2,..., n)
•   また、エージェントが自分以外のエージェントの資源利用情報                           を考慮せず、資源eijのコ
       i     i

                                                        xa                        k

    ストdijのみを考え、
           min Ca   xij  dij 
                     k
                               a        k


    を達成しようと最適化を行うことを個人最適化と定義する。
                           i j
問題
               CI
        A              E
               CD

              観測不能


• エージェント集合AはCIのコストを想定して共有資源Eを利用
  するが、他のエージェントの戦略 e k により実際にかかるコス
                   *

  トはCDである
モデル化にあたって
• モデルに必要とされる条件
       a
 – 解表現 X k が有限個で実数解である
 – 共有資源のコスト Ca がエージェント数で変動させられる
            k

 – エージェント数m及び共有資源数nを任意に設定可能




     TSPを拡張したモデルにより実現
背景
• インフラ、交通設備などの公共性が高い資源の利用法を考える

 問題:全員が自分の利益のみを考え最適化しようとすると
 効率よく利用できない


                       混雑




 情報技術を活用することで利用の効率化を図れるのでは
モデル化
• 最適化問題として表現
 – TSPを用いる
 – エージェントをエージェントとしてマルチエージェン
   トシミュレーション
• TSPの定式化
• 共有資源の利用問題の定式化
共有資源の利用問題の定式化
• 時間t (t=1,2,…,n)          • 制約条件
• エージェント集合A

• 巡回路行列X




• tにおける追加コスト

• 追加コスト行列G


dij(t):エージェントkがijを通った時の追加コスト
実験2
• 行動調整アルゴリズムによる小規模実験を
  行いナッシュ均衡な解が達成されるか確かめ
  る
• 行動調整アルゴリズムの概要
1. a1から順番にanまでエージェントを選択
   し,最適化
2. 最適化された結果に基づき
   追加コスト行列を更新
3. 全てのエージェントが最適化を
   行うまで繰り返す
4. 最適化された結果が変わらなくなるまで
   繰り返す
考察
• 都市構造によってはナッシュ均衡解がパレー
  ト効率的でない場合もあるが、ナッシュ均衡
  は存在する
• ナッシュ均衡解のコストの平均はパレート効
  率的な解のコストの平均を下回る
• ナッシュ均衡解とナッシュ均衡かつパレート効
  率的な解のコストの平均値の差はわずかで
  ある
結果
            ナッシュ均衡、パレート最適となる解の個数
                                                                                                          コストの比較
       90000
       80000                                                                                 25




                                                                             一人あたりのコストの平均値
       70000                                                                                 20
       60000                                                                                                               nash
解の個数




       50000                                                                                 15                            pareto
       40000                                              nash
                                                                                             10                            nash&pareto
       30000                                              pareto
       20000                                                                                  5                            greedy
                                                          nash&pareto
       10000                                                                                      1   2     3      4   5   opt cost
           0
                                                                                                          都市集合番号
                1       2     3           4   5

                            都市集合番号

        個人最適化=全体最適化となる確率
                                                                  0.032959




                                                  0.0101273


            0           0             0
        1           2             3           4               5

                            都市集合番号
ナッシュ均衡の存在条件
• 戦略が有限である
• プレイヤーの持つ戦略集合は戦略の次元と
  同じユークリッド空間上でコンパクトな凸集合
  である
• プレイヤーの利得関数は連続関数である
• プレイヤーの利得関数はそのプレイヤーの戦
  略について準凹である
まとめ
• 共有資源の利用問題をTSPを拡張することに
  よりモデル化を行いシミュレーションを行える
  ことを確認した
• 個人最適化<全体最適化<混雑がない最適
  となることを小規模な例題で確かめた
• 今後、様々な問題においてこのような解の求
  め方の設計及びその用い方についてさらに
  検証していく必要がある

Más contenido relacionado

La actualidad más candente

5分でわかるベイズ確率
5分でわかるベイズ確率5分でわかるベイズ確率
5分でわかるベイズ確率hoxo_m
 
1.単純パーセプトロンと学習アルゴリズム
1.単純パーセプトロンと学習アルゴリズム1.単純パーセプトロンと学習アルゴリズム
1.単純パーセプトロンと学習アルゴリズム浩気 西山
 
CNNの可視化手法Grad-CAMの紹介~CNNさん、あなたはどこを見ているの?~ | OHS勉強会#6
CNNの可視化手法Grad-CAMの紹介~CNNさん、あなたはどこを見ているの?~ | OHS勉強会#6CNNの可視化手法Grad-CAMの紹介~CNNさん、あなたはどこを見ているの?~ | OHS勉強会#6
CNNの可視化手法Grad-CAMの紹介~CNNさん、あなたはどこを見ているの?~ | OHS勉強会#6Toshinori Hanya
 
cvpaper.challenge 研究効率化 Tips
cvpaper.challenge 研究効率化 Tipscvpaper.challenge 研究効率化 Tips
cvpaper.challenge 研究効率化 Tipscvpaper. challenge
 
20190619 オートエンコーダーと異常検知入門
20190619 オートエンコーダーと異常検知入門20190619 オートエンコーダーと異常検知入門
20190619 オートエンコーダーと異常検知入門Kazuki Motohashi
 
PyData.Tokyo Meetup #21 講演資料「Optuna ハイパーパラメータ最適化フレームワーク」太田 健
PyData.Tokyo Meetup #21 講演資料「Optuna ハイパーパラメータ最適化フレームワーク」太田 健PyData.Tokyo Meetup #21 講演資料「Optuna ハイパーパラメータ最適化フレームワーク」太田 健
PyData.Tokyo Meetup #21 講演資料「Optuna ハイパーパラメータ最適化フレームワーク」太田 健Preferred Networks
 
因果探索: 基本から最近の発展までを概説
因果探索: 基本から最近の発展までを概説因果探索: 基本から最近の発展までを概説
因果探索: 基本から最近の発展までを概説Shiga University, RIKEN
 
Jubatus Casual Talks #2 異常検知入門
Jubatus Casual Talks #2 異常検知入門Jubatus Casual Talks #2 異常検知入門
Jubatus Casual Talks #2 異常検知入門Shohei Hido
 
量子アニーリングのこれまでとこれから -- ハード・ソフト・アプリ三方向からの協調的展開 --
量子アニーリングのこれまでとこれから -- ハード・ソフト・アプリ三方向からの協調的展開 --量子アニーリングのこれまでとこれから -- ハード・ソフト・アプリ三方向からの協調的展開 --
量子アニーリングのこれまでとこれから -- ハード・ソフト・アプリ三方向からの協調的展開 --Shu Tanaka
 
機械学習による統計的実験計画(ベイズ最適化を中心に)
機械学習による統計的実験計画(ベイズ最適化を中心に)機械学習による統計的実験計画(ベイズ最適化を中心に)
機械学習による統計的実験計画(ベイズ最適化を中心に)Kota Matsui
 
SIX ABEJA 講演資料 もうブラックボックスとは呼ばせない~機械学習を支援する情報
SIX ABEJA 講演資料 もうブラックボックスとは呼ばせない~機械学習を支援する情報SIX ABEJA 講演資料 もうブラックボックスとは呼ばせない~機械学習を支援する情報
SIX ABEJA 講演資料 もうブラックボックスとは呼ばせない~機械学習を支援する情報Takayuki Itoh
 
[DL輪読会]GENESIS: Generative Scene Inference and Sampling with Object-Centric L...
[DL輪読会]GENESIS: Generative Scene Inference and Sampling with Object-Centric L...[DL輪読会]GENESIS: Generative Scene Inference and Sampling with Object-Centric L...
[DL輪読会]GENESIS: Generative Scene Inference and Sampling with Object-Centric L...Deep Learning JP
 
“機械学習の説明”の信頼性
“機械学習の説明”の信頼性“機械学習の説明”の信頼性
“機械学習の説明”の信頼性Satoshi Hara
 
[DL輪読会]Revisiting Deep Learning Models for Tabular Data (NeurIPS 2021) 表形式デー...
[DL輪読会]Revisiting Deep Learning Models for Tabular Data  (NeurIPS 2021) 表形式デー...[DL輪読会]Revisiting Deep Learning Models for Tabular Data  (NeurIPS 2021) 表形式デー...
[DL輪読会]Revisiting Deep Learning Models for Tabular Data (NeurIPS 2021) 表形式デー...Deep Learning JP
 
第126回 ロボット工学セミナー 三次元点群と深層学習
第126回 ロボット工学セミナー 三次元点群と深層学習第126回 ロボット工学セミナー 三次元点群と深層学習
第126回 ロボット工学セミナー 三次元点群と深層学習Naoya Chiba
 
[DL輪読会]YOLO9000: Better, Faster, Stronger
[DL輪読会]YOLO9000: Better, Faster, Stronger[DL輪読会]YOLO9000: Better, Faster, Stronger
[DL輪読会]YOLO9000: Better, Faster, StrongerDeep Learning JP
 
[DL輪読会]BERT: Pre-training of Deep Bidirectional Transformers for Language Und...
[DL輪読会]BERT: Pre-training of Deep Bidirectional Transformers for Language Und...[DL輪読会]BERT: Pre-training of Deep Bidirectional Transformers for Language Und...
[DL輪読会]BERT: Pre-training of Deep Bidirectional Transformers for Language Und...Deep Learning JP
 
【DL輪読会】"A Generalist Agent"
【DL輪読会】"A Generalist Agent"【DL輪読会】"A Generalist Agent"
【DL輪読会】"A Generalist Agent"Deep Learning JP
 
[DL輪読会]Grokking: Generalization Beyond Overfitting on Small Algorithmic Datasets
[DL輪読会]Grokking: Generalization Beyond Overfitting on Small Algorithmic Datasets[DL輪読会]Grokking: Generalization Beyond Overfitting on Small Algorithmic Datasets
[DL輪読会]Grokking: Generalization Beyond Overfitting on Small Algorithmic DatasetsDeep Learning JP
 

La actualidad más candente (20)

5分でわかるベイズ確率
5分でわかるベイズ確率5分でわかるベイズ確率
5分でわかるベイズ確率
 
1.単純パーセプトロンと学習アルゴリズム
1.単純パーセプトロンと学習アルゴリズム1.単純パーセプトロンと学習アルゴリズム
1.単純パーセプトロンと学習アルゴリズム
 
CNNの可視化手法Grad-CAMの紹介~CNNさん、あなたはどこを見ているの?~ | OHS勉強会#6
CNNの可視化手法Grad-CAMの紹介~CNNさん、あなたはどこを見ているの?~ | OHS勉強会#6CNNの可視化手法Grad-CAMの紹介~CNNさん、あなたはどこを見ているの?~ | OHS勉強会#6
CNNの可視化手法Grad-CAMの紹介~CNNさん、あなたはどこを見ているの?~ | OHS勉強会#6
 
cvpaper.challenge 研究効率化 Tips
cvpaper.challenge 研究効率化 Tipscvpaper.challenge 研究効率化 Tips
cvpaper.challenge 研究効率化 Tips
 
20190619 オートエンコーダーと異常検知入門
20190619 オートエンコーダーと異常検知入門20190619 オートエンコーダーと異常検知入門
20190619 オートエンコーダーと異常検知入門
 
PyData.Tokyo Meetup #21 講演資料「Optuna ハイパーパラメータ最適化フレームワーク」太田 健
PyData.Tokyo Meetup #21 講演資料「Optuna ハイパーパラメータ最適化フレームワーク」太田 健PyData.Tokyo Meetup #21 講演資料「Optuna ハイパーパラメータ最適化フレームワーク」太田 健
PyData.Tokyo Meetup #21 講演資料「Optuna ハイパーパラメータ最適化フレームワーク」太田 健
 
因果探索: 基本から最近の発展までを概説
因果探索: 基本から最近の発展までを概説因果探索: 基本から最近の発展までを概説
因果探索: 基本から最近の発展までを概説
 
MICの解説
MICの解説MICの解説
MICの解説
 
Jubatus Casual Talks #2 異常検知入門
Jubatus Casual Talks #2 異常検知入門Jubatus Casual Talks #2 異常検知入門
Jubatus Casual Talks #2 異常検知入門
 
量子アニーリングのこれまでとこれから -- ハード・ソフト・アプリ三方向からの協調的展開 --
量子アニーリングのこれまでとこれから -- ハード・ソフト・アプリ三方向からの協調的展開 --量子アニーリングのこれまでとこれから -- ハード・ソフト・アプリ三方向からの協調的展開 --
量子アニーリングのこれまでとこれから -- ハード・ソフト・アプリ三方向からの協調的展開 --
 
機械学習による統計的実験計画(ベイズ最適化を中心に)
機械学習による統計的実験計画(ベイズ最適化を中心に)機械学習による統計的実験計画(ベイズ最適化を中心に)
機械学習による統計的実験計画(ベイズ最適化を中心に)
 
SIX ABEJA 講演資料 もうブラックボックスとは呼ばせない~機械学習を支援する情報
SIX ABEJA 講演資料 もうブラックボックスとは呼ばせない~機械学習を支援する情報SIX ABEJA 講演資料 もうブラックボックスとは呼ばせない~機械学習を支援する情報
SIX ABEJA 講演資料 もうブラックボックスとは呼ばせない~機械学習を支援する情報
 
[DL輪読会]GENESIS: Generative Scene Inference and Sampling with Object-Centric L...
[DL輪読会]GENESIS: Generative Scene Inference and Sampling with Object-Centric L...[DL輪読会]GENESIS: Generative Scene Inference and Sampling with Object-Centric L...
[DL輪読会]GENESIS: Generative Scene Inference and Sampling with Object-Centric L...
 
“機械学習の説明”の信頼性
“機械学習の説明”の信頼性“機械学習の説明”の信頼性
“機械学習の説明”の信頼性
 
[DL輪読会]Revisiting Deep Learning Models for Tabular Data (NeurIPS 2021) 表形式デー...
[DL輪読会]Revisiting Deep Learning Models for Tabular Data  (NeurIPS 2021) 表形式デー...[DL輪読会]Revisiting Deep Learning Models for Tabular Data  (NeurIPS 2021) 表形式デー...
[DL輪読会]Revisiting Deep Learning Models for Tabular Data (NeurIPS 2021) 表形式デー...
 
第126回 ロボット工学セミナー 三次元点群と深層学習
第126回 ロボット工学セミナー 三次元点群と深層学習第126回 ロボット工学セミナー 三次元点群と深層学習
第126回 ロボット工学セミナー 三次元点群と深層学習
 
[DL輪読会]YOLO9000: Better, Faster, Stronger
[DL輪読会]YOLO9000: Better, Faster, Stronger[DL輪読会]YOLO9000: Better, Faster, Stronger
[DL輪読会]YOLO9000: Better, Faster, Stronger
 
[DL輪読会]BERT: Pre-training of Deep Bidirectional Transformers for Language Und...
[DL輪読会]BERT: Pre-training of Deep Bidirectional Transformers for Language Und...[DL輪読会]BERT: Pre-training of Deep Bidirectional Transformers for Language Und...
[DL輪読会]BERT: Pre-training of Deep Bidirectional Transformers for Language Und...
 
【DL輪読会】"A Generalist Agent"
【DL輪読会】"A Generalist Agent"【DL輪読会】"A Generalist Agent"
【DL輪読会】"A Generalist Agent"
 
[DL輪読会]Grokking: Generalization Beyond Overfitting on Small Algorithmic Datasets
[DL輪読会]Grokking: Generalization Beyond Overfitting on Small Algorithmic Datasets[DL輪読会]Grokking: Generalization Beyond Overfitting on Small Algorithmic Datasets
[DL輪読会]Grokking: Generalization Beyond Overfitting on Small Algorithmic Datasets
 

Destacado

Tohfa e nasahe urdu tarjama wa hashiya by syed yousuf hussaini raja
Tohfa e nasahe urdu tarjama wa hashiya by syed yousuf hussaini rajaTohfa e nasahe urdu tarjama wa hashiya by syed yousuf hussaini raja
Tohfa e nasahe urdu tarjama wa hashiya by syed yousuf hussaini rajaMuhammad Tariq
 
The locations and my top ideas
The locations and my top ideasThe locations and my top ideas
The locations and my top ideashopey-hopey
 
Bolson y shoping
Bolson y shopingBolson y shoping
Bolson y shopingmartinika23
 
SMART CITY 3 novembre
SMART CITY 3 novembre SMART CITY 3 novembre
SMART CITY 3 novembre canaleenergia
 
Birkosit Application in Housings
Birkosit Application in HousingsBirkosit Application in Housings
Birkosit Application in HousingsProject Sales Corp
 
Hoe effectief is mijn team eigenlijk?
Hoe effectief is mijn team eigenlijk?Hoe effectief is mijn team eigenlijk?
Hoe effectief is mijn team eigenlijk?Van den Engel advies
 
Oltre l'orizzonte cosmologico
Oltre l'orizzonte cosmologicoOltre l'orizzonte cosmologico
Oltre l'orizzonte cosmologiconipslab
 
SW 아키텍처 분석방법
SW 아키텍처 분석방법 SW 아키텍처 분석방법
SW 아키텍처 분석방법 YoungSu Son
 
Types of garment washes
Types of garment washesTypes of garment washes
Types of garment washeslatifaslam
 

Destacado (17)

Tohfa e nasahe urdu tarjama wa hashiya by syed yousuf hussaini raja
Tohfa e nasahe urdu tarjama wa hashiya by syed yousuf hussaini rajaTohfa e nasahe urdu tarjama wa hashiya by syed yousuf hussaini raja
Tohfa e nasahe urdu tarjama wa hashiya by syed yousuf hussaini raja
 
Pmi
PmiPmi
Pmi
 
The locations and my top ideas
The locations and my top ideasThe locations and my top ideas
The locations and my top ideas
 
Bolson y shoping
Bolson y shopingBolson y shoping
Bolson y shoping
 
Terrorism
TerrorismTerrorism
Terrorism
 
SMART CITY 3 novembre
SMART CITY 3 novembre SMART CITY 3 novembre
SMART CITY 3 novembre
 
Ci 350 assure1
Ci 350 assure1Ci 350 assure1
Ci 350 assure1
 
Mobilbruk
MobilbrukMobilbruk
Mobilbruk
 
Birkosit Application in Housings
Birkosit Application in HousingsBirkosit Application in Housings
Birkosit Application in Housings
 
Hoe effectief is mijn team eigenlijk?
Hoe effectief is mijn team eigenlijk?Hoe effectief is mijn team eigenlijk?
Hoe effectief is mijn team eigenlijk?
 
Division
DivisionDivision
Division
 
hetCV Oprichter Milano Naarden
hetCV Oprichter Milano Naarden hetCV Oprichter Milano Naarden
hetCV Oprichter Milano Naarden
 
Data nomor telepon
Data nomor teleponData nomor telepon
Data nomor telepon
 
финансы сущность и функции авт
финансы сущность и функции автфинансы сущность и функции авт
финансы сущность и функции авт
 
Oltre l'orizzonte cosmologico
Oltre l'orizzonte cosmologicoOltre l'orizzonte cosmologico
Oltre l'orizzonte cosmologico
 
SW 아키텍처 분석방법
SW 아키텍처 분석방법 SW 아키텍처 분석방법
SW 아키텍처 분석방법
 
Types of garment washes
Types of garment washesTypes of garment washes
Types of garment washes
 

Más de harmonylab

【修士論文】代替出勤者の選定業務における依頼順決定方法に関する研究   千坂知也
【修士論文】代替出勤者の選定業務における依頼順決定方法に関する研究   千坂知也【修士論文】代替出勤者の選定業務における依頼順決定方法に関する研究   千坂知也
【修士論文】代替出勤者の選定業務における依頼順決定方法に関する研究   千坂知也harmonylab
 
【修士論文】経路探索のための媒介中心性に基づく道路ネットワーク階層化手法に関する研究
【修士論文】経路探索のための媒介中心性に基づく道路ネットワーク階層化手法に関する研究【修士論文】経路探索のための媒介中心性に基づく道路ネットワーク階層化手法に関する研究
【修士論文】経路探索のための媒介中心性に基づく道路ネットワーク階層化手法に関する研究harmonylab
 
A Study on Decision Support System for Snow Removal Dispatch using Road Surfa...
A Study on Decision Support System for Snow Removal Dispatch using Road Surfa...A Study on Decision Support System for Snow Removal Dispatch using Road Surfa...
A Study on Decision Support System for Snow Removal Dispatch using Road Surfa...harmonylab
 
【卒業論文】印象タグを用いた衣服画像生成システムに関する研究
【卒業論文】印象タグを用いた衣服画像生成システムに関する研究【卒業論文】印象タグを用いた衣服画像生成システムに関する研究
【卒業論文】印象タグを用いた衣服画像生成システムに関する研究harmonylab
 
【卒業論文】大規模言語モデルを用いたマニュアル文章修正手法に関する研究
【卒業論文】大規模言語モデルを用いたマニュアル文章修正手法に関する研究【卒業論文】大規模言語モデルを用いたマニュアル文章修正手法に関する研究
【卒業論文】大規模言語モデルを用いたマニュアル文章修正手法に関する研究harmonylab
 
DLゼミ:Primitive Generation and Semantic-related Alignment for Universal Zero-S...
DLゼミ:Primitive Generation and Semantic-related Alignment for Universal Zero-S...DLゼミ:Primitive Generation and Semantic-related Alignment for Universal Zero-S...
DLゼミ:Primitive Generation and Semantic-related Alignment for Universal Zero-S...harmonylab
 
DLゼミ: MobileOne: An Improved One millisecond Mobile Backbone
DLゼミ: MobileOne: An Improved One millisecond Mobile BackboneDLゼミ: MobileOne: An Improved One millisecond Mobile Backbone
DLゼミ: MobileOne: An Improved One millisecond Mobile Backboneharmonylab
 
DLゼミ: Llama 2: Open Foundation and Fine-Tuned Chat Models
DLゼミ: Llama 2: Open Foundation and Fine-Tuned Chat ModelsDLゼミ: Llama 2: Open Foundation and Fine-Tuned Chat Models
DLゼミ: Llama 2: Open Foundation and Fine-Tuned Chat Modelsharmonylab
 
DLゼミ: ViTPose: Simple Vision Transformer Baselines for Human Pose Estimation
DLゼミ: ViTPose: Simple Vision Transformer Baselines for Human Pose EstimationDLゼミ: ViTPose: Simple Vision Transformer Baselines for Human Pose Estimation
DLゼミ: ViTPose: Simple Vision Transformer Baselines for Human Pose Estimationharmonylab
 
Voyager: An Open-Ended Embodied Agent with Large Language Models
Voyager: An Open-Ended Embodied Agent with Large Language ModelsVoyager: An Open-Ended Embodied Agent with Large Language Models
Voyager: An Open-Ended Embodied Agent with Large Language Modelsharmonylab
 
DLゼミ: Ego-Body Pose Estimation via Ego-Head Pose Estimation
DLゼミ: Ego-Body Pose Estimation via Ego-Head Pose EstimationDLゼミ: Ego-Body Pose Estimation via Ego-Head Pose Estimation
DLゼミ: Ego-Body Pose Estimation via Ego-Head Pose Estimationharmonylab
 
ReAct: Synergizing Reasoning and Acting in Language Models
ReAct: Synergizing Reasoning and Acting in Language ModelsReAct: Synergizing Reasoning and Acting in Language Models
ReAct: Synergizing Reasoning and Acting in Language Modelsharmonylab
 
形態素解析を用いた帝国議会議事速記録の変遷に関する研究
形態素解析を用いた帝国議会議事速記録の変遷に関する研究形態素解析を用いた帝国議会議事速記録の変遷に関する研究
形態素解析を用いた帝国議会議事速記録の変遷に関する研究harmonylab
 
【卒業論文】深層生成モデルを用いたユーザ意図に基づく衣服画像の生成に関する研究
【卒業論文】深層生成モデルを用いたユーザ意図に基づく衣服画像の生成に関する研究【卒業論文】深層生成モデルを用いたユーザ意図に基づく衣服画像の生成に関する研究
【卒業論文】深層生成モデルを用いたユーザ意図に基づく衣服画像の生成に関する研究harmonylab
 
灯油タンク内の液面高計測を用いた 灯油残量推定システムに関する研究
灯油タンク内の液面高計測を用いた灯油残量推定システムに関する研究灯油タンク内の液面高計測を用いた灯油残量推定システムに関する研究
灯油タンク内の液面高計測を用いた 灯油残量推定システムに関する研究harmonylab
 
深層自己回帰モデルを用いた俳句の生成と評価に関する研究
深層自己回帰モデルを用いた俳句の生成と評価に関する研究深層自己回帰モデルを用いた俳句の生成と評価に関する研究
深層自己回帰モデルを用いた俳句の生成と評価に関する研究harmonylab
 
競輪におけるレーティングシステムを用いた予想記事生成に関する研究
競輪におけるレーティングシステムを用いた予想記事生成に関する研究競輪におけるレーティングシステムを用いた予想記事生成に関する研究
競輪におけるレーティングシステムを用いた予想記事生成に関する研究harmonylab
 
【卒業論文】B2Bオークションにおけるユーザ別 入札行動予測に関する研究
【卒業論文】B2Bオークションにおけるユーザ別 入札行動予測に関する研究【卒業論文】B2Bオークションにおけるユーザ別 入札行動予測に関する研究
【卒業論文】B2Bオークションにおけるユーザ別 入札行動予測に関する研究harmonylab
 
A Study on Estimation of Household Kerosene Consumption for Optimization of D...
A Study on Estimation of Household Kerosene Consumption for Optimization of D...A Study on Estimation of Household Kerosene Consumption for Optimization of D...
A Study on Estimation of Household Kerosene Consumption for Optimization of D...harmonylab
 
マルチエージェント深層強化学習による自動運転車両の追越行動の獲得に関する研究
マルチエージェント深層強化学習による自動運転車両の追越行動の獲得に関する研究マルチエージェント深層強化学習による自動運転車両の追越行動の獲得に関する研究
マルチエージェント深層強化学習による自動運転車両の追越行動の獲得に関する研究harmonylab
 

Más de harmonylab (20)

【修士論文】代替出勤者の選定業務における依頼順決定方法に関する研究   千坂知也
【修士論文】代替出勤者の選定業務における依頼順決定方法に関する研究   千坂知也【修士論文】代替出勤者の選定業務における依頼順決定方法に関する研究   千坂知也
【修士論文】代替出勤者の選定業務における依頼順決定方法に関する研究   千坂知也
 
【修士論文】経路探索のための媒介中心性に基づく道路ネットワーク階層化手法に関する研究
【修士論文】経路探索のための媒介中心性に基づく道路ネットワーク階層化手法に関する研究【修士論文】経路探索のための媒介中心性に基づく道路ネットワーク階層化手法に関する研究
【修士論文】経路探索のための媒介中心性に基づく道路ネットワーク階層化手法に関する研究
 
A Study on Decision Support System for Snow Removal Dispatch using Road Surfa...
A Study on Decision Support System for Snow Removal Dispatch using Road Surfa...A Study on Decision Support System for Snow Removal Dispatch using Road Surfa...
A Study on Decision Support System for Snow Removal Dispatch using Road Surfa...
 
【卒業論文】印象タグを用いた衣服画像生成システムに関する研究
【卒業論文】印象タグを用いた衣服画像生成システムに関する研究【卒業論文】印象タグを用いた衣服画像生成システムに関する研究
【卒業論文】印象タグを用いた衣服画像生成システムに関する研究
 
【卒業論文】大規模言語モデルを用いたマニュアル文章修正手法に関する研究
【卒業論文】大規模言語モデルを用いたマニュアル文章修正手法に関する研究【卒業論文】大規模言語モデルを用いたマニュアル文章修正手法に関する研究
【卒業論文】大規模言語モデルを用いたマニュアル文章修正手法に関する研究
 
DLゼミ:Primitive Generation and Semantic-related Alignment for Universal Zero-S...
DLゼミ:Primitive Generation and Semantic-related Alignment for Universal Zero-S...DLゼミ:Primitive Generation and Semantic-related Alignment for Universal Zero-S...
DLゼミ:Primitive Generation and Semantic-related Alignment for Universal Zero-S...
 
DLゼミ: MobileOne: An Improved One millisecond Mobile Backbone
DLゼミ: MobileOne: An Improved One millisecond Mobile BackboneDLゼミ: MobileOne: An Improved One millisecond Mobile Backbone
DLゼミ: MobileOne: An Improved One millisecond Mobile Backbone
 
DLゼミ: Llama 2: Open Foundation and Fine-Tuned Chat Models
DLゼミ: Llama 2: Open Foundation and Fine-Tuned Chat ModelsDLゼミ: Llama 2: Open Foundation and Fine-Tuned Chat Models
DLゼミ: Llama 2: Open Foundation and Fine-Tuned Chat Models
 
DLゼミ: ViTPose: Simple Vision Transformer Baselines for Human Pose Estimation
DLゼミ: ViTPose: Simple Vision Transformer Baselines for Human Pose EstimationDLゼミ: ViTPose: Simple Vision Transformer Baselines for Human Pose Estimation
DLゼミ: ViTPose: Simple Vision Transformer Baselines for Human Pose Estimation
 
Voyager: An Open-Ended Embodied Agent with Large Language Models
Voyager: An Open-Ended Embodied Agent with Large Language ModelsVoyager: An Open-Ended Embodied Agent with Large Language Models
Voyager: An Open-Ended Embodied Agent with Large Language Models
 
DLゼミ: Ego-Body Pose Estimation via Ego-Head Pose Estimation
DLゼミ: Ego-Body Pose Estimation via Ego-Head Pose EstimationDLゼミ: Ego-Body Pose Estimation via Ego-Head Pose Estimation
DLゼミ: Ego-Body Pose Estimation via Ego-Head Pose Estimation
 
ReAct: Synergizing Reasoning and Acting in Language Models
ReAct: Synergizing Reasoning and Acting in Language ModelsReAct: Synergizing Reasoning and Acting in Language Models
ReAct: Synergizing Reasoning and Acting in Language Models
 
形態素解析を用いた帝国議会議事速記録の変遷に関する研究
形態素解析を用いた帝国議会議事速記録の変遷に関する研究形態素解析を用いた帝国議会議事速記録の変遷に関する研究
形態素解析を用いた帝国議会議事速記録の変遷に関する研究
 
【卒業論文】深層生成モデルを用いたユーザ意図に基づく衣服画像の生成に関する研究
【卒業論文】深層生成モデルを用いたユーザ意図に基づく衣服画像の生成に関する研究【卒業論文】深層生成モデルを用いたユーザ意図に基づく衣服画像の生成に関する研究
【卒業論文】深層生成モデルを用いたユーザ意図に基づく衣服画像の生成に関する研究
 
灯油タンク内の液面高計測を用いた 灯油残量推定システムに関する研究
灯油タンク内の液面高計測を用いた灯油残量推定システムに関する研究灯油タンク内の液面高計測を用いた灯油残量推定システムに関する研究
灯油タンク内の液面高計測を用いた 灯油残量推定システムに関する研究
 
深層自己回帰モデルを用いた俳句の生成と評価に関する研究
深層自己回帰モデルを用いた俳句の生成と評価に関する研究深層自己回帰モデルを用いた俳句の生成と評価に関する研究
深層自己回帰モデルを用いた俳句の生成と評価に関する研究
 
競輪におけるレーティングシステムを用いた予想記事生成に関する研究
競輪におけるレーティングシステムを用いた予想記事生成に関する研究競輪におけるレーティングシステムを用いた予想記事生成に関する研究
競輪におけるレーティングシステムを用いた予想記事生成に関する研究
 
【卒業論文】B2Bオークションにおけるユーザ別 入札行動予測に関する研究
【卒業論文】B2Bオークションにおけるユーザ別 入札行動予測に関する研究【卒業論文】B2Bオークションにおけるユーザ別 入札行動予測に関する研究
【卒業論文】B2Bオークションにおけるユーザ別 入札行動予測に関する研究
 
A Study on Estimation of Household Kerosene Consumption for Optimization of D...
A Study on Estimation of Household Kerosene Consumption for Optimization of D...A Study on Estimation of Household Kerosene Consumption for Optimization of D...
A Study on Estimation of Household Kerosene Consumption for Optimization of D...
 
マルチエージェント深層強化学習による自動運転車両の追越行動の獲得に関する研究
マルチエージェント深層強化学習による自動運転車両の追越行動の獲得に関する研究マルチエージェント深層強化学習による自動運転車両の追越行動の獲得に関する研究
マルチエージェント深層強化学習による自動運転車両の追越行動の獲得に関する研究
 

Ono b

  • 1. TSPに基づく共有資源の社会的 利用モデルに関する研究 北海道大学 工学部 情報エレクトロニクス系 情報工学コース 調和系工学研究室 学部4年 小野 良太
  • 2. 背景 • インフラ、交通設備などの公共性が高い資源の利用法を考える ⇒共有資源 例:渋滞 ハンチング現象 本当にそうなのか?問題の構造を調査して どのような問題なのか分析する必要があるのでは?
  • 3. 関連研究 A A R R R R R Et Ex テーマパーク問題[2003 川村] 道路交通における協調カーナビ[2006 山下]
  • 4. 共有資源と社会的利用 • エージェント集合 Eのべき集合 A={ak| k = 1,2,...,m} E* • 共有資源 E={ei| i = 1,2,...,n} • エージェントの取りうる戦略集合 E*=2E • エージェントkの戦略 ek  E * * * * ek e k • エージェントkのコスト * * Ck (ek , ek ) • ek  ek   * * ① C (ek ,  )  C (ek , ek )  C I * * * ek  ek * * ak以外の戦略 ② C (e ,  )  C (e , e )  C * k * k * k D の集合 | C (ek , ek )  C (ek ,  ) || ek  ek | * * * * *
  • 5. 共有資源利用におけるハイパーゲーム • エージェントkが受けるサービス * S (ek ) • エージェントkの利得関数 Pk  S (ek )  C (ek , ek ) * * * PkI  S (ek )  C I (ek , ek ) * * * エージェントが参加して PkD  S (ek )  C D (ek , ek ) * * * いるゲーム 考エ 他の全エージェントの関 えー PkI PkD 数であるので観測が困難 方ジ PII PID ェ PkI ン ト の PkD PDI PDD
  • 6. 目的 • ゲーム理論の観点から共有資源の利用問題の解の構造を分析する 仮説 P PID PII PDD PDI • そのために… TSPを拡張した – シミュレーションで扱いやすい数理モデルを構築 モデルにより – ハイパーゲームを統一的に扱える問題 実現 – エージェント及び共有資源に対するスケーラビリティ
  • 7. TSPの定式化 • 都市集合V • エッジ集合E E={eij| i,j = 1,2,...,n} • コスト行列C • 巡回路行列X • 目的関数
  • 8. 共有資源型TSP • エージェント集合A 全都市を巡回する経路 • エージェントkの目的: PkD  C D (ek , ek ) * * 最小化 共有資源のコスト 同時にijを使うエージェント – |A|=1の時、従来型TSPと一致 の数により変動
  • 9. 共有資源型TSPの定式化 • 時間t (t=1,2,…,n) • tにおける追加コスト • 巡回路行列X • 追加コスト行列G G  {g kij | i, j  1,2,..., n k  1,2,..., m} g kij  dij (t )  cij 目的関数
  • 10. 実験設計 • 目的:ゲーム理論の観点から共有資源の利用問題の解の構造を分析する 仮説 P ナッシュ均衡解 PID パレート解 PII 両方 PDD PDI 全ての解を列挙し構造を調査する必要がある 全探索が可能な規模の問題をシミュレーションにより分析
  • 11. 実験 • 4都市5エージェントの問題を全探索でコスト行列を列挙する ことにより解空間の構造を分析する – ナッシュ均衡、パレート効率的な解はどれくらいあるのか – 解の評価値及びTSPの最適解との差 – 個人最適化だけでは本当に社会的利用はできないのか
  • 12. 結果1 0.012 ナッシュ均衡、パレート最適となる解の割合 • 解の特徴が都市構造に よって異なる 解の全数に対する割合 0.01 0.008 0.006 • 都市集合{1・2}, nash 0.004 pareto {3・5},{4}の3つのタイプ 0.002 nash&pareto に分類できる 0 1 2 3 4 5 都市集合番号
  • 13. 結果2 TSPの最適解とそれぞれの解の比較 2 • ナッシュ均衡解、パレー TSPの最適解との比率 ト解のコストの平均値は 1.5 nash 1 pareto 0.5 nash&pareto ほぼ同じとなった 1 2 3 4 5 PID ID P 都市集合番号 PIDのうちナッシュ均衡解かつパレート解になる解の割合 • PIDのうちナッシュ均衡解 0.032959 かつパレート解となる解 は数パーセントしか存在 0 0 0 0.0101273 しない 1 2 3 4 5 都市集合番号
  • 15.
  • 16.
  • 17. 共有資源と社会的利用 • 共有資源 E={eij| i,j = 1,2,...,n} • エージェント集合 A={ak| k = 1,2,...,m} • 時間 t (t=1,2,...,n) エージェントは1ステップごとに1つ資源を使える • エージェントの資源利用情報 1 akが時刻tにeijを使う時 xijtk  a 0 otherwise • 資源eijを使うコスト D={dij | i,j = 1,2,...,n} • tにおいて資源eijを使うコスト bij (t )  d ij  xijtk a ak • エージェントがt=nまでにかかったコスト  Cak   xijtk  bij (t ) a  • 社会的利用 t i j min  Cak を満たすように資源を利用すること ak • エージェントakの目的関数 min Cak
  • 18. ゲーム理論的分析 • エージェントの資源利用情報行列を x ak  {xijtk | i, j  1,2,..., n} a エージェントが取りうる xa k の集合を X ak と定義するとCakは x a に依存しているので x a の関数として k k ijt Cak ( x a1 , x a2 ,..., x am ) と書くことができる。 エージェントakをプレイヤー、a をakの戦略、 a a a をプレイヤーakが戦略 x Ca ( x , x ,..., x ) をとったときに得られる利得と考えることでナッシュ均衡解、パレート解を定義することがで k xa k 1 2 m k き、 Cak ( x* )  min[Cak ( x*a1 , x*a2 ,..., x ak ,..., x*am ) : x ak  X ak ] を満たす解、x*  ( x*a1 , x*a2 ,..., x*am ) がナッシュ均衡解、 利得ベクトル C  (Ca ,..., Ca ), C  (Ca ,..., Ca ) において   となる利得ベクトルx’が存在しないときxがパレート効率的な解となる。 1 m 1 m  Ca  Ca (i  1,2,..., n) • また、エージェントが自分以外のエージェントの資源利用情報 を考慮せず、資源eijのコ i i xa k ストdijのみを考え、 min Ca   xij  dij  k a k を達成しようと最適化を行うことを個人最適化と定義する。 i j
  • 19. 問題 CI A E CD 観測不能 • エージェント集合AはCIのコストを想定して共有資源Eを利用 するが、他のエージェントの戦略 e k により実際にかかるコス * トはCDである
  • 20. モデル化にあたって • モデルに必要とされる条件 a – 解表現 X k が有限個で実数解である – 共有資源のコスト Ca がエージェント数で変動させられる k – エージェント数m及び共有資源数nを任意に設定可能 TSPを拡張したモデルにより実現
  • 21. 背景 • インフラ、交通設備などの公共性が高い資源の利用法を考える 問題:全員が自分の利益のみを考え最適化しようとすると 効率よく利用できない 混雑 情報技術を活用することで利用の効率化を図れるのでは
  • 22. モデル化 • 最適化問題として表現 – TSPを用いる – エージェントをエージェントとしてマルチエージェン トシミュレーション • TSPの定式化 • 共有資源の利用問題の定式化
  • 23. 共有資源の利用問題の定式化 • 時間t (t=1,2,…,n) • 制約条件 • エージェント集合A • 巡回路行列X • tにおける追加コスト • 追加コスト行列G dij(t):エージェントkがijを通った時の追加コスト
  • 24. 実験2 • 行動調整アルゴリズムによる小規模実験を 行いナッシュ均衡な解が達成されるか確かめ る • 行動調整アルゴリズムの概要 1. a1から順番にanまでエージェントを選択 し,最適化 2. 最適化された結果に基づき 追加コスト行列を更新 3. 全てのエージェントが最適化を 行うまで繰り返す 4. 最適化された結果が変わらなくなるまで 繰り返す
  • 25. 考察 • 都市構造によってはナッシュ均衡解がパレー ト効率的でない場合もあるが、ナッシュ均衡 は存在する • ナッシュ均衡解のコストの平均はパレート効 率的な解のコストの平均を下回る • ナッシュ均衡解とナッシュ均衡かつパレート効 率的な解のコストの平均値の差はわずかで ある
  • 26. 結果 ナッシュ均衡、パレート最適となる解の個数 コストの比較 90000 80000 25 一人あたりのコストの平均値 70000 20 60000 nash 解の個数 50000 15 pareto 40000 nash 10 nash&pareto 30000 pareto 20000 5 greedy nash&pareto 10000 1 2 3 4 5 opt cost 0 都市集合番号 1 2 3 4 5 都市集合番号 個人最適化=全体最適化となる確率 0.032959 0.0101273 0 0 0 1 2 3 4 5 都市集合番号
  • 27.
  • 28.
  • 29.
  • 30. ナッシュ均衡の存在条件 • 戦略が有限である • プレイヤーの持つ戦略集合は戦略の次元と 同じユークリッド空間上でコンパクトな凸集合 である • プレイヤーの利得関数は連続関数である • プレイヤーの利得関数はそのプレイヤーの戦 略について準凹である
  • 31. まとめ • 共有資源の利用問題をTSPを拡張することに よりモデル化を行いシミュレーションを行える ことを確認した • 個人最適化<全体最適化<混雑がない最適 となることを小規模な例題で確かめた • 今後、様々な問題においてこのような解の求 め方の設計及びその用い方についてさらに 検証していく必要がある