Se ha denunciado esta presentación.
Utilizamos tu perfil de LinkedIn y tus datos de actividad para personalizar los anuncios y mostrarte publicidad más relevante. Puedes cambiar tus preferencias de publicidad en cualquier momento.

「ゲーム理論」講義スライド

2017年度に大阪大学で担当している講義
『インセンティブ設計の理論』
https://sites.google.com/site/yosukeyasuda2/home/lecture/incentive17
の「ゲーム理論」パート(全3回分)で使用した講義スライドです。扱っているトピックは以下です。
・みんなと同じ行動を取るのはなぜか ー 協調ゲーム
・結果にコミットして優位に立とう ー コミットメント
・人はなぜ協力するのか ー 繰り返しゲーム

  • Sé el primero en comentar

「ゲーム理論」講義スライド

  1. 1. ゲーム理論 「インセンティブ設計の理論」 安田洋祐 | 大阪大学大学院 経済学研究科 ( yosuke.yasuda@gmail.com ) 1 2017年度インセンティブ設計の理論
  2. 2. 協調ゲーム みんなと同じ行動を取るのはなぜか? 2017年度インセンティブ設計の理論2
  3. 3. 講義の狙い 2017年度3  同調行動(まわりに合わせた行動)について考えよう!  例:エスカレーターの並び方  大阪:右に並ぶ(左を空ける)  東京:左に並ぶ(右を空ける)  なぜ同調行動が起こるのか?  どんなメリット・デメリットがあるのか?  当事者目線に立つと世の中が見えてくる! インセンティブ設計の理論
  4. 4. 参考図書 2017年度4 第2章「なぜ人は行列に並ぶの か?[ゲーム理論]」(安田洋祐) インセンティブ設計の理論
  5. 5. 暮らしの中の駆け引き 2017年度5  経済学の考え方  各人が本人にとって望ましい選択肢を選ぶ  かっこ良く言うと → 「インセンティブに従う」  ゲーム理論の考え方  望ましい選択肢が相手の行動によって変わる!  戦略的な駆け引きを分析する道具 = ゲーム理論  同調行動  まわりと同じ行動を取るのが各人にとって望ましい  実際の例を見てみよう! インセンティブ設計の理論
  6. 6. 同調行動の例 2017年度6 1. 共同作業: どのパソコンを使うか? 2. デートの場所:どこに遊びに行くか? 3. いじめ問題:加担するかしないか? 4. SNS:どのサービスを使うか? 5. 行列:どの店に並ぶか? インセンティブ設計の理論
  7. 7. コーディネーションゲーム:利得表 2017年度7  共同作業のために新しいパソコンを購入する  相手と異なるOSでは全く意味がないとする  (Mac, Mac)の方が(Win, Win)よりも2人にとってベター 学生2 学生1 Windows Mac Windows 1 1 0 0 Mac 0 0 2 2 インセンティブ設計の理論
  8. 8. コーディネーションゲーム:分析1 2017年度8  相手(2)がWinを選んでくるなら  自分(1)もWinを購入するのが最適: 1 > 0 なので 学生2 学生1 Windows Mac Windows 1 1 0 0 Mac 0 0 2 2 インセンティブ設計の理論
  9. 9. コーディネーションゲーム:分析2 2017年度9  相手(2)がMacを選んでくるなら  自分(1)もMacを購入するのが最適: 2 > 0 なので 学生2 学生1 Windows Mac Windows 1 1 0 0 Mac 0 0 2 2 インセンティブ設計の理論
  10. 10. コーディネーションゲーム:解説1 2017年度10  最適な戦略(支配戦略)が存在しない!  相手がMacなら自分もMac、相手がWinなら自分もWinが得  最適な行動が相手の行動によって変化する!  個人の合理性だけからでは問題を解くことができない  意思決定理論・契約理論のようには問題が解けない  「ナッシュ均衡」を求めよう!  一見するとベストな結果(Mac, Mac)が選ばれそうだが…  まずはナッシュ均衡の定義を見てみよう! インセンティブ設計の理論
  11. 11. ナッシュ均衡の定義 2017年度11  プレーヤーたちの選択した行動の組がナッシュ均衡 であるとき 1. (すべてのプレーヤーにとって)自分一人だけが行動を 変更しても利得を上げることができない  安定的な状況をうまく描写できる 2. プレーヤー同士がお互いの行動を正しく予想してそれ に対して最適な行動を選択し合っている  合理的な結果の予測として優れている  数学的には全く同じ定義でも多様な解釈ができる! インセンティブ設計の理論
  12. 12. ナッシュ均衡の見つけ方:下線法1 2017年度12  各自が選べる大きい方の利得に下線を引いて行くと…  どちらの利得にも下線が引かれている => ナッシュ均衡  それ以外の戦略の組み合わせ => ナッシュ均衡ではない 学生2 学生1 Windows Mac Windows 1 1 0 0 Mac 0 0 2 2 インセンティブ設計の理論
  13. 13. ナッシュ均衡の見つけ方:下線法2 2017年度13  各自が選べる大きい方の利得に下線を引いて行くと…  どちらの利得にも下線が引かれている => ナッシュ均衡  それ以外の戦略の組み合わせ => ナッシュ均衡ではない 学生2 学生1 Windows Mac Windows 1 1 0 0 Mac 0 0 2 2 インセンティブ設計の理論
  14. 14. コーディネーションゲーム:解説2 2017年度14  このゲームには2つナッシュ均衡がある!  (Mac, Mac)と(Win, Win)のどちらもナッシュ均衡  コーディネーションゲームのように  (一般に)ナッシュ均衡は複数存在する場合がある  プレイヤー全員にとってあるナッシュ均衡よりも別のナッシュ 均衡の方が望ましい場合もある  良い均衡(Mac, Mac)ではなく悪い均衡(Win, Win)が選 ばれてしまう危険性がある  「コーディネーションの失敗」と呼ばれる  選ばれなかった選択肢・商品は市場から消えて行くことも… インセンティブ設計の理論
  15. 15. 神取ミクロ(図6.1) 2017年度インセンティブ設計の理論15
  16. 16. キー配列もコーディネーションの失敗!? 2017年度16 インセンティブ設計の理論
  17. 17. 男女の争い:利得表 2017年度17  妻(プレイヤー1)と夫(プレイヤー2)が休みの日にどこに 遊びに行くかをそれぞれ決定  別々の場所に行くのは2人にとって最悪  妻は遊園地、夫は野球観戦の方が好き 夫 妻 遊園地 野球 遊園地 1 2 0 0 野球 0 0 2 1 インセンティブ設計の理論
  18. 18. 男女の争い:下線法1 2017年度18  夫が遊園地を選ぶなら  妻も遊園地を選ぶのが最適: 2 > 0 なので  相手の選択に対して最適な利得に下線を付けると… 夫 妻 遊園地 野球 遊園地 1 2 0 0 野球 0 0 2 1 インセンティブ設計の理論
  19. 19. 男女の争い:下線法2 2017年度19  夫が遊園地を選ぶなら  妻も遊園地を選ぶのが最適: 2 > 0 なので  相手の選択に対して最適な利得に下線を付けると… 夫 妻 遊園地 野球 遊園地 1 2 0 0 野球 0 0 2 1 インセンティブ設計の理論
  20. 20. 男女の争い:解説 2017年度20  このゲームにもナッシュ均衡が2つ!  (遊園地、遊園地)と(野球、野球)のどちらもナッシュ均衡  今回は “良い”(“悪い”)均衡は存在しない  双方にとって「より望ましい均衡」というものがない!  状況が対称的でどちらの均衡が実現しそうか分からない  理論以外の要素 ーたとえば慣習や文化、規範などー に よってどちらのナッシュ均衡が選ばれるかが決まる  例)レディファースト → (遊園地、遊園地)  例)男社会(?) → (野球、野球) インセンティブ設計の理論
  21. 21. 鹿狩りゲーム:利得表 2017年度21  2人のハンターがどちらの獲物を狙うかを決める  鹿は2人で協力しないと捕えることができない  兎は自分1人でも必ず捕えることができる=安全な戦略 ハンター2 ハンター1 シカ ウサギ シカ 3 3 2 0 ウサギ 0 2 2 2 インセンティブ設計の理論
  22. 22. 鹿狩りゲーム:ナッシュ均衡 2017年度22  2人のハンターがどちらの獲物を狙うかを決める  鹿は2人で協力しないと捕えることができない  兎は自分1人でも必ず捕えることができる=安全な戦略 ハンター2 ハンター1 シカ ウサギ シカ 3 3 2 0 ウサギ 0 2 2 2 インセンティブ設計の理論
  23. 23. 鹿狩りゲーム:解説 2017年度23  このゲームには2つナッシュ均衡がある!  (シカ、シカ)(ウサギ、ウサギ)のどちらもナッシュ均衡  コーディネーションゲームの一種と考えられる  どちらの均衡の方がもっともらしい?  (シカ、シカ)は2人にとって望ましい効率的な均衡だが…  (ウサギ、ウサギ)の方が実現しやすい可能性がある  相手がランダムに戦略を選んでくる場合には  「シカ」よりも「ウサギ」を選ぶ方が(期待)利得が高い!  「ウサギ」=リスク支配戦略、(ウサギ、ウサギ)=リスク支配均衡  この例のように、リスク支配均衡が効率的とは限らない… インセンティブ設計の理論
  24. 24. 鹿狩りゲームの応用1:銀行取り付け 2017年度24  銀行が危ないという噂に対して預金者はどうするか  実際は健全経営なので、急な引き出しがなければ破綻しない  「引き出さない」→危険、「引き出す」→安全  みんなが「引き出す」と健全な銀行が破綻してしまう… 預金者2 預金者1 引き出さない 引き出す 引き出さない 2 2 1 -10 引き出す -10 1 0 0 インセンティブ設計の理論
  25. 25. 銀行取り付け:ナッシュ均衡 2017年度25  銀行が危ないという噂に対して預金者はどうするか  実際は健全経営なので、急な引き出しがなければ破綻しない  「引き出さない」→危険、「引き出す」→安全  みんなが「引き出す」と健全な銀行が破綻してしまう… 預金者2 預金者1 引き出さない 引き出す 引き出さない 2 2 1 -10 引き出す -10 1 0 0 インセンティブ設計の理論
  26. 26. 銀行取り付け:預金保護制度がある場合 2017年度26  銀行が破たんしても預金を保護すると…  仮に破たんしても預金者は損することが無い  「引き出さない」 → 危険なし、「引き出す」 → 意味がない  (引き出さない、 引き出さない)が唯一のナッシュ均衡に! 預金者2 預金者1 引き出さない 引き出す 引き出さない 2 2 1 2 引き出す 2 1 1 1 インセンティブ設計の理論
  27. 27. 預金保険制度の効果 2017年度27 インセンティブ設計の理論
  28. 28. 鹿狩りゲームの応用2:イジメ問題 2017年度28  クラスメートがいじめ問題に立ち向かえるか  どちらの生徒にとっても、いじめが解決するのがベスト  自分だけ「立ち向かう」といじめの標的になる危険がある  みんなが安全に「見ないフリ」をするといじめは無くならない… 生徒2 生徒1 立ち向かう 見ないフリ 立ち向かう 2 2 0 -10 見ないフリ -10 0 0 0 インセンティブ設計の理論
  29. 29. イジメ問題:ナッシュ均衡 2017年度29  クラスメートがいじめ問題に立ち向かえるか  どちらの生徒にとっても、いじめが解決するのがベスト  自分だけ「立ち向かう」といじめの標的になる危険がある  みんなが安全に「見ないフリ」をするといじめは無くならない… 生徒2 生徒1 立ち向かう 見ないフリ 立ち向かう 2 2 0 -10 見ないフリ -10 0 0 0 インセンティブ設計の理論
  30. 30. SNS選択:ネットワーク外部性 2017年度30 インセンティブ設計の理論 利用者数が増えるにつれて 財・サービスの利便性が向上 ↓ さらなる利用者増をもたらす! <ポジティブ・フィードバック>
  31. 31. レストランの行列:社会的学習 2017年度31  どちらのレストランを選ぶか?  個々の客はお店に関する不確実な情報を受け取る  自分の情報と混み具合を見てお店を決定!  果たして美味しいお店に行列はできるのか? おいしい 和食処 俺の ザ・和食 インセンティブ設計の理論
  32. 32. おさらい:同調行動の例 2017年度32 1. 共同作業: どのパソコンを使うか?  コーディネーション・ゲーム 2. デートの場所:どこに遊びに行くか?  男女の争い 3. いじめ問題:加担するかしないか?  鹿狩りゲーム 4. SNS:どのサービスを使うか?  ネットワーク外部性 5. 行列:どの店に並ぶか?  社会的学習の理論 インセンティブ設計の理論
  33. 33. コミットメント 結果にコミットして優位に立とう 2017年度インセンティブ設計の理論33
  34. 34. 動学的なゲーム:参入ゲーム 2017年度34  プレーヤーは2種類の企業  既存企業と(潜在的な)参入企業  まずはじめに参入企業がこの独占市場に「参入する」か「しな い」かを決定する  後者の場合ゲームはただちに終了  参入企業は 0、既存企業は 4 の利得を得る  前者の場合、既存企業が次の意思決定を行う  参入が起こった場合に既存企業は「価格競争」するか「しな い」かを決定する  前者の場合、両企業はそれぞれ -1 の損失を被る  後者の場合、両企業はそれぞれ 1 の利得を得る インセンティブ設計の理論
  35. 35. 「ゲームの木」による描写 2017年度35  参入ゲームは以下のような「木」として表現できる (0,4) (-1,-1) (1,1) 参入企業 独占企業 しない 参入する 価格競争 しない インセンティブ設計の理論
  36. 36. 利得表を書いて分析すると… 2017年度36  どちらの企業も戦略は2つずつ  参入企業が「しない」を選ぶと利得は確定する 独占企業 参入企業 価格競争 しない 参入する -1 -1 1 1 しない 4 0 4 0 インセンティブ設計の理論
  37. 37. もっともらしくないナッシュ均衡? 2017年度37  ふたつのナッシュ均衡が存在する  左下(しない、価格競争)はもっともらしい均衡か? 独占企業 参入企業 価格競争 しない 参入する -1 -1 1 1 しない 4 0 4 0 インセンティブ設計の理論
  38. 38. 動学ゲーム分析で気を付けること 2017年度38  時間を通じた動学ゲームにはナッシュ均衡が複数存在 する場合が多い → これ自体は問題ではないが…  一部の均衡が信憑性のない「から脅し」に依存している  ゲームを「後ろから解く」ことによって、信憑性のない均 衡をきちんと排除することができる!  「バックワード・インダクション(後方帰納法)」と呼ぶ  この考えを解概念としてフォーマルに一般化すると  「部分ゲーム完全均衡」となる(本講義では省略) インセンティブ設計の理論
  39. 39. バックワード・インダクション解 2017年度39 ( ,4) (-1, ) ( , ) 参入企業 独占企業 しない 参入 価格競争 しない インセンティブ設計の理論 もし参入が起きてし まった場合には、独 占企業は価格競争を 「しない」のが得!
  40. 40. 逐次手番ゲームの例:Not 25 2017年度40  2人のプレーヤーが交互に数字を数え上げていく  各プレーヤーは1~3個の連続した数字を数える  最後に25の数字を数えたプレーヤーが負け  「Not XX」は一昔前に結構流行ったゲーム(のハズ)  先手もしくは後手に必勝戦略(必勝法)はあるだろうか?  あるとしたらそれはいったいどんな戦略か?  ネタバレになってしまうので必勝法は講義で…  もしも数字が他の数だったらどのように必勝法は変わる? インセンティブ設計の理論
  41. 41. ツェルメロの定理と“必勝法” 2017年度41  どのような動学的な2人ゲームにおいても 1. 結果が「勝ち」か「負け」しかなく 2. プレイヤーが交互に行動を選択し 3. 過去のプレーをすべて観察することができ 4. 偶然の要素による影響が全くなく 5. 必ず有限回の手番でゲームが終わる のであれば、どちらかのプレイヤーに必ず必勝戦略がある  【必勝戦略】 相手がどんなプレーをしてきても、必ず自分が 最終的に勝利できるような(動学的な)戦略  上の条件を満たせば必勝法は必ず存在する!  オセロ、チェス、将棋、囲碁には必ず必勝戦略がある! インセンティブ設計の理論
  42. 42. ツェルメロの定理の注意点 2017年度42  結果が「勝ち」「負け」「引き分け」の場合には… 1. 先手に必勝戦略がある 2. 後手に必勝戦略がある 3. どちらのプレーヤーにも「最低でも引き分けに持ち込むこと ができる」ような戦略がある (例: 〇×ゲーム) のいずれかが必ず成り立つ  必勝戦略の求め方については何も教えてくれない  複雑なゲームで必勝戦略を求めるのは現実的には不可能  「必ず必勝法がある」ことと「必勝法が見つかる」は違う  オセロ(8×8)ですら、まだ先手・後手必勝どちらかは不明 インセンティブ設計の理論
  43. 43. 参入ゲーム:再考 2017年度43  いったん参入が起これば価格競争は起こらない  もし独占企業が事前に「価格競争」にコミットできたら… (0,4) (-1,-1) (1,1) 参入企業 独占企業 しない 参入 価格競争 しない インセンティブ設計の理論
  44. 44. 参入ゲームとコミットメント 2017年度44  事後的には(いったん参入が起こったら)最適な価格競 争「しない」を選ばないことにコミットすると… (0,4) (-1,-1) (1,1) 参入企業 独占企業 しない 参入 価格競争 しない インセンティブ設計の理論
  45. 45. 銀行の破綻処理 2017年度45  プレーヤーは銀行と政府  はじめに銀行が動き、次に政府が動く動学ゲーム  まず銀行が「乱脈経営」か「まじめ」な経営かを決定  後者の場合ゲームはただちに終了  銀行は 1、政府(国民)は 10 の利得を得る  前者の場合、政府が次の意思決定を行う  乱脈経営によって経営破綻の危機が起きると、政府は 「見放す」か「救済」するかを決定する  前者の場合、両者はそれぞれ -1 の損失を被る  後者の場合、両者はそれぞれ 2 の利得を得る インセンティブ設計の理論
  46. 46. 「ゲームの木」による描写 2017年度46  「銀行の破綻処理」問題のゲームの木 (1,10) (-1,-1) (2,2) 銀行 政府 まじめ 乱脈経営 見放す 救済 インセンティブ設計の理論
  47. 47. バックワード・インダクション 2017年度47  救済を予期して乱脈経営が無くならない… (1,10) (-1,-1) (2,2) 銀行 政府 まじめ 乱脈経営 見放す 救済 インセンティブ設計の理論
  48. 48. コミットメント 2017年度48  もし政府が救済しないことにコミットできると… (1,10) (-1,-1) (2,2) 銀行 政府 まじめ 乱脈経営 見放す 救済 インセンティブ設計の理論
  49. 49. 航空機の開発投資:国際貿易競争 2017年度49  このゲームには2つの(非対称)ナッシュ均衡が存在  B社にもしもコミットメント・パワーがあるとどうなるか?  もちろん、「投資する」にコミットするのが最適!  現実にはどのようなコミットメント装置が考えられるか? A社 ╲ B社 投資する しない 投資する -5 -5 10 -2 しない -2 10 0 0 インセンティブ設計の理論
  50. 50. 政府がゲームを変える:戦略的貿易政策 2017年度50  もしも政府がB社への補助金にコミットできたら?  B社が投資を行ったら、(結果によらず)5だけ補助金を出す  このような戦略的通商政策は結果を改善できる  B社にとって「投資する」のが支配戦略になる  (投資する、しない)はもはやナッシュ均衡ではない! A社 ╲ B社 投資する しない 投資する -5 0 10 -2 しない -2 15 0 0 インセンティブ設計の理論
  51. 51. コミットメントの具体例 2017年度51  家電量販店などの「最低価格保証」  他店よりも1円でも高い商品があれば値下げします  事後的には最適ではない「価格競争」にコミットすることにより、 ライバル店の値下げを牽制する効果が期待できる!  代理人(エージェント)へ交渉や仕事を依頼する  代理人には条件を譲歩する権限が無い  交渉の余地がないことをコミットすることができる  ソフトウェアの「オープンソース」化  市場を独占化しないことにコミットする  ユーザーが安心してそのソフトを使えるように インセンティブ設計の理論
  52. 52. 現在バイアス:自分との闘い 2017年度インセンティブ設計の理論52  目の前にある事柄を過大に評価してしまうバイアス  時間非整合な意思決定に陥ってしまう…  ダイエット中でも目の前のケーキを我慢できない  夏休みの宿題にギリギリまで取り掛かれない  お小遣いを月のはじめにすぐ使い切ってしまう  (事前の)計画通りに行動するためには、(事後的な)欲 求を抑え込むだけの自己抑制が必要  なかなか難しい かもしれないので… → 「結果にコミット」することで解決! → ナッジも有効!(年金加入など)
  53. 53. 時間非整合な意思決定 2017年度インセンティブ設計の理論53 A) 今すぐに1万円もらう B) 1カ月後に1万500円もらう ⇒ 現在バイアスが強い人はAを選ぶ C) 1年後に1万円もらう D) 1年1か月後に1万500円もらう ⇒ Aを選んだ人も多くはDを選ぶ Dを選んだ人に1年経ってから最初の質問をすると…
  54. 54. 現在バイアスを弱める工夫 2017年度インセンティブ設計の理論54 A) 今すぐに1万円もらう B) 1カ月後に1万500円もらう ⇒ この聞き方だとAを選ぶ人が多い C) 今すぐ1万円もらうけど、1カ月後は1円ももらえない D) 今すぐには1円ももらえないけど、1カ月後は1万500円 もらう ⇒ 自制的なDを選ぶ人が増える!
  55. 55. 繰り返しゲーム 人はなぜ協力するのか 2017年度インセンティブ設計の理論55
  56. 56. 囚人のジレンマ:ストーリー 2017年度56  AさんとBさんの2人がある犯罪容疑で逮捕された!  有罪にするだけの証拠がなく、検事は自白が頼り(焦)  そこで、次のような司法取引を容疑者に持ちかけた…  2人とも自白すれば、A、Bともに懲役3年  2人とも黙秘すれば、A、Bともに懲役1年  Aが自白、Bが黙秘すれば、Aは釈放、Bは懲役5年  Bが自白、Aが黙秘すれば、Bは釈放、Aは懲役5年  まず、このゲームを表の形でまとめてみよう!  プレイヤー、戦略、利得が一目で分かるようになる インセンティブ設計の理論
  57. 57. 囚人のジレンマ:利得表(/利得行列) 2017年度57  ここでは、懲役の年数(×マイナス)を利得に設定  (実は他の数字でも同じ「囚人のジレンマ」を表すことが可能) B A 黙秘 自白 黙秘 -1 -1 0 -5 自白 -5 0 -3 -3 インセンティブ設計の理論
  58. 58. 囚人のジレンマ:利得表による分析(1) 2017年度58  もしも相手(B)が黙秘を選んでいた場合には  自分(A)は自白を選ぶ方が得: 0 > -1 なので B A 黙秘 自白 黙秘 -1 -1 0 -5 自白 -5 0 -3 -3 インセンティブ設計の理論
  59. 59. 囚人のジレンマ:利得表による分析(2) 2017年度59  もしも相手(B)が自白を選んでいた場合には  自分(A)は自白を選ぶ方が得: -3 > -5 なので B A 黙秘 自白 黙秘 -1 -1 0 -5 自白 -5 0 -3 -3 インセンティブ設計の理論
  60. 60. 囚人のジレンマ:利得表による分析(3) 2017年度60  (黙秘、黙秘)が2人にとって望ましい結果に見えるが…  実は相手の戦略によらず「自白」するのが各自の最適戦略!  各人が合理的に選択する結果、(自白、自白)が実現!  まさに、囚人の「ジレンマ」が起こってしまう… B A 黙秘 自白 黙秘 -1 -1 0 -5 自白 -5 0 -3 -3 インセンティブ設計の理論
  61. 61. 囚人のジレンマ:注意点 2017年度61  このゲームでは個々のプレーヤーが最適戦略を持つ  【最適戦略(支配戦略)】 他のプレーヤーたちがどのような行 動を選択しても、自分がある特定の行動Aを選ぶことによって 利得が最大化されるとき、行動Aを「支配戦略」と呼ぶ。  支配戦略の組み合わせは必ずナッシュ均衡になる!  支配戦略が存在しないゲームもたくさんある  各人の最適な意思決定 ≠ 全体にとっての効率性  ナッシュ均衡が全体にとって望ましい結果(パレート効率的な 結果)をもたらすとは限らない!  「アダム・スミスは間違っていた!」(映画『ビューティフル・マイ ンド』のナッシュの台詞)を簡潔に体現している インセンティブ設計の理論
  62. 62. 囚人のジレンマの応用:価格競争 2017年度インセンティブ設計の理論62 【プレイヤー】 X社とY社が価格競争を行っている 【戦略】 価格を「据え置く」か「値下げ」の2つ 【利得】 利潤は次のように決まる  両企業とも据え置きの場合にはともに 2 億円の利益  両企業とも値下げの場に合はともに利益はゼロ  X が値下げ、Y が現状価格だと  X は 3 億円の利益、Y は 1 億円の損失  Y が値下げ、X が現状価格だと  Y は 3 億円の利益、X は 1 億円の損失
  63. 63. 価格競争:利得表による分析 2017年度63  (据え置き、据え置き)が2人にとって望ましい結果だが…  実は相手の戦略によらず「値下げ」するのが各社の最適戦略!  各社が合理的に選択する結果、(値下げ、値下げ)が実現!  泥沼の「価格競争」から逃れることができない… Y X 据え置き 値下げ 据え置き 2 2 3 -1 値下げ -1 3 0 0 インセンティブ設計の理論
  64. 64. 囚人のジレンマ:別の利得表 2017年度64  それぞれのプレイヤーにとっての結果の望ましさ:  (裏切、協力)>(協力、協力)>(裏切、裏切)>(協力、裏切) プレイヤー2 プレイヤー1 協力 裏切り 協力 2 2 3 0 裏切り 0 3 1 1 インセンティブ設計の理論
  65. 65. 囚人のジレンマの応用例 2017年度65 現象 プレイヤー 「協力」 「裏切り」 軍拡競争 国 軍縮 軍拡 国際貿易政策 国 関税引き下げ 税率据え置き 男女間の協力 カップル 相手に従う 相手に要求 公共財供給 地域住民 貢献/負担 ただ乗り 森林伐採 きこり 控えめに伐採 とれるだけ伐採 インセンティブ設計の理論
  66. 66. ゲームのルールが変わると… 2017年度66  検事が司法取引を提示しなかったら、(黙秘、黙秘)が実現  相手の戦略によらず「黙秘」するのが各自の最適戦略に  検事が望んでいる結果=(自白、自白)は実現できない…  司法取引によって初めて囚人の「ジレンマ」が起こる! B A 黙秘 自白 黙秘 -1 -1 -3 -3 自白 -3 -3 -3 -3 インセンティブ設計の理論
  67. 67. ゲーム理論を活用した制度設計 2017年度67  人々に望ましい行動をとらせるためにゲームのルールを 変更するような実例はたくさんある!  課徴金減免(リニエンシー)制度  談合・カルテルを自己申告した企業に課徴金を減免  インセンティブ契約  業績に連動した人事制度や報酬体系  マーケットデザイン  オークション制度やマッチング・メカニズムへの実装 インセンティブ設計の理論
  68. 68. 長期的関係 2017年度68  以上の分析では、プレーヤーたちがゲームを一回だけプ レーするという状況を扱ってきた  現実には、同じ相手と同様のゲームを繰り返す場合がある  繰り返しゲーム → 長期的関係を自然に描写できる  囚人のジレンマで協力することができる場合がある!  1回限りでは裏切るのが得 → 協調達成は不可能だった  いったん裏切ると、協調関係が崩れて将来相手から協力して もらえなくなる、という脅し(お仕置き)が有効に  長期的な関係によって多様な結果が実現できるように  契約を使っても同じ結果が実現できるかもしれないが… インセンティブ設計の理論
  69. 69. 長期的関係のメリット 契約のデメリット 2017年度69 契約は長期的関係と比べて以下の短所がある  逸脱や裏切りを裁判所が見破ることは難しい  そもそも「協力」の定義や意味合い自体が曖昧  裏切り行為を当事者が立証するのはコストがかかる  そもそも裁判所や契約を監督する第三者がいない場合  例) 過去や途上国での経済活動、地球温暖化など  短期的(近視眼的)な利益の追求と長期的な損失とのト レードオフを分析する最善のツールが繰り返しゲーム! インセンティブ設計の理論
  70. 70. 繰り返しゲーム 2017年度70  繰り返しゲームは同じプレーヤー達が同一のゲーム(「ステー ジゲーム」と呼ぶ)をT回繰り返す  Tが有限: 有限回繰り返しゲーム  Tが無限: 無限回繰り返しゲーム  プレーヤー達は過去のプレー(「歴史」と呼ぶ)をすべて観察 することができる  「完全観測」(Perfect Monitoring)の仮定  不完全観測のケースについては複雑なので扱わない…  繰り返しゲーム全体の利得はどう定義するか  有限回: ステージゲームの利得の和  無限回: 将来利得の割引現在価値の和 インセンティブ設計の理論
  71. 71. 2回繰り返し「囚人のジレンマ」 2017年度71  2期目は実質的に通常の(1回だけの)囚人のジレンマ  1期目にどうプレーしても、2期目の結果は(裏切り、裏切り)  ゲームを後ろから解くと、毎期(裏切り、裏切り)が実現  繰り返しても(協力、協力)は実現できない… プレーヤー2 プレーヤー1 協力 裏切り 協力 2 2 3 -1 裏切り -1 3 0 0 インセンティブ設計の理論
  72. 72. 有限回繰り返しゲーム 2017年度72  動学ゲームの一種 → 後ろ(最終期)から解くべし! 1. 一番最後のステージゲームのナッシュ均衡を求める 2. その結果をもとに、最後から二番目のゲームを分析 3. 以下、順番に最初までさかのぼって全体のゲームの均衡 (これを「部分ゲーム完全均衡」と呼ぶ)を求める  ステージゲームにナッシュ均衡が一つしかない場合  毎期(それまでの歴史と関係なく)そのナッシュ均衡をプレーし 続けるのが、唯一の部分ゲーム完全均衡となる  ステージゲームのナッシュ均衡が複数の場合  様々な結果が均衡として実現できる → 詳しくは後述 インセンティブ設計の理論
  73. 73. 世界の終わりが分かるとお金は使えない? 2017年度73 もしも世界がT期後に終わるとすると… 1. T期 → 次の期が無いので誰もお金を受け取らない 2. T-1期 → お金を受け取っても来期は絶対使えない  実質的に今期が最終期 → 誰もお金を受け取らない 3. T-2期 → お金を受け取っても将来に使うことは無理  やはり誰もお金を受け取ろうとしない  以下、1期にさかのぼるまでこの議論は続く… 4. 世界の終わりが分かった瞬間に紙幣は紙くずに!? インセンティブ設計の理論
  74. 74. 有限回繰り返しゲームの罠 2017年度74  Tはどんなに大きい数でも構わない  いつかこの世界(人類の歴史)は終わる → Tは有限  疑問) だとすると、今すぐお金が使えなくなるのでは?  「有限の長さでゲームが終わる」のと「T期でゲームが終 わることが確実に分かっている」のは全く異なる状況  ゲームを後ろから解くためには、プレーヤーたちがいつゲー ムが終わるのかをお互いに正確に知っている必要がある  知らない場合には、常に将来の可能性を考慮するはず!  例) 今期裏切ったら、将来お仕置きされるかもしれない…  実は「無限回繰り返しゲーム」として分析する方が適切 インセンティブ設計の理論
  75. 75. 将来の価値を「割り引く」とは? 2017年度75  無限回繰り返しゲームでは、将来の利得を「割り引く」  来期の利得は、今期と比べて小さく(δ倍で)評価される  この(1より小さい)δを「割引因子」(discount factor)と呼ぶ  割引因子が大きい = 将来を重視(忍耐強い)  割引因子が小さい = 現在を重視(刹那的?)  さまざまな理由によって将来は割り引かれる  利子の存在: 金銭リターンは利回りで調整して評価する  主観的割引: 今すぐもらえる利得を将来の利得より重視する  ゲーム終了リスク: ゲームが終わる危険性を考慮する インセンティブ設計の理論
  76. 76. 協力を達成するための条件 2017年度76  次の形で定義される「トリガー戦略」を考える  最初の期には(協力、協力)をプレーする  過去に誰も裏切らない限り、(協力、協力)をプレーし続ける  もしも誰かが裏切った場合には、次の期以降ずっと(その後に 何が起きようが)(裏切り、裏切り)をプレーし続ける  協力を達成するためには、裏切りがもたらす将来の損失 が短期的な利益よりも大きくないといけない 3/12 1 1 ...221...2223 22         インセンティブ設計の理論
  77. 77. 無限回繰り返し「囚人のジレンマ」 2017年度77  無限回の場合にはゲームに終わり(最終期)が無い  うまくお仕置きの仕組みを作ると(協力、協力)が実現できる  実は、これ以外の多様な行動パターンも実現できる  これを「フォーク定理」と呼ぶ プレーヤー2 プレーヤー1 協力 裏切り 協力 2 2 3 -1 裏切り -1 3 0 0 インセンティブ設計の理論
  78. 78. 実現可能(?)な様々な行動パターン 2017年度インセンティブ設計の理論78 1. 奇数期は(協力、協力)、偶数期は(裏切り、裏切り) 2. 各期コインを投げて  表が出たら(協力、裏切り)  裏が出たら(裏切り、協力) 3. 最初のT期間は(裏切り、裏切り)、それ以降はずっと (協力、協力) 4. 最初のT期間は(協力、協力)、それ以降はずっと(裏 切り、裏切り)  (トリガー戦略を使って)部分ゲーム完全均衡で実現する ための割引因子の範囲を求めてみよう!
  79. 79. トリガー戦略以外の“お仕置き” 2017年度インセンティブ設計の理論79 1. T期間(裏切り、裏切り)を続けて、それ以降は元の(協 力、協力)に戻る。もしも最初のT期内に逸脱があった 場合はまた最初からT期間(裏切り、裏切り)を続ける 2. 各期コインを投げて  表が出たら(協力、裏切り)  裏が出たら(裏切り、協力) 3. 最初に(協力、協力)をプレーして、2期目以降は前の 期に相手がとった戦略をプレーする  「しっぺ返し(Tit for Tat)」戦略と呼ばれる  部分ゲーム完全均衡でずっと(協力、協力)を実現する ための割引因子の範囲を求めてみよう!
  80. 80. しっぺ返し戦略のインセンティブ条件 2017年度インセンティブ設計の理論80  前期のプレーが(協力、裏切り)のとき  しっぺ返し戦略に従い続けると → (裏切り、協力)、(協力、裏切り)、(裏切り、協力)…  しっぺ返し戦略から(今期だけ)逸脱すると → (協力、協力)、(協力、協力)、(協力、協力)…  前期のプレーが(協力、協力)のとき  しっぺ返し戦略に従い続けると → (協力、協力)、(協力、協力)、(協力、協力)、…  しっぺ返し戦略から(今期だけ)逸脱すると → (裏切り、協力)、(協力、裏切り)、(裏切り、協力)…  両方の条件を同時に満たすことは不可能!  「しっぺ返し」戦略は部分ゲーム完全均衡にならない
  81. 81. 繰り返しゲームで実現しやすい行動 2017年度インセンティブ設計の理論81  中途半端な協力よりも完全な協力の方が簡単!  (協力、協力)を毎期続けるときに、必要な割引因子が最小に  協力の度合いが下がると、逸脱せずに得られる期待利得も低 下する → (相対的に)逸脱するインセンティブが増大  ユルいお仕置きよりも厳しいお仕置きの方が効果的!  トリガー戦略が“協力”のために必要な割引因子を最小に  一見するともっともらしい「しっぺ返し」戦略は実は…  もしも不確実性が入った場合にはどうなるだろうか?  相手の行動が不正確にしか観察できない  一定の確率で自分の戦略を選び間違える
  82. 82. (ナッシュ回帰の)フォーク定理 2017年度82  プレーヤーたちの割引因子が十分に大きい(将来をほと んど割り引かない)とき、ステージゲームのナッシュ均衡 利得を(全員にとって)上回るすべての利得の組み合わ せを、部分ゲーム完全均衡として達成することができる  フォーク定理はトリガー戦略を使って証明できる 1. 目標とする利得を獲得できるような戦略をまずは計画する 2. この長期的な戦略から誰も逸脱しない限り、全員で計画に 従ってプレーを続ける 3. もしも誰かが逸脱した場合には、次の期以降ずっと(その 後に何が起きようが)ナッシュ均衡をプレーし続ける インセンティブ設計の理論
  83. 83. フォーク定理のイメージ図 2017年度83 (2, 2) (0, 0) (-1, 3) (3, -1) 実現可能な利得の集合 ナッシュ均衡 インセンティブ設計の理論
  84. 84. 共有地の悲劇と共有地の統治 2017年度84  一般に、共有資源(コモンズ)の管理は難しい  各人に消費/利用し過ぎるインセンティブが発生  例) 漁場の乱獲、森林破壊、環境汚染、温泉の枯渇  「共有地の悲劇」(Tragedy of Commons)と呼ばれる  伝統的な経済学による解決策  私有化: 共有地を区切って私有化してしまう  政府管理: 政府に直接管理を委ねて、利用料を適切に課す  「共有地の統治」 by オストロム(2009年ノーベル賞)  共有地を地元住民が(長期的関係を通じて)自分たちで統治 インセンティブ設計の理論

×