Más contenido relacionado
La actualidad más candente (13)
確率ロボティクス第十回
- 3. PFC(おさらい)
• 期待値計算において
「重み = パーティクルの重み/価値」とする
– ゴールに近いパーティクルが
行動決定に大きな影響を与える
• 投機的な行動が生成され、
ロボットがゴールを探すようになる
– ただしこれでもデッドロックは
発生する
• 問題を完全には解いていないので
Oct. 7, 2015 確率ロボティクスと移動ロボットの行動生成 3
G
4 3 2 1
5
6 7 8 9
重み1/3
重み1/7
- 8. PFCでの行動選択
• Q(bel,a)の値が最良の行動aを選択
– Qがコストを表す時は最小になるものを選択
• ただしどのQ(bel,a)も1より悪いと、
状況の改善は望めない
– 別の方策(+観測戦略)を使った方が良いかもしれない
– Qがコストを表す時は1より大きい場合
– 理由
• S[重み/動作前の価値*(報酬+動作後の価値)]
- S[重み/動作前の価値*(動作前の価値)]
= S[重み/動作前の価値*(報酬+動作後の価値)] - 1
• この値が0より大きいと価値が下がる
Oct. 7, 2015 確率ロボティクスと移動ロボットの行動生成 8
- 12. ポイント
• 特に賢そうにも役に立ちそうでもないが・・・
– 止まらない(理論上は止まることもある)
• 「止まらない」動作を手でコーディングすることはかなり難しい
– 稚拙だがゴール候補の部屋を探すような行動が発現
• もともと「探す」行動は価値反復では得られていなかった
– 位置推定が完璧に出来ればロボットは最適方策で動作
• Qの値が改善しない場合にfwを選択するので良い?
– 観測戦略が欲しい。ただ、Qの値で情報不足が明確に分かる
Oct. 7, 2015 確率ロボティクスと移動ロボットの行動生成 12