2. 研究背景
Deep Q-Network(1
Deep LearningをQ学習に適用したもの
• 先行研究
Preferred Networks” Autonomous robot car control
demonstration in CES2016”(2
• 複数ロボットの学習
• 複雑な環境の学習
1)Volodymyr Mnih, Koray Kavukcuoglu, David Silver,at el,
“Human-level control through deep reinforcement learning” Nature, 14236, pp.529—533
2)Preferred Reserch “CES2016でロボットカーのデモを展示してきました”
https://research.preferred.jp/2016/01/ces2016/
複数のRCカーが衝突しないで走行
指定ルートの走行
2