深層強化学習(DRL)は人間のような自律走行を実現するための有望な方法であり広く研究されている.しかし、DRLの実際の応用にはサンプル効率の低さと報酬関数の設計の難しさが妨げとなっている.DRLに人間の事前情報を組み込むことで、これらの問題を解消する新しいフレームワークを提案する.2つの都市交通シナリオ(無保護左折、環状交差点)で実験し、既存の手法と比較して最も良い性能を示した.