Más contenido relacionado
Más de Deep Learning JP (20)
[DL輪読会]IDA-3D: Instance-Depth-Aware 3D Object Detection From Stereo Vision for Autonomous Driving
- 3. 書誌情報
● タイトル
○ IDA-3D: Instance-Depth-Aware 3D Object Detection From Stereo Vision for Autonomous
Driving
● 著者
○ Wanli Peng, Hao Pan, He Liu, Yi Sun
● CVPR 2020
● リンク
○ https://openaccess.thecvf.com/content_CVPR_2020/html/Peng_IDA-3D_Instance-Depth-Awar
e_3D_Object_Detection_From_Stereo_Vision_for_Autonomous_CVPR_2020_paper.html
3
- 4. 概要
● 3D物体検出タスク
○ 3D Bounding Box の推定
○ 本論文の条件
■ 高コストなLiDARによる Depth Map は学習時でも使用しない
■ ステレオ画像
● 本論文の貢献
○ 上記の条件の中では SOTA
○ Depth Mapを学習に利用したモデルと比較しても精度の近いモデルの実現
4
- 5. 関連研究
● Stereo R-CNN
○ Region Proposal Network (RPN) の用いて, 物体周辺 (Region of Interest; RoI) 以外の情報を落
とす.
○ 地面に接している特徴点等の情報を推論し , 3D BBoxに変形する.
5
- 8. Instance Depth Aware (IDA) Module
● RPNによって切り抜いた特徴量マップに対し , Cost Volume を作成
○ shape (depth level, width, height, feature size)
● 3DCNNを通して, Depth Level の確率分布を出力し , その期待値を予測値とする
8
- 9. Nonuniform Depth
● Disparity (視差) は物体が近くにあるほど大きい
● Disparity に合わせて, Depthに変換すると遠くにある物体の誤差が大きくなってしまう .
● Depth Levelを式(3)のように変換することで誤差を抑える .
9
- 11. 実験
● KITTIデータセットを使用
● 以下の図
○ M : 単眼画像からの推論するモデル
○ S : ステレオ画像から推論するモデル (本実験と同じ前提条件 )
○ AP_bev: bird-eye-view (鳥瞰図) の2D BBoxに変換してから Average Precisionを計算
11