6. 既存の3D姿勢推定
6Analytical: 幾何的に解決する手法、Predictive: ネットワークで解決する手法
Single Camera
Multi Camera
Analytical
Predictive
Analytical
Predictive
Single
Camera
Multi
Camera
Multi
Person
Single
Person
射影したときに2D keypointにあうように3D keypointを最適化
2D keypointから3D keypointを回帰 (Deep的手法中心)
複数視点の2D keypointを幾何的手法(三角測量)で3D keypointを再現
複数の2D keypointを3D特徴表現に落として回帰 (幾何的要素も含むことあり)
Single Personに帰着 (Top-down) / Multi-Cameraの特殊ケース
Pictorical modelやRe-identificationを使い、カメラ間の人物の紐付け
7. 既存の3D姿勢推定
7Analytical: 幾何的に解決する手法、Predictive: ネットワークで解決する手法
Single Camera
Multi Camera
Analytical
Predictive
Analytical
Predictive
Single
Camera
Multi
Camera
Multi
Person
Single
Person
• 以下の2つの項目が特に関連項目
Single-Person Multi-Camera
Multi-Person Multi-Camera
• Single-Person Multi-Cameraのタスクは比較的論文あり
提案手法の発想が影響を強く受けているようにみえる
精度の高いモデルはPredictive要素を含む (こちらが現状の主流な雰囲気)
• Multi-Person Multi-Cameraの研究はあまり盛んでない
比較のために出てくるという感じ
提案手法はむしろ、Single-Person Multi-Cameraの考え方を応用させたと捉え
るほうが自然
8. 既存の3D姿勢推定
8Analytical: 幾何的に解決する手法、Predictive: ネットワークで解決する手法
Single Camera
Multi Camera
Analytical
Predictive
Analytical
Predictive
Single
Camera
Multi
Camera
Multi
Person
Single
Person
Learnable Triagular of Human Pose [Iskakov+ ICCV’19 (oral)]
① triangulationを活用する手法と② 3D特徴を使う手法の2つを提案
②のほうが精度が良くメインの手法 (SOTA/今回の提案手法に近い)
Cross View Fusion for 3D Human Pose Estimation [Qiu+ ICCV’19]
2D姿勢の結果とtriangulationを活用する手法 ([Iskakov+]①に近い)
Epipolar Transformers [He+ CVPR’20]
エピポーラ幾何を利用したモジュールの提案
上記2つの手法 ([Qiu+]と[Iskakov+]①)の精度向上
[Iskakov+ ICCV’19]① [Iskakov+ ICCV’19]②
9. 既存の3D姿勢推定
9Analytical: 幾何的に解決する手法、Predictive: ネットワークで解決する手法
Single Camera
Multi Camera
Analytical
Predictive
Analytical
Predictive
Single
Camera
Multi
Camera
Multi
Person
Single
Person
Fast and Robust Multi-Person 3D Pose Estimation from Multiple Views [Dong+
CVPR’19]
2Dの姿勢推定をカメラごとに独立で行い、同じ人物でグルーピング
を行い、Single-Personの3D姿勢推定の処理を行う
2D姿勢推定の結果を前提にするため、精度が落ちる
(この論文に[Iskakov+ ICCV’19]の要素を足す感じが今回紹介する
VoxelPoseのイメージ)