cvpaper.challengeにおいてECCVのOral論文をまとめた「ECCV 2020 報告」です。
ECCV2020 Oral論文 完全読破(2/2) [https://www.slideshare.net/cvpaperchallenge/eccv2020-22-238640597/1]
pp. 7-10 ECCVトレンド
pp. 12-81 3D geometry & reconstruction
pp. 82-137 Geometry, mapping and tracking
pp. 138-206 Image and Video synthesis
pp. 207-252 Learning methods
cvpaper.challengeはコンピュータビジョン分野の今を映し、トレンドを創り出す挑戦です。論文サマリ作成・アイディア考案・議論・実装・論文投稿に取り組み、凡ゆる知識を共有します。2020の目標は「トップ会議に30+本投稿」することです。
46. +αの情報
・ SQPnP is available at https://github.com/terzakig/sqpnp.
・.[1] Lu, C.P., Hager, G.D., Mjolsness, E.: Fast and globally convergent pose
estimation from video images. IEEE Transactions on Pattern Analysis and Machine
Intelligence 22(6), 610–622 (2000)
・[2]Schweighofer, G., Pinz, A.: Globally optimal O(n) solution to the PnP problem for
general camera models. In: British Machine Vision Conference. pp. 1–10 (2008)
81. +αの情報
・Yida Wang [https://www.researchgate.net/profile/Yida_Wang]
David Joseph Tan[http://campar.in.tum.de/Main/DavidTan]
Nassir Navab[https://scholar.google.de/citations?user=kzoVUPYAAAAJ&hl=ja]
Federico Tombari[https://scholar.google.com/citations?user=TFsE4BIAAAAJ&hl=ja]
Technische Universitat Munchen, Google Inc
・project page:[https://www.merl.com/research/license#KCNet]
・この研究室は毎年のように CVPRに論文を通している
Mining Point Cloud Local Structures by Kernel Correlation and Graph Pooling CVPR'18.
https://arxiv.org/abs/1712.06760
Adversarial Semantic Scene Completion from a Single Depth Image
2018 International Conference on 3D Vision (3DV)
152. 提案手法・新規性
・画像の一部のImage EditingのためのGANのエンコーダーネットワークを提案した
・変更する範囲の元を K, 先をVとして、K・Vは層の出力(The keys are single-location input features, and the values are patterns of output features.)
・全てのパラメータではなく、1つの層のみの重みを変更するようにした→Image Editingの被害を最小限に
・同じ層で出力される出力の距離そのものを最小化する関数を目的関数として選んだ
222. Post-Training Piecewise Linear Quantization for Deep Neural Networks
・効率よくDNNの重みを量子化するために、
長い尾を持つベル型分布を持つテンソル値を正確に近似するために、
PieceWise Linear Quantization (PWLQ) スキームを提案
・様々なタスクにおいて優れた性能を発揮することを実験的に示した
241. ・新しいVision-LanguageタスクImage Captioning with Reading Comprehensionとその
タスクのためのデータセットTextCapsを提案.
・SOTAな手法がTextCapsにおいてHuman精度とかなり差があることを示した.
TextCaps: a Dataset for Image Captioning with Reading Comprehension
まとめた人:Yue Qiu
247. ・血管, 神経膜, 道路網などの構造の描写に使う 2 値画像を生成するタスク.
・実画像の topology (ループの構造など) を学習させるために, GAN の生成器の loss に
topology GAN loss を導入.
・新たに提案した topology-aware な評価指標などを用いて, 有効性を確認.
TopoGAN: A Topology-Aware Generative Adversarial Network
まとめた人:古川 遼
248. 提案手法・新規性
・Topology GAN loss は, 実・生成画像から各々 1 次のパーシステント図を計算し, 得られ
たパーシステント図の集合の間の距離を測ることで計算される.
・Topology GAN loss を用いた学習をすることで, 実画像に近い topology の構造を持った
画像を生成できるようになった.