12. • Model/Architecture
– backbone
– neck
– head
• 学習時のテクニック
– Data Augmentation
– データ不均衡問題への対策
– 目的関数
• 推論時のテクニック・追加モジュール
– 受容野の拡張・強化
– Attention module
– Feature integration
– 活性化関数
– Post process
12
Object Detectionの体系整理
13. • 学習時のテクニック・手法
– Data Augmentation
• 画像情報に対するデータ拡張
– Photometric distortion(明るさ、コントラスト、色相、彩度、ノイズ), geometric distortion(スケーリング、クロップ、反転、回転)
• オクルージョン
– 画像レベル
» Random erase, cutout: 画像内の矩形領域を塗りつぶす
» hide-and-seek, grid mask: 複数の矩形領域を選択し、塗りつぶす
– 特徴量マップレベル
» DropOut, DropConect, DropBlock
• 組み合わせ
– MIxUp: 2枚の画像を用いて重ね合わせ
– CutMix: トリミングした画像を他の画像の矩形領域に被せる
– Style transfer GAN
13
Bag of freebies
14. • 学習時のテクニック・手法
– データセットの偏りに対する手法
• ラベルクラス間のデータ量不均衡問題
– two-stage modelの場合: hard negative example mining, online hard example mining
– one-stage modelの場合: focal loss
• ラベルクラス間の関連性の不均衡問題
– label smoothing, 蒸留
14
Bag of freebies
26. • Image Classification(ImageNet)と、Object Detection(MS COCO)でそれぞれ実験
– とにかくそれぞれのテクニック・手法を(ある程度の仮説を立てながらも)総当たりで実験し、良いものを採用するた
めの実験を行う
– 結果として、先述したProposed methodにたどり着いた
– 以下の軸で実験
1. Influence of different features on Classifier training
2. Influence of different features on Detector training
3. Influence of different backbones and pretrained weightings on Detector training
4. Influence of different mini-batch size on Detector training
5. GPU architecture
1. Maxwell
2. Pascal
3. Volta
26
Experiments