Enviar búsqueda
Cargar
SIGNATE オフロードコンペ 精度認識部門 3rd Place Solution
•
Descargar como PPTX, PDF
•
1 recomendación
•
1,666 vistas
Yusuke Uchida
Seguir
SIGNATE「オフロード画像のセグメンテーションチャレンジ」認識精度部門3位入賞の解法紹介です。https://signate.jp/competitions/101
Leer menos
Leer más
Tecnología
Denunciar
Compartir
Denunciar
Compartir
1 de 15
Descargar ahora
Recomendados
DeepVIO: Self-supervised Deep Learning of Monocular Visual Inertial Odometry ...
DeepVIO: Self-supervised Deep Learning of Monocular Visual Inertial Odometry ...
harmonylab
Semantic segmentation
Semantic segmentation
Takuya Minagawa
[DL輪読会]MetaFormer is Actually What You Need for Vision
[DL輪読会]MetaFormer is Actually What You Need for Vision
Deep Learning JP
SSII2021 [OS2-02] 深層学習におけるデータ拡張の原理と最新動向
SSII2021 [OS2-02] 深層学習におけるデータ拡張の原理と最新動向
SSII
三次元表現まとめ(深層学習を中心に)
三次元表現まとめ(深層学習を中心に)
Tomohiro Motoda
三次元点群を取り扱うニューラルネットワークのサーベイ
三次元点群を取り扱うニューラルネットワークのサーベイ
Naoya Chiba
【DL輪読会】Visual Classification via Description from Large Language Models (ICLR...
【DL輪読会】Visual Classification via Description from Large Language Models (ICLR...
Deep Learning JP
【DL輪読会】Vision-Centric BEV Perception: A Survey
【DL輪読会】Vision-Centric BEV Perception: A Survey
Deep Learning JP
Recomendados
DeepVIO: Self-supervised Deep Learning of Monocular Visual Inertial Odometry ...
DeepVIO: Self-supervised Deep Learning of Monocular Visual Inertial Odometry ...
harmonylab
Semantic segmentation
Semantic segmentation
Takuya Minagawa
[DL輪読会]MetaFormer is Actually What You Need for Vision
[DL輪読会]MetaFormer is Actually What You Need for Vision
Deep Learning JP
SSII2021 [OS2-02] 深層学習におけるデータ拡張の原理と最新動向
SSII2021 [OS2-02] 深層学習におけるデータ拡張の原理と最新動向
SSII
三次元表現まとめ(深層学習を中心に)
三次元表現まとめ(深層学習を中心に)
Tomohiro Motoda
三次元点群を取り扱うニューラルネットワークのサーベイ
三次元点群を取り扱うニューラルネットワークのサーベイ
Naoya Chiba
【DL輪読会】Visual Classification via Description from Large Language Models (ICLR...
【DL輪読会】Visual Classification via Description from Large Language Models (ICLR...
Deep Learning JP
【DL輪読会】Vision-Centric BEV Perception: A Survey
【DL輪読会】Vision-Centric BEV Perception: A Survey
Deep Learning JP
[DL輪読会]NeRF: Representing Scenes as Neural Radiance Fields for View Synthesis
[DL輪読会]NeRF: Representing Scenes as Neural Radiance Fields for View Synthesis
Deep Learning JP
モデルアーキテクチャ観点からの高速化2019
モデルアーキテクチャ観点からの高速化2019
Yusuke Uchida
【DL輪読会】“PanopticDepth: A Unified Framework for Depth-aware Panoptic Segmenta...
【DL輪読会】“PanopticDepth: A Unified Framework for Depth-aware Panoptic Segmenta...
Deep Learning JP
[DL輪読会]When Does Label Smoothing Help?
[DL輪読会]When Does Label Smoothing Help?
Deep Learning JP
コンピュータビジョンの研究開発状況
コンピュータビジョンの研究開発状況
cvpaper. challenge
Image Retrieval Overview (from Traditional Local Features to Recent Deep Lear...
Image Retrieval Overview (from Traditional Local Features to Recent Deep Lear...
Yusuke Uchida
【DL輪読会】NeRF-VAE: A Geometry Aware 3D Scene Generative Model
【DL輪読会】NeRF-VAE: A Geometry Aware 3D Scene Generative Model
Deep Learning JP
画像キャプションと動作認識の最前線 〜データセットに注目して〜(第17回ステアラボ人工知能セミナー)
画像キャプションと動作認識の最前線 〜データセットに注目して〜(第17回ステアラボ人工知能セミナー)
STAIR Lab, Chiba Institute of Technology
SIGNATE 鰹節コンペ2nd Place Solution
SIGNATE 鰹節コンペ2nd Place Solution
Yusuke Uchida
オープンワールド認識 (第34回全脳アーキテクチャ若手の会 勉強会)
オープンワールド認識 (第34回全脳アーキテクチャ若手の会 勉強会)
Takuma Yagi
文字認識はCNNで終わるのか?
文字認識はCNNで終わるのか?
Seiichi Uchida
[DL輪読会]Swin Transformer: Hierarchical Vision Transformer using Shifted Windows
[DL輪読会]Swin Transformer: Hierarchical Vision Transformer using Shifted Windows
Deep Learning JP
自己教師学習(Self-Supervised Learning)
自己教師学習(Self-Supervised Learning)
cvpaper. challenge
Depth Estimation論文紹介
Depth Estimation論文紹介
Keio Robotics Association
[DL輪読会]Vision Transformer with Deformable Attention (Deformable Attention Tra...
[DL輪読会]Vision Transformer with Deformable Attention (Deformable Attention Tra...
Deep Learning JP
【DL輪読会】SDEdit: Guided Image Synthesis and Editing with Stochastic Differentia...
【DL輪読会】SDEdit: Guided Image Synthesis and Editing with Stochastic Differentia...
Deep Learning JP
Swin Transformer (ICCV'21 Best Paper) を完璧に理解する資料
Swin Transformer (ICCV'21 Best Paper) を完璧に理解する資料
Yusuke Uchida
[DL輪読会]A closer look at few shot classification
[DL輪読会]A closer look at few shot classification
Deep Learning JP
【DL輪読会】DiffRF: Rendering-guided 3D Radiance Field Diffusion [N. Muller+ CVPR2...
【DL輪読会】DiffRF: Rendering-guided 3D Radiance Field Diffusion [N. Muller+ CVPR2...
Deep Learning JP
サーベイ論文:画像からの歩行者属性認識
サーベイ論文:画像からの歩行者属性認識
Yasutomo Kawanishi
近年のHierarchical Vision Transformer
近年のHierarchical Vision Transformer
Yusuke Uchida
You Only Look One-level Featureの解説と見せかけた物体検出のよもやま話
You Only Look One-level Featureの解説と見せかけた物体検出のよもやま話
Yusuke Uchida
Más contenido relacionado
La actualidad más candente
[DL輪読会]NeRF: Representing Scenes as Neural Radiance Fields for View Synthesis
[DL輪読会]NeRF: Representing Scenes as Neural Radiance Fields for View Synthesis
Deep Learning JP
モデルアーキテクチャ観点からの高速化2019
モデルアーキテクチャ観点からの高速化2019
Yusuke Uchida
【DL輪読会】“PanopticDepth: A Unified Framework for Depth-aware Panoptic Segmenta...
【DL輪読会】“PanopticDepth: A Unified Framework for Depth-aware Panoptic Segmenta...
Deep Learning JP
[DL輪読会]When Does Label Smoothing Help?
[DL輪読会]When Does Label Smoothing Help?
Deep Learning JP
コンピュータビジョンの研究開発状況
コンピュータビジョンの研究開発状況
cvpaper. challenge
Image Retrieval Overview (from Traditional Local Features to Recent Deep Lear...
Image Retrieval Overview (from Traditional Local Features to Recent Deep Lear...
Yusuke Uchida
【DL輪読会】NeRF-VAE: A Geometry Aware 3D Scene Generative Model
【DL輪読会】NeRF-VAE: A Geometry Aware 3D Scene Generative Model
Deep Learning JP
画像キャプションと動作認識の最前線 〜データセットに注目して〜(第17回ステアラボ人工知能セミナー)
画像キャプションと動作認識の最前線 〜データセットに注目して〜(第17回ステアラボ人工知能セミナー)
STAIR Lab, Chiba Institute of Technology
SIGNATE 鰹節コンペ2nd Place Solution
SIGNATE 鰹節コンペ2nd Place Solution
Yusuke Uchida
オープンワールド認識 (第34回全脳アーキテクチャ若手の会 勉強会)
オープンワールド認識 (第34回全脳アーキテクチャ若手の会 勉強会)
Takuma Yagi
文字認識はCNNで終わるのか?
文字認識はCNNで終わるのか?
Seiichi Uchida
[DL輪読会]Swin Transformer: Hierarchical Vision Transformer using Shifted Windows
[DL輪読会]Swin Transformer: Hierarchical Vision Transformer using Shifted Windows
Deep Learning JP
自己教師学習(Self-Supervised Learning)
自己教師学習(Self-Supervised Learning)
cvpaper. challenge
Depth Estimation論文紹介
Depth Estimation論文紹介
Keio Robotics Association
[DL輪読会]Vision Transformer with Deformable Attention (Deformable Attention Tra...
[DL輪読会]Vision Transformer with Deformable Attention (Deformable Attention Tra...
Deep Learning JP
【DL輪読会】SDEdit: Guided Image Synthesis and Editing with Stochastic Differentia...
【DL輪読会】SDEdit: Guided Image Synthesis and Editing with Stochastic Differentia...
Deep Learning JP
Swin Transformer (ICCV'21 Best Paper) を完璧に理解する資料
Swin Transformer (ICCV'21 Best Paper) を完璧に理解する資料
Yusuke Uchida
[DL輪読会]A closer look at few shot classification
[DL輪読会]A closer look at few shot classification
Deep Learning JP
【DL輪読会】DiffRF: Rendering-guided 3D Radiance Field Diffusion [N. Muller+ CVPR2...
【DL輪読会】DiffRF: Rendering-guided 3D Radiance Field Diffusion [N. Muller+ CVPR2...
Deep Learning JP
サーベイ論文:画像からの歩行者属性認識
サーベイ論文:画像からの歩行者属性認識
Yasutomo Kawanishi
La actualidad más candente
(20)
[DL輪読会]NeRF: Representing Scenes as Neural Radiance Fields for View Synthesis
[DL輪読会]NeRF: Representing Scenes as Neural Radiance Fields for View Synthesis
モデルアーキテクチャ観点からの高速化2019
モデルアーキテクチャ観点からの高速化2019
【DL輪読会】“PanopticDepth: A Unified Framework for Depth-aware Panoptic Segmenta...
【DL輪読会】“PanopticDepth: A Unified Framework for Depth-aware Panoptic Segmenta...
[DL輪読会]When Does Label Smoothing Help?
[DL輪読会]When Does Label Smoothing Help?
コンピュータビジョンの研究開発状況
コンピュータビジョンの研究開発状況
Image Retrieval Overview (from Traditional Local Features to Recent Deep Lear...
Image Retrieval Overview (from Traditional Local Features to Recent Deep Lear...
【DL輪読会】NeRF-VAE: A Geometry Aware 3D Scene Generative Model
【DL輪読会】NeRF-VAE: A Geometry Aware 3D Scene Generative Model
画像キャプションと動作認識の最前線 〜データセットに注目して〜(第17回ステアラボ人工知能セミナー)
画像キャプションと動作認識の最前線 〜データセットに注目して〜(第17回ステアラボ人工知能セミナー)
SIGNATE 鰹節コンペ2nd Place Solution
SIGNATE 鰹節コンペ2nd Place Solution
オープンワールド認識 (第34回全脳アーキテクチャ若手の会 勉強会)
オープンワールド認識 (第34回全脳アーキテクチャ若手の会 勉強会)
文字認識はCNNで終わるのか?
文字認識はCNNで終わるのか?
[DL輪読会]Swin Transformer: Hierarchical Vision Transformer using Shifted Windows
[DL輪読会]Swin Transformer: Hierarchical Vision Transformer using Shifted Windows
自己教師学習(Self-Supervised Learning)
自己教師学習(Self-Supervised Learning)
Depth Estimation論文紹介
Depth Estimation論文紹介
[DL輪読会]Vision Transformer with Deformable Attention (Deformable Attention Tra...
[DL輪読会]Vision Transformer with Deformable Attention (Deformable Attention Tra...
【DL輪読会】SDEdit: Guided Image Synthesis and Editing with Stochastic Differentia...
【DL輪読会】SDEdit: Guided Image Synthesis and Editing with Stochastic Differentia...
Swin Transformer (ICCV'21 Best Paper) を完璧に理解する資料
Swin Transformer (ICCV'21 Best Paper) を完璧に理解する資料
[DL輪読会]A closer look at few shot classification
[DL輪読会]A closer look at few shot classification
【DL輪読会】DiffRF: Rendering-guided 3D Radiance Field Diffusion [N. Muller+ CVPR2...
【DL輪読会】DiffRF: Rendering-guided 3D Radiance Field Diffusion [N. Muller+ CVPR2...
サーベイ論文:画像からの歩行者属性認識
サーベイ論文:画像からの歩行者属性認識
Más de Yusuke Uchida
近年のHierarchical Vision Transformer
近年のHierarchical Vision Transformer
Yusuke Uchida
You Only Look One-level Featureの解説と見せかけた物体検出のよもやま話
You Only Look One-level Featureの解説と見せかけた物体検出のよもやま話
Yusuke Uchida
DRIVE CHARTを支えるAI技術
DRIVE CHARTを支えるAI技術
Yusuke Uchida
SuperGlue;Learning Feature Matching with Graph Neural Networks (CVPR'20)
SuperGlue;Learning Feature Matching with Graph Neural Networks (CVPR'20)
Yusuke Uchida
画像認識と深層学習
画像認識と深層学習
Yusuke Uchida
Semi supervised, weakly-supervised, unsupervised, and active learning
Semi supervised, weakly-supervised, unsupervised, and active learning
Yusuke Uchida
Deep Fakes Detection
Deep Fakes Detection
Yusuke Uchida
モデル高速化百選
モデル高速化百選
Yusuke Uchida
畳み込みニューラルネットワークの高精度化と高速化
畳み込みニューラルネットワークの高精度化と高速化
Yusuke Uchida
Humpback whale identification challenge反省会
Humpback whale identification challenge反省会
Yusuke Uchida
DeNAにおける先端AI技術活用のチャレンジ
DeNAにおける先端AI技術活用のチャレンジ
Yusuke Uchida
コンピュータビジョン技術の実応用とビジネス
コンピュータビジョン技術の実応用とビジネス
Yusuke Uchida
深層学習を用いたコンピュータビジョン技術と運転行動モニタリングへの応用
深層学習を用いたコンピュータビジョン技術と運転行動モニタリングへの応用
Yusuke Uchida
畳み込みニューラルネットワークの研究動向
畳み込みニューラルネットワークの研究動向
Yusuke Uchida
PRMU研究会の今後のあり方について(NLP分野での取り組み紹介)
PRMU研究会の今後のあり方について(NLP分野での取り組み紹介)
Yusuke Uchida
モデルアーキテクチャ観点からのDeep Neural Network高速化
モデルアーキテクチャ観点からのDeep Neural Network高速化
Yusuke Uchida
最近のSingle Shot系の物体検出のアーキテクチャまとめ
最近のSingle Shot系の物体検出のアーキテクチャまとめ
Yusuke Uchida
Embedding Watermarks into Deep Neural Networks
Embedding Watermarks into Deep Neural Networks
Yusuke Uchida
"Scale Aware Face Detection"と"Finding Tiny Faces" (CVPR'17) の解説
"Scale Aware Face Detection"と"Finding Tiny Faces" (CVPR'17) の解説
Yusuke Uchida
Overcoming Catastrophic Forgetting in Neural Networks読んだ
Overcoming Catastrophic Forgetting in Neural Networks読んだ
Yusuke Uchida
Más de Yusuke Uchida
(20)
近年のHierarchical Vision Transformer
近年のHierarchical Vision Transformer
You Only Look One-level Featureの解説と見せかけた物体検出のよもやま話
You Only Look One-level Featureの解説と見せかけた物体検出のよもやま話
DRIVE CHARTを支えるAI技術
DRIVE CHARTを支えるAI技術
SuperGlue;Learning Feature Matching with Graph Neural Networks (CVPR'20)
SuperGlue;Learning Feature Matching with Graph Neural Networks (CVPR'20)
画像認識と深層学習
画像認識と深層学習
Semi supervised, weakly-supervised, unsupervised, and active learning
Semi supervised, weakly-supervised, unsupervised, and active learning
Deep Fakes Detection
Deep Fakes Detection
モデル高速化百選
モデル高速化百選
畳み込みニューラルネットワークの高精度化と高速化
畳み込みニューラルネットワークの高精度化と高速化
Humpback whale identification challenge反省会
Humpback whale identification challenge反省会
DeNAにおける先端AI技術活用のチャレンジ
DeNAにおける先端AI技術活用のチャレンジ
コンピュータビジョン技術の実応用とビジネス
コンピュータビジョン技術の実応用とビジネス
深層学習を用いたコンピュータビジョン技術と運転行動モニタリングへの応用
深層学習を用いたコンピュータビジョン技術と運転行動モニタリングへの応用
畳み込みニューラルネットワークの研究動向
畳み込みニューラルネットワークの研究動向
PRMU研究会の今後のあり方について(NLP分野での取り組み紹介)
PRMU研究会の今後のあり方について(NLP分野での取り組み紹介)
モデルアーキテクチャ観点からのDeep Neural Network高速化
モデルアーキテクチャ観点からのDeep Neural Network高速化
最近のSingle Shot系の物体検出のアーキテクチャまとめ
最近のSingle Shot系の物体検出のアーキテクチャまとめ
Embedding Watermarks into Deep Neural Networks
Embedding Watermarks into Deep Neural Networks
"Scale Aware Face Detection"と"Finding Tiny Faces" (CVPR'17) の解説
"Scale Aware Face Detection"と"Finding Tiny Faces" (CVPR'17) の解説
Overcoming Catastrophic Forgetting in Neural Networks読んだ
Overcoming Catastrophic Forgetting in Neural Networks読んだ
SIGNATE オフロードコンペ 精度認識部門 3rd Place Solution
1.
SIGNATE オフロード画像のセグメンテーション チャレンジ(認識精度部門) 3rd Place
Solution @yu4u 1
2.
コンペ概要 • 4クラスセグメンテーションタスク • background,
road, dirt road, other obstacle • データセット • train: オフロード環境の実走行で得られた画像(5014枚) • 19カテゴリ:3007枚(評価対象のroad, dirt road, other obstacleを含む) • 2カテゴリ:2007枚 • test: オフロード環境の実走行で得られた画像(640枚) • 評価指標 • road, dirt road, other obstacleのmIoU 2
3.
データ詳細 3
4.
アプローチ • モデル: 4
class segmentation model • FPN (efficientnet-b5) • UNet++ (efficientnet-b3, efficientnet-b5, efficientnet-b7, inceptionv4, resnet101, se_resnext101, skresnext50) • 8モデル x 5-fold CV = 40 model average ensemble • 損失関数 • cross entropy, iou, dice, lovasz loss • Optimizer • AdamW, lr: 1e-4 -> 1e-5, 30 epochs • augmentation • Resize to 960x540 • HorizontalFlip, RandomBrightnessContrast, ShiftScaleRotate • TTA: horizontal flip • train_images_Bは不使用 4
5.
Validation方針 • 類似画像が大量に存在するためrandom splitの信頼性が低い •
“データセットの類似に関して” • https://signate.jp/competitions/109/discussions/202101171843 52-39602 • クラスタリングしてみる • imagehashのphashを特徴量として sklearn.cluster.AgglomerativeClusteringを利用 • 凝縮型を利用したのは、同一道路を走っているような映像の場合でも その走行全体を1クラスタとしたいため 5
6.
(C) 防衛省・防衛装備庁
7.
Validation方針 • 類似画像が大量に存在するためrandom splitの信頼性が低い •
“データセットの類似に関して” • https://signate.jp/competitions/109/discussions/202101171843 52-39602 • クラスタリングしてみる • imagehashのphashを特徴量として sklearn.cluster.AgglomerativeClusteringを利用 • 凝縮型を利用したのは、同一道路を走っているような映像の場合でも その走行全体を1クラスタとしたいため • いっぱいクラスタが出てきた • が、「雪道」のようなレアなクラスタができてしまった • 雪道が認識できないモデルが生成される危険性があるため random splitを採用 7
8.
モデル • セグメンテーションアーキテクチャ • UNet,
UNet++, FPN, PAN, DeepLabV3+ を比較 • UNet++, FPNが良さそう • バックボーン • 良さそうなものもひたすら追加 • 学習がほぼ必要ない速度部門をやっていたので思考停止で学習だけ回していた • RegNetがあまりCV性能が良くなかったので外した以外は全て投入 • efficientnet-b3/b5/b7, inceptionv4, resnet101, se_resnext101, skresnext50 8
9.
損失関数 9 https://github.com/JunMa11/SegLoss
10.
損失関数 • Kaggleで良く利用されているcross entropy,
iou, dice, lovasz loss を採用 • CV上も全て利用したほうが良さそう 10
11.
Augmentation、Optimizer • Augmentation • HorizontalFlip,
RandomBrightnessContrast, ShiftScaleRotate • Optimizer • AdamW, lr: 1e-4 -> 1e-5 (CosineAnnealingWarmRestarts), 30 epochs • Automatic Mixed Precision利用 (ほぼ鰹節コンペの使いまわし) 11
12.
アンサンブル • 8モデル x
5-fold CV = 40 model average ensemble 12
13.
結果 13
14.
What did not
work • Pseudo label • train + train_images_B/test pseudo labelで訓練 • 評価される3ラベルのみiou, dice, lovasz lossを利用 14
15.
利用フレームワーク等 • パイプライン: pytorch-lightning •
config管理: OmegaConf • 実験管理: wandb • model: https://github.com/qubvel/segmentation_models.pytorch • Augmentation: albumentations • 参考図書 • https://neptune.ai/blog/image-segmentation-tips-and-tricks-from-kaggle- competitions • https://github.com/JunMa11/SegLoss • https://github.com/kevinzakka/pytorch-goodies 15
Descargar ahora