SlideShare una empresa de Scribd logo
1 de 34
Descargar para leer sin conexión
semantic segmentation
サーベイ
2019.4.19
hei4
本日の発表について
●
FCN 以降の semantic segmentation の手法について共有します
●
NN 以前の手法や、 NN でも FCN 以前の手法は紹介しません
●
紹介する手法の選択基準は独断ですが、
 後の研究に大きな影響を与えたと思う手法や
  SOTA な手法( 2019.4.19 現在)を選択したつもりです
●
SOTA は papers with code で判断しました
SOTA!
ニューラルネットワークによる画像認識
classification semanti segmentation
NN NN
車
船
飛行機
ヘリコプター
クラス数
1pix
1pix
RGB
=3 チャネル
クラス数チャネル
Wpix
Hpix
クラス数チャネル
Wpix
Hpix
クラス数だけのスコア
(クラス数次元のベクトル)画像
semantic segmentation の課題
●
物体のコンテキスト(意味)を得るためには、広い受容野が必要
●
広い受容野を形成するにはダウンサンプリングが効果的だが
(プーリング、ストライド、 ... )
ダウンサンプリングによって解像度が落ちると物体の輪郭情報が失われる
FCN (2015) [1]
Fully Convolutional Networks (FCN)
●
full connection がなく、すべて convolution で構成
●
full connection がないので任意の画像サイズの入力が可能
32 倍にアップ
サンプリング
FCN
●
一気に 32 倍アップサンプリングすると輪郭がほぼない
●
途中の特徴マップを使って段階的に
 アップサンプリング& element-wise addition (加算)
●
(更に -4s や -2s まで拡張すると・・・?)
 → U-Net がそれに近い
32 倍にアップ
サンプリング
2 倍
2 倍
16 倍 8 倍
U-Net (2015) [2]
●
対称な Encoder - Decoder 構造
●
Encoder の特徴マップを
  Decoder 側に concat (チャネル連結)
●
失われた輪郭情報を、
 ダウンサンプリング前の
 特徴マップから補っている
●
FCN と違い concat
SOTA!
Medical Image Segmentation
on ISBI 2012 EM Segmentation
U-Net
●
ISBI cell tracking challenge 2015 で
 従来手法(スライディングウィンドウ方式)に大差をつけて優勝
●
後の一般画像 segmentation の研究にも大きな影響を与えた
課題への対策①
●
物体のコンテキスト(意味)を得るためには、広い受容野が必要
●
広い受容野を形成するにはダウンサンプリングが効果的だが
(プーリング、ストライド、 ... )
ダウンサンプリングによって解像度が落ちると物体の輪郭情報が失われる
ネットワークの構造を工夫する
DeconvNet (2015) [3]
●
対称な Encoder - Decoder 構造
●
Encoder 部分は VGG-16 ( full connection 込み←重要)
full connection
特徴ベクトル
VGG-16
DeconvNet
●
Encoder で max pooling した位置を記録
●
Decoder の unpooling 時に使用
●
DeconvNet 単体での精度は良好とは言えず、
  FCN とのアンサンブルで効果を主張。曰く、
 「 DeconvNet は輪郭を捉え、
   FCN は概形を捉えることに長けている」
”our deconvolution network is appropriate to capture the fine-details of an object,
whereas FCN is typically good at extracting the overall shape of an object.”
DeconvNet
convolution convolution
convolution convolution convolution
upsampling upsampling
upsampling upsampling
SegNet (2017) [4]
●
Encoder – Decoder 構造で Encoder は VGG-16 を流用。
  Encoder の pooling インデックスを Decoder の unpooling に使用
●
DeconvNet とは full connection がないことが違う
●
SUNRGB-D データセットで FCN および DeconvNet より高精度を確認
VGG-16 ( full connection なし)
DeepUNet (2018) [5]
U 結合 (concat)
プラス結合 (element-wise addition)
DeepUNet
●
UNet に residual 構造を加えたことで、層が深いネットワーク構造が可能に
●
航空写真の2値分類(陸 / 海)タスク用の研究
●
(当該タスクでは、) U-Net および SegNet より高精度を確認
DownBlock
( Encoder 側)
UpBlock
( Decoder 側)
Attention U-Net (2018) [6]
●
Encoder 側の特徴マップを attention したマップに変換
●
attention したマップを Decoder 側に concat
attention したマップ
Attention Gate
ゲート信号
SOTA!
Pancreas Segmentation
on CT-150
Attention U-Net
ゲート信号
(低解像度の
特徴マップ)
高解像度の
特徴マップ
低解像度
sigmoid で [0, 1]
アップサンプリング
高解像度
attention されたマップ
Attention U-Net
●
上図は 3D 腹部 CT データにおいて、学習と共にアテンションが
 膵臓、腎臓、脾臓に集中する様子
●
TCIA Pancreas-CT データセットの segmentation タスクで
  U-Net より高精度を確認
3 エポック 6 エポック 10 エポック 60 エポック 150 エポック
課題への対策②
●
物体のコンテキスト(意味)を得るためには、広い受容野が必要
●
広い受容野を形成するにはダウンサンプリングが効果的だが
(プーリング、ストライド、 ... )
ダウンサンプリングによって解像度が落ちると物体の輪郭情報が失われる
モジュールを工夫する
PSPNet (2017) [7]
●
ResNet で特徴マップを作成してから、 Spatial Pyramid Pooling (SPP) で
 グリッドサイズの異なるグローバルなコンテキストを抽出
●
“ImageNet scene parsing challenge 2016” で FCN 、 SegNet より高精度を確認
●
高精度だが、とにかく動作が遅い模様 (出典: ESPNet )
Spatial Pyramid Pooling
ResNet
concat
入力の 1/8 サイズ
SOTA!
Real-Time Semantic Segmentation
on Cityscapes
Pyramid Scene Parsing Network
SPP+conv+upsample+concat
DeepLab -v2 (2017) [8]
●
ASP モジュールで解像度を低下せずに広い受容野を実現
ASP モジュール
CRF (Conditional Random Fields)
DeepLab -v2
●
atrous convolution: dilated convolution の別名
  kernel の間隔を広げることで、低解像度にせずに広い受容野を形成
●
ASP モジュールは間隔の異なる arous convolution を組み合わせており、
 異なる受容野の特徴量が抽出できる
DeepLab -v3+ (2018) [9]
●
v2 では Decoder はなく、アップサンプリングと CRF 後処理で推論していた
●
v3+ ではシンプルかつ軽量な Decoder を付与 (若干 U-Net 風味)
SOTA!
Semantic Segmentation
on PASCAL VOC 2012
DeepLab -v3+
●
さらに Xception のように separable (depth-wise & point-wise) に
  atrous convolution を分解して高精度化
●
(ネットワークサイズは? separable にすると軽くなりそうだが・・・)
●
Pascal VOC 2012 データセットで PSPNet より高性能を確認
ESPNet (2018) [10]
●
Efficient Spatial Pyramid (ESP) モジュール
 を使って軽量化&高速化
●
入力画像をダウンサンプリングした画像を
 ネットワークの途中で入力している
 ( ablation study で効果を検証)
●
Encoder 側のみを学習後、
  Decoder を追加して学習
ESP モジュール
1/2 サイズ
1/4 サイズ
Efficient Spatial Pyramid Networks
ESPNet
ASP モジュール from DeepLab ESP モジュール from ESPNet
●
ESPNet モジュールは concat を
 使うことで軽量化を実現
●
格子状アーティファクトが発生しないよう
  Hierarchical Feature Fusion (HFF)
 を使用してアーティファクト抑制
出力 N チャネル
N チャネル
出力 N チャネル
d=N/K チャネル
結局どの手法が良いのか?
精度 vs ネットワークサイズ [10]
Cityscape データセットでの結果
PSPNet は高精度
FCN はサイズと精度で
PSPNet に劣る
v3+ は v2 より高精度な筈
(サイズは?)
?
精度 vs 速度 [10]
Cityscape データセットでの結果。速度は GeForce GTX 960M で計測
高速な ESPNet
SegNet は速度と精度で
ESPNet に劣る
v3+ は v2 より高精度な筈(速度は?)?
総括
●
FCN 以降の semantic segmentation をサーベイ
●
精度重視なら DeepLab-v3+ 、あるいは PSPNet
●
速度重視、軽量重視なら ESPNet
●
しかし・・・
R2U-Net (2018) [11]
R2U-Net というものもある・・・
SOTA!
Lung Nodule Segmentation
on LUNA
Auto-DeepLab (2019) [12]
Auto-DeepLab というものもある・・・
To Be Continued ...
他にも様々な手法がありますが、
今回はここまで
出典
●
[1] Long, Jonathan, Evan Shelhamer, and Trevor Darrell. "Fully convolutional networks for semantic segmentation."
Proceedings of the IEEE conference on computer vision and pattern recognition. 2015.
●
[2] Ronneberger, Olaf, Philipp Fischer, and Thomas Brox. "U-net: Convolutional networks for biomedical image
segmentation." International Conference on Medical image computing and computer-assisted intervention. Springer, Cham,
2015.
●
[3] Noh, Hyeonwoo, Seunghoon Hong, and Bohyung Han. "Learning deconvolution network for semantic segmentation."
Proceedings of the IEEE international conference on computer vision. 2015.
●
[4] Badrinarayanan, Vijay, Alex Kendall, and Roberto Cipolla. "Segnet: A deep convolutional encoder-decoder architecture
for image segmentation." IEEE transactions on pattern analysis and machine intelligence 39.12 (2017): 2481-2495.
●
[5] Li, Ruirui, et al. "DeepUNet: a deep fully convolutional network for pixel-level sea-land segmentation." IEEE Journal of
Selected Topics in Applied Earth Observations and Remote Sensing 99 (2018): 1-9.
●
[6] Oktay, Ozan, et al. "Attention U-Net: learning where to look for the pancreas." arXiv preprint arXiv:1804.03999 (2018).
●
[7] Zhao, Hengshuang, et al. "Pyramid scene parsing network." Proceedings of the IEEE conference on computer vision and
pattern recognition. 2017.
●
[8] Chen, Liang-Chieh, et al. "Deeplab: Semantic image segmentation with deep convolutional nets, atrous convolution, and
fully connected crfs." IEEE transactions on pattern analysis and machine intelligence 40.4 (2018): 834-848.
●
[9] Chen, Liang-Chieh, et al. "Encoder-decoder with atrous separable convolution for semantic image segmentation."
Proceedings of the European Conference on Computer Vision (ECCV). 2018.
●
[10] Mehta, Sachin, et al. "Espnet: Efficient spatial pyramid of dilated convolutions for semantic segmentation." Proceedings
of the European Conference on Computer Vision (ECCV). 2018.
●
[11] Alom, Md Zahangir, et al. "Recurrent residual convolutional neural network based on u-net (r2u-net) for medical image
segmentation." arXiv preprint arXiv:1802.06955 (2018).
●
[12] Liu, Chenxi, et al. "Auto-deeplab: Hierarchical neural architecture search for semantic image segmentation." arXiv
preprint arXiv:1901.02985 (2019).

Más contenido relacionado

La actualidad más candente

SSII2021 [OS2-01] 転移学習の基礎:異なるタスクの知識を利用するための機械学習の方法
SSII2021 [OS2-01] 転移学習の基礎:異なるタスクの知識を利用するための機械学習の方法SSII2021 [OS2-01] 転移学習の基礎:異なるタスクの知識を利用するための機械学習の方法
SSII2021 [OS2-01] 転移学習の基礎:異なるタスクの知識を利用するための機械学習の方法SSII
 
SSII2022 [SS1] ニューラル3D表現の最新動向〜 ニューラルネットでなんでも表せる?? 〜​
SSII2022 [SS1] ニューラル3D表現の最新動向〜 ニューラルネットでなんでも表せる?? 〜​SSII2022 [SS1] ニューラル3D表現の最新動向〜 ニューラルネットでなんでも表せる?? 〜​
SSII2022 [SS1] ニューラル3D表現の最新動向〜 ニューラルネットでなんでも表せる?? 〜​SSII
 
深層学習の不確実性 - Uncertainty in Deep Neural Networks -
深層学習の不確実性 - Uncertainty in Deep Neural Networks -深層学習の不確実性 - Uncertainty in Deep Neural Networks -
深層学習の不確実性 - Uncertainty in Deep Neural Networks -tmtm otm
 
【DL輪読会】High-Resolution Image Synthesis with Latent Diffusion Models
【DL輪読会】High-Resolution Image Synthesis with Latent Diffusion Models【DL輪読会】High-Resolution Image Synthesis with Latent Diffusion Models
【DL輪読会】High-Resolution Image Synthesis with Latent Diffusion ModelsDeep Learning JP
 
Anomaly detection 系の論文を一言でまとめた
Anomaly detection 系の論文を一言でまとめたAnomaly detection 系の論文を一言でまとめた
Anomaly detection 系の論文を一言でまとめたぱんいち すみもと
 
Skip Connection まとめ(Neural Network)
Skip Connection まとめ(Neural Network)Skip Connection まとめ(Neural Network)
Skip Connection まとめ(Neural Network)Yamato OKAMOTO
 
SfM Learner系単眼深度推定手法について
SfM Learner系単眼深度推定手法についてSfM Learner系単眼深度推定手法について
SfM Learner系単眼深度推定手法についてRyutaro Yamauchi
 
backbone としての timm 入門
backbone としての timm 入門backbone としての timm 入門
backbone としての timm 入門Takuji Tahara
 
【DL輪読会】ViTPose: Simple Vision Transformer Baselines for Human Pose Estimation
【DL輪読会】ViTPose: Simple Vision Transformer Baselines for Human Pose Estimation【DL輪読会】ViTPose: Simple Vision Transformer Baselines for Human Pose Estimation
【DL輪読会】ViTPose: Simple Vision Transformer Baselines for Human Pose EstimationDeep Learning JP
 
Deep Learningによる超解像の進歩
Deep Learningによる超解像の進歩Deep Learningによる超解像の進歩
Deep Learningによる超解像の進歩Hiroto Honda
 
Optimizer入門&最新動向
Optimizer入門&最新動向Optimizer入門&最新動向
Optimizer入門&最新動向Motokawa Tetsuya
 
【論文紹介】How Powerful are Graph Neural Networks?
【論文紹介】How Powerful are Graph Neural Networks?【論文紹介】How Powerful are Graph Neural Networks?
【論文紹介】How Powerful are Graph Neural Networks?Masanao Ochi
 
[DL輪読会]ICLR2020の分布外検知速報
[DL輪読会]ICLR2020の分布外検知速報[DL輪読会]ICLR2020の分布外検知速報
[DL輪読会]ICLR2020の分布外検知速報Deep Learning JP
 
分散深層学習 @ NIPS'17
分散深層学習 @ NIPS'17分散深層学習 @ NIPS'17
分散深層学習 @ NIPS'17Takuya Akiba
 
SSII2020SS: 微分可能レンダリングの最新動向 〜「見比べる」ことによる3次元理解 〜​
SSII2020SS:  微分可能レンダリングの最新動向 〜「見比べる」ことによる3次元理解 〜​SSII2020SS:  微分可能レンダリングの最新動向 〜「見比べる」ことによる3次元理解 〜​
SSII2020SS: 微分可能レンダリングの最新動向 〜「見比べる」ことによる3次元理解 〜​SSII
 
DQNからRainbowまで 〜深層強化学習の最新動向〜
DQNからRainbowまで 〜深層強化学習の最新動向〜DQNからRainbowまで 〜深層強化学習の最新動向〜
DQNからRainbowまで 〜深層強化学習の最新動向〜Jun Okumura
 
畳み込みニューラルネットワークの高精度化と高速化
畳み込みニューラルネットワークの高精度化と高速化畳み込みニューラルネットワークの高精度化と高速化
畳み込みニューラルネットワークの高精度化と高速化Yusuke Uchida
 
[DL輪読会]ドメイン転移と不変表現に関するサーベイ
[DL輪読会]ドメイン転移と不変表現に関するサーベイ[DL輪読会]ドメイン転移と不変表現に関するサーベイ
[DL輪読会]ドメイン転移と不変表現に関するサーベイDeep Learning JP
 
SSII2021 [OS2-02] 深層学習におけるデータ拡張の原理と最新動向
SSII2021 [OS2-02] 深層学習におけるデータ拡張の原理と最新動向SSII2021 [OS2-02] 深層学習におけるデータ拡張の原理と最新動向
SSII2021 [OS2-02] 深層学習におけるデータ拡張の原理と最新動向SSII
 

La actualidad más candente (20)

SSII2021 [OS2-01] 転移学習の基礎:異なるタスクの知識を利用するための機械学習の方法
SSII2021 [OS2-01] 転移学習の基礎:異なるタスクの知識を利用するための機械学習の方法SSII2021 [OS2-01] 転移学習の基礎:異なるタスクの知識を利用するための機械学習の方法
SSII2021 [OS2-01] 転移学習の基礎:異なるタスクの知識を利用するための機械学習の方法
 
SSII2022 [SS1] ニューラル3D表現の最新動向〜 ニューラルネットでなんでも表せる?? 〜​
SSII2022 [SS1] ニューラル3D表現の最新動向〜 ニューラルネットでなんでも表せる?? 〜​SSII2022 [SS1] ニューラル3D表現の最新動向〜 ニューラルネットでなんでも表せる?? 〜​
SSII2022 [SS1] ニューラル3D表現の最新動向〜 ニューラルネットでなんでも表せる?? 〜​
 
深層学習の不確実性 - Uncertainty in Deep Neural Networks -
深層学習の不確実性 - Uncertainty in Deep Neural Networks -深層学習の不確実性 - Uncertainty in Deep Neural Networks -
深層学習の不確実性 - Uncertainty in Deep Neural Networks -
 
【DL輪読会】High-Resolution Image Synthesis with Latent Diffusion Models
【DL輪読会】High-Resolution Image Synthesis with Latent Diffusion Models【DL輪読会】High-Resolution Image Synthesis with Latent Diffusion Models
【DL輪読会】High-Resolution Image Synthesis with Latent Diffusion Models
 
Anomaly detection 系の論文を一言でまとめた
Anomaly detection 系の論文を一言でまとめたAnomaly detection 系の論文を一言でまとめた
Anomaly detection 系の論文を一言でまとめた
 
Skip Connection まとめ(Neural Network)
Skip Connection まとめ(Neural Network)Skip Connection まとめ(Neural Network)
Skip Connection まとめ(Neural Network)
 
SfM Learner系単眼深度推定手法について
SfM Learner系単眼深度推定手法についてSfM Learner系単眼深度推定手法について
SfM Learner系単眼深度推定手法について
 
backbone としての timm 入門
backbone としての timm 入門backbone としての timm 入門
backbone としての timm 入門
 
【DL輪読会】ViTPose: Simple Vision Transformer Baselines for Human Pose Estimation
【DL輪読会】ViTPose: Simple Vision Transformer Baselines for Human Pose Estimation【DL輪読会】ViTPose: Simple Vision Transformer Baselines for Human Pose Estimation
【DL輪読会】ViTPose: Simple Vision Transformer Baselines for Human Pose Estimation
 
Deep Learningによる超解像の進歩
Deep Learningによる超解像の進歩Deep Learningによる超解像の進歩
Deep Learningによる超解像の進歩
 
実装レベルで学ぶVQVAE
実装レベルで学ぶVQVAE実装レベルで学ぶVQVAE
実装レベルで学ぶVQVAE
 
Optimizer入門&最新動向
Optimizer入門&最新動向Optimizer入門&最新動向
Optimizer入門&最新動向
 
【論文紹介】How Powerful are Graph Neural Networks?
【論文紹介】How Powerful are Graph Neural Networks?【論文紹介】How Powerful are Graph Neural Networks?
【論文紹介】How Powerful are Graph Neural Networks?
 
[DL輪読会]ICLR2020の分布外検知速報
[DL輪読会]ICLR2020の分布外検知速報[DL輪読会]ICLR2020の分布外検知速報
[DL輪読会]ICLR2020の分布外検知速報
 
分散深層学習 @ NIPS'17
分散深層学習 @ NIPS'17分散深層学習 @ NIPS'17
分散深層学習 @ NIPS'17
 
SSII2020SS: 微分可能レンダリングの最新動向 〜「見比べる」ことによる3次元理解 〜​
SSII2020SS:  微分可能レンダリングの最新動向 〜「見比べる」ことによる3次元理解 〜​SSII2020SS:  微分可能レンダリングの最新動向 〜「見比べる」ことによる3次元理解 〜​
SSII2020SS: 微分可能レンダリングの最新動向 〜「見比べる」ことによる3次元理解 〜​
 
DQNからRainbowまで 〜深層強化学習の最新動向〜
DQNからRainbowまで 〜深層強化学習の最新動向〜DQNからRainbowまで 〜深層強化学習の最新動向〜
DQNからRainbowまで 〜深層強化学習の最新動向〜
 
畳み込みニューラルネットワークの高精度化と高速化
畳み込みニューラルネットワークの高精度化と高速化畳み込みニューラルネットワークの高精度化と高速化
畳み込みニューラルネットワークの高精度化と高速化
 
[DL輪読会]ドメイン転移と不変表現に関するサーベイ
[DL輪読会]ドメイン転移と不変表現に関するサーベイ[DL輪読会]ドメイン転移と不変表現に関するサーベイ
[DL輪読会]ドメイン転移と不変表現に関するサーベイ
 
SSII2021 [OS2-02] 深層学習におけるデータ拡張の原理と最新動向
SSII2021 [OS2-02] 深層学習におけるデータ拡張の原理と最新動向SSII2021 [OS2-02] 深層学習におけるデータ拡張の原理と最新動向
SSII2021 [OS2-02] 深層学習におけるデータ拡張の原理と最新動向
 

Similar a semantic segmentation サーベイ

2018 07 02_dense_pose
2018 07 02_dense_pose2018 07 02_dense_pose
2018 07 02_dense_poseharmonylab
 
[DL Hacks]OCNet: Object Context Networkfor Scene Parsing
[DL Hacks]OCNet: Object Context Networkfor Scene Parsing[DL Hacks]OCNet: Object Context Networkfor Scene Parsing
[DL Hacks]OCNet: Object Context Networkfor Scene ParsingDeep Learning JP
 
【チュートリアル】コンピュータビジョンによる動画認識 v2
【チュートリアル】コンピュータビジョンによる動画認識 v2【チュートリアル】コンピュータビジョンによる動画認識 v2
【チュートリアル】コンピュータビジョンによる動画認識 v2Hirokatsu Kataoka
 
大規模画像認識とその周辺
大規模画像認識とその周辺大規模画像認識とその周辺
大規模画像認識とその周辺n_hidekey
 
[DL輪読会]EfficientDet: Scalable and Efficient Object Detection
[DL輪読会]EfficientDet: Scalable and Efficient Object Detection[DL輪読会]EfficientDet: Scalable and Efficient Object Detection
[DL輪読会]EfficientDet: Scalable and Efficient Object DetectionDeep Learning JP
 
CoreMLによるiOS深層学習アプリの実装と性能分析
CoreMLによるiOS深層学習アプリの実装と性能分析CoreMLによるiOS深層学習アプリの実装と性能分析
CoreMLによるiOS深層学習アプリの実装と性能分析Ryosuke Tanno
 
ICCV 2019 論文紹介 (26 papers)
ICCV 2019 論文紹介 (26 papers)ICCV 2019 論文紹介 (26 papers)
ICCV 2019 論文紹介 (26 papers)Hideki Okada
 
「解説資料」ViTPose: Simple Vision Transformer Baselines for Human Pose Estimation
「解説資料」ViTPose: Simple Vision Transformer Baselines for Human Pose Estimation 「解説資料」ViTPose: Simple Vision Transformer Baselines for Human Pose Estimation
「解説資料」ViTPose: Simple Vision Transformer Baselines for Human Pose Estimation Takumi Ohkuma
 
3次元計測とフィルタリング
3次元計測とフィルタリング3次元計測とフィルタリング
3次元計測とフィルタリングNorishige Fukushima
 
これからのコンピュータビジョン技術 - cvpaper.challenge in PRMU Grand Challenge 2016 (PRMU研究会 2...
これからのコンピュータビジョン技術 - cvpaper.challenge in PRMU Grand Challenge 2016 (PRMU研究会 2...これからのコンピュータビジョン技術 - cvpaper.challenge in PRMU Grand Challenge 2016 (PRMU研究会 2...
これからのコンピュータビジョン技術 - cvpaper.challenge in PRMU Grand Challenge 2016 (PRMU研究会 2...cvpaper. challenge
 
[DL輪読会]MetaFormer is Actually What You Need for Vision
[DL輪読会]MetaFormer is Actually What You Need for Vision[DL輪読会]MetaFormer is Actually What You Need for Vision
[DL輪読会]MetaFormer is Actually What You Need for VisionDeep Learning JP
 
「解説資料」MetaFormer is Actually What You Need for Vision
「解説資料」MetaFormer is Actually What You Need for Vision「解説資料」MetaFormer is Actually What You Need for Vision
「解説資料」MetaFormer is Actually What You Need for VisionTakumi Ohkuma
 
三次元点群を取り扱うニューラルネットワークのサーベイ
三次元点群を取り扱うニューラルネットワークのサーベイ三次元点群を取り扱うニューラルネットワークのサーベイ
三次元点群を取り扱うニューラルネットワークのサーベイNaoya Chiba
 
SSD: Single Shot MultiBox Detector (ECCV2016)
SSD: Single Shot MultiBox Detector (ECCV2016)SSD: Single Shot MultiBox Detector (ECCV2016)
SSD: Single Shot MultiBox Detector (ECCV2016)Takanori Ogata
 
電子国土Webシステムのオープン化への取り組み(国土地理院・佐藤壮紀様)
電子国土Webシステムのオープン化への取り組み(国土地理院・佐藤壮紀様)電子国土Webシステムのオープン化への取り組み(国土地理院・佐藤壮紀様)
電子国土Webシステムのオープン化への取り組み(国土地理院・佐藤壮紀様)OSgeo Japan
 
CEDEC 2007 ゲーム開発者向け最新技術論文の解説・実装講座
CEDEC 2007 ゲーム開発者向け最新技術論文の解説・実装講座CEDEC 2007 ゲーム開発者向け最新技術論文の解説・実装講座
CEDEC 2007 ゲーム開発者向け最新技術論文の解説・実装講座Silicon Studio Corporation
 
Deep learningの発展と化学反応への応用 - 日本化学会第101春季大会(2021)
Deep learningの発展と化学反応への応用 - 日本化学会第101春季大会(2021)Deep learningの発展と化学反応への応用 - 日本化学会第101春季大会(2021)
Deep learningの発展と化学反応への応用 - 日本化学会第101春季大会(2021)Preferred Networks
 
ADVENTUREの他のモジュール・関連プロジェクトの紹介
ADVENTUREの他のモジュール・関連プロジェクトの紹介ADVENTUREの他のモジュール・関連プロジェクトの紹介
ADVENTUREの他のモジュール・関連プロジェクトの紹介ADVENTURE Project
 

Similar a semantic segmentation サーベイ (20)

2018 07 02_dense_pose
2018 07 02_dense_pose2018 07 02_dense_pose
2018 07 02_dense_pose
 
[DL Hacks]OCNet: Object Context Networkfor Scene Parsing
[DL Hacks]OCNet: Object Context Networkfor Scene Parsing[DL Hacks]OCNet: Object Context Networkfor Scene Parsing
[DL Hacks]OCNet: Object Context Networkfor Scene Parsing
 
【チュートリアル】コンピュータビジョンによる動画認識 v2
【チュートリアル】コンピュータビジョンによる動画認識 v2【チュートリアル】コンピュータビジョンによる動画認識 v2
【チュートリアル】コンピュータビジョンによる動画認識 v2
 
大規模画像認識とその周辺
大規模画像認識とその周辺大規模画像認識とその周辺
大規模画像認識とその周辺
 
[DL輪読会]EfficientDet: Scalable and Efficient Object Detection
[DL輪読会]EfficientDet: Scalable and Efficient Object Detection[DL輪読会]EfficientDet: Scalable and Efficient Object Detection
[DL輪読会]EfficientDet: Scalable and Efficient Object Detection
 
CoreMLによるiOS深層学習アプリの実装と性能分析
CoreMLによるiOS深層学習アプリの実装と性能分析CoreMLによるiOS深層学習アプリの実装と性能分析
CoreMLによるiOS深層学習アプリの実装と性能分析
 
ICCV 2019 論文紹介 (26 papers)
ICCV 2019 論文紹介 (26 papers)ICCV 2019 論文紹介 (26 papers)
ICCV 2019 論文紹介 (26 papers)
 
「解説資料」ViTPose: Simple Vision Transformer Baselines for Human Pose Estimation
「解説資料」ViTPose: Simple Vision Transformer Baselines for Human Pose Estimation 「解説資料」ViTPose: Simple Vision Transformer Baselines for Human Pose Estimation
「解説資料」ViTPose: Simple Vision Transformer Baselines for Human Pose Estimation
 
3次元計測とフィルタリング
3次元計測とフィルタリング3次元計測とフィルタリング
3次元計測とフィルタリング
 
MIRU2018 tutorial
MIRU2018 tutorialMIRU2018 tutorial
MIRU2018 tutorial
 
これからのコンピュータビジョン技術 - cvpaper.challenge in PRMU Grand Challenge 2016 (PRMU研究会 2...
これからのコンピュータビジョン技術 - cvpaper.challenge in PRMU Grand Challenge 2016 (PRMU研究会 2...これからのコンピュータビジョン技術 - cvpaper.challenge in PRMU Grand Challenge 2016 (PRMU研究会 2...
これからのコンピュータビジョン技術 - cvpaper.challenge in PRMU Grand Challenge 2016 (PRMU研究会 2...
 
[DL輪読会]MetaFormer is Actually What You Need for Vision
[DL輪読会]MetaFormer is Actually What You Need for Vision[DL輪読会]MetaFormer is Actually What You Need for Vision
[DL輪読会]MetaFormer is Actually What You Need for Vision
 
「解説資料」MetaFormer is Actually What You Need for Vision
「解説資料」MetaFormer is Actually What You Need for Vision「解説資料」MetaFormer is Actually What You Need for Vision
「解説資料」MetaFormer is Actually What You Need for Vision
 
三次元点群を取り扱うニューラルネットワークのサーベイ
三次元点群を取り扱うニューラルネットワークのサーベイ三次元点群を取り扱うニューラルネットワークのサーベイ
三次元点群を取り扱うニューラルネットワークのサーベイ
 
SSD: Single Shot MultiBox Detector (ECCV2016)
SSD: Single Shot MultiBox Detector (ECCV2016)SSD: Single Shot MultiBox Detector (ECCV2016)
SSD: Single Shot MultiBox Detector (ECCV2016)
 
電子国土Webシステムのオープン化への取り組み(国土地理院・佐藤壮紀様)
電子国土Webシステムのオープン化への取り組み(国土地理院・佐藤壮紀様)電子国土Webシステムのオープン化への取り組み(国土地理院・佐藤壮紀様)
電子国土Webシステムのオープン化への取り組み(国土地理院・佐藤壮紀様)
 
Semantic segmentation2
Semantic segmentation2Semantic segmentation2
Semantic segmentation2
 
CEDEC 2007 ゲーム開発者向け最新技術論文の解説・実装講座
CEDEC 2007 ゲーム開発者向け最新技術論文の解説・実装講座CEDEC 2007 ゲーム開発者向け最新技術論文の解説・実装講座
CEDEC 2007 ゲーム開発者向け最新技術論文の解説・実装講座
 
Deep learningの発展と化学反応への応用 - 日本化学会第101春季大会(2021)
Deep learningの発展と化学反応への応用 - 日本化学会第101春季大会(2021)Deep learningの発展と化学反応への応用 - 日本化学会第101春季大会(2021)
Deep learningの発展と化学反応への応用 - 日本化学会第101春季大会(2021)
 
ADVENTUREの他のモジュール・関連プロジェクトの紹介
ADVENTUREの他のモジュール・関連プロジェクトの紹介ADVENTUREの他のモジュール・関連プロジェクトの紹介
ADVENTUREの他のモジュール・関連プロジェクトの紹介
 

Más de yohei okawa

Explainable predictions pattern
Explainable predictions patternExplainable predictions pattern
Explainable predictions patternyohei okawa
 
Model versioning pattern
Model versioning patternModel versioning pattern
Model versioning patternyohei okawa
 
Workflow pipeline pattern
Workflow pipeline patternWorkflow pipeline pattern
Workflow pipeline patternyohei okawa
 
Transform pattern
Transform patternTransform pattern
Transform patternyohei okawa
 
Keyed predictions pattern
Keyed predictions patternKeyed predictions pattern
Keyed predictions patternyohei okawa
 
Batch serving pattern
Batch serving patternBatch serving pattern
Batch serving patternyohei okawa
 
Distribution Strategy pattern
Distribution Strategy patternDistribution Strategy pattern
Distribution Strategy patternyohei okawa
 
Useful Overfitting pattern
Useful Overfitting patternUseful Overfitting pattern
Useful Overfitting patternyohei okawa
 
Multilabel pattern
Multilabel patternMultilabel pattern
Multilabel patternyohei okawa
 
Reframing パターン
Reframing パターンReframing パターン
Reframing パターンyohei okawa
 
はじめての方向け GANチュートリアル
はじめての方向け GANチュートリアルはじめての方向け GANチュートリアル
はじめての方向け GANチュートリアルyohei okawa
 
Attention-Guided GANについて
Attention-Guided GANについてAttention-Guided GANについて
Attention-Guided GANについてyohei okawa
 
SLAM入門 第2章 SLAMの基礎
SLAM入門 第2章 SLAMの基礎SLAM入門 第2章 SLAMの基礎
SLAM入門 第2章 SLAMの基礎yohei okawa
 
CycleGANについて
CycleGANについてCycleGANについて
CycleGANについてyohei okawa
 

Más de yohei okawa (15)

Explainable predictions pattern
Explainable predictions patternExplainable predictions pattern
Explainable predictions pattern
 
Model versioning pattern
Model versioning patternModel versioning pattern
Model versioning pattern
 
Workflow pipeline pattern
Workflow pipeline patternWorkflow pipeline pattern
Workflow pipeline pattern
 
Transform pattern
Transform patternTransform pattern
Transform pattern
 
Keyed predictions pattern
Keyed predictions patternKeyed predictions pattern
Keyed predictions pattern
 
Batch serving pattern
Batch serving patternBatch serving pattern
Batch serving pattern
 
Distribution Strategy pattern
Distribution Strategy patternDistribution Strategy pattern
Distribution Strategy pattern
 
Useful Overfitting pattern
Useful Overfitting patternUseful Overfitting pattern
Useful Overfitting pattern
 
Multilabel pattern
Multilabel patternMultilabel pattern
Multilabel pattern
 
Reframing パターン
Reframing パターンReframing パターン
Reframing パターン
 
20190630_VoVNet
20190630_VoVNet20190630_VoVNet
20190630_VoVNet
 
はじめての方向け GANチュートリアル
はじめての方向け GANチュートリアルはじめての方向け GANチュートリアル
はじめての方向け GANチュートリアル
 
Attention-Guided GANについて
Attention-Guided GANについてAttention-Guided GANについて
Attention-Guided GANについて
 
SLAM入門 第2章 SLAMの基礎
SLAM入門 第2章 SLAMの基礎SLAM入門 第2章 SLAMの基礎
SLAM入門 第2章 SLAMの基礎
 
CycleGANについて
CycleGANについてCycleGANについて
CycleGANについて
 

Último

プレイマットのパターン生成支援ツール
プレイマットのパターン生成支援ツールプレイマットのパターン生成支援ツール
プレイマットのパターン生成支援ツールsugiuralab
 
新人研修のまとめ 2024/04/12の勉強会で発表されたものです。
新人研修のまとめ       2024/04/12の勉強会で発表されたものです。新人研修のまとめ       2024/04/12の勉強会で発表されたものです。
新人研修のまとめ 2024/04/12の勉強会で発表されたものです。iPride Co., Ltd.
 
プレイマットのパターン生成支援ツールの評価
プレイマットのパターン生成支援ツールの評価プレイマットのパターン生成支援ツールの評価
プレイマットのパターン生成支援ツールの評価sugiuralab
 
20240412_HCCJP での Windows Server 2025 Active Directory
20240412_HCCJP での Windows Server 2025 Active Directory20240412_HCCJP での Windows Server 2025 Active Directory
20240412_HCCJP での Windows Server 2025 Active Directoryosamut
 
Amazon SES を勉強してみる その12024/04/12の勉強会で発表されたものです。
Amazon SES を勉強してみる その12024/04/12の勉強会で発表されたものです。Amazon SES を勉強してみる その12024/04/12の勉強会で発表されたものです。
Amazon SES を勉強してみる その12024/04/12の勉強会で発表されたものです。iPride Co., Ltd.
 
PHP-Conference-Odawara-2024-04-000000000
PHP-Conference-Odawara-2024-04-000000000PHP-Conference-Odawara-2024-04-000000000
PHP-Conference-Odawara-2024-04-000000000Shota Ito
 
IoT in the era of generative AI, Thanks IoT ALGYAN.pptx
IoT in the era of generative AI, Thanks IoT ALGYAN.pptxIoT in the era of generative AI, Thanks IoT ALGYAN.pptx
IoT in the era of generative AI, Thanks IoT ALGYAN.pptxAtomu Hidaka
 

Último (7)

プレイマットのパターン生成支援ツール
プレイマットのパターン生成支援ツールプレイマットのパターン生成支援ツール
プレイマットのパターン生成支援ツール
 
新人研修のまとめ 2024/04/12の勉強会で発表されたものです。
新人研修のまとめ       2024/04/12の勉強会で発表されたものです。新人研修のまとめ       2024/04/12の勉強会で発表されたものです。
新人研修のまとめ 2024/04/12の勉強会で発表されたものです。
 
プレイマットのパターン生成支援ツールの評価
プレイマットのパターン生成支援ツールの評価プレイマットのパターン生成支援ツールの評価
プレイマットのパターン生成支援ツールの評価
 
20240412_HCCJP での Windows Server 2025 Active Directory
20240412_HCCJP での Windows Server 2025 Active Directory20240412_HCCJP での Windows Server 2025 Active Directory
20240412_HCCJP での Windows Server 2025 Active Directory
 
Amazon SES を勉強してみる その12024/04/12の勉強会で発表されたものです。
Amazon SES を勉強してみる その12024/04/12の勉強会で発表されたものです。Amazon SES を勉強してみる その12024/04/12の勉強会で発表されたものです。
Amazon SES を勉強してみる その12024/04/12の勉強会で発表されたものです。
 
PHP-Conference-Odawara-2024-04-000000000
PHP-Conference-Odawara-2024-04-000000000PHP-Conference-Odawara-2024-04-000000000
PHP-Conference-Odawara-2024-04-000000000
 
IoT in the era of generative AI, Thanks IoT ALGYAN.pptx
IoT in the era of generative AI, Thanks IoT ALGYAN.pptxIoT in the era of generative AI, Thanks IoT ALGYAN.pptx
IoT in the era of generative AI, Thanks IoT ALGYAN.pptx
 

semantic segmentation サーベイ