Submit Search
Upload
[DL Hacks]AVID: Adversarial Visual Irregularity Detection
•
Download as PPTX, PDF
•
6 likes
•
1,218 views
Deep Learning JP
Follow
2018/08/27 Deep Learning JP: http://deeplearning.jp/hacks/
Read less
Read more
Technology
Report
Share
Report
Share
1 of 30
Download now
Recommended
Serviceability Toolsの裏側
Serviceability Toolsの裏側
Yasumasa Suenaga
[DL輪読会]Supervision-by-Registration
[DL輪読会]Supervision-by-Registration
Deep Learning JP
【CVPR 2019】SPADE: Semantic Image Synthesis with Spatially-Adaptive Normalization
【CVPR 2019】SPADE: Semantic Image Synthesis with Spatially-Adaptive Normalization
cvpaper. challenge
OpenCV4Androidで画像処理アプリのススメ
OpenCV4Androidで画像処理アプリのススメ
Masaki Otsuki
AV 画像認識とその周辺 - UT Startup Gym 講演資料
AV 画像認識とその周辺 - UT Startup Gym 講演資料
ぱろすけ
2012 kanemotolablecture1
2012 kanemotolablecture1
ytanno
Devlove仙台20130309 レガシープロジェクト脱出大作戦
Devlove仙台20130309 レガシープロジェクト脱出大作戦
Masaki Yamamoto
OpenCVをAndroidで動かしてみた
OpenCVをAndroidで動かしてみた
徹 上野山
Recommended
Serviceability Toolsの裏側
Serviceability Toolsの裏側
Yasumasa Suenaga
[DL輪読会]Supervision-by-Registration
[DL輪読会]Supervision-by-Registration
Deep Learning JP
【CVPR 2019】SPADE: Semantic Image Synthesis with Spatially-Adaptive Normalization
【CVPR 2019】SPADE: Semantic Image Synthesis with Spatially-Adaptive Normalization
cvpaper. challenge
OpenCV4Androidで画像処理アプリのススメ
OpenCV4Androidで画像処理アプリのススメ
Masaki Otsuki
AV 画像認識とその周辺 - UT Startup Gym 講演資料
AV 画像認識とその周辺 - UT Startup Gym 講演資料
ぱろすけ
2012 kanemotolablecture1
2012 kanemotolablecture1
ytanno
Devlove仙台20130309 レガシープロジェクト脱出大作戦
Devlove仙台20130309 レガシープロジェクト脱出大作戦
Masaki Yamamoto
OpenCVをAndroidで動かしてみた
OpenCVをAndroidで動かしてみた
徹 上野山
SensorBeeのご紹介
SensorBeeのご紹介
Daisuke Tanaka
ECCV2020 オーラル論文完全読破 (2/2)
ECCV2020 オーラル論文完全読破 (2/2)
cvpaper. challenge
2016年2月4日 空間OSのためのビッグデータ技術基盤
2016年2月4日 空間OSのためのビッグデータ技術基盤
aitc_jp
GCM#4 アーティストのためのプログラマブルシェーダー講座Part2
GCM#4 アーティストのためのプログラマブルシェーダー講座Part2
GREE/Art
関西CVPRML勉強会 2012.2.18 (一般物体認識 - データセット)
関西CVPRML勉強会 2012.2.18 (一般物体認識 - データセット)
Akisato Kimura
ae-12. データの合成
ae-12. データの合成
kunihikokaneko1
ナレッジグラフ推論チャレンジ【実社会版】応募資料
ナレッジグラフ推論チャレンジ【実社会版】応募資料
Takanori Ugai
Code4NaraHandson2_151118
Code4NaraHandson2_151118
康司 石塚
DeepVIO: Self-supervised Deep Learning of Monocular Visual Inertial Odometry ...
DeepVIO: Self-supervised Deep Learning of Monocular Visual Inertial Odometry ...
harmonylab
[DL輪読会]GQNと関連研究,世界モデルとの関係について
[DL輪読会]GQNと関連研究,世界モデルとの関係について
Deep Learning JP
Neural Global Shutter: Learn to Restore Video from a Rolling Shutter Camera w...
Neural Global Shutter: Learn to Restore Video from a Rolling Shutter Camera w...
tomoaki0705
OpenJDKのコミッタってどんなことしたらなったの?解決してきた技術課題の事例から見えてくる必要な知識と技術(JJUG CCC 2023 Spring)
OpenJDKのコミッタってどんなことしたらなったの?解決してきた技術課題の事例から見えてくる必要な知識と技術(JJUG CCC 2023 Spring)
NTT DATA Technology & Innovation
初心者向けAndroidゲーム開発ノウハウ
初心者向けAndroidゲーム開発ノウハウ
Kentarou Mukunasi
PFI成果発表会2014発表資料 Where Do You Look?
PFI成果発表会2014発表資料 Where Do You Look?
Hokuto Kagaya
機械学習をビジネスに利活用する人たちに対してモデル開発後の実運用フェーズにおける課題とその対策方法
機械学習をビジネスに利活用する人たちに対してモデル開発後の実運用フェーズにおける課題とその対策方法
日本ディープラーニング協会(JDLA)
福岡XFD導入記
福岡XFD導入記
Go Takahashi
今夜わかるWebアプリケーション脆弱性診断 (OWASP Day 758 / 2018)
今夜わかるWebアプリケーション脆弱性診断 (OWASP Day 758 / 2018)
Sen Ueno
【DL輪読会】Reflash Dropout in Image Super-Resolution
【DL輪読会】Reflash Dropout in Image Super-Resolution
Deep Learning JP
【ナレッジグラフ推論チャレンジ】SPARQLと可視化ツールを用いた推論検討例
【ナレッジグラフ推論チャレンジ】SPARQLと可視化ツールを用いた推論検討例
KnowledgeGraph
20141008物体検出器
20141008物体検出器
Takuya Minagawa
【DL輪読会】AdaptDiffuser: Diffusion Models as Adaptive Self-evolving Planners
【DL輪読会】AdaptDiffuser: Diffusion Models as Adaptive Self-evolving Planners
Deep Learning JP
【DL輪読会】事前学習用データセットについて
【DL輪読会】事前学習用データセットについて
Deep Learning JP
More Related Content
Similar to [DL Hacks]AVID: Adversarial Visual Irregularity Detection
SensorBeeのご紹介
SensorBeeのご紹介
Daisuke Tanaka
ECCV2020 オーラル論文完全読破 (2/2)
ECCV2020 オーラル論文完全読破 (2/2)
cvpaper. challenge
2016年2月4日 空間OSのためのビッグデータ技術基盤
2016年2月4日 空間OSのためのビッグデータ技術基盤
aitc_jp
GCM#4 アーティストのためのプログラマブルシェーダー講座Part2
GCM#4 アーティストのためのプログラマブルシェーダー講座Part2
GREE/Art
関西CVPRML勉強会 2012.2.18 (一般物体認識 - データセット)
関西CVPRML勉強会 2012.2.18 (一般物体認識 - データセット)
Akisato Kimura
ae-12. データの合成
ae-12. データの合成
kunihikokaneko1
ナレッジグラフ推論チャレンジ【実社会版】応募資料
ナレッジグラフ推論チャレンジ【実社会版】応募資料
Takanori Ugai
Code4NaraHandson2_151118
Code4NaraHandson2_151118
康司 石塚
DeepVIO: Self-supervised Deep Learning of Monocular Visual Inertial Odometry ...
DeepVIO: Self-supervised Deep Learning of Monocular Visual Inertial Odometry ...
harmonylab
[DL輪読会]GQNと関連研究,世界モデルとの関係について
[DL輪読会]GQNと関連研究,世界モデルとの関係について
Deep Learning JP
Neural Global Shutter: Learn to Restore Video from a Rolling Shutter Camera w...
Neural Global Shutter: Learn to Restore Video from a Rolling Shutter Camera w...
tomoaki0705
OpenJDKのコミッタってどんなことしたらなったの?解決してきた技術課題の事例から見えてくる必要な知識と技術(JJUG CCC 2023 Spring)
OpenJDKのコミッタってどんなことしたらなったの?解決してきた技術課題の事例から見えてくる必要な知識と技術(JJUG CCC 2023 Spring)
NTT DATA Technology & Innovation
初心者向けAndroidゲーム開発ノウハウ
初心者向けAndroidゲーム開発ノウハウ
Kentarou Mukunasi
PFI成果発表会2014発表資料 Where Do You Look?
PFI成果発表会2014発表資料 Where Do You Look?
Hokuto Kagaya
機械学習をビジネスに利活用する人たちに対してモデル開発後の実運用フェーズにおける課題とその対策方法
機械学習をビジネスに利活用する人たちに対してモデル開発後の実運用フェーズにおける課題とその対策方法
日本ディープラーニング協会(JDLA)
福岡XFD導入記
福岡XFD導入記
Go Takahashi
今夜わかるWebアプリケーション脆弱性診断 (OWASP Day 758 / 2018)
今夜わかるWebアプリケーション脆弱性診断 (OWASP Day 758 / 2018)
Sen Ueno
【DL輪読会】Reflash Dropout in Image Super-Resolution
【DL輪読会】Reflash Dropout in Image Super-Resolution
Deep Learning JP
【ナレッジグラフ推論チャレンジ】SPARQLと可視化ツールを用いた推論検討例
【ナレッジグラフ推論チャレンジ】SPARQLと可視化ツールを用いた推論検討例
KnowledgeGraph
20141008物体検出器
20141008物体検出器
Takuya Minagawa
Similar to [DL Hacks]AVID: Adversarial Visual Irregularity Detection
(20)
SensorBeeのご紹介
SensorBeeのご紹介
ECCV2020 オーラル論文完全読破 (2/2)
ECCV2020 オーラル論文完全読破 (2/2)
2016年2月4日 空間OSのためのビッグデータ技術基盤
2016年2月4日 空間OSのためのビッグデータ技術基盤
GCM#4 アーティストのためのプログラマブルシェーダー講座Part2
GCM#4 アーティストのためのプログラマブルシェーダー講座Part2
関西CVPRML勉強会 2012.2.18 (一般物体認識 - データセット)
関西CVPRML勉強会 2012.2.18 (一般物体認識 - データセット)
ae-12. データの合成
ae-12. データの合成
ナレッジグラフ推論チャレンジ【実社会版】応募資料
ナレッジグラフ推論チャレンジ【実社会版】応募資料
Code4NaraHandson2_151118
Code4NaraHandson2_151118
DeepVIO: Self-supervised Deep Learning of Monocular Visual Inertial Odometry ...
DeepVIO: Self-supervised Deep Learning of Monocular Visual Inertial Odometry ...
[DL輪読会]GQNと関連研究,世界モデルとの関係について
[DL輪読会]GQNと関連研究,世界モデルとの関係について
Neural Global Shutter: Learn to Restore Video from a Rolling Shutter Camera w...
Neural Global Shutter: Learn to Restore Video from a Rolling Shutter Camera w...
OpenJDKのコミッタってどんなことしたらなったの?解決してきた技術課題の事例から見えてくる必要な知識と技術(JJUG CCC 2023 Spring)
OpenJDKのコミッタってどんなことしたらなったの?解決してきた技術課題の事例から見えてくる必要な知識と技術(JJUG CCC 2023 Spring)
初心者向けAndroidゲーム開発ノウハウ
初心者向けAndroidゲーム開発ノウハウ
PFI成果発表会2014発表資料 Where Do You Look?
PFI成果発表会2014発表資料 Where Do You Look?
機械学習をビジネスに利活用する人たちに対してモデル開発後の実運用フェーズにおける課題とその対策方法
機械学習をビジネスに利活用する人たちに対してモデル開発後の実運用フェーズにおける課題とその対策方法
福岡XFD導入記
福岡XFD導入記
今夜わかるWebアプリケーション脆弱性診断 (OWASP Day 758 / 2018)
今夜わかるWebアプリケーション脆弱性診断 (OWASP Day 758 / 2018)
【DL輪読会】Reflash Dropout in Image Super-Resolution
【DL輪読会】Reflash Dropout in Image Super-Resolution
【ナレッジグラフ推論チャレンジ】SPARQLと可視化ツールを用いた推論検討例
【ナレッジグラフ推論チャレンジ】SPARQLと可視化ツールを用いた推論検討例
20141008物体検出器
20141008物体検出器
More from Deep Learning JP
【DL輪読会】AdaptDiffuser: Diffusion Models as Adaptive Self-evolving Planners
【DL輪読会】AdaptDiffuser: Diffusion Models as Adaptive Self-evolving Planners
Deep Learning JP
【DL輪読会】事前学習用データセットについて
【DL輪読会】事前学習用データセットについて
Deep Learning JP
【DL輪読会】 "Learning to render novel views from wide-baseline stereo pairs." CVP...
【DL輪読会】 "Learning to render novel views from wide-baseline stereo pairs." CVP...
Deep Learning JP
【DL輪読会】Zero-Shot Dual-Lens Super-Resolution
【DL輪読会】Zero-Shot Dual-Lens Super-Resolution
Deep Learning JP
【DL輪読会】BloombergGPT: A Large Language Model for Finance arxiv
【DL輪読会】BloombergGPT: A Large Language Model for Finance arxiv
Deep Learning JP
【DL輪読会】マルチモーダル LLM
【DL輪読会】マルチモーダル LLM
Deep Learning JP
【 DL輪読会】ToolLLM: Facilitating Large Language Models to Master 16000+ Real-wo...
【 DL輪読会】ToolLLM: Facilitating Large Language Models to Master 16000+ Real-wo...
Deep Learning JP
【DL輪読会】AnyLoc: Towards Universal Visual Place Recognition
【DL輪読会】AnyLoc: Towards Universal Visual Place Recognition
Deep Learning JP
【DL輪読会】Can Neural Network Memorization Be Localized?
【DL輪読会】Can Neural Network Memorization Be Localized?
Deep Learning JP
【DL輪読会】Hopfield network 関連研究について
【DL輪読会】Hopfield network 関連研究について
Deep Learning JP
【DL輪読会】SimPer: Simple self-supervised learning of periodic targets( ICLR 2023 )
【DL輪読会】SimPer: Simple self-supervised learning of periodic targets( ICLR 2023 )
Deep Learning JP
【DL輪読会】RLCD: Reinforcement Learning from Contrast Distillation for Language M...
【DL輪読会】RLCD: Reinforcement Learning from Contrast Distillation for Language M...
Deep Learning JP
【DL輪読会】"Secrets of RLHF in Large Language Models Part I: PPO"
【DL輪読会】"Secrets of RLHF in Large Language Models Part I: PPO"
Deep Learning JP
【DL輪読会】"Language Instructed Reinforcement Learning for Human-AI Coordination "
【DL輪読会】"Language Instructed Reinforcement Learning for Human-AI Coordination "
Deep Learning JP
【DL輪読会】Llama 2: Open Foundation and Fine-Tuned Chat Models
【DL輪読会】Llama 2: Open Foundation and Fine-Tuned Chat Models
Deep Learning JP
【DL輪読会】"Learning Fine-Grained Bimanual Manipulation with Low-Cost Hardware"
【DL輪読会】"Learning Fine-Grained Bimanual Manipulation with Low-Cost Hardware"
Deep Learning JP
【DL輪読会】Parameter is Not All You Need:Starting from Non-Parametric Networks fo...
【DL輪読会】Parameter is Not All You Need:Starting from Non-Parametric Networks fo...
Deep Learning JP
【DL輪読会】Drag Your GAN: Interactive Point-based Manipulation on the Generative ...
【DL輪読会】Drag Your GAN: Interactive Point-based Manipulation on the Generative ...
Deep Learning JP
【DL輪読会】Self-Supervised Learning from Images with a Joint-Embedding Predictive...
【DL輪読会】Self-Supervised Learning from Images with a Joint-Embedding Predictive...
Deep Learning JP
【DL輪読会】Towards Understanding Ensemble, Knowledge Distillation and Self-Distil...
【DL輪読会】Towards Understanding Ensemble, Knowledge Distillation and Self-Distil...
Deep Learning JP
More from Deep Learning JP
(20)
【DL輪読会】AdaptDiffuser: Diffusion Models as Adaptive Self-evolving Planners
【DL輪読会】AdaptDiffuser: Diffusion Models as Adaptive Self-evolving Planners
【DL輪読会】事前学習用データセットについて
【DL輪読会】事前学習用データセットについて
【DL輪読会】 "Learning to render novel views from wide-baseline stereo pairs." CVP...
【DL輪読会】 "Learning to render novel views from wide-baseline stereo pairs." CVP...
【DL輪読会】Zero-Shot Dual-Lens Super-Resolution
【DL輪読会】Zero-Shot Dual-Lens Super-Resolution
【DL輪読会】BloombergGPT: A Large Language Model for Finance arxiv
【DL輪読会】BloombergGPT: A Large Language Model for Finance arxiv
【DL輪読会】マルチモーダル LLM
【DL輪読会】マルチモーダル LLM
【 DL輪読会】ToolLLM: Facilitating Large Language Models to Master 16000+ Real-wo...
【 DL輪読会】ToolLLM: Facilitating Large Language Models to Master 16000+ Real-wo...
【DL輪読会】AnyLoc: Towards Universal Visual Place Recognition
【DL輪読会】AnyLoc: Towards Universal Visual Place Recognition
【DL輪読会】Can Neural Network Memorization Be Localized?
【DL輪読会】Can Neural Network Memorization Be Localized?
【DL輪読会】Hopfield network 関連研究について
【DL輪読会】Hopfield network 関連研究について
【DL輪読会】SimPer: Simple self-supervised learning of periodic targets( ICLR 2023 )
【DL輪読会】SimPer: Simple self-supervised learning of periodic targets( ICLR 2023 )
【DL輪読会】RLCD: Reinforcement Learning from Contrast Distillation for Language M...
【DL輪読会】RLCD: Reinforcement Learning from Contrast Distillation for Language M...
【DL輪読会】"Secrets of RLHF in Large Language Models Part I: PPO"
【DL輪読会】"Secrets of RLHF in Large Language Models Part I: PPO"
【DL輪読会】"Language Instructed Reinforcement Learning for Human-AI Coordination "
【DL輪読会】"Language Instructed Reinforcement Learning for Human-AI Coordination "
【DL輪読会】Llama 2: Open Foundation and Fine-Tuned Chat Models
【DL輪読会】Llama 2: Open Foundation and Fine-Tuned Chat Models
【DL輪読会】"Learning Fine-Grained Bimanual Manipulation with Low-Cost Hardware"
【DL輪読会】"Learning Fine-Grained Bimanual Manipulation with Low-Cost Hardware"
【DL輪読会】Parameter is Not All You Need:Starting from Non-Parametric Networks fo...
【DL輪読会】Parameter is Not All You Need:Starting from Non-Parametric Networks fo...
【DL輪読会】Drag Your GAN: Interactive Point-based Manipulation on the Generative ...
【DL輪読会】Drag Your GAN: Interactive Point-based Manipulation on the Generative ...
【DL輪読会】Self-Supervised Learning from Images with a Joint-Embedding Predictive...
【DL輪読会】Self-Supervised Learning from Images with a Joint-Embedding Predictive...
【DL輪読会】Towards Understanding Ensemble, Knowledge Distillation and Self-Distil...
【DL輪読会】Towards Understanding Ensemble, Knowledge Distillation and Self-Distil...
Recently uploaded
スマートフォンを用いた新生児あやし動作の教示システム
スマートフォンを用いた新生児あやし動作の教示システム
sugiuralab
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介
Yuma Ohgami
TSAL operation mechanism and circuit diagram.pdf
TSAL operation mechanism and circuit diagram.pdf
taisei2219
SOPを理解する 2024/04/19 の勉強会で発表されたものです
SOPを理解する 2024/04/19 の勉強会で発表されたものです
iPride Co., Ltd.
[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略
[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略
Ryo Sasaki
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
Hiroki Ichikura
論文紹介:Semantic segmentation using Vision Transformers: A survey
論文紹介:Semantic segmentation using Vision Transformers: A survey
Toru Tamaki
論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...
論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...
Toru Tamaki
Postman LT Fukuoka_Quick Prototype_By Daniel
Postman LT Fukuoka_Quick Prototype_By Daniel
danielhu54
論文紹介:Automated Classification of Model Errors on ImageNet
論文紹介:Automated Classification of Model Errors on ImageNet
Toru Tamaki
Recently uploaded
(10)
スマートフォンを用いた新生児あやし動作の教示システム
スマートフォンを用いた新生児あやし動作の教示システム
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介
TSAL operation mechanism and circuit diagram.pdf
TSAL operation mechanism and circuit diagram.pdf
SOPを理解する 2024/04/19 の勉強会で発表されたものです
SOPを理解する 2024/04/19 の勉強会で発表されたものです
[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略
[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
論文紹介:Semantic segmentation using Vision Transformers: A survey
論文紹介:Semantic segmentation using Vision Transformers: A survey
論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...
論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...
Postman LT Fukuoka_Quick Prototype_By Daniel
Postman LT Fukuoka_Quick Prototype_By Daniel
論文紹介:Automated Classification of Model Errors on ImageNet
論文紹介:Automated Classification of Model Errors on ImageNet
[DL Hacks]AVID: Adversarial Visual Irregularity Detection
1.
DEEP LEARNING JP [DL
Hacks] AVID: AdversarialVisual Irregularity Detection Hiromi Nakagawa, Matsuo Lab http://deeplearning.jp/
2.
1. 論文紹介 2. 実装 3.
実験結果 2 Agenda
3.
1. 論文紹介 2. 実装 3.
実験結果 3 Agenda 久保くんのDL輪読会のスライドを引用します https://www.slideshare.net/DeepLearningJP2016/dlavidadversarial-visual-irregularity-detection
4.
4 論文紹介 引用:https://www.slideshare.net/DeepLearningJP2016/dlavidadversarial-visual-irregularity-detection
5.
5 論文紹介 引用:https://www.slideshare.net/DeepLearningJP2016/dlavidadversarial-visual-irregularity-detection
6.
6 論文紹介 引用:https://www.slideshare.net/DeepLearningJP2016/dlavidadversarial-visual-irregularity-detection Inpaiting Network (Generator側) •
直接的に異常を検知するのではなく 、 入力画像から 異常を消すよう に作用する。 • アーキテク チャ と し てはU-Netで正常画像のみで学習さ れる。 14 学習時は正常画像にガウシアンノ イ ズを加えたも のを入力と する。 テスト 時は異常部分が消えるイ メ ージ。
7.
7 論文紹介 引用:https://www.slideshare.net/DeepLearningJP2016/dlavidadversarial-visual-irregularity-detection Detection Network (Discriminator側) •
セマンティ ッ ク セグメ ンテーショ ンで用いら れるFCNの構造をと っ ている。 • 入力画像に対し て、 異常領域を検出するよう に学習する。 15 ヒ ート マッ プで表すと イ メ ージがつき やすい→
8.
8 論文紹介 引用:https://www.slideshare.net/DeepLearningJP2016/dlavidadversarial-visual-irregularity-detection 学習方法 • 一般的なGANの学習 • 提案手法の学習 16 は行列
9.
9 論文紹介 引用:https://www.slideshare.net/DeepLearningJP2016/dlavidadversarial-visual-irregularity-detection 異常の判定の仕方 • I (Generator側)がp
ixel-levelの検出、 D(Discrim inator側)がp atch-levelの検出を 行う 。 • I側はテスト 画像と 生成画像の差で異常かどう かを判定する。 異常がない場合は はゼロに近く なるが、 異常がある場合は値が大き く なる。 • D側は各領域に対する出力を閾値より 下かどう かで異常を判定する。 • 両者を考慮し て以下の条件に当てはまるも のを異常と し て定義する。 17
10.
10 論文紹介 引用:https://www.slideshare.net/DeepLearningJP2016/dlavidadversarial-visual-irregularity-detection データ セッ ト 1
. UCSD: 歩行者が通行し ている画像(定点カ メ ラ を1 0 fp s)。 自動車や自転車があ ると 異常値と なる。 Ped1 と Ped2 の2 つのサブセッ ト が用意さ れている。 2 . UM N: 歩行者が通行し ている動画。 急に歩行者が走り 出す。 (動画) 3 . IR-M NIST: 3 が抜けたM NIST。 テスト 時だけ3 が出てく るのでそれを異常と する。 19 UCSD 正常画像 UCSD 異常画像
11.
11 論文紹介 引用:https://www.slideshare.net/DeepLearningJP2016/dlavidadversarial-visual-irregularity-detection 結果1 (UCSD) • FL(フ
レームレベル): 1 p xでも 異常と 検出さ れれば異常。 • PL(ピク セルレベル): 最低でも 4 0 % をg round -truth と 合致さ せる。 • ラ スト カ ラ ムの意味 – D: d eep learning 使用 – E: end -to-end の学習 – P: p atchベースの学習か否か 20
12.
12 論文紹介 引用:https://www.slideshare.net/DeepLearningJP2016/dlavidadversarial-visual-irregularity-detection 結果1 (UCSD) 21 入力画像 Iの出力画像
13.
13 論文紹介 引用:https://www.slideshare.net/DeepLearningJP2016/dlavidadversarial-visual-irregularity-detection 結果2 (UMN) • 正常状態と
異常状態と 変化状態し かない単純なデータ セッ ト のため、 fram e-level のEERと AUCを算出。 22 動画のためには以下の手法でプリ プロセスを行う 。 (著者の別論文) Deep-anomaly: Fully convolutional neural network for fast anomaly detection in crowded scenes https:/ / arxiv.org/ abs/ 1609.00866
14.
14 論文紹介 引用:https://www.slideshare.net/DeepLearningJP2016/dlavidadversarial-visual-irregularity-detection 結果3 (IR-MNIST) I (Generator側)の入力と
出力 23 D (Discrim inator側)の出力のヒ ート マッ プ
15.
15 論文紹介 引用:https://www.slideshare.net/DeepLearningJP2016/dlavidadversarial-visual-irregularity-detection 結果3 (IR-MNIST) • 異常のThreshold
を変化さ せて結果を記録。 24
16.
1. 論文紹介 2. 実装 3.
実験結果 16 Agenda https://github.com/Hirominnn/AVID_pytorch
17.
17 実装 • Generator – 元論文と同様にU-Netを使用 –
以下URLなどを参考に実装 • https://github.com/milesial/Pytorch-UNet • https://github.com/jaxony/unet-pytorch UNetクラス
18.
18 実装 • Generator サブモジュール
19.
19 実装 • Discriminator – 以下URLなどを参考にFCNを実装 •
https://github.com/pochih/FCN-pytorch • https://github.com/wkentaro/pytorch-fcn – 元論文の図は64x64→11x11のモデルを仮定 • IR-MNIST(224x224)などは64x64にリサイズすると判読できないレベルまでつぶれてしまうため、 112x112→11x11や224x224→11x11のモデルを実装した
20.
20 実装 • Discriminator – 64x64→11x11のFCNの例
21.
21 実装 • 学習(一部省略)
22.
1. 論文紹介 2. 実装 3.
実験結果 22 Agenda 再現しきれず、、
23.
23 実験結果 • 元論文と同様のパラメータではうまく行かなかったので、いくつか変更(探索) – DiscriminatorのFCNの大きさ: •
元論文:64x64→11x11 • 実装 :IR-MNIST:224x224→11x11、UCSD:112x112→11x11 – 最適化: • 元論文:SGDでG/Dともに学習率 2e-3、モメンタム 0.9 • 実装 :AdamでGの学習率 1e-4 ~ 2e-4、Dの学習率 2e-5 ~ 1e-4 – ノイズの係数γ • 元論文:0.4 • 実装 :0.6 ~ 0.7
24.
24 実験結果 • IR-MNIST – Gの学習率をDより高くしておくと再構成については比較的スムーズに学習が進む
25.
25 実験結果 • IR-MNIST – が、テスト時に復元できないはずの「3」が復元できてしまう、、 –
恒等写像を覚えてしまっている?ノイズが不足? 元画像+正解マスク 生成画像 |生成画像 – 元画像|
26.
26 実験結果 • UCSD – 時系列を反映するために、元論文に沿って2フレームの差分x3の3チャネルに前処理済み •
Gはそれっぽく復元は出来るようになった • Dはほぼ0.5しか吐かなくなる
27.
27 実験結果 • UCSD – ものによっては異常検知できてるっぽいものもあった 元画像(加工済) 元画像+正解マスク Gの生成画像 D(生成画像) |生成画像-元画像| α=0.4,
ζ=0.49時のマスクと元画像+マスク
28.
28 実験結果 • UCSD – ものによっては異常検知できてるっぽいものもあった 元画像(加工済) 元画像+正解マスク Gの生成画像 D(生成画像) |生成画像-元画像| α=0.35,
ζ=0.49時のマスクと元画像+マスク
29.
29 実験結果 • UCSD – 時系列を反映するために、元論文に沿って2フレームの差分x3の3チャネルに前処理済み •
224x224だとなかなかうまく学習できなかった
30.
• 元論文のハイパラでうまくいかない、かつかなりハイパラに敏感で実験が大変だった – GANの実装・実験自体が初だったので、GANの勘所がなかなかわからず苦戦 –
学習率はG>DとしないとDが強くなりすぎてGがノイズしか吐かなくなるが、Dもうまく学習が進まない(0.5 しか吐かなくなる)と異常検知の段階で役に立たず、、 – ノイズが弱いとGが恒等写像を覚えてしまうっぽい?(テスト時に未知物体も復元できてしまう) – 筆者が本当に(64,64)のInputを想定していたのか?など不明点も多かった – 再構成誤差とかも入れたほうが安定しそう?(特に初めの方) • 訓練時にガウシアンノイズをかけるだけでテスト時に異常を消せるのか?の疑問は解決されず、、 – どなたか実験うまくいったら教えてください • (本筋に関係ないところとして)画像を-1~1で正規化すると可視化などで微妙につまった – -1~1のtensorをPILに変換すると、0~1のtensorを変換した場合と値が異なる 30 感想
Download now