Enviar búsqueda
Cargar
Sliced Wasserstein距離と生成モデル
•
Descargar como PPTX, PDF
•
1 recomendación
•
5,108 vistas
O
ohken
Seguir
1/24 パンハウスゼミ
Leer menos
Leer más
Ciencias
Denunciar
Compartir
Denunciar
Compartir
1 de 28
Descargar ahora
Recomendados
変分ベイズ法の説明
変分ベイズ法の説明
Haruka Ozaki
変分推論法(変分ベイズ法)(PRML第10章)
変分推論法(変分ベイズ法)(PRML第10章)
Takao Yamanaka
【DL輪読会】Efficiently Modeling Long Sequences with Structured State Spaces
【DL輪読会】Efficiently Modeling Long Sequences with Structured State Spaces
Deep Learning JP
Sliced Wasserstein Distance for Learning Gaussian Mixture Models
Sliced Wasserstein Distance for Learning Gaussian Mixture Models
Fujimoto Keisuke
最適輸送の計算アルゴリズムの研究動向
最適輸送の計算アルゴリズムの研究動向
ohken
[DL輪読会]Meta Reinforcement Learning
[DL輪読会]Meta Reinforcement Learning
Deep Learning JP
SSII2020SS: グラフデータでも深層学習 〜 Graph Neural Networks 入門 〜
SSII2020SS: グラフデータでも深層学習 〜 Graph Neural Networks 入門 〜
SSII
[DL輪読会]Flow-based Deep Generative Models
[DL輪読会]Flow-based Deep Generative Models
Deep Learning JP
Recomendados
変分ベイズ法の説明
変分ベイズ法の説明
Haruka Ozaki
変分推論法(変分ベイズ法)(PRML第10章)
変分推論法(変分ベイズ法)(PRML第10章)
Takao Yamanaka
【DL輪読会】Efficiently Modeling Long Sequences with Structured State Spaces
【DL輪読会】Efficiently Modeling Long Sequences with Structured State Spaces
Deep Learning JP
Sliced Wasserstein Distance for Learning Gaussian Mixture Models
Sliced Wasserstein Distance for Learning Gaussian Mixture Models
Fujimoto Keisuke
最適輸送の計算アルゴリズムの研究動向
最適輸送の計算アルゴリズムの研究動向
ohken
[DL輪読会]Meta Reinforcement Learning
[DL輪読会]Meta Reinforcement Learning
Deep Learning JP
SSII2020SS: グラフデータでも深層学習 〜 Graph Neural Networks 入門 〜
SSII2020SS: グラフデータでも深層学習 〜 Graph Neural Networks 入門 〜
SSII
[DL輪読会]Flow-based Deep Generative Models
[DL輪読会]Flow-based Deep Generative Models
Deep Learning JP
[DL輪読会]GLIDE: Guided Language to Image Diffusion for Generation and Editing
[DL輪読会]GLIDE: Guided Language to Image Diffusion for Generation and Editing
Deep Learning JP
計算論的学習理論入門 -PAC学習とかVC次元とか-
計算論的学習理論入門 -PAC学習とかVC次元とか-
sleepy_yoshi
[DL輪読会] Spectral Norm Regularization for Improving the Generalizability of De...
[DL輪読会] Spectral Norm Regularization for Improving the Generalizability of De...
Deep Learning JP
深層生成モデルと世界モデル
深層生成モデルと世界モデル
Masahiro Suzuki
最適輸送の解き方
最適輸送の解き方
joisino
GAN(と強化学習との関係)
GAN(と強化学習との関係)
Masahiro Suzuki
coordinate descent 法について
coordinate descent 法について
京都大学大学院情報学研究科数理工学専攻
[DL輪読会]Wasserstein GAN/Towards Principled Methods for Training Generative Adv...
[DL輪読会]Wasserstein GAN/Towards Principled Methods for Training Generative Adv...
Deep Learning JP
[DL輪読会]Pay Attention to MLPs (gMLP)
[DL輪読会]Pay Attention to MLPs (gMLP)
Deep Learning JP
強化学習その2
強化学習その2
nishio
線形計画法入門
線形計画法入門
Shunji Umetani
【DL輪読会】ViT + Self Supervised Learningまとめ
【DL輪読会】ViT + Self Supervised Learningまとめ
Deep Learning JP
[DL輪読会]相互情報量最大化による表現学習
[DL輪読会]相互情報量最大化による表現学習
Deep Learning JP
SSII2019OS: 深層学習にかかる時間を短くしてみませんか? ~分散学習の勧め~
SSII2019OS: 深層学習にかかる時間を短くしてみませんか? ~分散学習の勧め~
SSII
PRML学習者から入る深層生成モデル入門
PRML学習者から入る深層生成モデル入門
tmtm otm
機械学習による統計的実験計画(ベイズ最適化を中心に)
機械学習による統計的実験計画(ベイズ最適化を中心に)
Kota Matsui
実装レベルで学ぶVQVAE
実装レベルで学ぶVQVAE
ぱんいち すみもと
[DL輪読会]Set Transformer: A Framework for Attention-based Permutation-Invariant...
[DL輪読会]Set Transformer: A Framework for Attention-based Permutation-Invariant...
Deep Learning JP
構造方程式モデルによる因果推論: 因果構造探索に関する最近の発展
構造方程式モデルによる因果推論: 因果構造探索に関する最近の発展
Shiga University, RIKEN
深層学習の数理
深層学習の数理
Taiji Suzuki
IJCAI13 Paper review: Large-scale spectral clustering on graphs
IJCAI13 Paper review: Large-scale spectral clustering on graphs
Akisato Kimura
MIA 2 - Vector Concept Review.pdf
MIA 2 - Vector Concept Review.pdf
Vania Najah
Más contenido relacionado
La actualidad más candente
[DL輪読会]GLIDE: Guided Language to Image Diffusion for Generation and Editing
[DL輪読会]GLIDE: Guided Language to Image Diffusion for Generation and Editing
Deep Learning JP
計算論的学習理論入門 -PAC学習とかVC次元とか-
計算論的学習理論入門 -PAC学習とかVC次元とか-
sleepy_yoshi
[DL輪読会] Spectral Norm Regularization for Improving the Generalizability of De...
[DL輪読会] Spectral Norm Regularization for Improving the Generalizability of De...
Deep Learning JP
深層生成モデルと世界モデル
深層生成モデルと世界モデル
Masahiro Suzuki
最適輸送の解き方
最適輸送の解き方
joisino
GAN(と強化学習との関係)
GAN(と強化学習との関係)
Masahiro Suzuki
coordinate descent 法について
coordinate descent 法について
京都大学大学院情報学研究科数理工学専攻
[DL輪読会]Wasserstein GAN/Towards Principled Methods for Training Generative Adv...
[DL輪読会]Wasserstein GAN/Towards Principled Methods for Training Generative Adv...
Deep Learning JP
[DL輪読会]Pay Attention to MLPs (gMLP)
[DL輪読会]Pay Attention to MLPs (gMLP)
Deep Learning JP
強化学習その2
強化学習その2
nishio
線形計画法入門
線形計画法入門
Shunji Umetani
【DL輪読会】ViT + Self Supervised Learningまとめ
【DL輪読会】ViT + Self Supervised Learningまとめ
Deep Learning JP
[DL輪読会]相互情報量最大化による表現学習
[DL輪読会]相互情報量最大化による表現学習
Deep Learning JP
SSII2019OS: 深層学習にかかる時間を短くしてみませんか? ~分散学習の勧め~
SSII2019OS: 深層学習にかかる時間を短くしてみませんか? ~分散学習の勧め~
SSII
PRML学習者から入る深層生成モデル入門
PRML学習者から入る深層生成モデル入門
tmtm otm
機械学習による統計的実験計画(ベイズ最適化を中心に)
機械学習による統計的実験計画(ベイズ最適化を中心に)
Kota Matsui
実装レベルで学ぶVQVAE
実装レベルで学ぶVQVAE
ぱんいち すみもと
[DL輪読会]Set Transformer: A Framework for Attention-based Permutation-Invariant...
[DL輪読会]Set Transformer: A Framework for Attention-based Permutation-Invariant...
Deep Learning JP
構造方程式モデルによる因果推論: 因果構造探索に関する最近の発展
構造方程式モデルによる因果推論: 因果構造探索に関する最近の発展
Shiga University, RIKEN
深層学習の数理
深層学習の数理
Taiji Suzuki
La actualidad más candente
(20)
[DL輪読会]GLIDE: Guided Language to Image Diffusion for Generation and Editing
[DL輪読会]GLIDE: Guided Language to Image Diffusion for Generation and Editing
計算論的学習理論入門 -PAC学習とかVC次元とか-
計算論的学習理論入門 -PAC学習とかVC次元とか-
[DL輪読会] Spectral Norm Regularization for Improving the Generalizability of De...
[DL輪読会] Spectral Norm Regularization for Improving the Generalizability of De...
深層生成モデルと世界モデル
深層生成モデルと世界モデル
最適輸送の解き方
最適輸送の解き方
GAN(と強化学習との関係)
GAN(と強化学習との関係)
coordinate descent 法について
coordinate descent 法について
[DL輪読会]Wasserstein GAN/Towards Principled Methods for Training Generative Adv...
[DL輪読会]Wasserstein GAN/Towards Principled Methods for Training Generative Adv...
[DL輪読会]Pay Attention to MLPs (gMLP)
[DL輪読会]Pay Attention to MLPs (gMLP)
強化学習その2
強化学習その2
線形計画法入門
線形計画法入門
【DL輪読会】ViT + Self Supervised Learningまとめ
【DL輪読会】ViT + Self Supervised Learningまとめ
[DL輪読会]相互情報量最大化による表現学習
[DL輪読会]相互情報量最大化による表現学習
SSII2019OS: 深層学習にかかる時間を短くしてみませんか? ~分散学習の勧め~
SSII2019OS: 深層学習にかかる時間を短くしてみませんか? ~分散学習の勧め~
PRML学習者から入る深層生成モデル入門
PRML学習者から入る深層生成モデル入門
機械学習による統計的実験計画(ベイズ最適化を中心に)
機械学習による統計的実験計画(ベイズ最適化を中心に)
実装レベルで学ぶVQVAE
実装レベルで学ぶVQVAE
[DL輪読会]Set Transformer: A Framework for Attention-based Permutation-Invariant...
[DL輪読会]Set Transformer: A Framework for Attention-based Permutation-Invariant...
構造方程式モデルによる因果推論: 因果構造探索に関する最近の発展
構造方程式モデルによる因果推論: 因果構造探索に関する最近の発展
深層学習の数理
深層学習の数理
Similar a Sliced Wasserstein距離と生成モデル
IJCAI13 Paper review: Large-scale spectral clustering on graphs
IJCAI13 Paper review: Large-scale spectral clustering on graphs
Akisato Kimura
MIA 2 - Vector Concept Review.pdf
MIA 2 - Vector Concept Review.pdf
Vania Najah
Vertex Culling illustration at SBR07
Vertex Culling illustration at SBR07
Syoyo Fujita
Sharp Characterization of Optimal Minibatch Size for Stochastic Finite Sum Co...
Sharp Characterization of Optimal Minibatch Size for Stochastic Finite Sum Co...
Atsushi Nitanda
Visual Explanation of Ridge Regression and LASSO
Visual Explanation of Ridge Regression and LASSO
Kazuki Yoshida
Svm map reduce_slides
Svm map reduce_slides
Sara Asher
Research_Poster_Final
Research_Poster_Final
Sauvik Chakraborty
Stochastic Gradient Descent with Exponential Convergence Rates of Expected Cl...
Stochastic Gradient Descent with Exponential Convergence Rates of Expected Cl...
Atsushi Nitanda
Backpropagation (DLAI D3L1 2017 UPC Deep Learning for Artificial Intelligence)
Backpropagation (DLAI D3L1 2017 UPC Deep Learning for Artificial Intelligence)
Universitat Politècnica de Catalunya
Score based Generative Modeling through Stochastic Differential Equations
Score based Generative Modeling through Stochastic Differential Equations
Sungchul Kim
MUMS: Transition & SPUQ Workshop - Gradient-Free Construction of Active Subsp...
MUMS: Transition & SPUQ Workshop - Gradient-Free Construction of Active Subsp...
The Statistical and Applied Mathematical Sciences Institute
post119s1-file2
post119s1-file2
Venkata Suhas Maringanti
Split block domination in graphs
Split block domination in graphs
eSAT Journals
Multi-Step-Ahead Simultaneously Forecasting For Multiple Time-Series, Using T...
Multi-Step-Ahead Simultaneously Forecasting For Multiple Time-Series, Using T...
Florian Cartuta
is anyone_interest_in_auto-encoding_variational-bayes
is anyone_interest_in_auto-encoding_variational-bayes
NAVER Engineering
Distributional RL via Moment Matching
Distributional RL via Moment Matching
taeseon ryu
Optimization of sample configurations for variogram estimation
Optimization of sample configurations for variogram estimation
Alessandro Samuel-Rosa
about power system operation and control13197214.ppt
about power system operation and control13197214.ppt
MohammedAhmed66819
Localized methods for diffusions in large graphs
Localized methods for diffusions in large graphs
David Gleich
Caret Package for R
Caret Package for R
kmettler
Similar a Sliced Wasserstein距離と生成モデル
(20)
IJCAI13 Paper review: Large-scale spectral clustering on graphs
IJCAI13 Paper review: Large-scale spectral clustering on graphs
MIA 2 - Vector Concept Review.pdf
MIA 2 - Vector Concept Review.pdf
Vertex Culling illustration at SBR07
Vertex Culling illustration at SBR07
Sharp Characterization of Optimal Minibatch Size for Stochastic Finite Sum Co...
Sharp Characterization of Optimal Minibatch Size for Stochastic Finite Sum Co...
Visual Explanation of Ridge Regression and LASSO
Visual Explanation of Ridge Regression and LASSO
Svm map reduce_slides
Svm map reduce_slides
Research_Poster_Final
Research_Poster_Final
Stochastic Gradient Descent with Exponential Convergence Rates of Expected Cl...
Stochastic Gradient Descent with Exponential Convergence Rates of Expected Cl...
Backpropagation (DLAI D3L1 2017 UPC Deep Learning for Artificial Intelligence)
Backpropagation (DLAI D3L1 2017 UPC Deep Learning for Artificial Intelligence)
Score based Generative Modeling through Stochastic Differential Equations
Score based Generative Modeling through Stochastic Differential Equations
MUMS: Transition & SPUQ Workshop - Gradient-Free Construction of Active Subsp...
MUMS: Transition & SPUQ Workshop - Gradient-Free Construction of Active Subsp...
post119s1-file2
post119s1-file2
Split block domination in graphs
Split block domination in graphs
Multi-Step-Ahead Simultaneously Forecasting For Multiple Time-Series, Using T...
Multi-Step-Ahead Simultaneously Forecasting For Multiple Time-Series, Using T...
is anyone_interest_in_auto-encoding_variational-bayes
is anyone_interest_in_auto-encoding_variational-bayes
Distributional RL via Moment Matching
Distributional RL via Moment Matching
Optimization of sample configurations for variogram estimation
Optimization of sample configurations for variogram estimation
about power system operation and control13197214.ppt
about power system operation and control13197214.ppt
Localized methods for diffusions in large graphs
Localized methods for diffusions in large graphs
Caret Package for R
Caret Package for R
Último
Proteomics: types, protein profiling steps etc.
Proteomics: types, protein profiling steps etc.
Silpa
(May 9, 2024) Enhanced Ultrafast Vector Flow Imaging (VFI) Using Multi-Angle ...
(May 9, 2024) Enhanced Ultrafast Vector Flow Imaging (VFI) Using Multi-Angle ...
Scintica Instrumentation
Factory Acceptance Test( FAT).pptx .
Factory Acceptance Test( FAT).pptx .
Poonam Aher Patil
CURRENT SCENARIO OF POULTRY PRODUCTION IN INDIA
CURRENT SCENARIO OF POULTRY PRODUCTION IN INDIA
Dr. TATHAGAT KHOBRAGADE
Cyanide resistant respiration pathway.pptx
Cyanide resistant respiration pathway.pptx
Silpa
GBSN - Microbiology (Unit 3)Defense Mechanism of the body
GBSN - Microbiology (Unit 3)Defense Mechanism of the body
Areesha Ahmad
Cyathodium bryophyte: morphology, anatomy, reproduction etc.
Cyathodium bryophyte: morphology, anatomy, reproduction etc.
Silpa
TransientOffsetin14CAftertheCarringtonEventRecordedbyPolarTreeRings
TransientOffsetin14CAftertheCarringtonEventRecordedbyPolarTreeRings
Sérgio Sacani
Phenolics: types, biosynthesis and functions.
Phenolics: types, biosynthesis and functions.
Silpa
Climate Change Impacts on Terrestrial and Aquatic Ecosystems.pptx
Climate Change Impacts on Terrestrial and Aquatic Ecosystems.pptx
DiariAli
Site Acceptance Test .
Site Acceptance Test .
Poonam Aher Patil
PSYCHOSOCIAL NEEDS. in nursing II sem pptx
PSYCHOSOCIAL NEEDS. in nursing II sem pptx
Suji236384
FAIRSpectra - Enabling the FAIRification of Spectroscopy and Spectrometry
FAIRSpectra - Enabling the FAIRification of Spectroscopy and Spectrometry
Alex Henderson
Clean In Place(CIP).pptx .
Clean In Place(CIP).pptx .
Poonam Aher Patil
THE ROLE OF BIOTECHNOLOGY IN THE ECONOMIC UPLIFT.pptx
THE ROLE OF BIOTECHNOLOGY IN THE ECONOMIC UPLIFT.pptx
ANSARKHAN96
Dr. E. Muralinath_ Blood indices_clinical aspects
Dr. E. Muralinath_ Blood indices_clinical aspects
muralinath2
CYTOGENETIC MAP................ ppt.pptx
CYTOGENETIC MAP................ ppt.pptx
Silpa
module for grade 9 for distance learning
module for grade 9 for distance learning
levieagacer
PATNA CALL GIRLS 8617370543 LOW PRICE ESCORT SERVICE
PATNA CALL GIRLS 8617370543 LOW PRICE ESCORT SERVICE
Goa Call Girls High Profile Escorts
Thyroid Physiology_Dr.E. Muralinath_ Associate Professor
Thyroid Physiology_Dr.E. Muralinath_ Associate Professor
muralinath2
Último
(20)
Proteomics: types, protein profiling steps etc.
Proteomics: types, protein profiling steps etc.
(May 9, 2024) Enhanced Ultrafast Vector Flow Imaging (VFI) Using Multi-Angle ...
(May 9, 2024) Enhanced Ultrafast Vector Flow Imaging (VFI) Using Multi-Angle ...
Factory Acceptance Test( FAT).pptx .
Factory Acceptance Test( FAT).pptx .
CURRENT SCENARIO OF POULTRY PRODUCTION IN INDIA
CURRENT SCENARIO OF POULTRY PRODUCTION IN INDIA
Cyanide resistant respiration pathway.pptx
Cyanide resistant respiration pathway.pptx
GBSN - Microbiology (Unit 3)Defense Mechanism of the body
GBSN - Microbiology (Unit 3)Defense Mechanism of the body
Cyathodium bryophyte: morphology, anatomy, reproduction etc.
Cyathodium bryophyte: morphology, anatomy, reproduction etc.
TransientOffsetin14CAftertheCarringtonEventRecordedbyPolarTreeRings
TransientOffsetin14CAftertheCarringtonEventRecordedbyPolarTreeRings
Phenolics: types, biosynthesis and functions.
Phenolics: types, biosynthesis and functions.
Climate Change Impacts on Terrestrial and Aquatic Ecosystems.pptx
Climate Change Impacts on Terrestrial and Aquatic Ecosystems.pptx
Site Acceptance Test .
Site Acceptance Test .
PSYCHOSOCIAL NEEDS. in nursing II sem pptx
PSYCHOSOCIAL NEEDS. in nursing II sem pptx
FAIRSpectra - Enabling the FAIRification of Spectroscopy and Spectrometry
FAIRSpectra - Enabling the FAIRification of Spectroscopy and Spectrometry
Clean In Place(CIP).pptx .
Clean In Place(CIP).pptx .
THE ROLE OF BIOTECHNOLOGY IN THE ECONOMIC UPLIFT.pptx
THE ROLE OF BIOTECHNOLOGY IN THE ECONOMIC UPLIFT.pptx
Dr. E. Muralinath_ Blood indices_clinical aspects
Dr. E. Muralinath_ Blood indices_clinical aspects
CYTOGENETIC MAP................ ppt.pptx
CYTOGENETIC MAP................ ppt.pptx
module for grade 9 for distance learning
module for grade 9 for distance learning
PATNA CALL GIRLS 8617370543 LOW PRICE ESCORT SERVICE
PATNA CALL GIRLS 8617370543 LOW PRICE ESCORT SERVICE
Thyroid Physiology_Dr.E. Muralinath_ Associate Professor
Thyroid Physiology_Dr.E. Muralinath_ Associate Professor
Sliced Wasserstein距離と生成モデル
1.
2021/01/24 Sliced Wasserstein距離と生成モデル 1 @ohken322
2.
目次 1. Wasserstein距離とWGAN 2. Sliced
Wasserstein 距離と生成モデルSWG 3. Max-sliced Wasserstein距離 1. Sliced Wassersteinの統計的性質 2. 生成モデルへの応用 4. Generalized sliced Wasserstein距離 1. Radon変換 2. SWの一般化 5. Augmented sliced Wasserstein距離 2
3.
Wasserstein距離 𝜇, 𝜈 :
ℝ𝑑 上の確率測度 (e.g. d𝜇 = 𝑓d𝑥, 𝑓は確率密度関数) Π 𝜇, 𝜈 ≔ {𝜋: ℝ𝑑 × ℝ𝑑 上の測度, 𝜋 𝐴 × ℝ𝑑 = 𝜇 𝐴 , 𝜋 ℝ𝑑 × 𝐵 = 𝜈 𝐵 } Wasserstein距離 𝑝 ≥ 1に対し 𝑊 𝑝 𝜇, 𝜈 ≔ min 𝜋∈Π(𝜇,𝜈) 𝒳×𝒳 𝑥 − 𝑦 𝑝 d𝜋 𝑥, 𝑦 1/𝑝 命題 𝑊 𝑝 は ℝ𝑑 上の確率測度間の距離を定める. 3
4.
Wasserstein GAN 双対性 𝑊1
𝜇, 𝜈 = inf 𝜋∈Π(𝜇,𝜈) ℝ𝑑 𝑥 − 𝑦 d𝜋 = sup 𝑓∈𝐿𝑖𝑝1 ℝ𝑑 𝑓d𝜇 − ℝ𝑑 𝑓d𝜈 Wasserstein GAN (Arjovsky et al. ICML 2017) 𝜇:生成分布、𝜈: データ分布として、min 𝑊1 を解くように生成器と 𝑓 を学習する 課題: 𝑊1を正確に推定するために識別器 𝑓 がある程度学習できてないといけない e.g. 生成器のパラメータ更新1回に対して 𝑓 を5回更新 4
5.
Generative Modeling using
the Sliced Wasserstein Distance DESHPANDE, ZHANG, SCHWING @ CVPR 2018 5
6.
Sliced Wasserstein distance Sliced
Wasserstein (Rabin 2011, Bonneel 2015) SW2 𝜇, 𝜈 2 ≔ 𝕊𝑑−1 𝑊2 𝑃𝜃 #𝜇, 𝑃𝜃 #𝜈 2 d𝜃 𝑃𝜃 ∶ 𝒳 = ℝ𝑑 → ℝ は𝜃 ∈ 𝕊𝑑−1 = {𝑥 ∈ ℝ𝑑 ∣ 𝑥 = 1} 方向の直線への射影 1次元でのOTが陽に解けるので計算が楽 積分は方向ベクトルのサンプリングで行う SWも距離(しかもWasserstein距離と同値) 混合ガウス分布によるモデリングでの応用 Kolouri, et al. 2018 6
7.
Sliced Wasserstein Generator Deshpande,
et al. CVPR 2018 Sliced Wasserstein距離を損失関数に用いた生成モデル 距離を推定するために識別器を学習させずに済む 方向ベクトルのサンプル数は10000くらい(MNISTで) 生成器の更新が1.5 ~ 2倍くらいの時間になるらしい (識別機はないのでWGANより高速) 7
8.
SWGの実験結果 あ 8 ロスの収束先が バッチサイズに反比例 (SWの統計的性質:後述) バッチサイズ=128 でも 十分な生成品質と多様性 NNの構造に依らずに学習が安定
9.
SWG : 高次元の場合 課題:
高次元になるほど、SWの近似に必要な方向ベクトルの数が増える → できるだけ「情報の多い」方向ベクトルを選びたい 「情報の多い低次元空間」に移す役割としてDiscriminator を復活 Discriminator 𝑓𝜃′ ′ 𝑓 生成分布 𝐺𝜃(𝑃𝑧) データ分布 𝑃𝑑 𝒟 ℱ サンプリング 𝑓𝜃′ 𝒟 𝑓𝜃′(ℱ) SW Loss Discriminator Loss 識別しやすい空間 = SWの推定が簡単な空間 というヒューリスティック 生成結果は論文を参照 8
10.
(Sliced) Wassersteinの統計的性質 Wasserstein距離の推定は、次元が高くなるほどサンプル効率が悪い 経験分布の弱収束 確率測度
𝜇 ∈ 𝒫𝑝 ℝ𝑑 の経験分布 𝜇𝑛 に対し、𝑊 𝑝 𝜇𝑛, 𝜇 → 0 a.s. しかしながら収束の速さは (𝜇:絶対連続, 𝑑 > 2𝑞のとき) 𝔼 𝑊 𝑝 𝜇𝑛, 𝜇 ≃ 𝑛− 1 𝑑 Sliced Wassersteinのサンプル効率 (Nadjahi, et al. 2020, Lin, et al. 2020) (適当な条件の下で) ) 𝔼 𝑆𝑊 𝑝 𝜇𝑛, 𝜇 ≃ 𝑛−1 10 SWD (Deshpande 2018)での実験結果
11.
Max-Sliced Wasserstein Distance and
its use for GANs DESHPANDE, HU, SUN, PYRROS, SIDDIQUI @ CVPR 2019 11
12.
SWの推定効率 Sliced Wassersteinのサンプル効率性に加え、方向ベクトルのサンプル効率を検証 →
重要な方向だけを採用するのが良さそう 12 𝜇 = 𝒩(0, 𝐼) を 𝜈 = 𝒩(𝛽𝑒, 𝐼)で推定: 𝛽 ← 𝛽 − 𝛼𝛻𝛽𝑆𝑊2 𝜇, 𝜈 max-𝑊 : 𝑒を方向ベクトルに使う
13.
Max-sliced Wasserstein距離 max-sliced
Wasserstein maxSW2 𝜇, 𝜈 ≔ max 𝜃∈𝕊𝑑−1 𝑊2 𝑃𝜃 #𝜇, 𝑃𝜃 #𝜈 分布間の距離を与える (Wasserstein距離と同値) Sliced Wasserstein とほぼ同じサンプル効率 13
14.
Max-sliced GAN maxをどうやって計算するのか? Sliced
Wasserstein Generator の時と同じアイデア : 特徴量写像 + 良い方向ベクトル = Discriminator 14 特徴量写像のパラメータ ちょっと難しい… Surrogateモデル導入 e.g.
15.
Max-sliced GAN 15 生成結果は論文を参照
16.
Generalized Sliced Wasserstein Distance KOLOURI,
NADJAHIM, ŞIMŞEKLI, BADEAU, ROHDE @ NEURIPS 2019 16
17.
ラドン変換とSliced Wasserstein Radon
Transform (Radon, 1917) 𝐼 ∈ 𝐿1 ℝ𝑑 = 𝐼: ℝ𝑑 → ℝ ℝ𝑑 𝐼 𝑥 d𝑥 < ∞ , 𝑡, 𝜃 ∈ ℝ × 𝕊𝑑−1 𝐼 ↦ ℛ𝐼 𝑡, 𝜃 ∶= ℝ𝑑 𝐼 𝑥 𝛿(𝑡 − 𝑥, 𝜃 )d𝑥 ※ CTスキャンなどの断層映像法(トモグラフィ)で使われる これを使うと密度 d𝜇 = 𝐼𝜇(𝑥)d𝑥, d𝜈 = 𝐼𝜈(𝑥)d𝑥 を持つ 𝜇, 𝜈 に対して 𝑆𝑊 𝑝 𝑝 𝜇, 𝜈 = 𝕊𝑑−1 𝑊 𝑝 𝑝 (ℛ𝐼𝜇 ⋅, 𝜃 , ℛ𝐼𝜈 ⋅, 𝜃 )d𝜃 と書ける。 17
18.
一般化ラドン変換 Generalized Radon
Transform (Beylkin, 1984) 𝒢𝐼 𝑡, 𝜃 = ℝ𝑑 𝐼 𝑥 𝛿(𝑡 − 𝑔 𝑥, 𝜃 )d𝑥 𝑔: ℝ𝑑 × (ℝ𝑛∖ 0 ) → ℝ は いくつかの条件を満たす定義関数 18
19.
一般化(max-)Sliced Wasserstein Generalized
(max-)sliced Wasserstein distance 𝐺𝑆𝑊 𝑝 𝑝 𝜇, 𝜈 ≔ Ω𝜃 𝑊 𝑝 𝑝 (𝒢𝐼𝜇 ⋅, 𝜃 , 𝒢𝐼𝜈 ⋅, 𝜃 )d𝜃 max𝐺𝑆𝑊 𝑝 𝜇, 𝜈 ≔ max 𝜃∈Ω𝜃 𝑊 𝑝( 𝒢𝐼𝜇 ⋅, 𝜃 , 𝒢𝐼𝜈 ⋅, 𝜃 ) 命題 𝒢 が単射のとき、𝐺𝑆𝑊, max𝐺𝑆𝑊 は確率分布間の距離を与える ※ 𝑔 : circular, polynomial(奇数次のみで斉次) などが単射を与えることが知られている 19
20.
(max-)GSWの計算アルゴリズム 20 𝜃はexactに最適化していることに注意 (さっきはDiscriminatorに織り込んでいた)
21.
実験結果 Toy example
でSWと比較 より柔軟な射影を計算できるので効率よく分布マッチングできる Sliced Wasserstein Auto-Encoder (Kolouri, et al. 2019) に適用 実用的よりも実験的な設定(右図) GANとの組み合わせは試してない 𝑔 をNNで構成できるか微妙 21
22.
Augmented Sliced Wasserstein Distance CHEN,
YANG, LI @ ICLR 2021 REJECTED(6,7,4) 22
23.
Spatial Radon Transform
Spatial Radon Transform 𝑡, 𝜃 ∈ ℝ × 𝕊𝑑𝜃−1, 𝑔: ℝ𝑑 → ℝ𝑑𝜃 ℋ𝐼 𝑡, 𝜃; 𝑔 = ℝ𝑑 𝐼 𝑥 𝛿 𝑡 − 𝑔 𝑥 , 𝜃 d𝑥 = ℛ 𝑔∗ 𝐼 𝑡, 𝜃 ※ 多項式によるGRTを含む 命題 𝑔 :単射 ⇔ ℋ:単射 23
24.
Augmented Sliced Wasserstein
Distance Augmented (max-)sliced Wasserstein distance 𝐴𝑆𝑊 𝑝 𝑝 𝜇, 𝜈 ≔ 𝕊𝑑𝜃−1 𝑊 𝑝 𝑝 (ℋ𝐼𝜇 ⋅, 𝜃; 𝑔 , ℋ𝐼𝜈 ⋅, 𝜃; 𝑔 )d𝜃 max𝐴𝑆𝑊 𝑝 𝜇, 𝜈 ≔ max 𝜃∈𝕊𝑑𝜃−1 𝑊 𝑝( ℋ𝐼𝜇 ⋅, 𝜃; 𝑔 , ℋ𝐼𝜈 ⋅, 𝜃; 𝑔 ) 𝑔 が単射でさえあれば良いので、NNでも表現できる : 𝑔 = [𝑥, 𝜙𝑁𝑁 𝑥 ] 良い𝑔を得るための最適化の目的関数: 24 実験では1層、ReLU 𝑑 = 𝑑𝜃
25.
実験結果 Toy Problem
(KolouriのGSWと同じ) 標準正規分布から勾配法で他の分布を目指す 25 実際のW2が最小
26.
GANへの適用 CIFAR10 (64*64),
CELEBA (64*64) モデルやロスの設計はDeshpande 2018と同じ?: 26 方向ベクトル のサンプル数 Distributed SWD (NeurIPS 2019)
27.
紹介した論文 1. Deshpande, Zhang,
Schwing, “Generative Modeling Using the Sliced Wasserstein Distance”, CVPR 2018. 2. Deshpande, Hu, Sun, Pyrros, Siddiqui, Koyejo, Zhao, Forsyth, Schwing, “Max-Sliced Wasserstein distance and its use for GANs”, CVPR 2019. 3. Kolouri, Nadjahi, Simsekli, Badeau, Rohde “Generalized Sliced Wasserstein Distances”, NeurIPS 2019. 4. Chen, Yang, Li, “Augmented Sliced Wasserstein Distances”, arXiv:2006.08812, 2020. 27
28.
参考文献 1. Arjovsky, Chintala,
Bottou, “Wasserstein Generative Adversarial Networks”, ICML 2017. 2. Rabin, Peyre, Delon, Marc, “Wasserstein Barycenter and its Application to Texture Mixing”, SSVM’11, 435-446, 2011. 3. Bonneel, Rabin, Peyre, Pfister, “Sliced and Radon Wasserstein Barycenters of Measures”, Journal of Mathematical Imaging and Vision, Springer Verlag, 1 (51), 22-45, 2015. 4. Kolouri, Rohde, Hoffman, “Sliced Wasserstein Distance for Learning Gaussian Mixture Models”, CVPR 2018. 5. Kolouri, Pope, Martin, Rohde, “Sliced Wasserstein Auto-Encoders”, ICLR 2019. 6. Nadjahi, Durmus, Chizat, Kolouri, Shahranpour, Şimsekli, “Statistical and Topological Properties of Sliced Probability Divergences”, arXiv:2003.05783, 2020. 7. Lin, Zheng, Chen, Cuturi, Jordan, “On Projection Robust Optimal Transport: Sample Complexity and Model Misspecification”, arXiv:2006.12301, 2020. 28
Descargar ahora