[DL輪読会]Scalable Training of Inference Networks for Gaussian-Process Models
1. DEEP LEARNING JP
[DL Papers]
http://deeplearning.jp/
Scalable Training of Inference Networks
for Gaussian-Process Models
Makoto Kawano (@mkt_kwn), Matsuo Lab.
2. 書誌情報
著者情報:
Jiaxin Shi, Mohammad Emtiyaz Khan, Jun Zhu
清華大学 (インターン),理研 AIP(近似ベイズ推論チーム)
ICML2019
選定理由
ベイズ・不確実性周りでガウス過程は大事と思ったため
免責事項
思ったよりもニューラルネットワーク関係なかったです
再生核ヒルベルト空間 (RKHS) に意識を飛ばすのは初めてなので,
間違っているかもしれないです
間違っていたら,炎上しないようにそっと twitter とかで教えてください
1/32
3. 研究概要
ガウス過程は計算量が O(N3) かかってしまうことが知られている
補助入力点の導入 [Cheng and Boots, 2016]
計算量は O(M3
) とかなり減る
(ただし M N)
事後分布の近似精度が M に依存してしまう
DNN による事後分布近似 [Sun et al., 2019]
補助入力点よりも柔軟な事後分布近似が可能
ミニバッチ学習では全データ点同士の相関を
捉えられない
入力空間 X 上ではなく,RKHSH 上でガウス過程 (の近似 NN) をミニバッチ学習
2/32
30. References i
Cheng, C.-A. and Boots, B. (2016).
Incremental variational sparse gaussian process regression.
In Advances in Neural Information Processing Systems, pages 4410–4418.
Doucet, A., De Freitas, N., and Gordon, N. (2001).
An introduction to sequential monte carlo methods.
In Sequential Monte Carlo methods in practice, pages 3–14. Springer.
Eldredge, N. (2016).
Analysis and probability on infinite-dimensional spaces.
arXiv preprint arXiv:1607.03591.
29/32
31. References ii
Hensman, J., Fusi, N., and Lawrence, N. D. (2013).
Gaussian processes for big data.
arXiv preprint arXiv:1309.6835.
Jacot, A., Gabriel, F., and Hongler, C. (2018).
Neural tangent kernel: Convergence and generalization in neural networks.
In Advances in neural information processing systems, pages 8571–8580.
Neal, R. M. (2012).
Bayesian learning for neural networks, volume 118.
Springer Science & Business Media.
30/32
32. References iii
Quiñonero-Candela, J. and Rasmussen, C. E. (2005).
A unifying view of sparse approximate gaussian process regression.
Journal of Machine Learning Research, 6(Dec):1939–1959.
Rahimi, A. and Recht, B. (2008).
Random features for large-scale kernel machines.
In Advances in neural information processing systems, pages 1177–1184.
Sun, S., Zhang, G., Shi, J., and Grosse, R. (2019).
Functional variational bayesian neural networks.
arXiv preprint arXiv:1903.05779.
31/32
33. References iv
Williams, C. K. and Rasmussen, C. E. (1996).
Gaussian processes for regression.
In Advances in neural information processing systems, pages 514–520.
持橋大地 and 大羽成征 (2019).
ガウス過程と機械学習 = Gaussian process and machine learning.
MLP 機械学習プロフェッショナルシリーズ. 講談社.
鈴木大慈 (2018).
機械学習における確率的最適化.
応用数理, 28(3):27–33.
32/32