Más contenido relacionado
La actualidad más candente (20)
Similar a Stochastic Gradient MCMC (20)
Stochastic Gradient MCMC
- 6. MCMCとは
• Markov Chain Monte Carlo / マルコフ連鎖モンテカルロ法
• Markov Chain
• 状態遷移モデルで次の状態が今の状態だけから決まるもの
• Monte Carlo
• 乱数を⽤いて数値計算・シミュレーション・サンプリングなどを⾏う⼿法
• パラメータ空間中を遷移するマルコフ連鎖を作り、その軌道をたどることで、パラメータ空間上
の確率分布からサンプリングを⾏う⼿法
6
- 9. 今回の問題設定
• 事後分布からのサンプリングを考える。
• θ : ⽣成モデルのパラメータ
• X = {x1, x2, …, xN} : 訓練データ、xn 〜 p(x | θ) i.i.d.
• 事後分布:p(θ | X) からサンプリングを⾏いたい
• 状態空間について
• 幾つかの⼿法は θ の他に補助的なパラメータ (p, ξ…) を⽤いる。
• φ = θ, (θ, p), (θ, p, ξ) などを考え、その上の同時分布 p(φ| X) を考える
• θ, p, ξいずれも連続変数
9
- 12. カノニカル分布
• パラメータ空間上の運動とあるパラメータを
とる確率を紐づける関係式
• エネルギー H(φ) が⾼いほど、パラメータφを
とる確率は低くなる
12
統計⼒学では、この関係式は等重率の仮定から導かれるものだ
が、今回はこの関係式を⽤いて、⼀⽅から他⽅を定義している
と考える。
• 今回は、H(φ) が、各パラメータの関数の和で
書かれている場合を考える(Santaを除く)
• これは、各パラメータがXに条件づけられた時、
独⽴である事を意味する
• この事から、各パラメータの周辺分布もカノ
ニカル分布に従うこともわかる
- 21. Santa
⼀⾔で⾔うと、mSGNHT + ⾮ユークリッド化
+ RMSprop + 焼きなまし
21
• ベースとなる運動⽅程式はmSGNHT
• G1, G2にパラメータ空間の曲がり⽅の情報
を⼊れる (⾮ユークリッド化)
• G1, G2の推定をオンラインで⾏う
(RMSprop)
• 逆温度 β = 1とすれば事後分布からのサン
プリング、β を更新ごとに徐々に上げてい
き∞とすればMAP推定 (焼きなまし)
これは次の不変分布を持つ
- 23. Symmetric Splitting [Chen+15a] [Chen+15b] [Chen+15c]
Leapfrog法と同様に、運動⽅程式を⽅程式の和
に分解し各々を順番に解析的に解く
SGHMCの場合 [Chen+15a]
23
これを3つに分解して
A(h/2) → B(h/2) → O(h) → B(h/2) → A (h/2)
の順に解析的に解く
[Chen+15b]でmSGNHTに、[Chen+15c]でSantaにSSを
適⽤している
Baker-Campbell-Hausdorffの公式を使って離散化による
近似誤差がO(h2)→O(h3)になることが証明できる
- 26. 実験
モデル
• パラメータ:θ = (θ1, θ2)
• 事前分布:p(θ) = (N(0, 10), N(0, 1))
• ⽣成:p(x | θ) = N(θ1, 2)/2 + N(θ1+θ2, 2)/2
問題設定
• θ = (0, 1)として100サンプルをiidで⽣成
• 事前分布と⽣成⽅法はわかっているとしてパラ
メータの事後分布 p(θ | X) を推定
• 事後分布は (0, 1)と(1, -1)にモードがある⼆峰
性の⼭になる
26
⼿法
• HMC, SGHMC, SGLD, mSGNHT
• HMCは勾配の計算に100サンプル使⽤、それ
以外は10サンプルずつミニバッチで使⽤
対数尤度の勾配 -∇log p(θ | x) はChainerで⽣成
モデルを作ってback propで計算
⼀昨⽇1.6.0が出ました