ma52006id384

未知パラメータを伴う隠れマルコフモデルの状態推定に関する一考察前田　康成　（北見工業大学工学部）吉田　秀樹　（北見工業大学工学部）藤原　祥隆　（北見工業大学工学部）松嶋　敏泰　（早稲田大学理工学部）

本日の発表内容未知パラメータを伴う隠れマルコフモデルの状態推定問題の概要準備従来研究未知パラメータを伴う隠れマルコフモデルの状態推定の目的の整理状態系列単位で評価する場合・定式化・ベイズ基準のもとで誤り率を最小にする推定方法・ベイズ解を求める DP アルゴリズム・近似アルゴリズム状態単位で評価する場合・定式化・ベイズ基準のもとで誤り率を最小にする推定方法・近似アルゴリズム状態の有無に関して評価する場合・定式化・ベイズ基準のもとで誤り率を最小にする推定方法まとめと今後の課題

隠れマルコフモデル（ HMM ）の概要状態から状態への遷移確率状態での記号の生起確率状態記号初期状態が生起し，記号の生起と状態遷移を繰り返す通常，状態系列は未知で，記号系列が観測される初期状態の生起確率

未知パラメータを伴う隠れマルコフモデルの状態推定問題確率分布を支配するパラメータが未知のもとで，学習データを用いて学習し，新規の記号系列を観測して，新規の記号系列に対応する未知の状態系列を推定する問題単語系列を観測して，品詞系列を推定　->　形態素解析単語系列を観測して，クラス系列を推定　->　複数のクラスに属する文書のクラスの推定【応用例】複数のクラスに属する文書の生成単語文書のクラス文の生成単語品詞表現するもの記号状態

準備（ 1/2 ）状態状態集合記号記号の集合状態が生起する確率分布（ HMM の初期状態の生起確率）状態で記号が生起する確率分布を支配するパラメータ真のパラメータ（未知）状態から状態へ遷移する確率を示す確率分布（ HMM の状態の遷移確率）を支配するパラメータ

準備（ 2/2 ）学習データの番目の系列番目の系列の番目の状態番目の系列の番目の記号番目の系列の状態および記号の数個の学習データ（状態系列，記号系列ともに既知）新規に状態系列を推定したい系列の組学習データと新規の記号系列を受け取ったもとで，新規の記号系列に対応する状態系列を推定する問題未知パラメータを伴う隠れマルコフモデルの状態推定問題学習データ新規のデータ（状態系列は未知，記号系列は既知）

従来研究における学習と推定方法従来研究では未知パラメータの推定（学習）と状態推定が二つの問題に分けて検討されている未知パラメータの推定状態推定最尤学習漸近的に真のパラメータに収束することは保証されているが，有限の学習データに対して何故この推定方法を採用するかという根拠が不明確真のパラメータ既知の場合に誤り率を最小にする推定方法に推定値を代入　->　推定値次第本研究では統計的決定理論の視点から未知パラメータの推定と状態推定を一つの統計的決定問題として検討する . . . (1) (2) (3)

状態推定の目的の整理状態の推定結果・単語単位で評価する形態素解析・複数のクラスに属する文書の分類及びインデックスの付与状態単位で評価状態系列中に状態が含まれるかどうかの推定結果系列の推定結果出力　　　　　学習データ　　　　新規の記号系列入力・複数のクラスに属する文書の分類・文単位で評価する形態素解析・複数のクラスに属する文書の分類及びインデックス付与用途状態の有無に関して評価状態系列単位で評価

定式化（状態系列単位）（ 1/2 ）損失関数ただし，は学習データと新規の記号系列を受け取ったもとで状態系列の推定結果を返す決定関数リスク関数 . (4) (5)

ベイズリスクただし，は事前分布ベイズ最適な決定関数 . . 定式化（状態系列単位）（ 2/2 ） (6) (7)

ベイズ決定（状態系列単位）（ 1/3 ）ベイズ最適な決定ベイズ基準のもとで状態系列の推定を間違えてしまう確率である誤り率を最小にする決定事前分布に共役事前分布であるディレクレ分布を採用することにより積分部分はディレクレ分布のパラメータと頻度情報によって算出可能 . (8)

事前分布に共役事前分布であるディレクレ分布を採用した場合学習データの各状態系列中で最初の状態がの数に対するディレクレ分布のパラメータただし，学習データ中で状態で記号が生起した回数に対するディレクレ分布のパラメータただし， , , ベイズ決定（状態系列単位）（ 2/3 ） (9) (10)

学習データ中で状態から状態へ遷移した回数に対するディレクレ分布のパラメータただし，系列で状態で記号が生起した回数ただし， , , ベイズ決定（状態系列単位）（ 3/3 ） (11) (12)

ベイズ解を求めるＤＰアルゴリズム（状態系列単位）（ 1/2 ）新規の記号系列に対応する状態系列の候補を木構造で列挙して，動的計画法（ＤＰ）を用いてベイズ解を求める例　　　　の場合空列のノード個個深さ個各ノードにその系列に対応する事後分布を保持させて，動的計画法を用いて，深さのノードから遡ってベイズ最適な系列を推定する

木の末端から以下の処理を再帰的に繰り返すことによって，ベイズ最適な系列が推定できるは，ノードにおける部分最適解の確率ただし，上式で定まる部分最適解の確率，系列をそれぞれ保持しておいて，深さのノードで部分最適解として利用する深さの各ノードでの計算ベイズ最適な系列の推定は可能だが，計算量はノード数に比例し，系列長に対する指数オーダになる , ベイズ解を求めるＤＰアルゴリズム（状態系列単位）（ 2/2 ） (13)

近似アルゴリズム（状態系列単位）（ 1/2 ）学習データに対する事後分布による予測分布を未知パラメータの推定値として採用し，ビタビアルゴリズムで状態系列を推定する学習データに対する事後分布によるの予測分布も同様従来研究と同様にパラメータの推定問題と状態系列の推定問題という二つの問題に分割して検討していることになる -> 　しかし，ベイズ最適な推定方法を導出する際に出てきた事後分布による予測分布を未知パラメータの推定値として採用しており，推定方法の採用には統計的決定理論に基づく根拠があるベイズ解における新規系列による頻度更新を無視することに相当 . (14)

トレリス線図の例　　　　の場合時点時点時点時点時点時点のメトリック（時点の状態から時点の状態への枝に付与）時点から時点まで各時点ごとにトレリス線図上の全状態について次式によって計算（時点から時点の状態までの最尤系列）学習データに対する事後分布による予測分布を用いた場合の最尤系列を求められる．計算量は系列長に比例 . . 近似アルゴリズム（状態系列単位）（ 2/2 ） (15) (16)

定式化とベイズ解（状態単位）損失関数ただし，は学習データと新規の記号系列を受け取ったもとで状態の推定結果を返す決定関数ベイズ最適な決定 . ベイズ基準のもとで状態の推定を間違えてしまう確率である誤り率を最小にする決定は可能だが，計算量は系列長に対する指数オーダ -> 　近似アルゴリズムの検討 (17) (18)

近似アルゴリズム（状態単位）（ 1/2 ）学習データに対する事後分布による予測分布を未知パラメータの推定値として採用し， BCJR アルゴリズムで状態を推定する . . . (19) (20) (21)

近似アルゴリズム（状態単位）（ 2/2 ） . . およびは以下のように再帰的に計算される近似解時点時点時点時点時点時点時点近似アルゴリズムの計算量は系列長に比例 (22) (23)

定式化とベイズ解（状態の有無）損失関数ただし，は系列中に状態が有れば，無ければを返す関数ベイズ最適な決定この場合の近似アルゴリズムは BCJR アルゴリズムを利用して導出できるただし，は状態が系列中に無い確率の推定値 . (24) (25) (26)

まとめ未知パラメータを伴う隠れマルコフモデルの状態推定問題を　・状態系列単位で評価する場合　・状態単位で評価する場合　・状態の有無で評価する場合という目的別に定式化を実施状態系列単位で評価する推定問題について　・統計的決定理論に基づきベイズ基準のもとで誤り率を最小にするベイズ決定の導出　・動的計画法によってベイズ決定を行うアルゴリズムの提案　・学習データに対する事後分布による予測分布を用いた近似アルゴリズムの提案（ビタビアルゴリズムを適用）状態単位で評価する推定問題について　・統計的決定理論に基づきベイズ基準のもとで誤り率を最小にするベイズ決定の導出　・学習データに対する事後分布による予測分布を用いた近似アルゴリズムの提案（ＢＣＪＲアルゴリズムを適用）状態の有無で評価する推定問題について　・統計的決定理論に基づきベイズ基準のもとで誤り率を最小にするベイズ決定の導出

今後の課題形態素解析等の実データでの検証本研究が応用可能な実問題の模索ベイズ最適な推定方法の計算量の軽減

ma52006id384

Recommended

Recommended

More Related Content

Viewers also liked

Viewers also liked (20)

Similar to ma52006id384

Similar to ma52006id384 (20)

More from matsushimalab

More from matsushimalab (20)

ma52006id384