13. 基本的なアイディア(3/3) p(J|E) = ∑Ap(J,A|E) A: アライメント E中の単語とJ中の単語の対応付け A[i] = i番目の翻訳先の翻訳元番号 0 1 2 3 4 5 6 NULL ichgehejanichtzumhaus I do not go to the house A = [ 1 , 0, 4, 2, 5, 5, 6 ]
14. IBM モデル p(E, A, | J) をどのように定義するかで5種類 そのうち簡単なIBM Model-2まで紹介 Model-1 ∝Πk t (ek | JA[k]) アライメントに従い、各翻訳は独立に t (e | j) : 単語対の翻訳確率 Model-2 ∝Πk t (ek | JA[k]) u(A[k] | k, |E|, |J|) u:どのくらい翻訳元と先で単語が移動し得るか
24. 出展 [Broun+ 93] “The Mathematics of Machine Translation: Parameter Estimation”, P. F. Brown and et. al. Computational Linguistics 1993 [Chiang+ 09]“11,001 new features for statistical machine translation”, D. Chaingand et. al. NAACL 2009 [Galley+ 10] “Accurate Non-Hierarchical Phrase-Based Translation”, M. Galley and C. D. Manning NAACL 2010 [Dyer+ 10] “Two monolingual parses are better than one (synchronous parse)” C. Dyer NAACL 2010 [Liang+ 06] “Alignment by agreement”, P. Laing and et. al. NAACL 2006 [Lopez 07] “Hierarchical Phrase-Based Translation with Suffix Arrays”, A. Lopez, EMNLP 2007 [Haghighi+ 08] “Learning Bilingual Lexicons from Monolingual Corpora”, A. Haghighi+ ACL 2008