SlideShare una empresa de Scribd logo
1 de 15
Descargar para leer sin conexión
Text	
  simplifica.on	
  for	
  children.	
  
	
  
Jan	
  De	
  Belder,	
  Marie-­‐Francine	
  Moens.	
  	
  
	
  
	
  In	
  Proceedings	
  of	
  the	
  SIGIR	
  Workshop	
  on	
  
Accessible	
  Search	
  Systems,	
  pp.19–26,	
  2010.	
プレゼンテーション	
  
関沢祐樹	
2015/07/24	
 1
概要	
•  対象:テキスト平易化	
  
	
  
•  目的	
  
–  子供が理解しやすいテキストへの自動変換	
  
•  難しいテキストを入力、 簡単なテキストを出力	
  
•  文分割、語彙平易化をする	
  
•  結果	
  
–  難易度の減少に成功	
  
–  理想ほどは落ちなかった	
2015/07/24	
 2
はじめに	
•  インターネットには大量の情報	
  
– しかし、子供が読むレベルの情報はごくわずか	
  
•  従来のテキスト簡単化	
  
– アノテーションデータが必要	
  
– 文単位で難易度を考慮	
  
•  文書全体の難易度は考慮しない	
  
– 子供に読みやすくするため、簡単すぎても	
  ×	
  
•  ほどよく難易度を下げたい	
  
2015/07/24	
 3
関連研究	
•  テキスト自動平易化	
  
– 文を短くする	
  
– 解析結果や、規則を用いる	
  
•  語彙平易化	
  
– ある単語を上位語、出現頻度によって置換	
  
•  WordNet	
  を使用	
  
– 語義曖昧性により、意味の通らなくなることもある	
  
2015/07/24	
 4
提案手法	
•  3つの要素で構成	
  
1.  語彙平易化	
  
2.  文法平易化	
  
3.  平易化の最適選択	
  
2015/07/24	
 5
1.語彙平易化	
•  語義曖昧性解消を用いた単語の置換	
  
– WordNet と 言語モデルで実現	
2015/07/24	
 6
1.語彙平易化	
2015/07/24	
 7	
WordNet	
  
からなる	
  
同意語のリスト	
言語モデル	
  
からなる	
  
置換可能な単語
1.語彙平易化	
2015/07/24	
 8	
共通する	
  
単語のみ	
  
とってくる	
言い換え	
  
らしさを頻度で	
  
スコア付け	
最も頻度の高い	
  
単語を出力
2.文法平易化	
•  実際に使った4つの文法	
  
1.  同格 	
  	
  	
  	
  	
  	
  	
  	
  	
  	
  	
  	
  	
  	
  	
  	
  	
  	
  	
  	
  	
  	
  	
  	
  	
  	
  	
  	
  	
  	
  	
  	
  	
  	
  	
  	
  	
  	
  John,	
  a	
  taxi	
  driver,	
  won	
  the	
  lo=ery.	
  
2.  関係節	
  	
  	
  	
  	
  	
  	
  	
  	
  	
  	
  	
  	
  	
  	
  	
  	
  	
  	
  	
  	
  	
  	
  	
  	
  	
  	
  	
  	
  	
  	
  	
  	
  	
  The	
  boy,	
  who	
  had	
  a	
  ball,	
  was	
  tall.	
  
3.  接頭辞による従属節 Although	
  it	
  is	
  raining,	
  the	
  sun	
  is	
  shining.	
  
4.  挿入辞による同格、従属	
  	
  I	
  bought	
  a	
  wallet	
  but	
  I	
  lost	
  it.	
  	
  
•  これらの文法を簡単化した文全てを保持し、
どれを採用するかを次に述べる	
  
2015/07/24	
 9
平易化の最適選択	
•  最適な言い換え	
  
–  平均文長、文数の差、語彙数の差を用いる	
  
•  テキストの難易度	
  
– 総文数、総単語数の線形和	
  
•  これらの情報を用いる	
2015/07/24	
 10
実験設定	
•  使用データ	
  
–  English	
  Wikipedia	
  &	
  Simple	
  English	
  Wikipedia	
  
–  100記事使用	
  
•  評価に50、残りを開発に割り当て	
  
	
  
–  Literacyworks	
  :	
  ニュース記事と、その簡約版のセット	
  
•  50記事を評価に使用	
  
合計100記事を評価に用いる	
  
2015/07/24	
 11
実験1:語彙平易化	
•  それぞれ180の平易化をランダムに選択	
  
•  ベースライン:WordNetのみを用いる	
  
–  同意語のなかで頻度最大の単語に置換	
  
•  提案手法:ベースラインに言語モデルを追加	
  
•  評価:Amazon’s	
  Mechanical	
  Turk	
  
–  置換が正しいかを3人の多数決	
  
–  単語の適合率で評価	
2015/07/24	
 12
実験2:文法平易化	
•  実験1の100記事を使用	
  
•  平易化前後の文が正しい英語かを	
  0	
  or	
  1	
  で判定	
  
•  評価環境は実験1とほぼ同じ (正解率で評価)	
  
	
  
エラーが	
  
多い	
2015/07/24	
 13
実験2:文法平易化	
•  各データの詳細、及び簡単化の割合	
  
•  共に、20%未満であった	
2015/07/24	
 14
まとめ	
•  テキスト平易化	
  
– 子供に読みやすくしたい	
  
•  提案手法	
  
– 言語モデルを用いて、語彙平易化の精度向上	
  
– 解析による文法構造の簡単化はエラーが多い	
  
子供が読みやすいほどへの難易度の減少に失敗	
2015/07/24	
 15

Más contenido relacionado

Más de sekizawayuuki

Translating phrases in neural machine translation
Translating phrases in neural machine translationTranslating phrases in neural machine translation
Translating phrases in neural machine translation sekizawayuuki
 
Improving lexical choice in neural machine translation
Improving lexical choice in neural machine translationImproving lexical choice in neural machine translation
Improving lexical choice in neural machine translationsekizawayuuki
 
Improving Japanese-to-English Neural Machine Translation by Paraphrasing the ...
Improving Japanese-to-English Neural Machine Translation by Paraphrasing the ...Improving Japanese-to-English Neural Machine Translation by Paraphrasing the ...
Improving Japanese-to-English Neural Machine Translation by Paraphrasing the ...sekizawayuuki
 
Incorporating word reordering knowledge into attention-based neural machine t...
Incorporating word reordering knowledge into attention-based neural machine t...Incorporating word reordering knowledge into attention-based neural machine t...
Incorporating word reordering knowledge into attention-based neural machine t...sekizawayuuki
 
paper introducing: Exploiting source side monolingual data in neural machine ...
paper introducing: Exploiting source side monolingual data in neural machine ...paper introducing: Exploiting source side monolingual data in neural machine ...
paper introducing: Exploiting source side monolingual data in neural machine ...sekizawayuuki
 
Coling2016 pre-translation for neural machine translation
Coling2016 pre-translation for neural machine translationColing2016 pre-translation for neural machine translation
Coling2016 pre-translation for neural machine translationsekizawayuuki
 
目的言語の低頻度語の高頻度語への言い換えによるニューラル機械翻訳の改善
目的言語の低頻度語の高頻度語への言い換えによるニューラル機械翻訳の改善目的言語の低頻度語の高頻度語への言い換えによるニューラル機械翻訳の改善
目的言語の低頻度語の高頻度語への言い換えによるニューラル機械翻訳の改善sekizawayuuki
 
Emnlp読み会@2017 02-15
Emnlp読み会@2017 02-15Emnlp読み会@2017 02-15
Emnlp読み会@2017 02-15sekizawayuuki
 
Acl reading@2016 10-26
Acl reading@2016 10-26Acl reading@2016 10-26
Acl reading@2016 10-26sekizawayuuki
 
[論文紹介]Selecting syntactic, non redundant segments in active learning for mach...
[論文紹介]Selecting syntactic, non redundant segments in active learning for mach...[論文紹介]Selecting syntactic, non redundant segments in active learning for mach...
[論文紹介]Selecting syntactic, non redundant segments in active learning for mach...sekizawayuuki
 
Emnlp読み会@2015 10-09
Emnlp読み会@2015 10-09Emnlp読み会@2015 10-09
Emnlp読み会@2015 10-09sekizawayuuki
 
Acl読み会@2015 09-18
Acl読み会@2015 09-18Acl読み会@2015 09-18
Acl読み会@2015 09-18sekizawayuuki
 
読解支援@2015 08-10-6
読解支援@2015 08-10-6読解支援@2015 08-10-6
読解支援@2015 08-10-6sekizawayuuki
 
読解支援@2015 08-10-5
読解支援@2015 08-10-5読解支援@2015 08-10-5
読解支援@2015 08-10-5sekizawayuuki
 
読解支援@2015 08-10-4
読解支援@2015 08-10-4読解支援@2015 08-10-4
読解支援@2015 08-10-4sekizawayuuki
 
読解支援@2015 08-10-3
読解支援@2015 08-10-3読解支援@2015 08-10-3
読解支援@2015 08-10-3sekizawayuuki
 
読解支援@2015 08-10-2
読解支援@2015 08-10-2読解支援@2015 08-10-2
読解支援@2015 08-10-2sekizawayuuki
 
読解支援@2015 08-10-1
読解支援@2015 08-10-1読解支援@2015 08-10-1
読解支援@2015 08-10-1sekizawayuuki
 
読解支援@2015 07-17
読解支援@2015 07-17読解支援@2015 07-17
読解支援@2015 07-17sekizawayuuki
 

Más de sekizawayuuki (20)

Translating phrases in neural machine translation
Translating phrases in neural machine translationTranslating phrases in neural machine translation
Translating phrases in neural machine translation
 
Improving lexical choice in neural machine translation
Improving lexical choice in neural machine translationImproving lexical choice in neural machine translation
Improving lexical choice in neural machine translation
 
Improving Japanese-to-English Neural Machine Translation by Paraphrasing the ...
Improving Japanese-to-English Neural Machine Translation by Paraphrasing the ...Improving Japanese-to-English Neural Machine Translation by Paraphrasing the ...
Improving Japanese-to-English Neural Machine Translation by Paraphrasing the ...
 
Incorporating word reordering knowledge into attention-based neural machine t...
Incorporating word reordering knowledge into attention-based neural machine t...Incorporating word reordering knowledge into attention-based neural machine t...
Incorporating word reordering knowledge into attention-based neural machine t...
 
paper introducing: Exploiting source side monolingual data in neural machine ...
paper introducing: Exploiting source side monolingual data in neural machine ...paper introducing: Exploiting source side monolingual data in neural machine ...
paper introducing: Exploiting source side monolingual data in neural machine ...
 
Coling2016 pre-translation for neural machine translation
Coling2016 pre-translation for neural machine translationColing2016 pre-translation for neural machine translation
Coling2016 pre-translation for neural machine translation
 
目的言語の低頻度語の高頻度語への言い換えによるニューラル機械翻訳の改善
目的言語の低頻度語の高頻度語への言い換えによるニューラル機械翻訳の改善目的言語の低頻度語の高頻度語への言い換えによるニューラル機械翻訳の改善
目的言語の低頻度語の高頻度語への言い換えによるニューラル機械翻訳の改善
 
Emnlp読み会@2017 02-15
Emnlp読み会@2017 02-15Emnlp読み会@2017 02-15
Emnlp読み会@2017 02-15
 
Acl reading@2016 10-26
Acl reading@2016 10-26Acl reading@2016 10-26
Acl reading@2016 10-26
 
[論文紹介]Selecting syntactic, non redundant segments in active learning for mach...
[論文紹介]Selecting syntactic, non redundant segments in active learning for mach...[論文紹介]Selecting syntactic, non redundant segments in active learning for mach...
[論文紹介]Selecting syntactic, non redundant segments in active learning for mach...
 
Nlp2016 sekizawa
Nlp2016 sekizawaNlp2016 sekizawa
Nlp2016 sekizawa
 
Emnlp読み会@2015 10-09
Emnlp読み会@2015 10-09Emnlp読み会@2015 10-09
Emnlp読み会@2015 10-09
 
Acl読み会@2015 09-18
Acl読み会@2015 09-18Acl読み会@2015 09-18
Acl読み会@2015 09-18
 
読解支援@2015 08-10-6
読解支援@2015 08-10-6読解支援@2015 08-10-6
読解支援@2015 08-10-6
 
読解支援@2015 08-10-5
読解支援@2015 08-10-5読解支援@2015 08-10-5
読解支援@2015 08-10-5
 
読解支援@2015 08-10-4
読解支援@2015 08-10-4読解支援@2015 08-10-4
読解支援@2015 08-10-4
 
読解支援@2015 08-10-3
読解支援@2015 08-10-3読解支援@2015 08-10-3
読解支援@2015 08-10-3
 
読解支援@2015 08-10-2
読解支援@2015 08-10-2読解支援@2015 08-10-2
読解支援@2015 08-10-2
 
読解支援@2015 08-10-1
読解支援@2015 08-10-1読解支援@2015 08-10-1
読解支援@2015 08-10-1
 
読解支援@2015 07-17
読解支援@2015 07-17読解支援@2015 07-17
読解支援@2015 07-17
 

読解支援@2015 07-24