SlideShare una empresa de Scribd logo
1 de 15
Descargar para leer sin conexión
Semi-supervised sequence tagging with
bidirectional language models
長岡技術科学大学 自然言語処理研究室
修士1年 西山 浩気
Matthew E. Peters, Waleed Ammar, Chandra Bhagavatula, Russel Power, Proceedings
of the 55th Annual Meeting of the Association for Computational Linguistics, pages
1756–1765, Vancouver, Canada, July 30 - August 4, 2017.
 単語の意味を獲得するための事前学習
 比較的小さなラベル付データで学習
 Bi-directional Language Modelを使い、
半教師有りで学習したベクトルを加える
 ラベリングタスクにおいて先行研究を上回る
✓ 固有表現認識(Named Entity Recognition)
✓ Chunking
1. 概要
2
 NLPシステムにおいて
事前学習されたWord Embeddingが使われる
✓ 構文的・意味的な情報を獲得[Mikilov ら, ‘13]
✓ 後段のタスクに対して有効[Collobert ら, ‘11]
 多くのNLPタスクでは単語の意味だけでなく
文中での意味を表すことが必要
 “The Central African Republic”
 “A Central Bank spokesman”
 “Central(中央)” は”組織・場所”という意味を示す
2.1 Word Embedding はじめに
3
 文中の意味を獲得するため
事前学習にBi-directional RNNを利用
[Yangら,’17;Ma and Hovy,’16;Lampleら,16;Hashimotoら,’16]
 RNNのパラメータの学習手法
 同タスクのラベル付データ
 他タスクのラベル付データ
[Søgaard and Goldberg,’16; Yang ら, ‘17]
 本論文ではNeural Language Model(LM)を使用、
大規模なラベル無しデータから学習
2.2 先行研究はじめに
4
 階層的なTag付けモデル (baseline)
[Ma and Hovy,’16;Lampleら, ’16;Yangら, ’17;Chiu and Nichols, ’16]
✓1段目 : Bi-directional RNN
 双方向の文脈表現を学習
✓2段目:2層のRNN
 タスクに応じて
Gated Reccurent Units(GRU)または
Long-Short Term Memory(LSTM)でパラメータを推定
✓ 3段目: bi-gramを計算し、CRFでタグ付け[Laffertyら,’11]
2.3 Sequence tagging model 先行手法
5
 ニューラル 言語モデル
 入力は 文字CNN/RNN (baselineと同じ)
 位置kまでの単語に対して、
softmax層を通してk+1番目の単語確率を計算する
 事前学習 Bi-LM
 順・逆方向の言語モデルを学習
 softmax層を除去し、双方向のベクトルを連結
 パラメータは方向ごとに独立
2.3 Bidirectional Language Model 提案手法
6
 ニューラル 言語モデル
 入力は 文字CNN/RNN (baselineと同じ)
 位置kまでの単語に対して、
softmax層を通してk+1番目の単語確率を計算する
 双方向ニューラル言語モデル(Bi-LM)
 順・逆方向の言語モデルを学習
 LM Embedding
softmax層を除去し、双方向のベクトルを連結
 パラメータは方向ごとに独立
2.3 Bidirectional Language Model 提案手法
7
 Baselineを改良
第1層の出力にLM Embeddingを加える
事前実験で最高性能を獲得
2.4 LM Augmented Sequence Taggers(tagLM) 提案手法
8
9
3. 実験設定 実験
 評価タスク (BIOESタグを使用)
 CoNLL2003 NERタスク[Sang and Meulder,’03]
 ニュース文
 4つの固有表現(PER, LOC, ORG, MISC)でタグ付け
 CoNLL2000 Chunkingタスク[Sang and Buchholz, ‘00]
 11個の構文タイプ(NP, VP, ADJPなど)
 訓練データから1000文を抽出
 事前学習
 1B Word Benchmark
 大規模言語モデル構築用のデータセット
 CoNLLデータセットの約4,000倍のデータ(8億トークン)
10
3. 実験設定 実験
 従来手法と比べ、
LMを加えることで約1ポイントの性能向上
11
4.1 Neural LMによる性能向上 実験
 他外部資源を用いた手法と比べ、
LM Embeddingは改善が大きい(+1.06/+1.37)
12
4.2 外部資源を用いた場合の精度向上比較 実験
 他ドメインにおける精度
 本実験では訓練データのドメインはニュース
 SemEval 2017 Shared Task10, ScienceIE
✓ F1値を49.93から54.05(+4.12)に向上
✓ 他ドメインにおいても、性能向上に寄与
 データセットサイズ
 タグ付データセットのサイズにあまり依存せず
大量のタグ付訓練データでも性能を向上
13
4.2 実験
 系列タグ付け問題においてNeural LMは有効
✓NER, Chunkingタスクで1ポイント以上の性能向上
 Neural Language Model
✓ 順・逆方向のLM Embeddingを
用いることで性能が向上
 本実験では単純なベクトルの連結
 将来的に Attentionモデルや非線形マッピングを追加
✓ ドメイン特有の事前学習をする必要が無い
14
まとめ
 システム全体図
Language Model Augmented Sequence Taggers(tagLM)
15

Más contenido relacionado

Similar a Semi supervised sequence tagging with bidirectional language models

Similar a Semi supervised sequence tagging with bidirectional language models (7)

論文読み会 Enriching Word Vectors with Subword Information
論文読み会 Enriching Word Vectors with Subword Information論文読み会 Enriching Word Vectors with Subword Information
論文読み会 Enriching Word Vectors with Subword Information
 
Improving vietnamese word segmentation and pos tagging using MEM with various...
Improving vietnamese word segmentation and pos tagging using MEM with various...Improving vietnamese word segmentation and pos tagging using MEM with various...
Improving vietnamese word segmentation and pos tagging using MEM with various...
 
EMNLP 2015 yomikai
EMNLP 2015 yomikai EMNLP 2015 yomikai
EMNLP 2015 yomikai
 
文章読解支援のための語彙平易化
文章読解支援のための語彙平易化文章読解支援のための語彙平易化
文章読解支援のための語彙平易化
 
深層学習を用いた文生成モデルの歴史と研究動向
深層学習を用いた文生成モデルの歴史と研究動向深層学習を用いた文生成モデルの歴史と研究動向
深層学習を用いた文生成モデルの歴史と研究動向
 
20190324 第6章 テキストデータのための素性
20190324 第6章 テキストデータのための素性20190324 第6章 テキストデータのための素性
20190324 第6章 テキストデータのための素性
 
VCWE[論文読み会]
VCWE[論文読み会]VCWE[論文読み会]
VCWE[論文読み会]
 

Más de 浩気 西山

Más de 浩気 西山 (12)

Using continuous lexical embeddings to improve symbolicprosody prediction in ...
Using continuous lexical embeddings to improve symbolicprosody prediction in ...Using continuous lexical embeddings to improve symbolicprosody prediction in ...
Using continuous lexical embeddings to improve symbolicprosody prediction in ...
 
Character-based Joint Segmentation and POS Tagging for Chinese using Bidirec...
Character-based Joint Segmentation and POS Tagging for Chinese using Bidirec...Character-based Joint Segmentation and POS Tagging for Chinese using Bidirec...
Character-based Joint Segmentation and POS Tagging for Chinese using Bidirec...
 
Character word lstm language models
Character word lstm language modelsCharacter word lstm language models
Character word lstm language models
 
Nlp2018 参加報告
Nlp2018 参加報告Nlp2018 参加報告
Nlp2018 参加報告
 
Character aware-neural-networks-for-arabic-named-entity-recognition-for-socia...
Character aware-neural-networks-for-arabic-named-entity-recognition-for-socia...Character aware-neural-networks-for-arabic-named-entity-recognition-for-socia...
Character aware-neural-networks-for-arabic-named-entity-recognition-for-socia...
 
Evaluating non expert_annotations_for_natural_language_tasks
Evaluating non expert_annotations_for_natural_language_tasksEvaluating non expert_annotations_for_natural_language_tasks
Evaluating non expert_annotations_for_natural_language_tasks
 
Neural Network Language Model For Chinese Pinyin Input Method Engine
Neural Network Language Model For Chinese Pinyin Input Method EngineNeural Network Language Model For Chinese Pinyin Input Method Engine
Neural Network Language Model For Chinese Pinyin Input Method Engine
 
Are emojis predictable
Are emojis predictableAre emojis predictable
Are emojis predictable
 
Semantic analysis and helpfulness prediction of text for online product reviews
Semantic analysis and helpfulness prediction of text  for online product reviewsSemantic analysis and helpfulness prediction of text  for online product reviews
Semantic analysis and helpfulness prediction of text for online product reviews
 
Effective search space reduction for spell correction using character neural ...
Effective search space reduction for spell correction using character neural ...Effective search space reduction for spell correction using character neural ...
Effective search space reduction for spell correction using character neural ...
 
1.単純パーセプトロンと学習アルゴリズム
1.単純パーセプトロンと学習アルゴリズム1.単純パーセプトロンと学習アルゴリズム
1.単純パーセプトロンと学習アルゴリズム
 
1.単純パーセプトロンと学習アルゴリズム
1.単純パーセプトロンと学習アルゴリズム1.単純パーセプトロンと学習アルゴリズム
1.単純パーセプトロンと学習アルゴリズム
 

Último

The_Five_Books_Overview_Presentation_2024
The_Five_Books_Overview_Presentation_2024The_Five_Books_Overview_Presentation_2024
The_Five_Books_Overview_Presentation_2024
koheioishi1
 
TokyoTechGraduateExaminationPresentation
TokyoTechGraduateExaminationPresentationTokyoTechGraduateExaminationPresentation
TokyoTechGraduateExaminationPresentation
YukiTerazawa
 

Último (8)

生成AIの回答内容の修正を課題としたレポートについて:お茶の水女子大学「授業・研究における生成系AIの活用事例」での講演資料
生成AIの回答内容の修正を課題としたレポートについて:お茶の水女子大学「授業・研究における生成系AIの活用事例」での講演資料生成AIの回答内容の修正を課題としたレポートについて:お茶の水女子大学「授業・研究における生成系AIの活用事例」での講演資料
生成AIの回答内容の修正を課題としたレポートについて:お茶の水女子大学「授業・研究における生成系AIの活用事例」での講演資料
 
2024年度 東京工業大学 工学院 機械系 大学院 修士課程 入試 説明会 資料
2024年度 東京工業大学 工学院 機械系 大学院 修士課程 入試 説明会 資料2024年度 東京工業大学 工学院 機械系 大学院 修士課程 入試 説明会 資料
2024年度 東京工業大学 工学院 機械系 大学院 修士課程 入試 説明会 資料
 
東京工業大学 環境・社会理工学院 建築学系 大学院入学入試・進学説明会2024_v2
東京工業大学 環境・社会理工学院 建築学系 大学院入学入試・進学説明会2024_v2東京工業大学 環境・社会理工学院 建築学系 大学院入学入試・進学説明会2024_v2
東京工業大学 環境・社会理工学院 建築学系 大学院入学入試・進学説明会2024_v2
 
The_Five_Books_Overview_Presentation_2024
The_Five_Books_Overview_Presentation_2024The_Five_Books_Overview_Presentation_2024
The_Five_Books_Overview_Presentation_2024
 
世界を変えるクレーンを生み出そう! 高知エンジニアリングキャンプ2024プログラム
世界を変えるクレーンを生み出そう! 高知エンジニアリングキャンプ2024プログラム世界を変えるクレーンを生み出そう! 高知エンジニアリングキャンプ2024プログラム
世界を変えるクレーンを生み出そう! 高知エンジニアリングキャンプ2024プログラム
 
TokyoTechGraduateExaminationPresentation
TokyoTechGraduateExaminationPresentationTokyoTechGraduateExaminationPresentation
TokyoTechGraduateExaminationPresentation
 
ゲーム理論 BASIC 演習106 -価格の交渉ゲーム-#ゲーム理論 #gametheory #数学
ゲーム理論 BASIC 演習106 -価格の交渉ゲーム-#ゲーム理論 #gametheory #数学ゲーム理論 BASIC 演習106 -価格の交渉ゲーム-#ゲーム理論 #gametheory #数学
ゲーム理論 BASIC 演習106 -価格の交渉ゲーム-#ゲーム理論 #gametheory #数学
 
次世代機の製品コンセプトを描く ~未来の機械を創造してみよう~
次世代機の製品コンセプトを描く ~未来の機械を創造してみよう~次世代機の製品コンセプトを描く ~未来の機械を創造してみよう~
次世代機の製品コンセプトを描く ~未来の機械を創造してみよう~
 

Semi supervised sequence tagging with bidirectional language models