SlideShare una empresa de Scribd logo
1 de 27
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
言語モデルを用いた俳句評価器
の構築と性能評価に関する研究
北海道大学 大学院情報科学研究院
情報理工学部門 複合情報工学分野 調和系工学研究室
学部4年 花野愛里咲
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
2
研究背景
• 人工知能技術を用いた芸術作品の創作が盛ん
• 創作においては良い作品を作るだけでなく,
良い作品を選ぶことも重要
• 本研究では俳句を研究の対象とする
吾輩は猫である。名前はまだない。
そんな吾輩であるが、数日前にマ
タタビを追いかけて走り回ってい
たらトラックに轢かれてしまった。
これは本当にたまたまだったのだ
が、運が悪かったというかなんと
いうか…………。何にせよその結果、
中世ヨーロッパのような世界に転
生してしまったのである。
…
[1]AIのべりすと https://ai-novel.com/ (2021年12月14日閲覧)
[2]Art42 https://art42.net/ (2021年12月14日閲覧)
[3]出典:キオクシア:「TEZUKA2020」プロジェクトチームが2020年度 人工知能学会 現場イノベーション賞・銀賞を受賞
https://www.businesswire.com/news/home/20210622005555/ja/ (2021年12月14日閲覧)
小説[1] 絵画[2] 漫画[3]
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
3
俳句とは
• 俳句の約束事[4]
– 5・7・5 の17 文字(音) で作る
• 17音で生成・評価のコストがその他の文学作品と比較して小さい
– 季節の言葉(季題、季語) を入れる
– 上記の条件を満たす俳句を「有季定型句」と呼ぶ
• 俳句(芸術作品)の評価の難しさ
– 多様な評価基準
• 情景が思い浮かぶ,意外性,etc
– 主観的な価値判断
• 読み手の属性,etc
– 外的要因
• 読む時・詠まれた時の時代背景,etc
– etc
[4]公益社団法人日本伝統俳句協会俳句入門講座-1,https://haiku.jp/tsukuru/2430/ (2021年12月14日閲覧)
古池や 蛙飛び込む 水の音
切れ字 季語
上五 中七 下五
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
4
本研究で扱う評価
• 俳句に対する評価は大きく分けて3つの段階が考えられる
• 先行研究で俳句の自動生成が行われており
質の保証はないが大量に俳句を生成することは可能[5]
• 人間が俳句を選ぶ際の余計な負担が軽減される
– 人間が決めるまでもなく質が低い俳句は機械的に取り除き,
残った候補の中から良いものを人間が決めるという状態が理想
• 本研究では誰もが明らかに俳句として成立しないと感じる句
(下位層)の評価を扱う
上位層
中間層
下位層
作品の質
俳句に強い魅力を感じる
俳句としては成立するが魅力を感じない
俳句として成立しない
(例)
夕立をかなして通る榎哉
あらはれて羽蟻のように歩くのみ
えりこぼれたったろあんなにぐずらん
[5]横山 想一郎,山下 倫央,川村 秀憲:深層学習を用いた俳句の生成と選句,人工知能,Vol.34, No.4, (2019)
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
5
関連研究
• 俳句の自動評価に関する研究
– LSTMを用いて生成された俳句に対して
季語の有無や音数で俳句を評価[6]
• 近年では,深層学習に基づく言語モデルが
文書分類の手法として多く提案されている
– RoBERTa[7]は多くの文書分類タスクにおいて
当時の最高スコアを獲得した
[6]太田 瑶子,進藤 裕之,松本 裕治:深層学習を用いた俳句の自動生成,情報処理学会
(2018)
[7] Yinhan Liu, Myle Ott, Naman Goyal, Jingfei Du, Mandar Joshi, Danqi Chen, Omer Levy, Mike
Lewis, Luke Zettlemoyer, Veselin Stoyanov:RoBERTa: A Robustly Optimized BERT Pretraining
Approach,arXiv(2019)
本研究では文書分類タスクとして俳句評価問題を扱い
俳句として成立しない句の検出を行う
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
6
研究目的とアプローチ
• 俳句評価器の構築
– 明らかに俳句とみなすことができない句を取り除き,
大量の候補の中から俳句として成立する句の抽出を目的とする
• 本研究では,俳句として成立しない特徴の代表例2つを対象
– 意味が通らない・散文的
• 俳句として成立しない句の例
– 夕立をかなして通る榎哉(意味が通らない)
– えりこぼれたったろあんなにぐずらん(意味が通らない)
– あらはれて羽蟻のように歩くのみ(散文的)
• データセット作成のアプローチ
– 生成器の生成俳句について手動アノテーション
• アノテーションコスト:高
• データの質:高
– 既存のデータセットから人工的に自動作成
• アノテーションコスト:低
• データの質:低
• 本研究では自動的に作成する
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
7
提案手法
• 俳句評価器の構築
– 人間が作成した俳句(正例)と人工的に作成した
有季定型句を満たす文字列(負例)を用いて
二値分類タスクをモデルに適用
sentence, label
鰤あぐる島の夕べを時雨けり, 1
びつしりと通草はじけてひとりなり, 1
…
日光が無風の庭の葉鶏頭, 0
草花の前で澄まして直立し, 0
…
モデル
正例と負例の識別
一生の悲しきさまに昼寝覚 俳句評価器 0.915
学習させたモデルを
評価器として使用
入力 出力
入力された俳句に対して評価値
(正例に対する予測確率)を算出
学習データ
(1が正例,0が負例)
学習フェーズ
評価フェーズ
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
8
評価器の学習・検証に使用するデータ
• 俳句データセット(正例)
– インターネットから取得した俳句
• 交換データセット(負例)
– 俳句データの季語・名詞・助詞・動詞・上五・下五のどれかを
ランダムに交換
– 例)みちのくの青田に降りる山の雲 (元となる俳句データ)
↓
みちのくのざくろに降りる山の雲(生成される交換データ)
• 散文データセット(負例)
– 有季定型句の条件を満たす部分文字列をコーパスから抽出
• 青空文庫,CC100,Wiki-40bから抽出
– 俳句データとの最小編集距離が5以下の文字列を除外
– 例)草花の前で澄まして直立し
• ランダムデータ(負例)
– 青空文庫の学習データに含まれる単語をランダムに選択し,
17音になるように結合
– 例)冬の雲しかし程近いはかない
※上記の負例作成方法は正例として扱っても良い例が作成される可能性がある
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
9
使用する正例・負例の妥当性について
人工的に作成したデータの例 俳句生成器の俳句の例
俳句
(正例)
五月雨や大木並ぶ窓の外 野のはてや馬にのりたる時鳥
交換
(負例)
鴨一羽飛んも野川の暮にけり 夕立をかなして通る榎哉
散文
(負例)
紋章の中にしばしば描かれて あらはれて羽蟻のように歩くのみ
ランダム
(負例)
ただしんいっつ行装しつこくしし えりこぼれたったろあんなにぐずらん
• 定性的な比較から
提案する負例作成手法によって
生成器の出力する俳句として成立しない句
と同様のサンプルを生成可能であると判断
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
10
俳句評価器の性能評価
• (実験1)
俳句として成立しない句の検出性能の評価
– (実験1-1)
人工的に作成したデータセットを使用した検証
– (実験1-2)
俳句生成器の生成俳句から作成したデータセット
を使用した検証
• (実験2)
俳人から選を得る句の検出性能の評価
– ※本研究の目的である
「俳句として成立しない句の検出」
とは異なる使用方法であることに注意
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
11
実験1-1
• 実験目的
– 俳句として成立しない句の検出性能の評価
– 人工的に作成したデータにおいて
汎化性能があるモデルが学習可能かを調査
• 実験方法
– 学習データと同様の方法で作成した検証データを
用いて混同行列,Precision@kにより各モデルを
比較
• 本研究では俳句として成立しないものを省くことを重視
• 負例を正しく負例と判定した数が最も多いモデルを最良
のモデルとする
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
12
作成したモデルと学習・検証データについて
学習データ 検証データ
モデル名 正例 負例 正例 負例
交換モデル 俳句データ 交換データ 俳句データ 交換データ
散文モデル 俳句データ 散文データ 俳句データ 散文データ
ランダムモデル 俳句データ ランダムデータ 俳句データ ランダムデータ
混合モデル① 俳句データ 交換データ
(133,334)
散文データ
(133,333)
ランダムデータ
(133,333)
俳句データ 交換データ
(13,334)
散文データ
(13,333)
ランダムデータ
(13,333)
混合モデル② 俳句データ 交換データ
散文データ
ランダムデータ
(各データ
400,000)
俳句データ 交換データ
散文データ
ランダムデータ
(各データ
40,000)
(各モデル
400,000)
(各モデル
40,000)
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
13
ハイパーパラメータ設定
事前学習 ファインチューニング
モデル名 RoBERTa RoBERTa
学習データ 青空文庫 正例+負例
作品数 12,978 混合モデル②:1600,000
それ以外:800,000
エポック数 20 50
バッチサイズ 4 512
ドロップアウト率 0.1 交換モデル:0.1
それ以外:0.3
事前学習・ファインチューニングの実験設定
• 青空文庫で事前学習
• 人工的に作成したデータセットでファインチューニング
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
14
実験結果 混同行列(1/2)
交換モデル(早期停止なし)
散文モデル(早期停止なし) ランダムモデル(早期停止あり)
• 混同行列の算出には,
検証データにも用いた
俳句データ,交換データ,
散文データ,
ランダムデータをそれぞれ
4万句含むデータを使用
• 評価値が0.5以上であれば
正例(俳句として成立する
文字列)0.5未満であれば負例
(俳句として成立しない
文字列)と判定
正例 負例
正例 俳句 23,766 16,234
負例 交換 7,233 32,767
散文 10,924 29,076
ランダム 224 39,776
負例合計 18,381 101,619
正例 負例
正例 俳句 38,433 1,567
負例 交換 38,453 1,547
散文 957 39,043
ランダム 19,667 20,333
負例合計 59,077 60,923
正例 負例
正例 俳句 39,835 165
負例 交換 39,425 475
散文 37,531 2,469
ランダム 76 39,924
負例合計 77,032 42,868
• 交換モデルはどの負例に対しても半分以上判定できている.
• 俳句データと交換データの識別はモデルにとって難しいタスクであると考えられる
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
15
実験結果 混同行列(2/2)
混合モデル②(早期停止なし)
• 混合モデル②がどの負例に対しても正しく
負例と判定できた数が多い
 混合モデル②は俳句評価器として実用可能
であるかを検討する
混合モデル①(早期停止なし)
正例 負例
正例 俳句 35,267 4,733
負例 交換 25,089 14,911
散文 1,018 38,982
ランダム 52 39,948
負例合計 26,159 93,841
正例 負例
正例 俳句 31,004 8,996
負例 交換 14,079 25,921
散文 621 39,379
ランダム 10 39,990
負例合計 14,710 105,290
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
16
俳句評価器の実用性
• 評価指標にPrecision@kを使用
Precision@k =(評価値上位k番目までの正例の数)/ k
• 混同行列の算出に用いたデータを使用
k 交換
(早期停止
なし)
散文
(早期停止
なし)
ランダム
(早期停止
あり)
混合①
(早期停止
なし)
混合②
(早期停止
なし)
500 0.376 0.494 0.404 0.840 0.874
5000 0.594 0.469 0.421 0.786 0.865
50000 0.534 0.445 0.403 0.618 0.656
• 混合モデル②(早期停止なし)は負例を多く学習させているため,
負例のフィルタリングができている
• 混合モデル②の汎化性能が高い
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
17
評価値上位500句以内の負例の例
• 混合モデル②(早期停止なし)による評価
俳句 評価値 データセット
蝉の声きゝそめてより山路かな 0.99641 交換
月見草の人を尋ねる心哉 0.99626 交換
秋晴の城を見上げてなつてゐし 0.99605 交換
汐先を指して馬車ゆく遅日かな 0.99521 交換
遠くより呼ばれて蓮の無言かな 0.99448 交換
寒き世や行燈にさす針の音 0.99325 散文
雁落ちてあそこの森は暮れにけり 0.99128 散文
夕闇や螢過ぎゆく鼻の先 0.98964 散文
春雨や寝返りもせぬ膝の猫 0.98956 散文
表中の文字列以外において,日本語として不自然な文字列は500句中4句に絞る
ことができた
• 表中の4つの散文データは作成元のコーパスに含まれている俳句であり,
他の散文データに関しても俳句として成立すると言える
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
18
実験1-2
• 実験目的
– 俳句生成器が生成した俳句に対する俳句評価器
の性能評価
• 実験方法
– 俳句生成器が生成した句をランダムに100句取得
– 意味が通る俳句を正例,意味が通らない俳句を
負例としてPrecision@kにより評価
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
19
俳句生成器が生成した俳句に対する評価
• 取得した100句に対して意味が通る俳句を正例,
意味が通らない俳句を負例としてアノテーション
を行った
• Precision@kを算出
k precision@k
10 0.600
20 0.550
30 0.433
40 0.400
50 0.460
60 0.433
70 0.414
80 0.425
90 0.411
100 0.410
意味が通るかどうか
正例:41句
負例:59句
• 100句の中からランダムに選択すると
意味が通る俳句は41%だが,評価値上位
10句を選ぶことで60%に向上
⇒俳句評価器を使うことで人間の負担
を減らすことが可能
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
20
実験1のまとめ
• 俳句として成立しない句の検出を目的とした
俳句評価器の有用性を検証
• 負例を多く学習したモデルの汎用性が
最も高いことを確認
• 俳句生成器が生成した俳句に対しても
俳句評価器としての実用性を示した
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
21
実験2
• 実験目的
– 俳人による評価と俳句評価器による評価の
一致度合いを確認
– ※本研究の目的である
「俳句として成立しない句の検出」
とは異なる使用方法であることに注意
• 実験方法
– 作成したモデルに俳人に評価を付けてもらった
ものと同じ俳句データを入力し,俳句に対して
評価値を算出
– 評価指標にAUCを用いて各モデルで結果を比較
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
22
俳人による評価付きデータ
• 俳句イベントを利用して,俳句生成器が生成した
俳句に対する俳人の評価データを収集した
– 参加者1人につき異なる俳句を300句配布
• ☆特選1句(イベントのテーマ「恋」にまつわる句)
• 特選5句(テーマに関係なく特に良いと感じた句)
• 並選30~60句(テーマに関係なく良いと感じた句)
を選句
• 配布した300句の選定方法
– 2019年のイベント
• LSTMを用いた俳句生成器が生成した俳句を利用
• 人間が作成した俳句を正例,正例に含まれる任意の単語を
交換した文字列を負例として学習した俳句評価器で評価値が
上位の俳句
– 2021年のイベント
• GPT-2を用いた俳句生成器が生成したGPT-2 対数尤度の
上位5000番目までの俳句を取得し,その中から意味が通らない
俳句を主観で除外
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
23
俳人による評価付きデータ
• 選句した人数
– 2019年:26人
– 2021年:24人
俳句例
☆特選 香水を深めて嘘をつきはじむ
特選 初恋の人をかくして牡丹雪
並選 配達の二人来てゐる障子かな
選なし 初恋をくりかへしゆく紙帳かな
2019年 2021年
☆特選 26 24
特選 130 120
並選 592 1,069
選なし 7,052 5,987
計 7,800 7,200
取得したデータ数 グレードとその俳句例
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
24
AUCによる性能評価
• 俳句イベントのデータを使って俳人による
評価と評価器による評価の一致度合いを確認
1. 並選,特選,☆特選以上の評価を持つ俳句を
それぞれ正例とする
2. 俳句に対して評価器が算出した正例に対する
予測確率が大きい順に俳句を並べ替える
3. AUC を算出
• 値が1に近い評価器ほど、選者の評価に近い
• 値が0.5に近い評価器はランダムな分類器と同程度
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
25
結果
• 選無しの句には意味が通らないと
判定された句が多い
• 交換モデルのAUCが最も高く,
選者の評価に一番近い
• 混合モデル②の値が0.5に近い
– 俳句として成立する候補は獲得できた
が,その中から俳人に選ばれる句を
検出する機能は獲得できていない
モデル 早期停止
AUC 算出における正例の対象(2019) AUC 算出における正例の対象(2021)
並選以上 特選以上 ☆特選以上 並選以上 特選以上 ☆特選以上
交換 0.600 0.630 0.517 0.543 0.570 0.567
交換 〇 0.598 0.598 0.500 0.551 0.552 0.477
散文 0.498 0.487 0.515 0.498 0.488 0.412
散文 〇 0.491 0.507 0.560 0.472 0.488 0.469
ランダム 0.500 0.500 0.500 0.500 0.500 0.500
ランダム 〇 0.501 0.501 0.485 0.502 0.502 0.505
混合① 0.587 0.595 0.594 0.519 0.515 0.428
混合① ○ 0.540 0.512 0.503 0.513 0.506 0.466
混合② 0.596 0.582 0.554 0.544 0.561 0.509
混合② ○ 0.555 0.547 0.510 0.518 0.512 0.474
意味が通る 意味が通ら
ない
選あり 31 19
選無し 10 40
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
26
まとめ
• 俳句として成立する候補を獲得するために,
俳句として成立しない句を検出する俳句評価器
を構築した
• 作成したモデルが意味が通らない文字列を検出
できていることが確認でき,俳句評価器として
の実用性を示した
• 質が低い俳句を取り除くことを目的とした
俳句評価器では俳人による評価との一致は
あまり見られなかった
– 俳人に選ばれる句を選ぶ機能は選句にかかる負担を減
らすための今後の課題
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
27
研究実績
発表予定 国内学会 発表予定(2件)
• 〇花野 愛里咲, 横山 想一郎, 山下 倫央, 川村 秀憲,マスク化言語
モデル RoBERTa を用いた俳句の評価, 情報処理学会 第84回全国
大会, 2022.
• 〇花野 愛里咲, 横山 想一郎, 山下 倫央, 川村 秀憲, RoBERTaを用
いた俳句評価器の構築と性能評価, 社会システムと情報技術研究
ウィーク (WSSIT2022), 2022.

Más contenido relacionado

La actualidad más candente

SSII2018TS: 大規模深層学習
SSII2018TS: 大規模深層学習SSII2018TS: 大規模深層学習
SSII2018TS: 大規模深層学習SSII
 
第3回ナレッジグラフ推論チャレンジ2020の紹介
第3回ナレッジグラフ推論チャレンジ2020の紹介第3回ナレッジグラフ推論チャレンジ2020の紹介
第3回ナレッジグラフ推論チャレンジ2020の紹介KnowledgeGraph
 
DLゼミ: Ego-Body Pose Estimation via Ego-Head Pose Estimation
DLゼミ: Ego-Body Pose Estimation via Ego-Head Pose EstimationDLゼミ: Ego-Body Pose Estimation via Ego-Head Pose Estimation
DLゼミ: Ego-Body Pose Estimation via Ego-Head Pose Estimationharmonylab
 
「知識」のDeep Learning
「知識」のDeep Learning「知識」のDeep Learning
「知識」のDeep LearningYuya Unno
 
Imputation of Missing Values using Random Forest
Imputation of Missing Values using  Random ForestImputation of Missing Values using  Random Forest
Imputation of Missing Values using Random ForestSatoshi Kato
 
NeurIPS2021論文読み会 (parameter prediction for unseen deep architecture)
NeurIPS2021論文読み会 (parameter prediction for unseen deep architecture)NeurIPS2021論文読み会 (parameter prediction for unseen deep architecture)
NeurIPS2021論文読み会 (parameter prediction for unseen deep architecture)Kshinmei
 
0 データサイエンス概論まえがき
0 データサイエンス概論まえがき0 データサイエンス概論まえがき
0 データサイエンス概論まえがきSeiichi Uchida
 
Counterfaual Machine Learning(CFML)のサーベイ
Counterfaual Machine Learning(CFML)のサーベイCounterfaual Machine Learning(CFML)のサーベイ
Counterfaual Machine Learning(CFML)のサーベイARISE analytics
 
ロードヒーティング制御における深層学習を用いた路面画像認識に関する研究
ロードヒーティング制御における深層学習を用いた路面画像認識に関する研究ロードヒーティング制御における深層学習を用いた路面画像認識に関する研究
ロードヒーティング制御における深層学習を用いた路面画像認識に関する研究harmonylab
 
ベイジアンネット技術とサービス工学におけるビッグデータ活用技術
ベイジアンネット技術とサービス工学におけるビッグデータ活用技術ベイジアンネット技術とサービス工学におけるビッグデータ活用技術
ベイジアンネット技術とサービス工学におけるビッグデータ活用技術Yoichi Motomura
 
Active Learning 入門
Active Learning 入門Active Learning 入門
Active Learning 入門Shuyo Nakatani
 
[part 1]ナレッジグラフ推論チャレンジ・Tech Live!
[part 1]ナレッジグラフ推論チャレンジ・Tech Live![part 1]ナレッジグラフ推論チャレンジ・Tech Live!
[part 1]ナレッジグラフ推論チャレンジ・Tech Live!KnowledgeGraph
 
A Generalist Agent
A Generalist AgentA Generalist Agent
A Generalist Agentharmonylab
 
Deep High Resolution Representation Learning for Human Pose Estimation
Deep High Resolution Representation Learning for Human Pose EstimationDeep High Resolution Representation Learning for Human Pose Estimation
Deep High Resolution Representation Learning for Human Pose Estimationharmonylab
 
不均衡データのクラス分類
不均衡データのクラス分類不均衡データのクラス分類
不均衡データのクラス分類Shintaro Fukushima
 
シンギュラリティを知らずに機械学習を語るな
シンギュラリティを知らずに機械学習を語るなシンギュラリティを知らずに機械学習を語るな
シンギュラリティを知らずに機械学習を語るなhoxo_m
 
最高の統計ソフトウェアはどれか? "What’s the Best Statistical Software? A Comparison of R, Py...
最高の統計ソフトウェアはどれか? "What’s the Best Statistical Software? A Comparison of R, Py...最高の統計ソフトウェアはどれか? "What’s the Best Statistical Software? A Comparison of R, Py...
最高の統計ソフトウェアはどれか? "What’s the Best Statistical Software? A Comparison of R, Py...ケンタ タナカ
 
データ活用を俊敏に進めるためのDataOps実践方法とその高度化のためのナレッジグラフ活用の取り組み(NTTデータ テクノロジーカンファレンス 2020 ...
データ活用を俊敏に進めるためのDataOps実践方法とその高度化のためのナレッジグラフ活用の取り組み(NTTデータ テクノロジーカンファレンス 2020 ...データ活用を俊敏に進めるためのDataOps実践方法とその高度化のためのナレッジグラフ活用の取り組み(NTTデータ テクノロジーカンファレンス 2020 ...
データ活用を俊敏に進めるためのDataOps実践方法とその高度化のためのナレッジグラフ活用の取り組み(NTTデータ テクノロジーカンファレンス 2020 ...NTT DATA Technology & Innovation
 

La actualidad más candente (20)

SSII2018TS: 大規模深層学習
SSII2018TS: 大規模深層学習SSII2018TS: 大規模深層学習
SSII2018TS: 大規模深層学習
 
第3回ナレッジグラフ推論チャレンジ2020の紹介
第3回ナレッジグラフ推論チャレンジ2020の紹介第3回ナレッジグラフ推論チャレンジ2020の紹介
第3回ナレッジグラフ推論チャレンジ2020の紹介
 
DLゼミ: Ego-Body Pose Estimation via Ego-Head Pose Estimation
DLゼミ: Ego-Body Pose Estimation via Ego-Head Pose EstimationDLゼミ: Ego-Body Pose Estimation via Ego-Head Pose Estimation
DLゼミ: Ego-Body Pose Estimation via Ego-Head Pose Estimation
 
「知識」のDeep Learning
「知識」のDeep Learning「知識」のDeep Learning
「知識」のDeep Learning
 
Imputation of Missing Values using Random Forest
Imputation of Missing Values using  Random ForestImputation of Missing Values using  Random Forest
Imputation of Missing Values using Random Forest
 
NeurIPS2021論文読み会 (parameter prediction for unseen deep architecture)
NeurIPS2021論文読み会 (parameter prediction for unseen deep architecture)NeurIPS2021論文読み会 (parameter prediction for unseen deep architecture)
NeurIPS2021論文読み会 (parameter prediction for unseen deep architecture)
 
0 データサイエンス概論まえがき
0 データサイエンス概論まえがき0 データサイエンス概論まえがき
0 データサイエンス概論まえがき
 
Counterfaual Machine Learning(CFML)のサーベイ
Counterfaual Machine Learning(CFML)のサーベイCounterfaual Machine Learning(CFML)のサーベイ
Counterfaual Machine Learning(CFML)のサーベイ
 
ロードヒーティング制御における深層学習を用いた路面画像認識に関する研究
ロードヒーティング制御における深層学習を用いた路面画像認識に関する研究ロードヒーティング制御における深層学習を用いた路面画像認識に関する研究
ロードヒーティング制御における深層学習を用いた路面画像認識に関する研究
 
ベイジアンネット技術とサービス工学におけるビッグデータ活用技術
ベイジアンネット技術とサービス工学におけるビッグデータ活用技術ベイジアンネット技術とサービス工学におけるビッグデータ活用技術
ベイジアンネット技術とサービス工学におけるビッグデータ活用技術
 
Active Learning 入門
Active Learning 入門Active Learning 入門
Active Learning 入門
 
MICの解説
MICの解説MICの解説
MICの解説
 
[part 1]ナレッジグラフ推論チャレンジ・Tech Live!
[part 1]ナレッジグラフ推論チャレンジ・Tech Live![part 1]ナレッジグラフ推論チャレンジ・Tech Live!
[part 1]ナレッジグラフ推論チャレンジ・Tech Live!
 
A Generalist Agent
A Generalist AgentA Generalist Agent
A Generalist Agent
 
形態素解析
形態素解析形態素解析
形態素解析
 
Deep High Resolution Representation Learning for Human Pose Estimation
Deep High Resolution Representation Learning for Human Pose EstimationDeep High Resolution Representation Learning for Human Pose Estimation
Deep High Resolution Representation Learning for Human Pose Estimation
 
不均衡データのクラス分類
不均衡データのクラス分類不均衡データのクラス分類
不均衡データのクラス分類
 
シンギュラリティを知らずに機械学習を語るな
シンギュラリティを知らずに機械学習を語るなシンギュラリティを知らずに機械学習を語るな
シンギュラリティを知らずに機械学習を語るな
 
最高の統計ソフトウェアはどれか? "What’s the Best Statistical Software? A Comparison of R, Py...
最高の統計ソフトウェアはどれか? "What’s the Best Statistical Software? A Comparison of R, Py...最高の統計ソフトウェアはどれか? "What’s the Best Statistical Software? A Comparison of R, Py...
最高の統計ソフトウェアはどれか? "What’s the Best Statistical Software? A Comparison of R, Py...
 
データ活用を俊敏に進めるためのDataOps実践方法とその高度化のためのナレッジグラフ活用の取り組み(NTTデータ テクノロジーカンファレンス 2020 ...
データ活用を俊敏に進めるためのDataOps実践方法とその高度化のためのナレッジグラフ活用の取り組み(NTTデータ テクノロジーカンファレンス 2020 ...データ活用を俊敏に進めるためのDataOps実践方法とその高度化のためのナレッジグラフ活用の取り組み(NTTデータ テクノロジーカンファレンス 2020 ...
データ活用を俊敏に進めるためのDataOps実践方法とその高度化のためのナレッジグラフ活用の取り組み(NTTデータ テクノロジーカンファレンス 2020 ...
 

Similar a 言語モデルを用いた俳句評価器の構築と性能評価に関する研究

Efficient Deep Reinforcement Learning with Imitative Expert Priors for Autono...
Efficient Deep Reinforcement Learning with Imitative Expert Priors for Autono...Efficient Deep Reinforcement Learning with Imitative Expert Priors for Autono...
Efficient Deep Reinforcement Learning with Imitative Expert Priors for Autono...harmonylab
 
DLゼミ:Primitive Generation and Semantic-related Alignment for Universal Zero-S...
DLゼミ:Primitive Generation and Semantic-related Alignment for Universal Zero-S...DLゼミ:Primitive Generation and Semantic-related Alignment for Universal Zero-S...
DLゼミ:Primitive Generation and Semantic-related Alignment for Universal Zero-S...harmonylab
 
Semi-Supervised Neural Architecture Search
Semi-Supervised Neural Architecture SearchSemi-Supervised Neural Architecture Search
Semi-Supervised Neural Architecture Searchharmonylab
 
ECサイトにおける商品紹介文の作成支援システムの開発と評価に関する研究
ECサイトにおける商品紹介文の作成支援システムの開発と評価に関する研究ECサイトにおける商品紹介文の作成支援システムの開発と評価に関する研究
ECサイトにおける商品紹介文の作成支援システムの開発と評価に関する研究harmonylab
 
2021 09 29_dl_hirata
2021 09 29_dl_hirata2021 09 29_dl_hirata
2021 09 29_dl_hirataharmonylab
 
ArcFace: Additive Angular Margin Loss for Deep Face Recognition
ArcFace: Additive Angular Margin Loss for Deep Face RecognitionArcFace: Additive Angular Margin Loss for Deep Face Recognition
ArcFace: Additive Angular Margin Loss for Deep Face Recognitionharmonylab
 
MASTERING ATARI WITH DISCRETE WORLD MODELS (DreamerV2)
MASTERING ATARI WITH DISCRETE WORLD MODELS (DreamerV2)MASTERING ATARI WITH DISCRETE WORLD MODELS (DreamerV2)
MASTERING ATARI WITH DISCRETE WORLD MODELS (DreamerV2)harmonylab
 
Inspiration through Observation: Demonstrating the Influence of Automatically...
Inspiration through Observation: Demonstrating the Influence of Automatically...Inspiration through Observation: Demonstrating the Influence of Automatically...
Inspiration through Observation: Demonstrating the Influence of Automatically...harmonylab
 
Feature Erasing and Diffusion Network for Occluded Person Re-Identification
Feature Erasing and Diffusion Network for Occluded Person Re-IdentificationFeature Erasing and Diffusion Network for Occluded Person Re-Identification
Feature Erasing and Diffusion Network for Occluded Person Re-Identificationharmonylab
 
SegFormer: Simple and Efficient Design for Semantic Segmentation with Transfo...
SegFormer: Simple and Efficient Design for Semantic Segmentation with Transfo...SegFormer: Simple and Efficient Design for Semantic Segmentation with Transfo...
SegFormer: Simple and Efficient Design for Semantic Segmentation with Transfo...harmonylab
 
Self-supervised Learning of Adversarial Example: Towards Good Generalizations...
Self-supervised Learning of Adversarial Example:Towards Good Generalizations...Self-supervised Learning of Adversarial Example:Towards Good Generalizations...
Self-supervised Learning of Adversarial Example: Towards Good Generalizations...harmonylab
 
Emotionally Intelligent Fashion Design Using CNN and GAN
Emotionally Intelligent Fashion Design Using CNN and GANEmotionally Intelligent Fashion Design Using CNN and GAN
Emotionally Intelligent Fashion Design Using CNN and GANharmonylab
 
A Study on Generation of Deformed Route Maps using Octilinear Grid
A Study on Generation of Deformed Route Maps using Octilinear GridA Study on Generation of Deformed Route Maps using Octilinear Grid
A Study on Generation of Deformed Route Maps using Octilinear Gridharmonylab
 
MLP-Mixer: An all-MLP Architecture for Vision
MLP-Mixer: An all-MLP Architecture for VisionMLP-Mixer: An all-MLP Architecture for Vision
MLP-Mixer: An all-MLP Architecture for Visionharmonylab
 
AGenT Zero: Zero-shot Automatic Multiple-Choice Question Generation for Skill...
AGenT Zero: Zero-shot Automatic Multiple-Choice Question Generation for Skill...AGenT Zero: Zero-shot Automatic Multiple-Choice Question Generation for Skill...
AGenT Zero: Zero-shot Automatic Multiple-Choice Question Generation for Skill...harmonylab
 
Outfit net fashion outfit recommendation with attention based multiple instan...
Outfit net fashion outfit recommendation with attention based multiple instan...Outfit net fashion outfit recommendation with attention based multiple instan...
Outfit net fashion outfit recommendation with attention based multiple instan...harmonylab
 
Miu紹介最新版20130711
Miu紹介最新版20130711Miu紹介最新版20130711
Miu紹介最新版20130711Jun Imai
 

Similar a 言語モデルを用いた俳句評価器の構築と性能評価に関する研究 (20)

Efficient Deep Reinforcement Learning with Imitative Expert Priors for Autono...
Efficient Deep Reinforcement Learning with Imitative Expert Priors for Autono...Efficient Deep Reinforcement Learning with Imitative Expert Priors for Autono...
Efficient Deep Reinforcement Learning with Imitative Expert Priors for Autono...
 
DLゼミ:Primitive Generation and Semantic-related Alignment for Universal Zero-S...
DLゼミ:Primitive Generation and Semantic-related Alignment for Universal Zero-S...DLゼミ:Primitive Generation and Semantic-related Alignment for Universal Zero-S...
DLゼミ:Primitive Generation and Semantic-related Alignment for Universal Zero-S...
 
Semi-Supervised Neural Architecture Search
Semi-Supervised Neural Architecture SearchSemi-Supervised Neural Architecture Search
Semi-Supervised Neural Architecture Search
 
ECサイトにおける商品紹介文の作成支援システムの開発と評価に関する研究
ECサイトにおける商品紹介文の作成支援システムの開発と評価に関する研究ECサイトにおける商品紹介文の作成支援システムの開発と評価に関する研究
ECサイトにおける商品紹介文の作成支援システムの開発と評価に関する研究
 
2021 09 29_dl_hirata
2021 09 29_dl_hirata2021 09 29_dl_hirata
2021 09 29_dl_hirata
 
ArcFace: Additive Angular Margin Loss for Deep Face Recognition
ArcFace: Additive Angular Margin Loss for Deep Face RecognitionArcFace: Additive Angular Margin Loss for Deep Face Recognition
ArcFace: Additive Angular Margin Loss for Deep Face Recognition
 
MASTERING ATARI WITH DISCRETE WORLD MODELS (DreamerV2)
MASTERING ATARI WITH DISCRETE WORLD MODELS (DreamerV2)MASTERING ATARI WITH DISCRETE WORLD MODELS (DreamerV2)
MASTERING ATARI WITH DISCRETE WORLD MODELS (DreamerV2)
 
Inspiration through Observation: Demonstrating the Influence of Automatically...
Inspiration through Observation: Demonstrating the Influence of Automatically...Inspiration through Observation: Demonstrating the Influence of Automatically...
Inspiration through Observation: Demonstrating the Influence of Automatically...
 
Feature Erasing and Diffusion Network for Occluded Person Re-Identification
Feature Erasing and Diffusion Network for Occluded Person Re-IdentificationFeature Erasing and Diffusion Network for Occluded Person Re-Identification
Feature Erasing and Diffusion Network for Occluded Person Re-Identification
 
SegFormer: Simple and Efficient Design for Semantic Segmentation with Transfo...
SegFormer: Simple and Efficient Design for Semantic Segmentation with Transfo...SegFormer: Simple and Efficient Design for Semantic Segmentation with Transfo...
SegFormer: Simple and Efficient Design for Semantic Segmentation with Transfo...
 
Self-supervised Learning of Adversarial Example: Towards Good Generalizations...
Self-supervised Learning of Adversarial Example:Towards Good Generalizations...Self-supervised Learning of Adversarial Example:Towards Good Generalizations...
Self-supervised Learning of Adversarial Example: Towards Good Generalizations...
 
Emotionally Intelligent Fashion Design Using CNN and GAN
Emotionally Intelligent Fashion Design Using CNN and GANEmotionally Intelligent Fashion Design Using CNN and GAN
Emotionally Intelligent Fashion Design Using CNN and GAN
 
A Study on Generation of Deformed Route Maps using Octilinear Grid
A Study on Generation of Deformed Route Maps using Octilinear GridA Study on Generation of Deformed Route Maps using Octilinear Grid
A Study on Generation of Deformed Route Maps using Octilinear Grid
 
MLP-Mixer: An all-MLP Architecture for Vision
MLP-Mixer: An all-MLP Architecture for VisionMLP-Mixer: An all-MLP Architecture for Vision
MLP-Mixer: An all-MLP Architecture for Vision
 
AGenT Zero: Zero-shot Automatic Multiple-Choice Question Generation for Skill...
AGenT Zero: Zero-shot Automatic Multiple-Choice Question Generation for Skill...AGenT Zero: Zero-shot Automatic Multiple-Choice Question Generation for Skill...
AGenT Zero: Zero-shot Automatic Multiple-Choice Question Generation for Skill...
 
Outfit net fashion outfit recommendation with attention based multiple instan...
Outfit net fashion outfit recommendation with attention based multiple instan...Outfit net fashion outfit recommendation with attention based multiple instan...
Outfit net fashion outfit recommendation with attention based multiple instan...
 
Miu紹介最新版20130711
Miu紹介最新版20130711Miu紹介最新版20130711
Miu紹介最新版20130711
 
2021 haizoku
2021 haizoku2021 haizoku
2021 haizoku
 
2021 haizoku
2021 haizoku2021 haizoku
2021 haizoku
 
RAPiD
RAPiDRAPiD
RAPiD
 

Más de harmonylab

【修士論文】代替出勤者の選定業務における依頼順決定方法に関する研究   千坂知也
【修士論文】代替出勤者の選定業務における依頼順決定方法に関する研究   千坂知也【修士論文】代替出勤者の選定業務における依頼順決定方法に関する研究   千坂知也
【修士論文】代替出勤者の選定業務における依頼順決定方法に関する研究   千坂知也harmonylab
 
【修士論文】経路探索のための媒介中心性に基づく道路ネットワーク階層化手法に関する研究
【修士論文】経路探索のための媒介中心性に基づく道路ネットワーク階層化手法に関する研究【修士論文】経路探索のための媒介中心性に基づく道路ネットワーク階層化手法に関する研究
【修士論文】経路探索のための媒介中心性に基づく道路ネットワーク階層化手法に関する研究harmonylab
 
A Study on Decision Support System for Snow Removal Dispatch using Road Surfa...
A Study on Decision Support System for Snow Removal Dispatch using Road Surfa...A Study on Decision Support System for Snow Removal Dispatch using Road Surfa...
A Study on Decision Support System for Snow Removal Dispatch using Road Surfa...harmonylab
 
【卒業論文】印象タグを用いた衣服画像生成システムに関する研究
【卒業論文】印象タグを用いた衣服画像生成システムに関する研究【卒業論文】印象タグを用いた衣服画像生成システムに関する研究
【卒業論文】印象タグを用いた衣服画像生成システムに関する研究harmonylab
 
【卒業論文】大規模言語モデルを用いたマニュアル文章修正手法に関する研究
【卒業論文】大規模言語モデルを用いたマニュアル文章修正手法に関する研究【卒業論文】大規模言語モデルを用いたマニュアル文章修正手法に関する研究
【卒業論文】大規模言語モデルを用いたマニュアル文章修正手法に関する研究harmonylab
 
DLゼミ: MobileOne: An Improved One millisecond Mobile Backbone
DLゼミ: MobileOne: An Improved One millisecond Mobile BackboneDLゼミ: MobileOne: An Improved One millisecond Mobile Backbone
DLゼミ: MobileOne: An Improved One millisecond Mobile Backboneharmonylab
 
DLゼミ: Llama 2: Open Foundation and Fine-Tuned Chat Models
DLゼミ: Llama 2: Open Foundation and Fine-Tuned Chat ModelsDLゼミ: Llama 2: Open Foundation and Fine-Tuned Chat Models
DLゼミ: Llama 2: Open Foundation and Fine-Tuned Chat Modelsharmonylab
 
DLゼミ: ViTPose: Simple Vision Transformer Baselines for Human Pose Estimation
DLゼミ: ViTPose: Simple Vision Transformer Baselines for Human Pose EstimationDLゼミ: ViTPose: Simple Vision Transformer Baselines for Human Pose Estimation
DLゼミ: ViTPose: Simple Vision Transformer Baselines for Human Pose Estimationharmonylab
 
Voyager: An Open-Ended Embodied Agent with Large Language Models
Voyager: An Open-Ended Embodied Agent with Large Language ModelsVoyager: An Open-Ended Embodied Agent with Large Language Models
Voyager: An Open-Ended Embodied Agent with Large Language Modelsharmonylab
 
ReAct: Synergizing Reasoning and Acting in Language Models
ReAct: Synergizing Reasoning and Acting in Language ModelsReAct: Synergizing Reasoning and Acting in Language Models
ReAct: Synergizing Reasoning and Acting in Language Modelsharmonylab
 
形態素解析を用いた帝国議会議事速記録の変遷に関する研究
形態素解析を用いた帝国議会議事速記録の変遷に関する研究形態素解析を用いた帝国議会議事速記録の変遷に関する研究
形態素解析を用いた帝国議会議事速記録の変遷に関する研究harmonylab
 
灯油タンク内の液面高計測を用いた 灯油残量推定システムに関する研究
灯油タンク内の液面高計測を用いた灯油残量推定システムに関する研究灯油タンク内の液面高計測を用いた灯油残量推定システムに関する研究
灯油タンク内の液面高計測を用いた 灯油残量推定システムに関する研究harmonylab
 
競輪におけるレーティングシステムを用いた予想記事生成に関する研究
競輪におけるレーティングシステムを用いた予想記事生成に関する研究競輪におけるレーティングシステムを用いた予想記事生成に関する研究
競輪におけるレーティングシステムを用いた予想記事生成に関する研究harmonylab
 
【卒業論文】B2Bオークションにおけるユーザ別 入札行動予測に関する研究
【卒業論文】B2Bオークションにおけるユーザ別 入札行動予測に関する研究【卒業論文】B2Bオークションにおけるユーザ別 入札行動予測に関する研究
【卒業論文】B2Bオークションにおけるユーザ別 入札行動予測に関する研究harmonylab
 
A Study on Estimation of Household Kerosene Consumption for Optimization of D...
A Study on Estimation of Household Kerosene Consumption for Optimization of D...A Study on Estimation of Household Kerosene Consumption for Optimization of D...
A Study on Estimation of Household Kerosene Consumption for Optimization of D...harmonylab
 
A Study on the Generation of Clothing Captions Highlighting the Differences b...
A Study on the Generation of Clothing Captions Highlighting the Differences b...A Study on the Generation of Clothing Captions Highlighting the Differences b...
A Study on the Generation of Clothing Captions Highlighting the Differences b...harmonylab
 
A Study on Clothing Recommendation Information Presentation System Based on C...
A Study on Clothing Recommendation Information Presentation System Based on C...A Study on Clothing Recommendation Information Presentation System Based on C...
A Study on Clothing Recommendation Information Presentation System Based on C...harmonylab
 
Towards Total Recall in Industrial Anomaly Detection
Towards Total Recall in Industrial Anomaly DetectionTowards Total Recall in Industrial Anomaly Detection
Towards Total Recall in Industrial Anomaly Detectionharmonylab
 
DeBERTaV3: Improving DeBERTa using ELECTRA-Style Pre-Training with Gradient-D...
DeBERTaV3: Improving DeBERTa using ELECTRA-Style Pre-Training with Gradient-D...DeBERTaV3: Improving DeBERTa using ELECTRA-Style Pre-Training with Gradient-D...
DeBERTaV3: Improving DeBERTa using ELECTRA-Style Pre-Training with Gradient-D...harmonylab
 
ZeroCap: Zero-Shot Image-to-Text Generation for Visual-Semantic Arithmetic
ZeroCap: Zero-Shot Image-to-Text Generation for Visual-Semantic ArithmeticZeroCap: Zero-Shot Image-to-Text Generation for Visual-Semantic Arithmetic
ZeroCap: Zero-Shot Image-to-Text Generation for Visual-Semantic Arithmeticharmonylab
 

Más de harmonylab (20)

【修士論文】代替出勤者の選定業務における依頼順決定方法に関する研究   千坂知也
【修士論文】代替出勤者の選定業務における依頼順決定方法に関する研究   千坂知也【修士論文】代替出勤者の選定業務における依頼順決定方法に関する研究   千坂知也
【修士論文】代替出勤者の選定業務における依頼順決定方法に関する研究   千坂知也
 
【修士論文】経路探索のための媒介中心性に基づく道路ネットワーク階層化手法に関する研究
【修士論文】経路探索のための媒介中心性に基づく道路ネットワーク階層化手法に関する研究【修士論文】経路探索のための媒介中心性に基づく道路ネットワーク階層化手法に関する研究
【修士論文】経路探索のための媒介中心性に基づく道路ネットワーク階層化手法に関する研究
 
A Study on Decision Support System for Snow Removal Dispatch using Road Surfa...
A Study on Decision Support System for Snow Removal Dispatch using Road Surfa...A Study on Decision Support System for Snow Removal Dispatch using Road Surfa...
A Study on Decision Support System for Snow Removal Dispatch using Road Surfa...
 
【卒業論文】印象タグを用いた衣服画像生成システムに関する研究
【卒業論文】印象タグを用いた衣服画像生成システムに関する研究【卒業論文】印象タグを用いた衣服画像生成システムに関する研究
【卒業論文】印象タグを用いた衣服画像生成システムに関する研究
 
【卒業論文】大規模言語モデルを用いたマニュアル文章修正手法に関する研究
【卒業論文】大規模言語モデルを用いたマニュアル文章修正手法に関する研究【卒業論文】大規模言語モデルを用いたマニュアル文章修正手法に関する研究
【卒業論文】大規模言語モデルを用いたマニュアル文章修正手法に関する研究
 
DLゼミ: MobileOne: An Improved One millisecond Mobile Backbone
DLゼミ: MobileOne: An Improved One millisecond Mobile BackboneDLゼミ: MobileOne: An Improved One millisecond Mobile Backbone
DLゼミ: MobileOne: An Improved One millisecond Mobile Backbone
 
DLゼミ: Llama 2: Open Foundation and Fine-Tuned Chat Models
DLゼミ: Llama 2: Open Foundation and Fine-Tuned Chat ModelsDLゼミ: Llama 2: Open Foundation and Fine-Tuned Chat Models
DLゼミ: Llama 2: Open Foundation and Fine-Tuned Chat Models
 
DLゼミ: ViTPose: Simple Vision Transformer Baselines for Human Pose Estimation
DLゼミ: ViTPose: Simple Vision Transformer Baselines for Human Pose EstimationDLゼミ: ViTPose: Simple Vision Transformer Baselines for Human Pose Estimation
DLゼミ: ViTPose: Simple Vision Transformer Baselines for Human Pose Estimation
 
Voyager: An Open-Ended Embodied Agent with Large Language Models
Voyager: An Open-Ended Embodied Agent with Large Language ModelsVoyager: An Open-Ended Embodied Agent with Large Language Models
Voyager: An Open-Ended Embodied Agent with Large Language Models
 
ReAct: Synergizing Reasoning and Acting in Language Models
ReAct: Synergizing Reasoning and Acting in Language ModelsReAct: Synergizing Reasoning and Acting in Language Models
ReAct: Synergizing Reasoning and Acting in Language Models
 
形態素解析を用いた帝国議会議事速記録の変遷に関する研究
形態素解析を用いた帝国議会議事速記録の変遷に関する研究形態素解析を用いた帝国議会議事速記録の変遷に関する研究
形態素解析を用いた帝国議会議事速記録の変遷に関する研究
 
灯油タンク内の液面高計測を用いた 灯油残量推定システムに関する研究
灯油タンク内の液面高計測を用いた灯油残量推定システムに関する研究灯油タンク内の液面高計測を用いた灯油残量推定システムに関する研究
灯油タンク内の液面高計測を用いた 灯油残量推定システムに関する研究
 
競輪におけるレーティングシステムを用いた予想記事生成に関する研究
競輪におけるレーティングシステムを用いた予想記事生成に関する研究競輪におけるレーティングシステムを用いた予想記事生成に関する研究
競輪におけるレーティングシステムを用いた予想記事生成に関する研究
 
【卒業論文】B2Bオークションにおけるユーザ別 入札行動予測に関する研究
【卒業論文】B2Bオークションにおけるユーザ別 入札行動予測に関する研究【卒業論文】B2Bオークションにおけるユーザ別 入札行動予測に関する研究
【卒業論文】B2Bオークションにおけるユーザ別 入札行動予測に関する研究
 
A Study on Estimation of Household Kerosene Consumption for Optimization of D...
A Study on Estimation of Household Kerosene Consumption for Optimization of D...A Study on Estimation of Household Kerosene Consumption for Optimization of D...
A Study on Estimation of Household Kerosene Consumption for Optimization of D...
 
A Study on the Generation of Clothing Captions Highlighting the Differences b...
A Study on the Generation of Clothing Captions Highlighting the Differences b...A Study on the Generation of Clothing Captions Highlighting the Differences b...
A Study on the Generation of Clothing Captions Highlighting the Differences b...
 
A Study on Clothing Recommendation Information Presentation System Based on C...
A Study on Clothing Recommendation Information Presentation System Based on C...A Study on Clothing Recommendation Information Presentation System Based on C...
A Study on Clothing Recommendation Information Presentation System Based on C...
 
Towards Total Recall in Industrial Anomaly Detection
Towards Total Recall in Industrial Anomaly DetectionTowards Total Recall in Industrial Anomaly Detection
Towards Total Recall in Industrial Anomaly Detection
 
DeBERTaV3: Improving DeBERTa using ELECTRA-Style Pre-Training with Gradient-D...
DeBERTaV3: Improving DeBERTa using ELECTRA-Style Pre-Training with Gradient-D...DeBERTaV3: Improving DeBERTa using ELECTRA-Style Pre-Training with Gradient-D...
DeBERTaV3: Improving DeBERTa using ELECTRA-Style Pre-Training with Gradient-D...
 
ZeroCap: Zero-Shot Image-to-Text Generation for Visual-Semantic Arithmetic
ZeroCap: Zero-Shot Image-to-Text Generation for Visual-Semantic ArithmeticZeroCap: Zero-Shot Image-to-Text Generation for Visual-Semantic Arithmetic
ZeroCap: Zero-Shot Image-to-Text Generation for Visual-Semantic Arithmetic
 

言語モデルを用いた俳句評価器の構築と性能評価に関する研究

  • 1. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. 言語モデルを用いた俳句評価器 の構築と性能評価に関する研究 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 調和系工学研究室 学部4年 花野愛里咲
  • 2. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. 2 研究背景 • 人工知能技術を用いた芸術作品の創作が盛ん • 創作においては良い作品を作るだけでなく, 良い作品を選ぶことも重要 • 本研究では俳句を研究の対象とする 吾輩は猫である。名前はまだない。 そんな吾輩であるが、数日前にマ タタビを追いかけて走り回ってい たらトラックに轢かれてしまった。 これは本当にたまたまだったのだ が、運が悪かったというかなんと いうか…………。何にせよその結果、 中世ヨーロッパのような世界に転 生してしまったのである。 … [1]AIのべりすと https://ai-novel.com/ (2021年12月14日閲覧) [2]Art42 https://art42.net/ (2021年12月14日閲覧) [3]出典:キオクシア:「TEZUKA2020」プロジェクトチームが2020年度 人工知能学会 現場イノベーション賞・銀賞を受賞 https://www.businesswire.com/news/home/20210622005555/ja/ (2021年12月14日閲覧) 小説[1] 絵画[2] 漫画[3]
  • 3. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. 3 俳句とは • 俳句の約束事[4] – 5・7・5 の17 文字(音) で作る • 17音で生成・評価のコストがその他の文学作品と比較して小さい – 季節の言葉(季題、季語) を入れる – 上記の条件を満たす俳句を「有季定型句」と呼ぶ • 俳句(芸術作品)の評価の難しさ – 多様な評価基準 • 情景が思い浮かぶ,意外性,etc – 主観的な価値判断 • 読み手の属性,etc – 外的要因 • 読む時・詠まれた時の時代背景,etc – etc [4]公益社団法人日本伝統俳句協会俳句入門講座-1,https://haiku.jp/tsukuru/2430/ (2021年12月14日閲覧) 古池や 蛙飛び込む 水の音 切れ字 季語 上五 中七 下五
  • 4. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. 4 本研究で扱う評価 • 俳句に対する評価は大きく分けて3つの段階が考えられる • 先行研究で俳句の自動生成が行われており 質の保証はないが大量に俳句を生成することは可能[5] • 人間が俳句を選ぶ際の余計な負担が軽減される – 人間が決めるまでもなく質が低い俳句は機械的に取り除き, 残った候補の中から良いものを人間が決めるという状態が理想 • 本研究では誰もが明らかに俳句として成立しないと感じる句 (下位層)の評価を扱う 上位層 中間層 下位層 作品の質 俳句に強い魅力を感じる 俳句としては成立するが魅力を感じない 俳句として成立しない (例) 夕立をかなして通る榎哉 あらはれて羽蟻のように歩くのみ えりこぼれたったろあんなにぐずらん [5]横山 想一郎,山下 倫央,川村 秀憲:深層学習を用いた俳句の生成と選句,人工知能,Vol.34, No.4, (2019)
  • 5. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. 5 関連研究 • 俳句の自動評価に関する研究 – LSTMを用いて生成された俳句に対して 季語の有無や音数で俳句を評価[6] • 近年では,深層学習に基づく言語モデルが 文書分類の手法として多く提案されている – RoBERTa[7]は多くの文書分類タスクにおいて 当時の最高スコアを獲得した [6]太田 瑶子,進藤 裕之,松本 裕治:深層学習を用いた俳句の自動生成,情報処理学会 (2018) [7] Yinhan Liu, Myle Ott, Naman Goyal, Jingfei Du, Mandar Joshi, Danqi Chen, Omer Levy, Mike Lewis, Luke Zettlemoyer, Veselin Stoyanov:RoBERTa: A Robustly Optimized BERT Pretraining Approach,arXiv(2019) 本研究では文書分類タスクとして俳句評価問題を扱い 俳句として成立しない句の検出を行う
  • 6. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. 6 研究目的とアプローチ • 俳句評価器の構築 – 明らかに俳句とみなすことができない句を取り除き, 大量の候補の中から俳句として成立する句の抽出を目的とする • 本研究では,俳句として成立しない特徴の代表例2つを対象 – 意味が通らない・散文的 • 俳句として成立しない句の例 – 夕立をかなして通る榎哉(意味が通らない) – えりこぼれたったろあんなにぐずらん(意味が通らない) – あらはれて羽蟻のように歩くのみ(散文的) • データセット作成のアプローチ – 生成器の生成俳句について手動アノテーション • アノテーションコスト:高 • データの質:高 – 既存のデータセットから人工的に自動作成 • アノテーションコスト:低 • データの質:低 • 本研究では自動的に作成する
  • 7. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. 7 提案手法 • 俳句評価器の構築 – 人間が作成した俳句(正例)と人工的に作成した 有季定型句を満たす文字列(負例)を用いて 二値分類タスクをモデルに適用 sentence, label 鰤あぐる島の夕べを時雨けり, 1 びつしりと通草はじけてひとりなり, 1 … 日光が無風の庭の葉鶏頭, 0 草花の前で澄まして直立し, 0 … モデル 正例と負例の識別 一生の悲しきさまに昼寝覚 俳句評価器 0.915 学習させたモデルを 評価器として使用 入力 出力 入力された俳句に対して評価値 (正例に対する予測確率)を算出 学習データ (1が正例,0が負例) 学習フェーズ 評価フェーズ
  • 8. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. 8 評価器の学習・検証に使用するデータ • 俳句データセット(正例) – インターネットから取得した俳句 • 交換データセット(負例) – 俳句データの季語・名詞・助詞・動詞・上五・下五のどれかを ランダムに交換 – 例)みちのくの青田に降りる山の雲 (元となる俳句データ) ↓ みちのくのざくろに降りる山の雲(生成される交換データ) • 散文データセット(負例) – 有季定型句の条件を満たす部分文字列をコーパスから抽出 • 青空文庫,CC100,Wiki-40bから抽出 – 俳句データとの最小編集距離が5以下の文字列を除外 – 例)草花の前で澄まして直立し • ランダムデータ(負例) – 青空文庫の学習データに含まれる単語をランダムに選択し, 17音になるように結合 – 例)冬の雲しかし程近いはかない ※上記の負例作成方法は正例として扱っても良い例が作成される可能性がある
  • 9. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. 9 使用する正例・負例の妥当性について 人工的に作成したデータの例 俳句生成器の俳句の例 俳句 (正例) 五月雨や大木並ぶ窓の外 野のはてや馬にのりたる時鳥 交換 (負例) 鴨一羽飛んも野川の暮にけり 夕立をかなして通る榎哉 散文 (負例) 紋章の中にしばしば描かれて あらはれて羽蟻のように歩くのみ ランダム (負例) ただしんいっつ行装しつこくしし えりこぼれたったろあんなにぐずらん • 定性的な比較から 提案する負例作成手法によって 生成器の出力する俳句として成立しない句 と同様のサンプルを生成可能であると判断
  • 10. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. 10 俳句評価器の性能評価 • (実験1) 俳句として成立しない句の検出性能の評価 – (実験1-1) 人工的に作成したデータセットを使用した検証 – (実験1-2) 俳句生成器の生成俳句から作成したデータセット を使用した検証 • (実験2) 俳人から選を得る句の検出性能の評価 – ※本研究の目的である 「俳句として成立しない句の検出」 とは異なる使用方法であることに注意
  • 11. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. 11 実験1-1 • 実験目的 – 俳句として成立しない句の検出性能の評価 – 人工的に作成したデータにおいて 汎化性能があるモデルが学習可能かを調査 • 実験方法 – 学習データと同様の方法で作成した検証データを 用いて混同行列,Precision@kにより各モデルを 比較 • 本研究では俳句として成立しないものを省くことを重視 • 負例を正しく負例と判定した数が最も多いモデルを最良 のモデルとする
  • 12. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. 12 作成したモデルと学習・検証データについて 学習データ 検証データ モデル名 正例 負例 正例 負例 交換モデル 俳句データ 交換データ 俳句データ 交換データ 散文モデル 俳句データ 散文データ 俳句データ 散文データ ランダムモデル 俳句データ ランダムデータ 俳句データ ランダムデータ 混合モデル① 俳句データ 交換データ (133,334) 散文データ (133,333) ランダムデータ (133,333) 俳句データ 交換データ (13,334) 散文データ (13,333) ランダムデータ (13,333) 混合モデル② 俳句データ 交換データ 散文データ ランダムデータ (各データ 400,000) 俳句データ 交換データ 散文データ ランダムデータ (各データ 40,000) (各モデル 400,000) (各モデル 40,000)
  • 13. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. 13 ハイパーパラメータ設定 事前学習 ファインチューニング モデル名 RoBERTa RoBERTa 学習データ 青空文庫 正例+負例 作品数 12,978 混合モデル②:1600,000 それ以外:800,000 エポック数 20 50 バッチサイズ 4 512 ドロップアウト率 0.1 交換モデル:0.1 それ以外:0.3 事前学習・ファインチューニングの実験設定 • 青空文庫で事前学習 • 人工的に作成したデータセットでファインチューニング
  • 14. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. 14 実験結果 混同行列(1/2) 交換モデル(早期停止なし) 散文モデル(早期停止なし) ランダムモデル(早期停止あり) • 混同行列の算出には, 検証データにも用いた 俳句データ,交換データ, 散文データ, ランダムデータをそれぞれ 4万句含むデータを使用 • 評価値が0.5以上であれば 正例(俳句として成立する 文字列)0.5未満であれば負例 (俳句として成立しない 文字列)と判定 正例 負例 正例 俳句 23,766 16,234 負例 交換 7,233 32,767 散文 10,924 29,076 ランダム 224 39,776 負例合計 18,381 101,619 正例 負例 正例 俳句 38,433 1,567 負例 交換 38,453 1,547 散文 957 39,043 ランダム 19,667 20,333 負例合計 59,077 60,923 正例 負例 正例 俳句 39,835 165 負例 交換 39,425 475 散文 37,531 2,469 ランダム 76 39,924 負例合計 77,032 42,868 • 交換モデルはどの負例に対しても半分以上判定できている. • 俳句データと交換データの識別はモデルにとって難しいタスクであると考えられる
  • 15. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. 15 実験結果 混同行列(2/2) 混合モデル②(早期停止なし) • 混合モデル②がどの負例に対しても正しく 負例と判定できた数が多い  混合モデル②は俳句評価器として実用可能 であるかを検討する 混合モデル①(早期停止なし) 正例 負例 正例 俳句 35,267 4,733 負例 交換 25,089 14,911 散文 1,018 38,982 ランダム 52 39,948 負例合計 26,159 93,841 正例 負例 正例 俳句 31,004 8,996 負例 交換 14,079 25,921 散文 621 39,379 ランダム 10 39,990 負例合計 14,710 105,290
  • 16. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. 16 俳句評価器の実用性 • 評価指標にPrecision@kを使用 Precision@k =(評価値上位k番目までの正例の数)/ k • 混同行列の算出に用いたデータを使用 k 交換 (早期停止 なし) 散文 (早期停止 なし) ランダム (早期停止 あり) 混合① (早期停止 なし) 混合② (早期停止 なし) 500 0.376 0.494 0.404 0.840 0.874 5000 0.594 0.469 0.421 0.786 0.865 50000 0.534 0.445 0.403 0.618 0.656 • 混合モデル②(早期停止なし)は負例を多く学習させているため, 負例のフィルタリングができている • 混合モデル②の汎化性能が高い
  • 17. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. 17 評価値上位500句以内の負例の例 • 混合モデル②(早期停止なし)による評価 俳句 評価値 データセット 蝉の声きゝそめてより山路かな 0.99641 交換 月見草の人を尋ねる心哉 0.99626 交換 秋晴の城を見上げてなつてゐし 0.99605 交換 汐先を指して馬車ゆく遅日かな 0.99521 交換 遠くより呼ばれて蓮の無言かな 0.99448 交換 寒き世や行燈にさす針の音 0.99325 散文 雁落ちてあそこの森は暮れにけり 0.99128 散文 夕闇や螢過ぎゆく鼻の先 0.98964 散文 春雨や寝返りもせぬ膝の猫 0.98956 散文 表中の文字列以外において,日本語として不自然な文字列は500句中4句に絞る ことができた • 表中の4つの散文データは作成元のコーパスに含まれている俳句であり, 他の散文データに関しても俳句として成立すると言える
  • 18. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. 18 実験1-2 • 実験目的 – 俳句生成器が生成した俳句に対する俳句評価器 の性能評価 • 実験方法 – 俳句生成器が生成した句をランダムに100句取得 – 意味が通る俳句を正例,意味が通らない俳句を 負例としてPrecision@kにより評価
  • 19. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. 19 俳句生成器が生成した俳句に対する評価 • 取得した100句に対して意味が通る俳句を正例, 意味が通らない俳句を負例としてアノテーション を行った • Precision@kを算出 k precision@k 10 0.600 20 0.550 30 0.433 40 0.400 50 0.460 60 0.433 70 0.414 80 0.425 90 0.411 100 0.410 意味が通るかどうか 正例:41句 負例:59句 • 100句の中からランダムに選択すると 意味が通る俳句は41%だが,評価値上位 10句を選ぶことで60%に向上 ⇒俳句評価器を使うことで人間の負担 を減らすことが可能
  • 20. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. 20 実験1のまとめ • 俳句として成立しない句の検出を目的とした 俳句評価器の有用性を検証 • 負例を多く学習したモデルの汎用性が 最も高いことを確認 • 俳句生成器が生成した俳句に対しても 俳句評価器としての実用性を示した
  • 21. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. 21 実験2 • 実験目的 – 俳人による評価と俳句評価器による評価の 一致度合いを確認 – ※本研究の目的である 「俳句として成立しない句の検出」 とは異なる使用方法であることに注意 • 実験方法 – 作成したモデルに俳人に評価を付けてもらった ものと同じ俳句データを入力し,俳句に対して 評価値を算出 – 評価指標にAUCを用いて各モデルで結果を比較
  • 22. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. 22 俳人による評価付きデータ • 俳句イベントを利用して,俳句生成器が生成した 俳句に対する俳人の評価データを収集した – 参加者1人につき異なる俳句を300句配布 • ☆特選1句(イベントのテーマ「恋」にまつわる句) • 特選5句(テーマに関係なく特に良いと感じた句) • 並選30~60句(テーマに関係なく良いと感じた句) を選句 • 配布した300句の選定方法 – 2019年のイベント • LSTMを用いた俳句生成器が生成した俳句を利用 • 人間が作成した俳句を正例,正例に含まれる任意の単語を 交換した文字列を負例として学習した俳句評価器で評価値が 上位の俳句 – 2021年のイベント • GPT-2を用いた俳句生成器が生成したGPT-2 対数尤度の 上位5000番目までの俳句を取得し,その中から意味が通らない 俳句を主観で除外
  • 23. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. 23 俳人による評価付きデータ • 選句した人数 – 2019年:26人 – 2021年:24人 俳句例 ☆特選 香水を深めて嘘をつきはじむ 特選 初恋の人をかくして牡丹雪 並選 配達の二人来てゐる障子かな 選なし 初恋をくりかへしゆく紙帳かな 2019年 2021年 ☆特選 26 24 特選 130 120 並選 592 1,069 選なし 7,052 5,987 計 7,800 7,200 取得したデータ数 グレードとその俳句例
  • 24. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. 24 AUCによる性能評価 • 俳句イベントのデータを使って俳人による 評価と評価器による評価の一致度合いを確認 1. 並選,特選,☆特選以上の評価を持つ俳句を それぞれ正例とする 2. 俳句に対して評価器が算出した正例に対する 予測確率が大きい順に俳句を並べ替える 3. AUC を算出 • 値が1に近い評価器ほど、選者の評価に近い • 値が0.5に近い評価器はランダムな分類器と同程度
  • 25. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. 25 結果 • 選無しの句には意味が通らないと 判定された句が多い • 交換モデルのAUCが最も高く, 選者の評価に一番近い • 混合モデル②の値が0.5に近い – 俳句として成立する候補は獲得できた が,その中から俳人に選ばれる句を 検出する機能は獲得できていない モデル 早期停止 AUC 算出における正例の対象(2019) AUC 算出における正例の対象(2021) 並選以上 特選以上 ☆特選以上 並選以上 特選以上 ☆特選以上 交換 0.600 0.630 0.517 0.543 0.570 0.567 交換 〇 0.598 0.598 0.500 0.551 0.552 0.477 散文 0.498 0.487 0.515 0.498 0.488 0.412 散文 〇 0.491 0.507 0.560 0.472 0.488 0.469 ランダム 0.500 0.500 0.500 0.500 0.500 0.500 ランダム 〇 0.501 0.501 0.485 0.502 0.502 0.505 混合① 0.587 0.595 0.594 0.519 0.515 0.428 混合① ○ 0.540 0.512 0.503 0.513 0.506 0.466 混合② 0.596 0.582 0.554 0.544 0.561 0.509 混合② ○ 0.555 0.547 0.510 0.518 0.512 0.474 意味が通る 意味が通ら ない 選あり 31 19 選無し 10 40
  • 26. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. 26 まとめ • 俳句として成立する候補を獲得するために, 俳句として成立しない句を検出する俳句評価器 を構築した • 作成したモデルが意味が通らない文字列を検出 できていることが確認でき,俳句評価器として の実用性を示した • 質が低い俳句を取り除くことを目的とした 俳句評価器では俳人による評価との一致は あまり見られなかった – 俳人に選ばれる句を選ぶ機能は選句にかかる負担を減 らすための今後の課題
  • 27. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. 27 研究実績 発表予定 国内学会 発表予定(2件) • 〇花野 愛里咲, 横山 想一郎, 山下 倫央, 川村 秀憲,マスク化言語 モデル RoBERTa を用いた俳句の評価, 情報処理学会 第84回全国 大会, 2022. • 〇花野 愛里咲, 横山 想一郎, 山下 倫央, 川村 秀憲, RoBERTaを用 いた俳句評価器の構築と性能評価, 社会システムと情報技術研究 ウィーク (WSSIT2022), 2022.