SlideShare una empresa de Scribd logo
1 de 20
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
DLゼミ
Inspiration through Observation: Demonstrating the
Influence of Automatically Generated Text on
Creative Writing
北海道大学 大学院情報科学研究院
情報理工学部門 複合情報工学分野 調和系工学研究室
平田航大
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
Copyright © 2020 Laboratory of Harmonious Systems Engineering Research Group of Synergetic Information Engineering
Division of Computer Science and Information Technology Faculty of Information Science and Technology Hokkaido University – All rights reserved.
2
論文情報
• タイトル
– “Inspiration through Observation: Demonstrating the
Influence of Automatically Generated Text on Creative
Writing”
• 著者
– Melissa Roemmele
• Language Weaver (RWS Group)
• 発表
– International Conferences on Computational Creativity (ICCC)
2021
• 論文URL
– https://roemmele.github.io/publications/human_computer_a
uthoring.pdf
• 実装
– モデルの提案論文ではないため、なし
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
Copyright © 2020 Laboratory of Harmonious Systems Engineering Research Group of Synergetic Information Engineering
Division of Computer Science and Information Technology Faculty of Information Science and Technology Hokkaido University – All rights reserved.
3
観測によるインスピレーション
• コンピュータによる創作の方向性
1. コンピュータ自身がよい作品を生成
2. 人間の創作を支援 本論文の立場
観測前
“His hair was cropped
short, ….”
自動生成された作品
観測後
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
• 自動生成された文を提示することで、創作能
力が増強される可能性を実験的に示した
– 文章生成における Creativity Support Tools (CSTs)
• Creativity の中でも storiability に注目し、
統計的分析により storiability の向上を確認
論文概要 4
※ storiability
• 「一文がどの程度魅力的なストーリー
を連想させるか」で定義
• 物語の質を測る一指標
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
• 執筆者のタスク
– 3つの単語(プロンプト)をつなげ、「読み手が
続きを読みたくなるような一文を書く」
という穴埋めタスク
• 前述の storiability を強調した問題文
– 自動生成文を見る前(PRE sentence)、
自動生成文を見た後(POST sentence)
でそれぞれ2文を執筆
実験概要 5
プロンプト:“he town rain” →
“he rode his bike to town in the pouring rain.”
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
• 評価者のタスク
– PRE sentence、 POST sentence、
自動生成文(GEN sentence)の3つを状態を伏せ
て提示し、「最も続きを読みたくなるような文」
を選択
• storiability を評価するためのタスク
実験概要 6
Instructions: “imagine
that each sentence is an
excerpt from a story and
pick the one that makes
you most want to read it”
図:実験時のスクリーンショット
(発表スライドより引用)
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
7
GEN sentence の生成モデル
• GPT-2 [1]を用いて生成
• データ
– BookCorpus [2] の10,000作品から、
(prompt, sentence) のペアを生成
[1] Language Models are Unsupervised Multitask Learners, Radford, A., Wu, J., Child, R., Luan, D., Amodei, D. and
Sutskever, arXiv, 2018
[2] Kobayashi, S. 2018. Homemade bookcorpus. https://github.com/BIGBALLON/cifar-10-cnn
training validation test
約 34 M 約 900 K 約 900 K
Figure1: 穴埋めモデルの概略図
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
8
実験用プロンプトの選択とGEN生成
1. テストデータに前処理をし、約 23K のプロンプトを得る
2. Masked LM (DistilBERT [3]) で尤度的な確率を付与
– プロンプトの3単語が英語らしい並びとなっている確率
3. 2. で付与した確率をもとに、
– トップ 10% の確率がついたプロンプトに
“easy” ラベルを付ける (e.g., his, body, relax)
– 下位 10% の確率がついたプロンプトに
“hard” ラベルを付ける (e.g., peculiar, rob, more)
4. “easy”, “hard” ラベルがついたプロンプトに対し、以下の
条件を満たす GEN 文をそれぞれ5文生成
– プロンプトの語順を維持
– 7語以上50語以下
– 同じ単語の繰り返しがない
– 他の生成文と60%以上の被りがない
– 倫理的観点の問題がない
[3] Sanh, V.; Debut, L.; Chaumond, J.; and Wolf, T. 2019. DistilBERT, a distilled version of BERT: smaller, faster,
cheaper and lighter. arXiv preprint arXiv:1910.01108
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
• PRE ステージ
– “easy” or “hard” ラベルの付いたプロンプトをラン
ダムに表示
– 2文を執筆
実際の実験の流れ 9
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
• POST ステージ
– 自動生成文5文を表示
– 同じプロンプトに対し、2文を執筆
実際の実験の流れ 10
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
• 評価フェーズ
– PRE sentence、POST sentence、GEN sentence
の3つの中から最も storiability の高いと感じるも
のを選択
実際の実験の流れ 11
評価フェーズで提示される文の例
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
• 106 block の評価付きデータを収集
– 1 block =
PRE sentence 2文
POST sentence 2文
GEN sentence 5文
結果の分析 - 実験の規模 12
1 block のデータ
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
13
結果の分析 - 人間作とAI作の比較
• 人間作(PRE, POST) はAI作(GEN) よりも有意に
評価者からの評価が高い (p < 0.05)
– GPT-2 は storiability が高まるように学習していな
いから?
• そのように学習させても、人間作の基準に届かなかった
研究もある [4]
• 以降はAIの介在による、人間の storiability の
変化に注目していく
[4] Lin, B. Y.; Zhou, W.; Shen, M.; Zhou, P.; Bhagavatula, C.; Choi, Y.; and Ren, X. 2020. CommonGen: A constrained
text generation challenge for generative commonsense reasoning. In Findings of the Association for
Computational Linguistics: EMNLP 2020
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
• “hard” ラベルの付いたプロンプトは、単語間
をつなぐためにより多くの単語が必要
• “hard” ラベルの付いたプロンプトはより複雑
なタスクであることが確認できる
結果の分析 – プロンプトの難易度分析 14
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
• POST ステージの方が有意に storiability の高
い文を執筆出来ている (p < 0.05)
– ただし、”hard” ラベルの付いたプロンプトのみ
– “easy” ラベルの付いたプロンプトは有意な差は見
られない
結果の分析 - ステージ間の比較 15
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
• 自動生成文と人間作の文で意味的な類似度を算出
– DistillBERT を用いて文をベクトル化
𝑠𝑐𝑜𝑟𝑒 ℎ, 𝑠 = max
𝑔∈𝑔𝑠
𝑠𝑖𝑚(ℎ, 𝑔)
• h: 人間作の文(PRE, POST)
• gs: 対応するプロンプトの GEN 文集合
• sim(x, y): コサイン類似度
• PRE と POST 間で類似度に有意な差がみられる
– 人間が自動生成文に引っ張られるような影響が出てい
ることが確認できる
結果の分析 - 自動生成文が与える影響 16
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
• storiability が高いと評価された文はより GEN
と類似度が高い
– 自動生成文が、より storiability の高い文を書く
ための支援となっている
結果の分析 - 自動生成文が storiability を増強させるか 17
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
• プロンプトと “hair” を絡めるという発想を
GEN sentence から得ていると思われる
定性的な分析 18
プロンプト PRE sentence POST sentence GEN sentence
shoulders
waves
color
My shoulders were
aching but I was set
on diving through
the waves, the
color of the water
getting deeper the
further out I went.
Her new hair cut
had the length to
the shoulders, with
waves of a bright
pink color all the
way down.
His hair was
cropped short,
flowing down his
shoulders, but
there were waves
of the same color.
Table8から引用
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
• プロンプトの難易度で実験結果が変わったの
は意外
– 追加分析で、”easy” プロンプトについても
”hard” プロンプトと同様に、何らかの意味的な影
響を受けていることが分かった
• “easy” プロンプトでは自動生成文が人間の支援になって
いない?
• タスクが簡単すぎて自動生成文から得るものがない?
議論点 19
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
• 自動生成された文を観測することで、
storiability の高い文を書くタスクをこなす
能力が増強されていることが確認できた
– 「観測によるインスピレーション」を実験的に示
した形
• 今後は、
– storiability 以外の指標
– 難易度による変化のさらなる分析
などで「観測によるインスピレーション」
をさらに検証
まとめ 20

Más contenido relacionado

Similar a Inspiration through Observation: Demonstrating the Influence of Automatically Generated Text on Creative Writing

Efficient Deep Reinforcement Learning with Imitative Expert Priors for Autono...
Efficient Deep Reinforcement Learning with Imitative Expert Priors for Autono...Efficient Deep Reinforcement Learning with Imitative Expert Priors for Autono...
Efficient Deep Reinforcement Learning with Imitative Expert Priors for Autono...harmonylab
 
ArcFace: Additive Angular Margin Loss for Deep Face Recognition
ArcFace: Additive Angular Margin Loss for Deep Face RecognitionArcFace: Additive Angular Margin Loss for Deep Face Recognition
ArcFace: Additive Angular Margin Loss for Deep Face Recognitionharmonylab
 
深層学習を用いたバス乗客画像の属性推定 に関する研究
深層学習を用いたバス乗客画像の属性推定 に関する研究深層学習を用いたバス乗客画像の属性推定 に関する研究
深層学習を用いたバス乗客画像の属性推定 に関する研究harmonylab
 
DLゼミ: ViTPose: Simple Vision Transformer Baselines for Human Pose Estimation
DLゼミ: ViTPose: Simple Vision Transformer Baselines for Human Pose EstimationDLゼミ: ViTPose: Simple Vision Transformer Baselines for Human Pose Estimation
DLゼミ: ViTPose: Simple Vision Transformer Baselines for Human Pose Estimationharmonylab
 
MLP-Mixer: An all-MLP Architecture for Vision
MLP-Mixer: An all-MLP Architecture for VisionMLP-Mixer: An all-MLP Architecture for Vision
MLP-Mixer: An all-MLP Architecture for Visionharmonylab
 
2021 09 29_dl_hirata
2021 09 29_dl_hirata2021 09 29_dl_hirata
2021 09 29_dl_hirataharmonylab
 
深層強化学習による自動運転車両の追い越し行動の実現に関する研究
深層強化学習による自動運転車両の追い越し行動の実現に関する研究深層強化学習による自動運転車両の追い越し行動の実現に関する研究
深層強化学習による自動運転車両の追い越し行動の実現に関する研究harmonylab
 
深層自己回帰モデルを用いた俳句の生成と評価に関する研究
深層自己回帰モデルを用いた俳句の生成と評価に関する研究深層自己回帰モデルを用いた俳句の生成と評価に関する研究
深層自己回帰モデルを用いた俳句の生成と評価に関する研究harmonylab
 
Self-supervised Learning of Adversarial Example: Towards Good Generalizations...
Self-supervised Learning of Adversarial Example:Towards Good Generalizations...Self-supervised Learning of Adversarial Example:Towards Good Generalizations...
Self-supervised Learning of Adversarial Example: Towards Good Generalizations...harmonylab
 
DLゼミ: MobileOne: An Improved One millisecond Mobile Backbone
DLゼミ: MobileOne: An Improved One millisecond Mobile BackboneDLゼミ: MobileOne: An Improved One millisecond Mobile Backbone
DLゼミ: MobileOne: An Improved One millisecond Mobile Backboneharmonylab
 
MASTERING ATARI WITH DISCRETE WORLD MODELS (DreamerV2)
MASTERING ATARI WITH DISCRETE WORLD MODELS (DreamerV2)MASTERING ATARI WITH DISCRETE WORLD MODELS (DreamerV2)
MASTERING ATARI WITH DISCRETE WORLD MODELS (DreamerV2)harmonylab
 
You Only Learn One Representation: Unified Network for Multiple Tasks
You Only Learn One Representation: Unified Network for Multiple TasksYou Only Learn One Representation: Unified Network for Multiple Tasks
You Only Learn One Representation: Unified Network for Multiple Tasksharmonylab
 
言語モデルを用いた俳句評価器の構築と性能評価に関する研究
言語モデルを用いた俳句評価器の構築と性能評価に関する研究言語モデルを用いた俳句評価器の構築と性能評価に関する研究
言語モデルを用いた俳句評価器の構築と性能評価に関する研究harmonylab
 
A Study on Generation of Deformed Route Maps using Octilinear Grid
A Study on Generation of Deformed Route Maps using Octilinear GridA Study on Generation of Deformed Route Maps using Octilinear Grid
A Study on Generation of Deformed Route Maps using Octilinear Gridharmonylab
 
Fine Grained Fashion Similarity Prediction by Attribute Specific Embedding Le...
Fine Grained Fashion Similarity Prediction by Attribute Specific Embedding Le...Fine Grained Fashion Similarity Prediction by Attribute Specific Embedding Le...
Fine Grained Fashion Similarity Prediction by Attribute Specific Embedding Le...harmonylab
 
MAUVE: Measuring the Gap Between Neural Text and Human Text using Divergence ...
MAUVE: Measuring the Gap Between Neural Text and Human Text using Divergence ...MAUVE: Measuring the Gap Between Neural Text and Human Text using Divergence ...
MAUVE: Measuring the Gap Between Neural Text and Human Text using Divergence ...harmonylab
 
DeBERTaV3: Improving DeBERTa using ELECTRA-Style Pre-Training with Gradient-D...
DeBERTaV3: Improving DeBERTa using ELECTRA-Style Pre-Training with Gradient-D...DeBERTaV3: Improving DeBERTa using ELECTRA-Style Pre-Training with Gradient-D...
DeBERTaV3: Improving DeBERTa using ELECTRA-Style Pre-Training with Gradient-D...harmonylab
 
AGenT Zero: Zero-shot Automatic Multiple-Choice Question Generation for Skill...
AGenT Zero: Zero-shot Automatic Multiple-Choice Question Generation for Skill...AGenT Zero: Zero-shot Automatic Multiple-Choice Question Generation for Skill...
AGenT Zero: Zero-shot Automatic Multiple-Choice Question Generation for Skill...harmonylab
 

Similar a Inspiration through Observation: Demonstrating the Influence of Automatically Generated Text on Creative Writing (20)

Efficient Deep Reinforcement Learning with Imitative Expert Priors for Autono...
Efficient Deep Reinforcement Learning with Imitative Expert Priors for Autono...Efficient Deep Reinforcement Learning with Imitative Expert Priors for Autono...
Efficient Deep Reinforcement Learning with Imitative Expert Priors for Autono...
 
ArcFace: Additive Angular Margin Loss for Deep Face Recognition
ArcFace: Additive Angular Margin Loss for Deep Face RecognitionArcFace: Additive Angular Margin Loss for Deep Face Recognition
ArcFace: Additive Angular Margin Loss for Deep Face Recognition
 
深層学習を用いたバス乗客画像の属性推定 に関する研究
深層学習を用いたバス乗客画像の属性推定 に関する研究深層学習を用いたバス乗客画像の属性推定 に関する研究
深層学習を用いたバス乗客画像の属性推定 に関する研究
 
DLゼミ: ViTPose: Simple Vision Transformer Baselines for Human Pose Estimation
DLゼミ: ViTPose: Simple Vision Transformer Baselines for Human Pose EstimationDLゼミ: ViTPose: Simple Vision Transformer Baselines for Human Pose Estimation
DLゼミ: ViTPose: Simple Vision Transformer Baselines for Human Pose Estimation
 
MLP-Mixer: An all-MLP Architecture for Vision
MLP-Mixer: An all-MLP Architecture for VisionMLP-Mixer: An all-MLP Architecture for Vision
MLP-Mixer: An all-MLP Architecture for Vision
 
2021 09 29_dl_hirata
2021 09 29_dl_hirata2021 09 29_dl_hirata
2021 09 29_dl_hirata
 
深層強化学習による自動運転車両の追い越し行動の実現に関する研究
深層強化学習による自動運転車両の追い越し行動の実現に関する研究深層強化学習による自動運転車両の追い越し行動の実現に関する研究
深層強化学習による自動運転車両の追い越し行動の実現に関する研究
 
深層自己回帰モデルを用いた俳句の生成と評価に関する研究
深層自己回帰モデルを用いた俳句の生成と評価に関する研究深層自己回帰モデルを用いた俳句の生成と評価に関する研究
深層自己回帰モデルを用いた俳句の生成と評価に関する研究
 
RAPiD
RAPiDRAPiD
RAPiD
 
Self-supervised Learning of Adversarial Example: Towards Good Generalizations...
Self-supervised Learning of Adversarial Example:Towards Good Generalizations...Self-supervised Learning of Adversarial Example:Towards Good Generalizations...
Self-supervised Learning of Adversarial Example: Towards Good Generalizations...
 
修士論文
修士論文修士論文
修士論文
 
DLゼミ: MobileOne: An Improved One millisecond Mobile Backbone
DLゼミ: MobileOne: An Improved One millisecond Mobile BackboneDLゼミ: MobileOne: An Improved One millisecond Mobile Backbone
DLゼミ: MobileOne: An Improved One millisecond Mobile Backbone
 
MASTERING ATARI WITH DISCRETE WORLD MODELS (DreamerV2)
MASTERING ATARI WITH DISCRETE WORLD MODELS (DreamerV2)MASTERING ATARI WITH DISCRETE WORLD MODELS (DreamerV2)
MASTERING ATARI WITH DISCRETE WORLD MODELS (DreamerV2)
 
You Only Learn One Representation: Unified Network for Multiple Tasks
You Only Learn One Representation: Unified Network for Multiple TasksYou Only Learn One Representation: Unified Network for Multiple Tasks
You Only Learn One Representation: Unified Network for Multiple Tasks
 
言語モデルを用いた俳句評価器の構築と性能評価に関する研究
言語モデルを用いた俳句評価器の構築と性能評価に関する研究言語モデルを用いた俳句評価器の構築と性能評価に関する研究
言語モデルを用いた俳句評価器の構築と性能評価に関する研究
 
A Study on Generation of Deformed Route Maps using Octilinear Grid
A Study on Generation of Deformed Route Maps using Octilinear GridA Study on Generation of Deformed Route Maps using Octilinear Grid
A Study on Generation of Deformed Route Maps using Octilinear Grid
 
Fine Grained Fashion Similarity Prediction by Attribute Specific Embedding Le...
Fine Grained Fashion Similarity Prediction by Attribute Specific Embedding Le...Fine Grained Fashion Similarity Prediction by Attribute Specific Embedding Le...
Fine Grained Fashion Similarity Prediction by Attribute Specific Embedding Le...
 
MAUVE: Measuring the Gap Between Neural Text and Human Text using Divergence ...
MAUVE: Measuring the Gap Between Neural Text and Human Text using Divergence ...MAUVE: Measuring the Gap Between Neural Text and Human Text using Divergence ...
MAUVE: Measuring the Gap Between Neural Text and Human Text using Divergence ...
 
DeBERTaV3: Improving DeBERTa using ELECTRA-Style Pre-Training with Gradient-D...
DeBERTaV3: Improving DeBERTa using ELECTRA-Style Pre-Training with Gradient-D...DeBERTaV3: Improving DeBERTa using ELECTRA-Style Pre-Training with Gradient-D...
DeBERTaV3: Improving DeBERTa using ELECTRA-Style Pre-Training with Gradient-D...
 
AGenT Zero: Zero-shot Automatic Multiple-Choice Question Generation for Skill...
AGenT Zero: Zero-shot Automatic Multiple-Choice Question Generation for Skill...AGenT Zero: Zero-shot Automatic Multiple-Choice Question Generation for Skill...
AGenT Zero: Zero-shot Automatic Multiple-Choice Question Generation for Skill...
 

Más de harmonylab

【修士論文】代替出勤者の選定業務における依頼順決定方法に関する研究   千坂知也
【修士論文】代替出勤者の選定業務における依頼順決定方法に関する研究   千坂知也【修士論文】代替出勤者の選定業務における依頼順決定方法に関する研究   千坂知也
【修士論文】代替出勤者の選定業務における依頼順決定方法に関する研究   千坂知也harmonylab
 
【修士論文】経路探索のための媒介中心性に基づく道路ネットワーク階層化手法に関する研究
【修士論文】経路探索のための媒介中心性に基づく道路ネットワーク階層化手法に関する研究【修士論文】経路探索のための媒介中心性に基づく道路ネットワーク階層化手法に関する研究
【修士論文】経路探索のための媒介中心性に基づく道路ネットワーク階層化手法に関する研究harmonylab
 
A Study on Decision Support System for Snow Removal Dispatch using Road Surfa...
A Study on Decision Support System for Snow Removal Dispatch using Road Surfa...A Study on Decision Support System for Snow Removal Dispatch using Road Surfa...
A Study on Decision Support System for Snow Removal Dispatch using Road Surfa...harmonylab
 
【卒業論文】印象タグを用いた衣服画像生成システムに関する研究
【卒業論文】印象タグを用いた衣服画像生成システムに関する研究【卒業論文】印象タグを用いた衣服画像生成システムに関する研究
【卒業論文】印象タグを用いた衣服画像生成システムに関する研究harmonylab
 
【卒業論文】大規模言語モデルを用いたマニュアル文章修正手法に関する研究
【卒業論文】大規模言語モデルを用いたマニュアル文章修正手法に関する研究【卒業論文】大規模言語モデルを用いたマニュアル文章修正手法に関する研究
【卒業論文】大規模言語モデルを用いたマニュアル文章修正手法に関する研究harmonylab
 
DLゼミ: Llama 2: Open Foundation and Fine-Tuned Chat Models
DLゼミ: Llama 2: Open Foundation and Fine-Tuned Chat ModelsDLゼミ: Llama 2: Open Foundation and Fine-Tuned Chat Models
DLゼミ: Llama 2: Open Foundation and Fine-Tuned Chat Modelsharmonylab
 
Voyager: An Open-Ended Embodied Agent with Large Language Models
Voyager: An Open-Ended Embodied Agent with Large Language ModelsVoyager: An Open-Ended Embodied Agent with Large Language Models
Voyager: An Open-Ended Embodied Agent with Large Language Modelsharmonylab
 
DLゼミ: Ego-Body Pose Estimation via Ego-Head Pose Estimation
DLゼミ: Ego-Body Pose Estimation via Ego-Head Pose EstimationDLゼミ: Ego-Body Pose Estimation via Ego-Head Pose Estimation
DLゼミ: Ego-Body Pose Estimation via Ego-Head Pose Estimationharmonylab
 
形態素解析を用いた帝国議会議事速記録の変遷に関する研究
形態素解析を用いた帝国議会議事速記録の変遷に関する研究形態素解析を用いた帝国議会議事速記録の変遷に関する研究
形態素解析を用いた帝国議会議事速記録の変遷に関する研究harmonylab
 
【卒業論文】深層生成モデルを用いたユーザ意図に基づく衣服画像の生成に関する研究
【卒業論文】深層生成モデルを用いたユーザ意図に基づく衣服画像の生成に関する研究【卒業論文】深層生成モデルを用いたユーザ意図に基づく衣服画像の生成に関する研究
【卒業論文】深層生成モデルを用いたユーザ意図に基づく衣服画像の生成に関する研究harmonylab
 
灯油タンク内の液面高計測を用いた 灯油残量推定システムに関する研究
灯油タンク内の液面高計測を用いた灯油残量推定システムに関する研究灯油タンク内の液面高計測を用いた灯油残量推定システムに関する研究
灯油タンク内の液面高計測を用いた 灯油残量推定システムに関する研究harmonylab
 
競輪におけるレーティングシステムを用いた予想記事生成に関する研究
競輪におけるレーティングシステムを用いた予想記事生成に関する研究競輪におけるレーティングシステムを用いた予想記事生成に関する研究
競輪におけるレーティングシステムを用いた予想記事生成に関する研究harmonylab
 
【卒業論文】B2Bオークションにおけるユーザ別 入札行動予測に関する研究
【卒業論文】B2Bオークションにおけるユーザ別 入札行動予測に関する研究【卒業論文】B2Bオークションにおけるユーザ別 入札行動予測に関する研究
【卒業論文】B2Bオークションにおけるユーザ別 入札行動予測に関する研究harmonylab
 
A Study on Estimation of Household Kerosene Consumption for Optimization of D...
A Study on Estimation of Household Kerosene Consumption for Optimization of D...A Study on Estimation of Household Kerosene Consumption for Optimization of D...
A Study on Estimation of Household Kerosene Consumption for Optimization of D...harmonylab
 
マルチエージェント深層強化学習による自動運転車両の追越行動の獲得に関する研究
マルチエージェント深層強化学習による自動運転車両の追越行動の獲得に関する研究マルチエージェント深層強化学習による自動運転車両の追越行動の獲得に関する研究
マルチエージェント深層強化学習による自動運転車両の追越行動の獲得に関する研究harmonylab
 
A Study on the Generation of Clothing Captions Highlighting the Differences b...
A Study on the Generation of Clothing Captions Highlighting the Differences b...A Study on the Generation of Clothing Captions Highlighting the Differences b...
A Study on the Generation of Clothing Captions Highlighting the Differences b...harmonylab
 
A Study on Clothing Recommendation Information Presentation System Based on C...
A Study on Clothing Recommendation Information Presentation System Based on C...A Study on Clothing Recommendation Information Presentation System Based on C...
A Study on Clothing Recommendation Information Presentation System Based on C...harmonylab
 
Emotionally Intelligent Fashion Design Using CNN and GAN
Emotionally Intelligent Fashion Design Using CNN and GANEmotionally Intelligent Fashion Design Using CNN and GAN
Emotionally Intelligent Fashion Design Using CNN and GANharmonylab
 
Towards Total Recall in Industrial Anomaly Detection
Towards Total Recall in Industrial Anomaly DetectionTowards Total Recall in Industrial Anomaly Detection
Towards Total Recall in Industrial Anomaly Detectionharmonylab
 
Feature Erasing and Diffusion Network for Occluded Person Re-Identification
Feature Erasing and Diffusion Network for Occluded Person Re-IdentificationFeature Erasing and Diffusion Network for Occluded Person Re-Identification
Feature Erasing and Diffusion Network for Occluded Person Re-Identificationharmonylab
 

Más de harmonylab (20)

【修士論文】代替出勤者の選定業務における依頼順決定方法に関する研究   千坂知也
【修士論文】代替出勤者の選定業務における依頼順決定方法に関する研究   千坂知也【修士論文】代替出勤者の選定業務における依頼順決定方法に関する研究   千坂知也
【修士論文】代替出勤者の選定業務における依頼順決定方法に関する研究   千坂知也
 
【修士論文】経路探索のための媒介中心性に基づく道路ネットワーク階層化手法に関する研究
【修士論文】経路探索のための媒介中心性に基づく道路ネットワーク階層化手法に関する研究【修士論文】経路探索のための媒介中心性に基づく道路ネットワーク階層化手法に関する研究
【修士論文】経路探索のための媒介中心性に基づく道路ネットワーク階層化手法に関する研究
 
A Study on Decision Support System for Snow Removal Dispatch using Road Surfa...
A Study on Decision Support System for Snow Removal Dispatch using Road Surfa...A Study on Decision Support System for Snow Removal Dispatch using Road Surfa...
A Study on Decision Support System for Snow Removal Dispatch using Road Surfa...
 
【卒業論文】印象タグを用いた衣服画像生成システムに関する研究
【卒業論文】印象タグを用いた衣服画像生成システムに関する研究【卒業論文】印象タグを用いた衣服画像生成システムに関する研究
【卒業論文】印象タグを用いた衣服画像生成システムに関する研究
 
【卒業論文】大規模言語モデルを用いたマニュアル文章修正手法に関する研究
【卒業論文】大規模言語モデルを用いたマニュアル文章修正手法に関する研究【卒業論文】大規模言語モデルを用いたマニュアル文章修正手法に関する研究
【卒業論文】大規模言語モデルを用いたマニュアル文章修正手法に関する研究
 
DLゼミ: Llama 2: Open Foundation and Fine-Tuned Chat Models
DLゼミ: Llama 2: Open Foundation and Fine-Tuned Chat ModelsDLゼミ: Llama 2: Open Foundation and Fine-Tuned Chat Models
DLゼミ: Llama 2: Open Foundation and Fine-Tuned Chat Models
 
Voyager: An Open-Ended Embodied Agent with Large Language Models
Voyager: An Open-Ended Embodied Agent with Large Language ModelsVoyager: An Open-Ended Embodied Agent with Large Language Models
Voyager: An Open-Ended Embodied Agent with Large Language Models
 
DLゼミ: Ego-Body Pose Estimation via Ego-Head Pose Estimation
DLゼミ: Ego-Body Pose Estimation via Ego-Head Pose EstimationDLゼミ: Ego-Body Pose Estimation via Ego-Head Pose Estimation
DLゼミ: Ego-Body Pose Estimation via Ego-Head Pose Estimation
 
形態素解析を用いた帝国議会議事速記録の変遷に関する研究
形態素解析を用いた帝国議会議事速記録の変遷に関する研究形態素解析を用いた帝国議会議事速記録の変遷に関する研究
形態素解析を用いた帝国議会議事速記録の変遷に関する研究
 
【卒業論文】深層生成モデルを用いたユーザ意図に基づく衣服画像の生成に関する研究
【卒業論文】深層生成モデルを用いたユーザ意図に基づく衣服画像の生成に関する研究【卒業論文】深層生成モデルを用いたユーザ意図に基づく衣服画像の生成に関する研究
【卒業論文】深層生成モデルを用いたユーザ意図に基づく衣服画像の生成に関する研究
 
灯油タンク内の液面高計測を用いた 灯油残量推定システムに関する研究
灯油タンク内の液面高計測を用いた灯油残量推定システムに関する研究灯油タンク内の液面高計測を用いた灯油残量推定システムに関する研究
灯油タンク内の液面高計測を用いた 灯油残量推定システムに関する研究
 
競輪におけるレーティングシステムを用いた予想記事生成に関する研究
競輪におけるレーティングシステムを用いた予想記事生成に関する研究競輪におけるレーティングシステムを用いた予想記事生成に関する研究
競輪におけるレーティングシステムを用いた予想記事生成に関する研究
 
【卒業論文】B2Bオークションにおけるユーザ別 入札行動予測に関する研究
【卒業論文】B2Bオークションにおけるユーザ別 入札行動予測に関する研究【卒業論文】B2Bオークションにおけるユーザ別 入札行動予測に関する研究
【卒業論文】B2Bオークションにおけるユーザ別 入札行動予測に関する研究
 
A Study on Estimation of Household Kerosene Consumption for Optimization of D...
A Study on Estimation of Household Kerosene Consumption for Optimization of D...A Study on Estimation of Household Kerosene Consumption for Optimization of D...
A Study on Estimation of Household Kerosene Consumption for Optimization of D...
 
マルチエージェント深層強化学習による自動運転車両の追越行動の獲得に関する研究
マルチエージェント深層強化学習による自動運転車両の追越行動の獲得に関する研究マルチエージェント深層強化学習による自動運転車両の追越行動の獲得に関する研究
マルチエージェント深層強化学習による自動運転車両の追越行動の獲得に関する研究
 
A Study on the Generation of Clothing Captions Highlighting the Differences b...
A Study on the Generation of Clothing Captions Highlighting the Differences b...A Study on the Generation of Clothing Captions Highlighting the Differences b...
A Study on the Generation of Clothing Captions Highlighting the Differences b...
 
A Study on Clothing Recommendation Information Presentation System Based on C...
A Study on Clothing Recommendation Information Presentation System Based on C...A Study on Clothing Recommendation Information Presentation System Based on C...
A Study on Clothing Recommendation Information Presentation System Based on C...
 
Emotionally Intelligent Fashion Design Using CNN and GAN
Emotionally Intelligent Fashion Design Using CNN and GANEmotionally Intelligent Fashion Design Using CNN and GAN
Emotionally Intelligent Fashion Design Using CNN and GAN
 
Towards Total Recall in Industrial Anomaly Detection
Towards Total Recall in Industrial Anomaly DetectionTowards Total Recall in Industrial Anomaly Detection
Towards Total Recall in Industrial Anomaly Detection
 
Feature Erasing and Diffusion Network for Occluded Person Re-Identification
Feature Erasing and Diffusion Network for Occluded Person Re-IdentificationFeature Erasing and Diffusion Network for Occluded Person Re-Identification
Feature Erasing and Diffusion Network for Occluded Person Re-Identification
 

Inspiration through Observation: Demonstrating the Influence of Automatically Generated Text on Creative Writing

  • 1. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. DLゼミ Inspiration through Observation: Demonstrating the Influence of Automatically Generated Text on Creative Writing 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 調和系工学研究室 平田航大
  • 2. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. Copyright © 2020 Laboratory of Harmonious Systems Engineering Research Group of Synergetic Information Engineering Division of Computer Science and Information Technology Faculty of Information Science and Technology Hokkaido University – All rights reserved. 2 論文情報 • タイトル – “Inspiration through Observation: Demonstrating the Influence of Automatically Generated Text on Creative Writing” • 著者 – Melissa Roemmele • Language Weaver (RWS Group) • 発表 – International Conferences on Computational Creativity (ICCC) 2021 • 論文URL – https://roemmele.github.io/publications/human_computer_a uthoring.pdf • 実装 – モデルの提案論文ではないため、なし
  • 3. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. Copyright © 2020 Laboratory of Harmonious Systems Engineering Research Group of Synergetic Information Engineering Division of Computer Science and Information Technology Faculty of Information Science and Technology Hokkaido University – All rights reserved. 3 観測によるインスピレーション • コンピュータによる創作の方向性 1. コンピュータ自身がよい作品を生成 2. 人間の創作を支援 本論文の立場 観測前 “His hair was cropped short, ….” 自動生成された作品 観測後
  • 4. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. • 自動生成された文を提示することで、創作能 力が増強される可能性を実験的に示した – 文章生成における Creativity Support Tools (CSTs) • Creativity の中でも storiability に注目し、 統計的分析により storiability の向上を確認 論文概要 4 ※ storiability • 「一文がどの程度魅力的なストーリー を連想させるか」で定義 • 物語の質を測る一指標
  • 5. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. • 執筆者のタスク – 3つの単語(プロンプト)をつなげ、「読み手が 続きを読みたくなるような一文を書く」 という穴埋めタスク • 前述の storiability を強調した問題文 – 自動生成文を見る前(PRE sentence)、 自動生成文を見た後(POST sentence) でそれぞれ2文を執筆 実験概要 5 プロンプト:“he town rain” → “he rode his bike to town in the pouring rain.”
  • 6. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. • 評価者のタスク – PRE sentence、 POST sentence、 自動生成文(GEN sentence)の3つを状態を伏せ て提示し、「最も続きを読みたくなるような文」 を選択 • storiability を評価するためのタスク 実験概要 6 Instructions: “imagine that each sentence is an excerpt from a story and pick the one that makes you most want to read it” 図:実験時のスクリーンショット (発表スライドより引用)
  • 7. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. 7 GEN sentence の生成モデル • GPT-2 [1]を用いて生成 • データ – BookCorpus [2] の10,000作品から、 (prompt, sentence) のペアを生成 [1] Language Models are Unsupervised Multitask Learners, Radford, A., Wu, J., Child, R., Luan, D., Amodei, D. and Sutskever, arXiv, 2018 [2] Kobayashi, S. 2018. Homemade bookcorpus. https://github.com/BIGBALLON/cifar-10-cnn training validation test 約 34 M 約 900 K 約 900 K Figure1: 穴埋めモデルの概略図
  • 8. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. 8 実験用プロンプトの選択とGEN生成 1. テストデータに前処理をし、約 23K のプロンプトを得る 2. Masked LM (DistilBERT [3]) で尤度的な確率を付与 – プロンプトの3単語が英語らしい並びとなっている確率 3. 2. で付与した確率をもとに、 – トップ 10% の確率がついたプロンプトに “easy” ラベルを付ける (e.g., his, body, relax) – 下位 10% の確率がついたプロンプトに “hard” ラベルを付ける (e.g., peculiar, rob, more) 4. “easy”, “hard” ラベルがついたプロンプトに対し、以下の 条件を満たす GEN 文をそれぞれ5文生成 – プロンプトの語順を維持 – 7語以上50語以下 – 同じ単語の繰り返しがない – 他の生成文と60%以上の被りがない – 倫理的観点の問題がない [3] Sanh, V.; Debut, L.; Chaumond, J.; and Wolf, T. 2019. DistilBERT, a distilled version of BERT: smaller, faster, cheaper and lighter. arXiv preprint arXiv:1910.01108
  • 9. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. • PRE ステージ – “easy” or “hard” ラベルの付いたプロンプトをラン ダムに表示 – 2文を執筆 実際の実験の流れ 9
  • 10. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. • POST ステージ – 自動生成文5文を表示 – 同じプロンプトに対し、2文を執筆 実際の実験の流れ 10
  • 11. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. • 評価フェーズ – PRE sentence、POST sentence、GEN sentence の3つの中から最も storiability の高いと感じるも のを選択 実際の実験の流れ 11 評価フェーズで提示される文の例
  • 12. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. • 106 block の評価付きデータを収集 – 1 block = PRE sentence 2文 POST sentence 2文 GEN sentence 5文 結果の分析 - 実験の規模 12 1 block のデータ
  • 13. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. 13 結果の分析 - 人間作とAI作の比較 • 人間作(PRE, POST) はAI作(GEN) よりも有意に 評価者からの評価が高い (p < 0.05) – GPT-2 は storiability が高まるように学習していな いから? • そのように学習させても、人間作の基準に届かなかった 研究もある [4] • 以降はAIの介在による、人間の storiability の 変化に注目していく [4] Lin, B. Y.; Zhou, W.; Shen, M.; Zhou, P.; Bhagavatula, C.; Choi, Y.; and Ren, X. 2020. CommonGen: A constrained text generation challenge for generative commonsense reasoning. In Findings of the Association for Computational Linguistics: EMNLP 2020
  • 14. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. • “hard” ラベルの付いたプロンプトは、単語間 をつなぐためにより多くの単語が必要 • “hard” ラベルの付いたプロンプトはより複雑 なタスクであることが確認できる 結果の分析 – プロンプトの難易度分析 14
  • 15. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. • POST ステージの方が有意に storiability の高 い文を執筆出来ている (p < 0.05) – ただし、”hard” ラベルの付いたプロンプトのみ – “easy” ラベルの付いたプロンプトは有意な差は見 られない 結果の分析 - ステージ間の比較 15
  • 16. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. • 自動生成文と人間作の文で意味的な類似度を算出 – DistillBERT を用いて文をベクトル化 𝑠𝑐𝑜𝑟𝑒 ℎ, 𝑠 = max 𝑔∈𝑔𝑠 𝑠𝑖𝑚(ℎ, 𝑔) • h: 人間作の文(PRE, POST) • gs: 対応するプロンプトの GEN 文集合 • sim(x, y): コサイン類似度 • PRE と POST 間で類似度に有意な差がみられる – 人間が自動生成文に引っ張られるような影響が出てい ることが確認できる 結果の分析 - 自動生成文が与える影響 16
  • 17. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. • storiability が高いと評価された文はより GEN と類似度が高い – 自動生成文が、より storiability の高い文を書く ための支援となっている 結果の分析 - 自動生成文が storiability を増強させるか 17
  • 18. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. • プロンプトと “hair” を絡めるという発想を GEN sentence から得ていると思われる 定性的な分析 18 プロンプト PRE sentence POST sentence GEN sentence shoulders waves color My shoulders were aching but I was set on diving through the waves, the color of the water getting deeper the further out I went. Her new hair cut had the length to the shoulders, with waves of a bright pink color all the way down. His hair was cropped short, flowing down his shoulders, but there were waves of the same color. Table8から引用
  • 19. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. • プロンプトの難易度で実験結果が変わったの は意外 – 追加分析で、”easy” プロンプトについても ”hard” プロンプトと同様に、何らかの意味的な影 響を受けていることが分かった • “easy” プロンプトでは自動生成文が人間の支援になって いない? • タスクが簡単すぎて自動生成文から得るものがない? 議論点 19
  • 20. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. • 自動生成された文を観測することで、 storiability の高い文を書くタスクをこなす 能力が増強されていることが確認できた – 「観測によるインスピレーション」を実験的に示 した形 • 今後は、 – storiability 以外の指標 – 難易度による変化のさらなる分析 などで「観測によるインスピレーション」 をさらに検証 まとめ 20