Evaluating Visual Representations for Topic Understanding and Their Effects on Manually Generated Topic Labels

•Descargar como PPTX, PDF•

1 recomendación•557 vistas

This is a presentation material used in https://sites.google.com/view/snlp-jp/home/2017.

Evaluating
Visual Representations for Topic Understanding
and
Their Effects on Manually Generated Topic Labels
Author:
Expositor: KAMEDA Akihiro (東南アジア地域研究研究所, Kyoto University)

Summary
• 確率的トピックモデルは要約や分析で有用だけど、トピックの理
解って難しくない？（ここで確率的トピックモデル＝ＬＤＡ）
• ４種類の可視化＋自動付与のラベルをユーザの認知実験を使って比
較したよ。
• シンプルな方が分かりやすく、複雑なのは広い理解に繋がる。
• fw:自動付与はダメだったけど、今回のデータセットで改善可？

自己紹介
論文紹介
• KAMEDA Akihiro
京大の東南アジア地域研究研究所
• 情報学的分析の解釈が課題
• LDAはDH(Digital Humanities)
とかでもよく使われてる
• どう理解可能にするか、
どう解釈するかは課題

Summary
• 確率的トピックモデルは要約や分析で有用だけど、トピックの理
解って難しくない？（ここで確率的トピックモデル＝ＬＤＡ）
• ４種類の可視化＋自動付与のラベルをユーザの認知実験を使って比
較したよ。
• シンプルな方が分かりやすく、複雑なのは広い理解に繋がる。
• fw:自動付与はダメだったけど、今回のデータセットで改善可？

実験プロセス(1) ラベルの生成

実験プロセス(2) ラベルの評価

実験設定
• トピックモデル Mallet実装のLDA、ハイパーパラメータ固定
• トピック数50
• “off the shelf”
• データはNY Times 7156記事(2007年～)
• 自動ラベル:WikipediaをLuceneで上位20語で検索して50記事
を得る
• それらをtf-idfのベクトルで表す、そのベクトル平均に最も近い記事を
centroid として選びその記事名をラベルにする（Lau et al. 2011)
• Mechanical Turk で 600HITS×$0.30+750HITS×$0.50=6万円
ちょい（実験計画法的な工夫もあって削減してる see 3.4, 3.5)

比較対象

結果と考察

複雑だと
時間がかかる

挿話：
トピック一貫性の機械的評価
Topic coherence

https://www.slideshare.net/hoxo_m/coherence-57598192

この指標で↓自信の自己申告を分析

• 自己申告の自信と
Topic Coherence は相関
• 一貫したトピックは自信もってラ
ベリングできる
• Coherenceの有用性の傍証にも
• ラベル所要時間は有意ではなかった
• 諦めも早いから？

ユーザ評価(1)→自動ラベルが弱い

ユーザ評価(2)
• Coherence 4分割のbest, worst
についてのユーザ評価
• アルゴリズムが躍進
• With Bars は
ダメトピックに強い
• メリハリが分かるから？
• 他変わらず

分析
• 短い方が良いと評価されがち
• もちろんワードリスト上位の方がラベルに使われやすい
• 合成語を挙げるにはネットワークが良い
• 上位語がラベルに
好まれるという
既存研究の検証
• 上位語率1割
• うち6割は
WordNetにある
• ネットワークが
上位語ラベルを誘発しやすい

• 自動ラベルは長くて意味が狭くて常に最低評価
• 例：
• Topic 14—{health, drug, medical, research, conditions}
• × health care in the united states
• 〇 health
• Topic 48—{league, team, baseball, players, contract}
• × major league baseball on fox
• 〇 baseball
• WordNet の汎用化には限界
• {san, los, angels, terms, francisco}→ California
• {open, second, final, won, williams}→tennis
• ネットワークは近接性情報が理解促進
• 数が少ないとトピックを誤解する、（特にワードクラウドの）近接性が誤解を生む
Cont. 分析 (in discussion)

まとめ
• ユーザ付与のラベルの質は４つであまり変わらず
• トレードオフ、効率重視ならシンプル vs 広さなら複雑
• ワードリストはラベリング効率の面だけでなく、検索タスクでも有能（既存
研究）
• 自動ラベリング研究への貢献：
• 自動ラベルの使いどころの示唆→一貫性の高いトピックにのみつける
• 訓練データの提供
https://github.com/alisonmsmith/Papers/tree/master/TopicRepresentati
ons
• Future Work
• トピックではなく、トピックモデル全体の理解については未着手
• 理解の広さを測るタスクの設計
• 個人的疑問：ゆっくり考えるからラベルが広くなるのか、可視化手法そのも
のの良さなのか

Recomendados

田畑研ゼミ発表Yes Yes

Centerlossを読んでみた_20170618@abeja

Centerlossを読んでみた_20170618@abeja

Centerlossを読んでみた_20170618@abejaYumaMatsuoka

CVPRプレゼン動画100本サーベイ

CVPRプレゼン動画100本サーベイ

CVPRプレゼン動画100本サーベイYuki Yamashita

Visualizing and understanding neural models in NLP

Visualizing and understanding neural models in NLP

Visualizing and understanding neural models in NLPNaoaki Okazaki

[DL輪読会]Decision Transformer: Reinforcement Learning via Sequence Modeling

[DL輪読会]Decision Transformer: Reinforcement Learning via Sequence Modeling

[DL輪読会]Decision Transformer: Reinforcement Learning via Sequence ModelingDeep Learning JP

220707_ishizone_class_imbalance_SSL.pdf

220707_ishizone_class_imbalance_SSL.pdf

220707_ishizone_class_imbalance_SSL.pdfssuser70401c

[DL輪読会]Object-Oriented Dynamics Predictor (NIPS 2018)

[DL輪読会]Object-Oriented Dynamics Predictor (NIPS 2018)

[DL輪読会]Object-Oriented Dynamics Predictor (NIPS 2018)Deep Learning JP

第1回モデリング勉強会hakoika-itwg

Recomendados

田畑研ゼミ発表Yes Yes

Centerlossを読んでみた_20170618@abeja

Centerlossを読んでみた_20170618@abeja

Centerlossを読んでみた_20170618@abejaYumaMatsuoka

CVPRプレゼン動画100本サーベイ

CVPRプレゼン動画100本サーベイ

CVPRプレゼン動画100本サーベイYuki Yamashita

Visualizing and understanding neural models in NLP

Visualizing and understanding neural models in NLP

Visualizing and understanding neural models in NLPNaoaki Okazaki

[DL輪読会]Decision Transformer: Reinforcement Learning via Sequence Modeling

[DL輪読会]Decision Transformer: Reinforcement Learning via Sequence Modeling

[DL輪読会]Decision Transformer: Reinforcement Learning via Sequence ModelingDeep Learning JP

220707_ishizone_class_imbalance_SSL.pdf

220707_ishizone_class_imbalance_SSL.pdf

220707_ishizone_class_imbalance_SSL.pdfssuser70401c

[DL輪読会]Object-Oriented Dynamics Predictor (NIPS 2018)

[DL輪読会]Object-Oriented Dynamics Predictor (NIPS 2018)

[DL輪読会]Object-Oriented Dynamics Predictor (NIPS 2018)Deep Learning JP

第1回モデリング勉強会hakoika-itwg

[DL輪読会]Meta-Learning Probabilistic Inference for Prediction

[DL輪読会]Meta-Learning Probabilistic Inference for Prediction

[DL輪読会]Meta-Learning Probabilistic Inference for PredictionDeep Learning JP

クイズ・Python勝ち抜きバトル pycon jp_2017

クイズ・Python勝ち抜きバトル pycon jp_2017

クイズ・Python勝ち抜きバトル pycon jp_2017Motohiro Ueki

「一瞬で大切なことを伝える技術」でロジカルシンキング以前の基礎を確実に身につける

「一瞬で大切なことを伝える技術」でロジカルシンキング以前の基礎を確実に身につける

「一瞬で大切なことを伝える技術」でロジカルシンキング以前の基礎を確実に身につけるbijikin

【DL輪読会】論文解説：Offline Reinforcement Learning as One Big Sequence Modeling Problem

【DL輪読会】論文解説：Offline Reinforcement Learning as One Big Sequence Modeling Problem

【DL輪読会】論文解説：Offline Reinforcement Learning as One Big Sequence Modeling ProblemDeep Learning JP

BADUIからユニバーサルデザインへ展開するデザイン教育実践

BADUIからユニバーサルデザインへ展開するデザイン教育実践

BADUIからユニバーサルデザインへ展開するデザイン教育実践saireya _

【論文調査】XAI技術の効能をユーザ実験で評価する研究

【論文調査】XAI技術の効能をユーザ実験で評価する研究

【論文調査】XAI技術の効能をユーザ実験で評価する研究Satoshi Hara

「解説資料」ViTPose: Simple Vision Transformer Baselines for Human Pose Estimation

「解説資料」ViTPose: Simple Vision Transformer Baselines for Human Pose Estimation

「解説資料」ViTPose: Simple Vision Transformer Baselines for Human Pose Estimation Takumi Ohkuma

【DL輪読会】ViTPose: Simple Vision Transformer Baselines for Human Pose Estimation

【DL輪読会】ViTPose: Simple Vision Transformer Baselines for Human Pose Estimation

【DL輪読会】ViTPose: Simple Vision Transformer Baselines for Human Pose EstimationDeep Learning JP

DLhacks paperreading_20150902

DLhacks paperreading_20150902

DLhacks paperreading_20150902Makoto Kawano

Vision and Language（メタサーベイ）

Vision and Language（メタサーベイ）

Vision and Language（メタサーベイ）cvpaper. challenge

鷲崎愛媛大学講演-プロジェクト型演習2014年12月15日

鷲崎愛媛大学講演-プロジェクト型演習2014年12月15日

鷲崎愛媛大学講演-プロジェクト型演習2014年12月15日Hironori Washizaki

【メタサーベイ】Vision and Language のトップ研究室/研究者

【メタサーベイ】Vision and Language のトップ研究室/研究者

【メタサーベイ】Vision and Language のトップ研究室/研究者cvpaper. challenge

Summary: A Sense-Based Translation Model for Statistical Machine Translation

Summary: A Sense-Based Translation Model for Statistical Machine Translation

Summary: A Sense-Based Translation Model for Statistical Machine TranslationHiroshi Matsumoto

AgileTourOsaka2011 関係者に理解してもらえるアジャイル開発にむけて

AgileTourOsaka2011 関係者に理解してもらえるアジャイル開発にむけて

AgileTourOsaka2011 関係者に理解してもらえるアジャイル開発にむけてShuji Morisaki

How to use in R model-agnostic data explanation with DALEX & iml

How to use in R model-agnostic data explanation with DALEX & iml

How to use in R model-agnostic data explanation with DALEX & imlSatoshi Kato

入門トピックモデル + Google colab で試せる実装

入門トピックモデル + Google colab で試せる実装

入門トピックモデル + Google colab で試せる実装pon get

iPRES Day 3 instruction

iPRES Day 3 instruction

iPRES Day 3 instructionAkihiro Kameda

ISWC2016 1-slide-survey

ISWC2016 1-slide-survey

ISWC2016 1-slide-surveyAkihiro Kameda

いかにしてデータを手に入れるか

いかにしてデータを手に入れるか

いかにしてデータを手に入れるかAkihiro Kameda

"Joint Extraction of Events and Entities within a Document Context"の解説

"Joint Extraction of Events and Entities within a Document Context"の解説

"Joint Extraction of Events and Entities within a Document Context"の解説Akihiro Kameda

Iodd2015osaka kameda-slideshare

Iodd2015osaka kameda-slideshare

Iodd2015osaka kameda-slideshareAkihiro Kameda

PATTY: A Taxonomy of Relational Patterns with Semantic Types

PATTY: A Taxonomy of Relational Patterns with Semantic Types

PATTY: A Taxonomy of Relational Patterns with Semantic TypesAkihiro Kameda

Más contenido relacionado

Similar a Evaluating Visual Representations for Topic Understanding and Their Effects on Manually Generated Topic Labels

[DL輪読会]Meta-Learning Probabilistic Inference for Prediction

[DL輪読会]Meta-Learning Probabilistic Inference for Prediction

[DL輪読会]Meta-Learning Probabilistic Inference for PredictionDeep Learning JP

クイズ・Python勝ち抜きバトル pycon jp_2017

クイズ・Python勝ち抜きバトル pycon jp_2017

クイズ・Python勝ち抜きバトル pycon jp_2017Motohiro Ueki

「一瞬で大切なことを伝える技術」でロジカルシンキング以前の基礎を確実に身につける

「一瞬で大切なことを伝える技術」でロジカルシンキング以前の基礎を確実に身につける

「一瞬で大切なことを伝える技術」でロジカルシンキング以前の基礎を確実に身につけるbijikin

【DL輪読会】論文解説：Offline Reinforcement Learning as One Big Sequence Modeling Problem

【DL輪読会】論文解説：Offline Reinforcement Learning as One Big Sequence Modeling Problem

【DL輪読会】論文解説：Offline Reinforcement Learning as One Big Sequence Modeling ProblemDeep Learning JP

BADUIからユニバーサルデザインへ展開するデザイン教育実践

BADUIからユニバーサルデザインへ展開するデザイン教育実践

BADUIからユニバーサルデザインへ展開するデザイン教育実践saireya _

【論文調査】XAI技術の効能をユーザ実験で評価する研究

【論文調査】XAI技術の効能をユーザ実験で評価する研究

【論文調査】XAI技術の効能をユーザ実験で評価する研究Satoshi Hara

「解説資料」ViTPose: Simple Vision Transformer Baselines for Human Pose Estimation

「解説資料」ViTPose: Simple Vision Transformer Baselines for Human Pose Estimation

「解説資料」ViTPose: Simple Vision Transformer Baselines for Human Pose Estimation Takumi Ohkuma

【DL輪読会】ViTPose: Simple Vision Transformer Baselines for Human Pose Estimation

【DL輪読会】ViTPose: Simple Vision Transformer Baselines for Human Pose Estimation

【DL輪読会】ViTPose: Simple Vision Transformer Baselines for Human Pose EstimationDeep Learning JP

DLhacks paperreading_20150902

DLhacks paperreading_20150902

DLhacks paperreading_20150902Makoto Kawano

Vision and Language（メタサーベイ）

Vision and Language（メタサーベイ）

Vision and Language（メタサーベイ）cvpaper. challenge

鷲崎愛媛大学講演-プロジェクト型演習2014年12月15日

鷲崎愛媛大学講演-プロジェクト型演習2014年12月15日

鷲崎愛媛大学講演-プロジェクト型演習2014年12月15日Hironori Washizaki

【メタサーベイ】Vision and Language のトップ研究室/研究者

【メタサーベイ】Vision and Language のトップ研究室/研究者

【メタサーベイ】Vision and Language のトップ研究室/研究者cvpaper. challenge

Summary: A Sense-Based Translation Model for Statistical Machine Translation

Summary: A Sense-Based Translation Model for Statistical Machine Translation

Summary: A Sense-Based Translation Model for Statistical Machine TranslationHiroshi Matsumoto

AgileTourOsaka2011 関係者に理解してもらえるアジャイル開発にむけて

AgileTourOsaka2011 関係者に理解してもらえるアジャイル開発にむけて

AgileTourOsaka2011 関係者に理解してもらえるアジャイル開発にむけてShuji Morisaki

How to use in R model-agnostic data explanation with DALEX & iml

How to use in R model-agnostic data explanation with DALEX & iml

How to use in R model-agnostic data explanation with DALEX & imlSatoshi Kato

入門トピックモデル + Google colab で試せる実装

入門トピックモデル + Google colab で試せる実装

入門トピックモデル + Google colab で試せる実装pon get

Similar a Evaluating Visual Representations for Topic Understanding and Their Effects on Manually Generated Topic Labels (16)

[DL輪読会]Meta-Learning Probabilistic Inference for Prediction

[DL輪読会]Meta-Learning Probabilistic Inference for Prediction

[DL輪読会]Meta-Learning Probabilistic Inference for Prediction

クイズ・Python勝ち抜きバトル pycon jp_2017

クイズ・Python勝ち抜きバトル pycon jp_2017

クイズ・Python勝ち抜きバトル pycon jp_2017

「一瞬で大切なことを伝える技術」でロジカルシンキング以前の基礎を確実に身につける

「一瞬で大切なことを伝える技術」でロジカルシンキング以前の基礎を確実に身につける

「一瞬で大切なことを伝える技術」でロジカルシンキング以前の基礎を確実に身につける

【DL輪読会】論文解説：Offline Reinforcement Learning as One Big Sequence Modeling Problem

【DL輪読会】論文解説：Offline Reinforcement Learning as One Big Sequence Modeling Problem

【DL輪読会】論文解説：Offline Reinforcement Learning as One Big Sequence Modeling Problem

BADUIからユニバーサルデザインへ展開するデザイン教育実践

BADUIからユニバーサルデザインへ展開するデザイン教育実践

BADUIからユニバーサルデザインへ展開するデザイン教育実践

【論文調査】XAI技術の効能をユーザ実験で評価する研究

【論文調査】XAI技術の効能をユーザ実験で評価する研究

【論文調査】XAI技術の効能をユーザ実験で評価する研究

「解説資料」ViTPose: Simple Vision Transformer Baselines for Human Pose Estimation

「解説資料」ViTPose: Simple Vision Transformer Baselines for Human Pose Estimation

「解説資料」ViTPose: Simple Vision Transformer Baselines for Human Pose Estimation

【DL輪読会】ViTPose: Simple Vision Transformer Baselines for Human Pose Estimation

【DL輪読会】ViTPose: Simple Vision Transformer Baselines for Human Pose Estimation

【DL輪読会】ViTPose: Simple Vision Transformer Baselines for Human Pose Estimation

DLhacks paperreading_20150902

DLhacks paperreading_20150902

DLhacks paperreading_20150902

Vision and Language（メタサーベイ）

Vision and Language（メタサーベイ）

Vision and Language（メタサーベイ）

鷲崎愛媛大学講演-プロジェクト型演習2014年12月15日

鷲崎愛媛大学講演-プロジェクト型演習2014年12月15日

鷲崎愛媛大学講演-プロジェクト型演習2014年12月15日

【メタサーベイ】Vision and Language のトップ研究室/研究者

【メタサーベイ】Vision and Language のトップ研究室/研究者

【メタサーベイ】Vision and Language のトップ研究室/研究者

Summary: A Sense-Based Translation Model for Statistical Machine Translation

Summary: A Sense-Based Translation Model for Statistical Machine Translation

Summary: A Sense-Based Translation Model for Statistical Machine Translation

AgileTourOsaka2011 関係者に理解してもらえるアジャイル開発にむけて

AgileTourOsaka2011 関係者に理解してもらえるアジャイル開発にむけて

AgileTourOsaka2011 関係者に理解してもらえるアジャイル開発にむけて

How to use in R model-agnostic data explanation with DALEX & iml

How to use in R model-agnostic data explanation with DALEX & iml

How to use in R model-agnostic data explanation with DALEX & iml

入門トピックモデル + Google colab で試せる実装

入門トピックモデル + Google colab で試せる実装

入門トピックモデル + Google colab で試せる実装

Más de Akihiro Kameda

iPRES Day 3 instruction

iPRES Day 3 instruction

iPRES Day 3 instructionAkihiro Kameda

ISWC2016 1-slide-survey

ISWC2016 1-slide-survey

ISWC2016 1-slide-surveyAkihiro Kameda

いかにしてデータを手に入れるか

いかにしてデータを手に入れるか

いかにしてデータを手に入れるかAkihiro Kameda

"Joint Extraction of Events and Entities within a Document Context"の解説

"Joint Extraction of Events and Entities within a Document Context"の解説

"Joint Extraction of Events and Entities within a Document Context"の解説Akihiro Kameda

Iodd2015osaka kameda-slideshare

Iodd2015osaka kameda-slideshare

Iodd2015osaka kameda-slideshareAkihiro Kameda

PATTY: A Taxonomy of Relational Patterns with Semantic Types

PATTY: A Taxonomy of Relational Patterns with Semantic Types

PATTY: A Taxonomy of Relational Patterns with Semantic TypesAkihiro Kameda

Reference Scope Identification in Citing Sentences

Reference Scope Identification in Citing Sentences

Reference Scope Identification in Citing SentencesAkihiro Kameda

Más de Akihiro Kameda (7)

iPRES Day 3 instruction

iPRES Day 3 instruction

iPRES Day 3 instruction

ISWC2016 1-slide-survey

ISWC2016 1-slide-survey

ISWC2016 1-slide-survey

いかにしてデータを手に入れるか

いかにしてデータを手に入れるか

いかにしてデータを手に入れるか

"Joint Extraction of Events and Entities within a Document Context"の解説

"Joint Extraction of Events and Entities within a Document Context"の解説

"Joint Extraction of Events and Entities within a Document Context"の解説

Iodd2015osaka kameda-slideshare

Iodd2015osaka kameda-slideshare

Iodd2015osaka kameda-slideshare

PATTY: A Taxonomy of Relational Patterns with Semantic Types

PATTY: A Taxonomy of Relational Patterns with Semantic Types

PATTY: A Taxonomy of Relational Patterns with Semantic Types

Reference Scope Identification in Citing Sentences

Reference Scope Identification in Citing Sentences

Reference Scope Identification in Citing Sentences

Último

LoRaWANスマート距離検出センサー DS20L カタログ LiDARデバイス

LoRaWANスマート距離検出センサー DS20L カタログ LiDARデバイス

LoRaWANスマート距離検出センサー DS20L カタログ LiDARデバイスCRI Japan, Inc.

Amazon SES を勉強してみるその３2024/04/26の勉強会で発表されたものです。

Amazon SES を勉強してみるその３2024/04/26の勉強会で発表されたものです。

Amazon SES を勉強してみるその３2024/04/26の勉強会で発表されたものです。iPride Co., Ltd.

Amazon SES を勉強してみるその２2024/04/26の勉強会で発表されたものです。

Amazon SES を勉強してみるその２2024/04/26の勉強会で発表されたものです。

Amazon SES を勉強してみるその２2024/04/26の勉強会で発表されたものです。iPride Co., Ltd.

知識ゼロの営業マンでもできた！超速で初心者を脱する、悪魔的学習ステップ3選.pptx

知識ゼロの営業マンでもできた！超速で初心者を脱する、悪魔的学習ステップ3選.pptx

知識ゼロの営業マンでもできた！超速で初心者を脱する、悪魔的学習ステップ3選.pptxsn679259

LoRaWAN スマート距離検出デバイスDS20L日本語マニュアル

LoRaWAN スマート距離検出デバイスDS20L日本語マニュアル

LoRaWAN スマート距離検出デバイスDS20L日本語マニュアルCRI Japan, Inc.

新人研修　後半 2024/04/26の勉強会で発表されたものです。

新人研修　後半 2024/04/26の勉強会で発表されたものです。

新人研修　後半 2024/04/26の勉強会で発表されたものです。iPride Co., Ltd.

論文紹介：Selective Structured State-Spaces for Long-Form Video Understanding

論文紹介：Selective Structured State-Spaces for Long-Form Video Understanding

論文紹介：Selective Structured State-Spaces for Long-Form Video UnderstandingToru Tamaki

Utilizing Ballerina for Cloud Native Integrations

Utilizing Ballerina for Cloud Native Integrations

Utilizing Ballerina for Cloud Native IntegrationsWSO2

論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games

論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games

論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Gamesatsushi061452

論文紹介：Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...

論文紹介：Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...

論文紹介：Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...Toru Tamaki

Último (10)

LoRaWANスマート距離検出センサー DS20L カタログ LiDARデバイス

LoRaWANスマート距離検出センサー DS20L カタログ LiDARデバイス

LoRaWANスマート距離検出センサー DS20L カタログ LiDARデバイス

Amazon SES を勉強してみるその３2024/04/26の勉強会で発表されたものです。

Amazon SES を勉強してみるその３2024/04/26の勉強会で発表されたものです。

Amazon SES を勉強してみるその３2024/04/26の勉強会で発表されたものです。

Amazon SES を勉強してみるその２2024/04/26の勉強会で発表されたものです。

Amazon SES を勉強してみるその２2024/04/26の勉強会で発表されたものです。

Amazon SES を勉強してみるその２2024/04/26の勉強会で発表されたものです。

知識ゼロの営業マンでもできた！超速で初心者を脱する、悪魔的学習ステップ3選.pptx

知識ゼロの営業マンでもできた！超速で初心者を脱する、悪魔的学習ステップ3選.pptx

知識ゼロの営業マンでもできた！超速で初心者を脱する、悪魔的学習ステップ3選.pptx

LoRaWAN スマート距離検出デバイスDS20L日本語マニュアル

LoRaWAN スマート距離検出デバイスDS20L日本語マニュアル

LoRaWAN スマート距離検出デバイスDS20L日本語マニュアル

新人研修　後半 2024/04/26の勉強会で発表されたものです。

新人研修　後半 2024/04/26の勉強会で発表されたものです。

新人研修　後半 2024/04/26の勉強会で発表されたものです。

論文紹介：Selective Structured State-Spaces for Long-Form Video Understanding

論文紹介：Selective Structured State-Spaces for Long-Form Video Understanding

論文紹介：Selective Structured State-Spaces for Long-Form Video Understanding

Utilizing Ballerina for Cloud Native Integrations

Utilizing Ballerina for Cloud Native Integrations

Utilizing Ballerina for Cloud Native Integrations

論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games

論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games

論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games

論文紹介：Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...

論文紹介：Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...

論文紹介：Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...

Evaluating Visual Representations for Topic Understanding and Their Effects on Manually Generated Topic Labels

1. Evaluating Visual Representations for Topic Understanding and Their Effects on Manually Generated Topic Labels Author: Expositor: KAMEDA Akihiro (東南アジア地域研究研究所, Kyoto University)

2. Summary • 確率的トピックモデルは要約や分析で有用だけど、トピックの理解って難しくない？（ここで確率的トピックモデル＝ＬＤＡ） • ４種類の可視化＋自動付与のラベルをユーザの認知実験を使って比較したよ。 • シンプルな方が分かりやすく、複雑なのは広い理解に繋がる。 • fw:自動付与はダメだったけど、今回のデータセットで改善可？

3. 自己紹介論文紹介 • KAMEDA Akihiro 京大の東南アジア地域研究研究所 • 情報学的分析の解釈が課題 • LDAはDH(Digital Humanities) とかでもよく使われてる • どう理解可能にするか、どう解釈するかは課題

4. Summary • 確率的トピックモデルは要約や分析で有用だけど、トピックの理解って難しくない？（ここで確率的トピックモデル＝ＬＤＡ） • ４種類の可視化＋自動付与のラベルをユーザの認知実験を使って比較したよ。 • シンプルな方が分かりやすく、複雑なのは広い理解に繋がる。 • fw:自動付与はダメだったけど、今回のデータセットで改善可？

5.

6. 実験プロセス(1) ラベルの生成

7. 実験プロセス(2) ラベルの評価

8. 実験設定 • トピックモデル Mallet実装のLDA、ハイパーパラメータ固定 • トピック数50 • “off the shelf” • データはNY Times 7156記事(2007年～) • 自動ラベル:WikipediaをLuceneで上位20語で検索して50記事を得る • それらをtf-idfのベクトルで表す、そのベクトル平均に最も近い記事を centroid として選びその記事名をラベルにする（Lau et al. 2011) • Mechanical Turk で 600HITS×$0.30+750HITS×$0.50=6万円ちょい（実験計画法的な工夫もあって削減してる see 3.4, 3.5)

9. 比較対象

10. 結果と考察

11. 複雑だと時間がかかる

12. 挿話：トピック一貫性の機械的評価 Topic coherence

13. https://www.slideshare.net/hoxo_m/coherence-57598192

14.

15.

16.

17.

18.

19. この指標で↓自信の自己申告を分析

20. • 自己申告の自信と Topic Coherence は相関 • 一貫したトピックは自信もってラベリングできる • Coherenceの有用性の傍証にも • ラベル所要時間は有意ではなかった • 諦めも早いから？

21. ユーザ評価(1)→自動ラベルが弱い

22. ユーザ評価(2) • Coherence 4分割のbest, worst についてのユーザ評価 • アルゴリズムが躍進 • With Bars はダメトピックに強い • メリハリが分かるから？ • 他変わらず

23. 分析 • 短い方が良いと評価されがち • もちろんワードリスト上位の方がラベルに使われやすい • 合成語を挙げるにはネットワークが良い • 上位語がラベルに好まれるという既存研究の検証 • 上位語率1割 • うち6割は WordNetにある • ネットワークが上位語ラベルを誘発しやすい

24. • 自動ラベルは長くて意味が狭くて常に最低評価 • 例： • Topic 14—{health, drug, medical, research, conditions} • × health care in the united states • 〇 health • Topic 48—{league, team, baseball, players, contract} • × major league baseball on fox • 〇 baseball • WordNet の汎用化には限界 • {san, los, angels, terms, francisco}→ California • {open, second, final, won, williams}→tennis • ネットワークは近接性情報が理解促進 • 数が少ないとトピックを誤解する、（特にワードクラウドの）近接性が誤解を生む Cont. 分析 (in discussion)

25. まとめ • ユーザ付与のラベルの質は４つであまり変わらず • トレードオフ、効率重視ならシンプル vs 広さなら複雑 • ワードリストはラベリング効率の面だけでなく、検索タスクでも有能（既存研究） • 自動ラベリング研究への貢献： • 自動ラベルの使いどころの示唆→一貫性の高いトピックにのみつける • 訓練データの提供 https://github.com/alisonmsmith/Papers/tree/master/TopicRepresentati ons • Future Work • トピックではなく、トピックモデル全体の理解については未着手 • 理解の広さを測るタスクの設計 • 個人的疑問：ゆっくり考えるからラベルが広くなるのか、可視化手法そのものの良さなのか