Enviar búsqueda
Cargar
PGXによる学術文献データの分析
•
0 recomendaciones
•
190 vistas
M
Mio Takei
Seguir
PGXによる学術文献データの分析
Leer menos
Leer más
Software
Denunciar
Compartir
Denunciar
Compartir
1 de 6
Recomendados
レコードリンケージに基づく科研費分野-WoS分野マッピング
レコードリンケージに基づく科研費分野-WoS分野マッピング
National Institute of Informatics
Towards Knowledge-Based Personalized Product Description Generation in E-comm...
Towards Knowledge-Based Personalized Product Description Generation in E-comm...
harmonylab
『逆転オセロニア』における運用効率化支援 〜デッキログのデータマイニング〜
『逆転オセロニア』における運用効率化支援 〜デッキログのデータマイニング〜
DeNA
Visualization of life science research by using MeSH and GIS techniques
Visualization of life science research by using MeSH and GIS techniques
Masashi Shirabe
レコードリンケージに基づく科研費分野-WoS分野マッピングの導出
レコードリンケージに基づく科研費分野-WoS分野マッピングの導出
National Institute of Informatics
GeneratingWikipedia_ICLR18_論文紹介
GeneratingWikipedia_ICLR18_論文紹介
Masayoshi Kondo
SQiP20222投稿応援フォーラム「開発現場で役立つ論文の書き方のお話」
SQiP20222投稿応援フォーラム「開発現場で役立つ論文の書き方のお話」
Makoto SAKAI
研究支援のためのアカデミッククラウド(CloudWeek2013@Hokkaido University)
研究支援のためのアカデミッククラウド(CloudWeek2013@Hokkaido University)
Masaharu Munetomo
Recomendados
レコードリンケージに基づく科研費分野-WoS分野マッピング
レコードリンケージに基づく科研費分野-WoS分野マッピング
National Institute of Informatics
Towards Knowledge-Based Personalized Product Description Generation in E-comm...
Towards Knowledge-Based Personalized Product Description Generation in E-comm...
harmonylab
『逆転オセロニア』における運用効率化支援 〜デッキログのデータマイニング〜
『逆転オセロニア』における運用効率化支援 〜デッキログのデータマイニング〜
DeNA
Visualization of life science research by using MeSH and GIS techniques
Visualization of life science research by using MeSH and GIS techniques
Masashi Shirabe
レコードリンケージに基づく科研費分野-WoS分野マッピングの導出
レコードリンケージに基づく科研費分野-WoS分野マッピングの導出
National Institute of Informatics
GeneratingWikipedia_ICLR18_論文紹介
GeneratingWikipedia_ICLR18_論文紹介
Masayoshi Kondo
SQiP20222投稿応援フォーラム「開発現場で役立つ論文の書き方のお話」
SQiP20222投稿応援フォーラム「開発現場で役立つ論文の書き方のお話」
Makoto SAKAI
研究支援のためのアカデミッククラウド(CloudWeek2013@Hokkaido University)
研究支援のためのアカデミッククラウド(CloudWeek2013@Hokkaido University)
Masaharu Munetomo
Survey of Scientific Publication Analysis by NLP and CV
Survey of Scientific Publication Analysis by NLP and CV
Shintaro Yamamoto
Generating Better Search Engine Text Advertisements with Deep Reinforcement L...
Generating Better Search Engine Text Advertisements with Deep Reinforcement L...
harmonylab
ShunGendo_fit2021
ShunGendo_fit2021
Matsushita Laboratory
20151029 CODATA
20151029 CODATA
Taro misumi
[DL輪読会]Meta-Learning Probabilistic Inference for Prediction
[DL輪読会]Meta-Learning Probabilistic Inference for Prediction
Deep Learning JP
CNNの構造最適化手法について
CNNの構造最適化手法について
MasanoriSuganuma
ユーザーサイド情報検索システム
ユーザーサイド情報検索システム
joisino
午後の講座 : インパクトファクターと論文へのアクセス改善(2018年7月)
午後の講座 : インパクトファクターと論文へのアクセス改善(2018年7月)
Northern Campus Library, Hokkaido University
大規模医療データベースを活用した治療効果研究の計画と報告:DB研究の手続き
大規模医療データベースを活用した治療効果研究の計画と報告:DB研究の手続き
Sayuri Shimizu
科学技術イノベーション政策におけるBig-Dataの利活用促進 SPIAS: SciREX 政策形成インテリジェント支援システムの構想
科学技術イノベーション政策におけるBig-Dataの利活用促進 SPIAS: SciREX 政策形成インテリジェント支援システムの構想
scirexcenter
鷲崎 メトリクスの基礎とGQM法によるゴール指向の測定 2014年12月18日 日本科学技術連名SQiP研究会 演習コースI ソフトウェア工学の基礎
鷲崎 メトリクスの基礎とGQM法によるゴール指向の測定 2014年12月18日 日本科学技術連名SQiP研究会 演習コースI ソフトウェア工学の基礎
Hironori Washizaki
Más contenido relacionado
Similar a PGXによる学術文献データの分析
Survey of Scientific Publication Analysis by NLP and CV
Survey of Scientific Publication Analysis by NLP and CV
Shintaro Yamamoto
Generating Better Search Engine Text Advertisements with Deep Reinforcement L...
Generating Better Search Engine Text Advertisements with Deep Reinforcement L...
harmonylab
ShunGendo_fit2021
ShunGendo_fit2021
Matsushita Laboratory
20151029 CODATA
20151029 CODATA
Taro misumi
[DL輪読会]Meta-Learning Probabilistic Inference for Prediction
[DL輪読会]Meta-Learning Probabilistic Inference for Prediction
Deep Learning JP
CNNの構造最適化手法について
CNNの構造最適化手法について
MasanoriSuganuma
ユーザーサイド情報検索システム
ユーザーサイド情報検索システム
joisino
午後の講座 : インパクトファクターと論文へのアクセス改善(2018年7月)
午後の講座 : インパクトファクターと論文へのアクセス改善(2018年7月)
Northern Campus Library, Hokkaido University
大規模医療データベースを活用した治療効果研究の計画と報告:DB研究の手続き
大規模医療データベースを活用した治療効果研究の計画と報告:DB研究の手続き
Sayuri Shimizu
科学技術イノベーション政策におけるBig-Dataの利活用促進 SPIAS: SciREX 政策形成インテリジェント支援システムの構想
科学技術イノベーション政策におけるBig-Dataの利活用促進 SPIAS: SciREX 政策形成インテリジェント支援システムの構想
scirexcenter
鷲崎 メトリクスの基礎とGQM法によるゴール指向の測定 2014年12月18日 日本科学技術連名SQiP研究会 演習コースI ソフトウェア工学の基礎
鷲崎 メトリクスの基礎とGQM法によるゴール指向の測定 2014年12月18日 日本科学技術連名SQiP研究会 演習コースI ソフトウェア工学の基礎
Hironori Washizaki
Similar a PGXによる学術文献データの分析
(11)
Survey of Scientific Publication Analysis by NLP and CV
Survey of Scientific Publication Analysis by NLP and CV
Generating Better Search Engine Text Advertisements with Deep Reinforcement L...
Generating Better Search Engine Text Advertisements with Deep Reinforcement L...
ShunGendo_fit2021
ShunGendo_fit2021
20151029 CODATA
20151029 CODATA
[DL輪読会]Meta-Learning Probabilistic Inference for Prediction
[DL輪読会]Meta-Learning Probabilistic Inference for Prediction
CNNの構造最適化手法について
CNNの構造最適化手法について
ユーザーサイド情報検索システム
ユーザーサイド情報検索システム
午後の講座 : インパクトファクターと論文へのアクセス改善(2018年7月)
午後の講座 : インパクトファクターと論文へのアクセス改善(2018年7月)
大規模医療データベースを活用した治療効果研究の計画と報告:DB研究の手続き
大規模医療データベースを活用した治療効果研究の計画と報告:DB研究の手続き
科学技術イノベーション政策におけるBig-Dataの利活用促進 SPIAS: SciREX 政策形成インテリジェント支援システムの構想
科学技術イノベーション政策におけるBig-Dataの利活用促進 SPIAS: SciREX 政策形成インテリジェント支援システムの構想
鷲崎 メトリクスの基礎とGQM法によるゴール指向の測定 2014年12月18日 日本科学技術連名SQiP研究会 演習コースI ソフトウェア工学の基礎
鷲崎 メトリクスの基礎とGQM法によるゴール指向の測定 2014年12月18日 日本科学技術連名SQiP研究会 演習コースI ソフトウェア工学の基礎
PGXによる学術文献データの分析
1.
PGXによる学術文献データの分析 PGXユーザー勉強会#5 Mio Takei, Keisuke
Honda
2.
前回のおさらい • プロジェクト概要 – 研究成果(論文等)から抽出されるデータを用いて、研究機関、 研究者のパフォーマンスを把握するための指標(インデックス)を開発 –
本プロジェクトでは、「論文の引用-被引用ネットワーク」のデータを利用した、 研究における「異分野融合の進展や効果を公正かつ適切に評価」する指標を ターゲット – 以下の流れで分析中 2 引⽤-被引⽤ネットワーク:有向⾮巡回グラフ 論⽂A 論⽂B 論⽂C 論⽂D 関係データ⾏列表現 雑誌に付与された分野IDのセットで集約 l個のブロックに分割 k 個 の ブ ロ ッ ク に 分 割 確率的ブロックモデル(SBM)を⽤い クラスタ分類
3.
今回の内容 • 前回までの結果をPGX のデータに変換し、分析 分野ID
ごとの引用-被引用関係の関係データ行列 確率的ブロックモデル(SBM)を用いたクラスタ結果 (15クラスタ数のものを利用) 分野ID 1、5 C14 分野ID 3、6 C9 … 分野ID=1 クラスタ番号=14 分野ID=2 クラスタ番号=13 引用数=16852 分野ID=3 クラスタ番号=9 引用数=9 引用数=992 PGX 用のグラフデータに変換 … …
4.
やってみた データのロード pgx> G =
session.readGraphWithProperties("adj_list_cluster.json") pgx> analyst.pagerank(G, 0.0001, 0.85, 100) ページランクの計算 クラスタごとにページランクを合計し、合計したページランクが低い順に表示 pgx> G.queryPgql(" pgx> SELECT n.cluster, sum(n.pagerank) AS sum_pagerank pgx> WHERE (n) pgx> GROUP BY n.cluster ORDER BY sum_pagerank pgx> ").getResults() ==> n.cluster(INTEGER)=0 sum_pagerank(DOUBLE)=0.0110773348639506 ==> n.cluster(INTEGER)=11 sum_pagerank(DOUBLE)=0.020312595090387905 ==> n.cluster(INTEGER)=8 sum_pagerank(DOUBLE)=0.03755630103537656 ==> n.cluster(INTEGER)=5 sum_pagerank(DOUBLE)=0.04089094952370574 ==> n.cluster(INTEGER)=12 sum_pagerank(DOUBLE)=0.06018916942420414 ==> n.cluster(INTEGER)=7 sum_pagerank(DOUBLE)=0.07208125032160698 ==> n.cluster(INTEGER)=6 sum_pagerank(DOUBLE)=0.07344488328895958 ==> n.cluster(INTEGER)=2 sum_pagerank(DOUBLE)=0.07596533950324032 ==> n.cluster(INTEGER)=9 sum_pagerank(DOUBLE)=0.07861241730109866 ==> n.cluster(INTEGER)=1 sum_pagerank(DOUBLE)=0.08369227392733092 [rest of output truncated] クラスタ=0の ページランクの 合計が最も低い あまり引用されていな い分野グループ
5.
やってみた データのロード pgx> G =
session.readGraphWithProperties("adj_list_cluster.json") pgx> analyst.pagerank(G, 0.0001, 0.85, 100) ページランクの計算 クラスタごとにページランクを計算し、ページランクが低い順に表示 pgx> G.queryPgql(" pgx> SELECT n.cluster, sum(n.pagerank) AS sum_pagerank pgx> WHERE (n) pgx> GROUP BY n.cluster ORDER BY sum_pagerank pgx> ").getResults() ==> n.cluster(INTEGER)=0 sum_pagerank(DOUBLE)=0.0110773348639506 ==> n.cluster(INTEGER)=11 sum_pagerank(DOUBLE)=0.020312595090387905 ==> n.cluster(INTEGER)=8 sum_pagerank(DOUBLE)=0.03755630103537656 ==> n.cluster(INTEGER)=5 sum_pagerank(DOUBLE)=0.04089094952370574 ==> n.cluster(INTEGER)=12 sum_pagerank(DOUBLE)=0.06018916942420414 ==> n.cluster(INTEGER)=7 sum_pagerank(DOUBLE)=0.07208125032160698 ==> n.cluster(INTEGER)=6 sum_pagerank(DOUBLE)=0.07344488328895958 ==> n.cluster(INTEGER)=2 sum_pagerank(DOUBLE)=0.07596533950324032 ==> n.cluster(INTEGER)=9 sum_pagerank(DOUBLE)=0.07861241730109866 ==> n.cluster(INTEGER)=1 sum_pagerank(DOUBLE)=0.08369227392733092 [rest of output truncated] クラスタ=0の ページランクの 合計が最も低い あまり引用されていな い分野グループ クラスタ=0 医療と倫理や心理のクラスタ 医療、ヘルスケア、倫理学、心理学、犯 罪学、社会福祉 クラスタ=11 物質や材料などを中心とした工学 寄りのクラスタ 物質化学(特性評価・テスト・コーティ ング・フィルム)、鉱業・鉱物加工、 生物多様性保全、工学、力学、 ナノサイエンス
6.
今後の課題 • 分野ID毎の論文数の偏りの補正 – 分野ID
毎に論文数が異なるため、正規化が必要 – Green-Marl を利用してPMI(Pointwise Mutual Information)を実装し実現予定 • 異分野度を評価する指標の算出方法の検討 – とある分野ID の論文がとある分野ID に引用されていた場合、 それがどれだけ異分野融合を起こしているかのスコアリングをしたい – Elastic Map を利用して算出することを検討中 6