SlideShare una empresa de Scribd logo
1 de 49
Descargar para leer sin conexión
なぜ研究者の名寄せが必要か
 ~世界の動向と研究者リゾルバー~
CSI委託事業ワークショップ「名寄せのこれから~研究者IDサミット~」
     2011年2月17日,学術総合センター,主催:金沢大学


        蔵川 圭
     国立情報学研究所
学術コンテンツサービス研究開発センター


                         http://www.nii.ac.jp/cscenter/
学術研究における貢献
• 学術研究成果の多くは論文として出版され公表
  される
• すでに存在する論文を引用しながらそれが表す
  知識の体系を位置づける
• 誰が貢献したか、どのような組織が貢献したか
  がわかるように内容とともに著者名や所属組織
  名が明記される。助成機関に対して謝辞を加え
  ることも多い
• ある研究者がどのくらい知識の体系化に貢献し
  たかを測ってみたいとき、研究者の論文を並べ
  てみればよい
                                        2
                http://www.nii.ac.jp/cscenter/
名前の曖昧性の問題
     (Name Ambiguity Problem)
•   同姓同名
•   旧姓
•   ペンネーム
•   漢字異体字
•   ジャーナルごとに異なる姓名表記フォーマット
    – 姓名の順
    – イニシャル表記
    – 大文字・小文字
                                               3
                       http://www.nii.ac.jp/cscenter/
名前の翻字(transliterate)
• ラテン文字への翻字によって、同姓同名が増
  える

王伟,王薇,王维,王蔚,汪卫,汪玮,汪威,汪巍


         Wei Wang

       “Which Wei Wang?”,Phys. Rev. Lett. 99, 230001 (2007)
       DOI:10.1103/PhysRevLett.99.230001                 4
                                   http://www.nii.ac.jp/cscenter/
名寄せ(Name Disambiguation)
• 名前の問題を解決して、同一性を判定すること
  を「名寄せ」という
• 研究者の名寄せによって、
 – 研究者ごとに正確に論文やその他研究成果をリスト
   化でき、リストは知識体系への貢献度を正確に測る
   情報源となる
 – 研究者が正確に過去の業績によってプロファイルさ
   れることで、そのプロファイルは新たな研究チームを
   構成する際の正確な情報源として活用できる
 – 学術コミュニケーションにおける様々な場面において
   、研究者を特定した情報交換が可能となる
                                          5
                  http://www.nii.ac.jp/cscenter/
日本の図書館目録
• NACSIS-CAT
  –   国立情報学研究所の運営
  –   日本の大学図書館の所蔵する図書・雑誌の総合目録
  –   洋書が多く含まれる
  –   USMARC準拠
  –   日本目録規則,およびAACR2
• JAPAN/MARC
  – 国立国会図書館の運営
  – 国会図書館の所蔵する,日本で刊行された出版物および外国で刊行された日
    本語出版物の目録
  – UNIMARC準拠            目録
  – 日本目録規則                     参照する
• TRC/MARC                  参照する
  –   図書館流通センターの運営     書誌           典拠
  –   日本で刊行される出版物の目録
  –   UNIMARC準拠
  –   日本目録規則                 著者名        (統一)書名
                                                       6
                               http://www.nii.ac.jp/cscenter/
図書館目録の著者名典拠
•   NACSIS-CAT著者名典拠ファイル
     – 個人名,団体名の典拠
     – 個人名1,263,685件(西洋人著者名含む, 2008年12月18日)
•   JAPAN/MARC典拠ファイル
     – 個人名,家名,団体名,および統一書名の典拠
     – 個人名681,924件(西洋人著者名含む, 2008年7月5日)
•   TRC/MARC著者名典拠ファイル
     – 個人名,機関名の典拠
     – 個人名566,249件(西洋人著者名含む, 2009年3月29日)
    人名データベース             登録件数      同一姓名が     同一姓名が 同一姓名に         同一姓名が
                      (漢字圏の東洋      複数存在す     複数存在す 対する最大         複数存在す
                     人の統一形標目       る登録件数     る異なり姓  登録件数         る登録件数
                          を抜粋)                  名数                 の割合
        NACSIS-CAT
    著者名典拠ファイル            329,864    32,034    13,344        20      9.71%
     (2008年12月18日)
       JAPAN/MARC
        典拠ファイル           572,638    73,138    28,067        29     12.77%
       (2008年7月5日)
         TRC/MARC
    著者名典拠ファイル            464,962    58,979    22,969        27     12.68%
      (2009年3月29日)
                                                                            7
                                                   http://www.nii.ac.jp/cscenter/
登録件数
                                                 登録件数                                                 登録件数




                                                                             件




                                                     10
                                                            15
                                                                       20
                                                                            25
                                                                                 30
                                                                                                          10
                                                                                                                15
                                                                                                                         20
                                                                                                                                     25
                                                                                                                                          件 30
                                                                                                                                                                   10
                                                                                                                                                                         15
                                                                                                                                                                                 20
                                                                                                                                                                                       25
                                                                                                                                                                                              件 30




                                             0
                                                 5
                                                                                                  0
                                                                                                      5
                                                                                                                                                           0
                                                                                                                                                               5
                                     1                                                    1                                                     1
                                   501                                                  501                                                   501
                                  1001                                                 1001                                                  1001
                                  1501                                                 1501                                                  1501
                                  2001                                                 2001                                                  2001
                                  2501                                                 2501                                                  2501




                                                                            27
                                                                                                                                      29
                                                                                                                                                                                 20
                                  3001                                                 3001                                                  3001
                                  3501                                                 3501                                                  3501
                                  4001                                                 4001                                                  4001
                                  4501                                                 4501                                                  4501
                                  5001                                                 5001                                                  5001
                                  5501                                                 5501                                                  5501
                                  6001                                                 6001                                                  6001
                                  6501                                                 6501                                                  6501
                                  7001                                                 7001                                                  7001
                                  7501                                                 7501                                                  7501
                                  8001                                                 8001                                                  8001
                                  8501                                                 8501                                                  8501
                                  9001                                                 9001                                                  9001
                                  9501                                                 9501                                                  9501
                                 10001                                                10001                                                 10001
                                                                                      10501                                                 10501
                                                                                                                                                                        13,344



                                 10501
                                 11001                                                11001                                                 11001
                                 11501                                                11501                                                 11501
                                 12001                                                12001                                                 12001
                                 12501                                                12501                                                 12501
                                 13001                                                13001                                                 13001
                                 13501                                                13501
                                 14001                                                14001
                                 14501                                                14501
                                 15001                                                15001
                                 15501                                                15501
                                 16001                                                16001
                                 16501                                                16501
                                                                                      17001
                                                                                                                                                 異なり姓名順位




                                 17001
                                                                                                                                                                                 NACSIS-CAT




                                                                                      17501
                                                                                                                        JAPAN/MARC




                                 17501
                                 18001                                                18001
                                 18501                                                18501
                                 19001                                                19001
                                 19501                                                19501
                                 20001                    TRC/MARC 22,969             20001
                                 20501                                                20501
                                 21001                                                21001
                                 21501                                                21501
                                 22001                                                22001
                                 22501                                                22501
                                                                                      23001
                                                                                                                                                                    311,174




                                                                                      23501
                                                                                      24001
                                                                                      24501
                                                                                      25001
                                                                                                               28,067




                                                                                      25501
                                                                                                                                                                                                        著者名典拠における




                                                                                      26001
                                                                                      26501
                                   異なり姓名順位




                                                                                      27001
                                                                                      27501
                                                                                      28001
                                                      428,952
                                                                                        異なり姓名順位
                                                                                                                                                                                                     異なり姓名ごとの登録件数の分布




                                 8
                                                                                                           527,567




http://www.nii.ac.jp/cscenter/
著者名典拠における
                   異なり姓名順位トップ20
     NACSIS--CAT           JAPAN/MARC                       TRC/MARC

順位   姓名        登録件数        姓名           登録件数                姓名         登録件数

1    高橋徹              20   鈴木博                 29           鈴木博               27
2    鈴木博              17   田中実                 29           田中実               26
3    佐藤進              17   伊藤博                 28           小林茂               24
4    田中実              16   小林茂                 26           高橋徹               23
5    伊藤博              16   鈴木一郎                24           鈴木実               22
6    高橋進              13   高橋一郎                22           佐藤進               21
7    高橋清              13   佐藤正                 22           渡辺誠               19
8    鈴木一郎             13   高橋徹                 21           佐藤正               19
9    小林茂              13   鈴木実                 21           伊藤博               19
10   吉田豊              13   田中豊                 21           田中稔               18
11   高橋誠              12   (李〓)                21           小林一郎              18
12   田中宏              12   鈴木茂                 20           鈴木隆               17
13   渡辺誠              12   吉田稔                 20           鈴木茂               17
14   渡辺茂              12   田中宏                 19           田中宏               17
15   小林哲夫             12   佐藤進                 19           吉田豊               17
16   田中明              11   高橋和子                18           佐藤博               17
17   佐藤正              11   渡辺誠                 18           高橋進               16
18   中村宏              11   渡辺宏                 18           田中豊               16
19   高橋豊              10   高橋清                 17           田中茂               16
                                                                               9
     高橋正明             10   (陳〓)                17            田中一郎          16
20
                                                    http://www.nii.ac.jp/cscenter/
母集団の大きさに依存する
    同姓同名の割合
• 文献によると
 – 田中康仁,同姓同名の発生頻度,計算言語学
   10-1,1977
 – 昭和51年当時の日本人の漢字姓名107万人の
   名簿を用いて機械的に数え上げ
              同姓同名がいる人の割合(%)
   % 40
     30
     20
     10
      0                              母集団
          0       50   100     150
                               万人
                                                      10
                               http://www.nii.ac.jp/cscenter/
研究者の名寄せの方法
• 図書館の目録のように、閉じたデータベースの中では
  人手で著者に英数字記号の識別子(Identity: ID)を付
  けて区別した
• 学術論文のデータベースでは、2つの方法がとられて
  きた
 – 計算機による名寄せ
 – 手動で登録
• 新たな名寄せの潮流
 – ORCID (Open Researcher and Contributor ID)
 – 学術コミュニケーションに関与するすべてのステークホル
   ダーを包含した、研究者にIDを付与するコミュニティを形
   成する

                                                      11
                               http://www.nii.ac.jp/cscenter/
学術論文データベースにおける
      これまでの2つのアプローチ
• 計算機による名寄せ
 – 論文書誌を対象に著者でまとめる
 – 論文情報システムの著者名検索結果として機能
 – プロダクションシステムとして必要な99%以上の精度を求める
   には程遠い
 – 例
     • Scopus Author Identifier
        (Elsevier社のScopusに実装)
     • Distinct Author Identification System
       (Thomson Reuters社のWeb of Scienceに実装)
• 手動で登録
 –   著者を対象に論文書誌を集める
 –   研究者業績ショーケースとして機能
 –   簡単に著者と論文書誌を網羅できない
 –   例
     • ResearcherID (Thomson Reuters社)                          12
                                         http://www.nii.ac.jp/cscenter/
研究者ID付与コミュニティORCID
• Open Researcher and Contributor ID
   –   Open : 公開された
   –   Researcher : 研究者
   –   Contributor : 貢献者
   –   ID : 本人証明
• 設立趣旨(Mission Statement)
   – ORCIDは、学術コミュニケーションにおける著者/貢献者の名
     前の曖昧性の問題を解決することを目的とし、個々の研究者
     に対する固有の識別子の中央レジストリと、ORCIDと現存する
     他の著者IDスキームとの間のオープンで透過的なリンクメカニ
     ズムを構築することによって実現する。これらの識別子及び識
     別子間の関係は研究者のアウトプットにリンクすることが可能
     であり、科学的発見プロセスを拡大させ、研究コミュニティにお
     ける研究助成や協働の効率性を改善する。
• http://www.orcid.org/
                                                              13
                                       http://www.nii.ac.jp/cscenter/
ORCIDの参加組織
• 2010年11月では144機関。
 – 学術機関47、出版者28、企業19、学会15、政府
   11、NPO17、その他7
 – 米国70、英国30、ドイツ8、オーストラリア6、日本
   3、イタリア3、インド3、スペイン2、中国2、カナ
   ダ2、トルコ1、スイス1 、スウェーデン1 、韓国1 、
   シンガポール1 、セルビア1 、オランダ1 、イスラ
   エル1 、ギリシャ1 、フランス1 、エジプト1 、コロン
   ビア1 、ブラジル1 、ベルギー1 、オーストリア1

                                             14
                      http://www.nii.ac.jp/cscenter/
ORCID IDシステム
• アイデンティティとして扱う基本的な情報
 – 著者/貢献者自身の記述
 – 著者/貢献者とその出版物間の関係の記述
• ハイブリッド型による登録
 – 著者/貢献者による登録                  プロファイル

 – 組織による登録       ORCID
                  ID

                                出版物申告




                                                15
                         http://www.nii.ac.jp/cscenter/
ORCID IDシステムのシナリオ

       エンド                               パートナー
      ユーザー                               システム

                                     たとえば、原稿追跡システム(
だれが文書Xを書いたか?                         MTS : Manuscript Tracking
                                     System)にシングルサインオン(
ID Yの人が書いた、                          SSO)して、編集事務局、マーケ
または査読した文書はどれか?                       ティング部門、ロイヤルティ支払
                                     いシステムなどと連絡先情報を
                                     共有
                    コアシステム
               (ORCID identity system)

                                                                16
                                         http://www.nii.ac.jp/cscenter/
プロファイルの交換とマッチング
                                                                                           可能なマッチングアルゴリズム
                                                                                           • VIAF(OCLC)
                                                                                           • Author Resolver (ProQuest)
                                                                                           • OKKAM




                                                               ORCID
                                                        F67572010




(By Howard Ratner, ORCID Update, Slides at CrossRef Annual Meeting, in London, 16 Nov. 2010)                        17
                                                                                           http://www.nii.ac.jp/cscenter/
著作者にIDを付ける活動
• バーチャル国際典拠ファイル VIAF (Virtual International Authority
  File),
  –   米国OCLC
  –   LC
  –   ドイツDNB
  –   フランスBnF
• 国際標準名前識別子 ISNI (International Standard Name
  Identifier), ISO27729
  – International Confederation of Societies of Authors and
    Composers (CISAC) www.cisac.org
  – International Federation of Reproduction Rights Organisations
    (IFRRO)www.ifrro.org
  – International Performers’ Database Association (ipda.sami.se)
  – Bowker (www.bowker.com )
  – Online Computer Library Center (OCLC) (www.oclc.org)
  – Bibliotheque Nationale de France
  – The British Library                                              18
                                              http://www.nii.ac.jp/cscenter/
VIAF
 • 各国の名前典拠ファイルをリンク
 • 今は個人名のみ

• 1050万件(2010-03)の
  名前レコード
• 抽出元
 – 1300万件名前レコード
 – 8000万件の引用レコード
                                              19
                       http://www.nii.ac.jp/cscenter/
ISNI

・16ケタの数字
・クリエーター一般
・少なくとも2000万件のIDを想定
                 ブリッジ識別子




                               20
        http://www.nii.ac.jp/cscenter/
機関リポジトリを対象とした
      著者にIDを付ける活動
• DAI (Digital Author Identifier), オランダ
  SURF財団
• Names Project, 英国 Mimas, JISC funded
• arXiv.org Author Identifiers, 米国コーネル
  大学
• Networking Names, 米国OCLC
• 研究者リゾルバー,NII

                                                   21
                            http://www.nii.ac.jp/cscenter/
JAIRO著者同定
                              日本の機関リポジトリからJAIROがハーベストした
                              書誌メタデータに書かれた著者を同定するために

研究者リゾルバーIDと機関のローカル研究者IDとの
マッピングテーブル
                  メタデータをハーベストする間、
                  ローカル研究者IDを解決する
        研究者リゾルバー              JAIRO
                                       NII (国レベル)

                                     書誌メタデータ
                                      [ローカル研究者IDが組み込まれている]


       IR著者名典拠
                                IR
       (研究者ディレクトリ)                     機関 (機関レベル)
               双方のシステムで同一のローカル研究者
               IDスキームが使われるべきである


          著者名典拠             書誌レコード

                                                                 22
                                          http://www.nii.ac.jp/cscenter/
IRにおける研究者典拠IDの付与
                     DSpace 1.6
                     Authority Control




                                  23
           http://www.nii.ac.jp/cscenter/
研究者リゾルバーの目的
•   日本の研究者を対象としたWeb上の名前典拠
    – Web上にアーカイブされたリソースをターゲット
       •   例1) 機関リポジトリ
       •   例2) 論文アーカイブ
    – さらに、日本の研究組織を対象とした名称典拠
•   2種類のエンティティ、すなわち論文と研究者をベースとした情報マネージメント
•   情報の質に応じた研究者情報マネージメント
    – 研究者情報の品質レベル
       •   機関担当者による                                                          \論文    機関担当者による     研究者自身に         機械による
       •   研究者自身による                                                           \     とりまとめ        よるとりまとめ        自動処理
                                                                                \
       •   機械の自動処理による                                             高          研究者
•   Web上のリソースのリンキングハブ                                                        機関担当   研究者ディレクトリ    機関にある
    – 研究者データベースへ直接リンク                                                        者による   ReaD         ホームページ
                                                                             登録     IR
       •   大学研究者ディレクトリ, KAKEN, ReaD                                                 KAKEN

                                                                  情報の品質レベル
                                                       研究者のカバー率
    – 学術関連データベースへ                                                                    研究者
      検索問い合わせURLリンク                                                                  リゾルバー
       •   Google (Scholar), CiNii, WebcatPlus, ReaD                         研究者自                ResearcherID
•   Linked Data Webのための、                                                     身による
                                                                             登録
                                                                                                 Researchmap

    日本の研究者と組織のURI表現                                                          機械によ   CiNii 著者検索                  Google
•   名前解決するWebサービス                                                            る自動処                               Google
                                                       高                     理                                  scholar
•   NIIの学術関連サービスへの
    密接なデータ連携                                                                                                      24
                                                                                     http://www.nii.ac.jp/cscenter/
研究者リゾルバーのアプローチ
• 日本の研究者を対象としたURIベースのIDスキーム
  – 研究者リゾルバーID
  – http://rns.nii.ac.jp/nr/xxxxxxxxxxxxx (xxxxxxxxxxxxxはID)
• KAKENから研究者を初期登録 (2010年3月19日現在、 177,558人)
• 機関担当者による、IDに紐づいた研究者プロファイルのアップロード
  – 研究者リゾルバーIDと、他のIDスキームによるIDリスト
      •   機関による完全に永続的なID (例、職員番号、同姓同名を区別する)
      •   ・・・・・
      •   科研費研究者番号
      •   ReaD研究者コード
      •   ResearcherID (Thomson Reuters)
      •   研究者リゾルバーID
  – 名前
  – 所属履歴
  – 業績リスト
• 大学研究者ディレクトリへの自動リンキング
  – 大学研究者ディレクトリをWebクローリング
  – 自動研究者同定
                                                                           25
                                                    http://www.nii.ac.jp/cscenter/
研究者同定スキーム
•            研究者が同じ人物であることを示すこと

                           研究者同定
• 研究者/著者を同定しマネージメントするひとつの方法
      – 番号IDスキーム
          • 13ケタの番号によって研究者を表す
          • 研究者リゾルバーIDと呼ぶ
    ID (13ケタの番号)      説明
      10000xxxxxxxx   科研費登録者のID割り当て
                      xxxxxxxx は、科研費研究者番号 (8 桁)
      200xxxxxxxxxx   ReaD登録者のID割り当て(科研費登録者は除く)
                      xxxxxxxxxx は、ReaD研究者コード (10桁)
      3xxxxxxxxxxxx   それ以外のID割り当て

                                                                 26
                                          http://www.nii.ac.jp/cscenter/
IDの特徴
• KAKEN ID (科研費研究者番号)
  – 科学研究費補助金における研究者番号
  – 文部省(現・文部科学省)が1939年に開始した,多様
    な研究分野・研究組織・研究段階を対象とした,日本
    で最大唯一の研究費配分制度
  – 約18万人が登録
• ReaD ID
  – JST(科学技術振興機構)が運営する,研究者・研究
    機関ディレクトリの研究者ID
  – 約22万人が登録
  – 大学教員,研究スタッフのほか,大学院生含む
                                            27
                     http://www.nii.ac.jp/cscenter/
機関担当者による
          データアップローディング
研究者リゾルバーIDと機関のローカル研究者IDとのマッピングテーブルを構築し、
研究者名を解決する
                         機関は何をすべきか?
                         1. 機関自身を表明する
       研究者リゾルバー          2. 機関のローカル研究者IDを登録するために、
 NII                      a) ローカル研究者IDとそれに紐づいた国内で広く使われている研究者IDを知らせる
                                   A: KAKEN ID
                                   B:ReaD ID
                                   → KAKEN ID または ReaD ID ベースの研究者リゾルバーIDが
                                      登録される
                          a’) ローカル研究者IDを新規登録者として知らせる
                                   → 新しい研究者リゾルバーIDが割り当てられる
                         3. 機関のローカル研究者ID同士のマッピングのために、
                          a) ローカル研究者IDに紐づいた、別の外部スキーマによる研究者IDを知らせる
                                   A: KAKEN ID
       IR研究者典拠                     B: ReaD ID
 機関    (研究者ディレクトリ)                 C: ResearcherID
                                   D: その他サービスのIDs….
                         4. 研究者のプロファイルをステートするために、
                          a) 研究者名、所属履歴、研究業績を知らせる
                         5. 研究者リゾルバーから研究者ディレクトリへ逆リンクをはるために、
                          a) それぞれのローカル研究者IDに割り当てられた研究者ディレクトリのURLを教える



        日本人の名前とデータに適用し、IDマップを構築できるよう
        ResearcherIDのフォーマットを拡張したXMLファイルをアップロードする 28
                                      http://www.nii.ac.jp/cscenter/
機関担当者の視点
•   IR
     – 機関固有のローカルな研究者IDが埋
       め込まれた書誌メタデータが様々な                                      OAIster
       OAIサービスプロバイダーにハーベスト
•   IR研究者典拠(研究者ディレクトリ)
     – 機関がローカルな研究者IDに紐づいた            IR                      JAIRO
       研究者プロファイルを研究者を指向し
       たサービスプロバイダにアップロード
     – 研究者リゾルバーの研究者プロファイ                                     NDLTD
       ルには以下の項目が含まれる                      (Networked Digital Library of Theses and Dissertations)
         • ローカルな研究者ID
         • 名前
         • 外部サービスのID,たとえば                                  (ResearcherID)
            –   科研費研究者番号
            –   ReaD研究者コード
            –   ResearcherID
            –   研究者リゾルバーID     IR研究者典拠
         • 個々の研究者の研究者ディレクトリ                                研究者リゾルバー
                               (研究者ディレクトリ)
           URL
         • 所属履歴
         • 業績リスト                                           (ReaD)

                                                                                         29
                                          http://www.nii.ac.jp/cscenter/
異なる研究者リソース間のリンキング
• 異なる研究者ID集合間のIDマッチング


   研究者ID集合A   研究者ID集合B




                                        30
                 http://www.nii.ac.jp/cscenter/
研究者Webリソースリンキング
• Web上の研究者ID集合
 – 大学研究者ディレクトリ
 – J-Global (ReaD)
 – KAKEN
• 集合間のIDマッチング
                                  大学研究者ディレクトリ B
  大学研究者ディレクトリ A    研究者リゾルバー




                                 KAKEN
        J-Global




                                                     31
                              http://www.nii.ac.jp/cscenter/
大学研究者ディレクトリへのリンク
• Web上の大学研究者ディレクトリへのクローリ
  ング
 – 研究者ページのURLを特定
 – それぞれのURLに対して研究者名を特定
• 研究者リゾルバーIDと大学研究者ディレクトリ
  のローカルIDを同定する方法を適用
• 研究者リゾルバーの研究者ページから大学研
  究者ディレクトリの研究者ページURLへリンク
                                        32
                 http://www.nii.ac.jp/cscenter/
研究者同定のひとつの方法
• KAKENと研究者ディレクトリのそれぞれのID
  に対して以下のとき、同一人物と判定する
 – 漢字氏名の一致
 – 所属の一致
 – 所属内でユニーク名(同姓同名がいない)
• IDが以下のとき、同一人物である
 – KAKEN IDが同一
 – ReaD IDが同一

                                        33
                 http://www.nii.ac.jp/cscenter/
システム間連携の概略
                             2010年度
                                                                          論文著者フィールドに
                                                                          機関の永続固定IDを組み込む
                                  機関研究者ディレ                                                             研究者サービス
                                     クトリ
                                     および                  機関研究者ディレクトリ            機関リポジトリ
                                   機関リポジトリ
                                      機関の永続固定IDごとの     機関の永続固定IDごとの
                                      研究者プロファイルと       研究者プロファイルと
  Web of                              業績リスト            業績リスト                                         研究者と論文のサービス
Knowledge            ResearcherID
(Thomson          (Thomson Reuters)
 Reuters)                                            機関の永続固定IDと研究者リゾルバーIDを
                                                     変換するための質問と応答
                                                                        JAIRO                          論文サービス
                                               研究者リゾルバー              日本の機関リポジトリ
                                                  (NII)               横断検索サービス
                      KAKEN IDとReaD IDの                                  (NII)
                                                          KAKEN ID、                        CLS
                      マッピングテーブル                                                                          リンク
                                                          研究者姓名、所属、
                                                          分野、キーワード

                                                                 KAKEN                       CiNii
                                                                                                       データ連携
                                                                  (NII)          ALS         (NII)



                 J-Global
            (Including ReaD)
                  (JST)



                                                                   Researchmap
                                                                       (NII)



                                                                                                         34
                                                                                 http://www.nii.ac.jp/cscenter/
研究者リゾルバー β1.0
            現在の実装
• 研究者ごとのページ
  – 現在はKAKENに登録された研究者に対しページを提供
  – 約18万研究者
  – 同姓同名解決された研究者
• Web上の研究者リソースとのリンク
  – 直接リンク
     • KAKEN                        Webクローリングと
     • 機関の研究者DB(現在33大学を対象)          KAKEN IDマッチング
     • J-Global (JST 旧ReaD)
  – 検索問い合わせリンク
     • Google, Google Scholar, CiNii, Webcat Plus, ReaDへの日本語・英語の氏名,所属
       による問い合わせ
• 機関担当者による研究者プロファイルと業績リストのアップロード
• SemanticWebのための質問応答
  – OpenSearch
  – RDF/XML
• 研究者IDリダイレクトWebサービス
• http://rns.nii.ac.jp/                                                35
                                                http://www.nii.ac.jp/cscenter/
研究者リゾルバー β1.0
 研究者ページ(概略)
     研究者姓名 (漢字,カタカナ,ローマ字)

            研究者基本情報


            直接リンク



            検索質問フォーマットURLリンク


            科研費研究課題の研究分野

            科研費研究課題のキーワード

            このページのURI
                                      36
               http://www.nii.ac.jp/cscenter/
研究者リゾルバー β1.0
        研究者ページ(上側)
              研究者姓名 (漢字,カタカナ,ローマ字)
               研究者リゾルバーID
研究者
               科研費研究者番号
基本情報
                所属




                                            37
                     http://www.nii.ac.jp/cscenter/
研究者リゾルバー β1.0
              研究者ページ(上側)




直接リンク
•KAKEN(NII)
•大学研究者ディレクトリ
•J-Global(ReaD)



                                              38
                       http://www.nii.ac.jp/cscenter/
研究者リゾルバー β1.0
            研究者ページ(上側)

検索質問フォーマットURLリンク
(漢字姓名と所属)
•Google




                                            39
                     http://www.nii.ac.jp/cscenter/
研究者リゾルバー β1.0
            研究者ページ(上側)

検索質問フォーマットURLリンク
(漢字姓名)
•CiNii
•Webcat Plus
•ReaD
•Google Scholar
•Google




                                            40
                     http://www.nii.ac.jp/cscenter/
研究者リゾルバー β1.0
            研究者ページ(上側)

検索質問フォーマットURLリンク
 (英語姓名)
•CiNii
•Webcat Plus
•ReaD
•Google Scholar
•Google




                                            41
                     http://www.nii.ac.jp/cscenter/
研究者リゾルバー β1.0
            研究者ページ(下側)



科研費研究課題の
研究分野


科研費研究課題の
キーワード


このページの
URI

                                            42
                     http://www.nii.ac.jp/cscenter/
Webの波
• Web技術のパラダイムシフト
  – Web of Documentsから
  – Web of Dataへ
• Linking Open Dataの潮流
  – RDFによって事実を記述して、データとして公開
  – RDFでは、事実は2つのリソース(URI)と語彙で記
    述される
    • 抽象的な概念を含めてすべてのモノをURIで表現
    • モノの関係を表す語彙を定義して、2つのURIの関係を
      語彙でつないで表す
                                                43
                         http://www.nii.ac.jp/cscenter/
Linked Data Web of Open Repositories in 2010 - 2015                     2010-07-28, Kei Kurakawa, NII

                             URI based Identification of All Resources
                             Fact Descriptions in RDF (Resource Description Framework)
                             Scholarly Communications Vocabulary
                                                                          Open Repositories
                 Open Repositories                                        by Institutions
                 by Institutions




                                 dcterms:Agent
             rdfs:Resource

                        dcterms:creator



        Open Repositories                                          Open Repositories
        by Institutions                                            in the Cloud
Linked Data Webのための
       検索質問応答API
• OpenSearch1.1
• RDF/XML




                                         45
                  http://www.nii.ac.jp/cscenter/
研究者IDリダイレクトWebサービス
    • 研究者IDとターゲットサービスをURLで指定
      して,研究者ページへリダイレクトするWebサ
      ービス
                                       研究者ID解決して
http://rns.nii.ac.jp/services/redire   目的のサービスへ
ct?source=resolver&id=1000010          リダイレクト
295694&target=kaken


     sourceに指定できるID
     研究者リゾルバーID
     KAKEN(NII)
     ReaD(JST)
     ResearcherID(Thomson Reuters)
                                                         機関の研究者ディレクトリ
     アップロードした機関のローカル研究者ID




                                                                          46
                                                   http://www.nii.ac.jp/cscenter/
サービス連携の例
• 京都大学リポジトリ                • 静岡大学リポジトリ(SURE)
  (KURENAI)                 – dc.contributor.author
 – dc.contributor.author    – dc.contributor.alternative
                            – dc.contributor.transcription




                                                            47
                                     http://www.nii.ac.jp/cscenter/
国際連携・協力
• 研究者・著者名システム間連携




                                      48
               http://www.nii.ac.jp/cscenter/
まとめ
• 研究者の学術研究の貢献度を正確に測るために
  は,名前の曖昧性の問題を解決して,研究成果
  に記述された著者の名寄せを行う必要がある.
• 日本人姓名に関しては,図書館典拠ファイルを調
  査したところ,同姓同名が50万人規模で10パー
  セント以上存在する.
• 著者に識別子を付与して名寄せを行う活動は,
  世界で行われている
• 研究者リゾルバーは,日本の研究者の識別子を
  与える
                                        49
                 http://www.nii.ac.jp/cscenter/

Más contenido relacionado

La actualidad más candente

Classifying and understanding financial data using graph neural network
Classifying and understanding financial data using graph neural networkClassifying and understanding financial data using graph neural network
Classifying and understanding financial data using graph neural networkPark JunPyo
 
[part 2]ナレッジグラフ推論チャレンジ・Tech Live!
[part 2]ナレッジグラフ推論チャレンジ・Tech Live![part 2]ナレッジグラフ推論チャレンジ・Tech Live!
[part 2]ナレッジグラフ推論チャレンジ・Tech Live!KnowledgeGraph
 
単一事例研究法と統計的推測:ベイズ流アプローチを架け橋として
単一事例研究法と統計的推測:ベイズ流アプローチを架け橋として単一事例研究法と統計的推測:ベイズ流アプローチを架け橋として
単一事例研究法と統計的推測:ベイズ流アプローチを架け橋としてYoshitake Takebayashi
 
[DL輪読会]“Meta-Learning for Online Update of Recommender Systems. (AAAI 2022)”
[DL輪読会]“Meta-Learning for Online Update of Recommender Systems.  (AAAI 2022)” [DL輪読会]“Meta-Learning for Online Update of Recommender Systems.  (AAAI 2022)”
[DL輪読会]“Meta-Learning for Online Update of Recommender Systems. (AAAI 2022)” Deep Learning JP
 
Stochastic Gradient MCMC
Stochastic Gradient MCMCStochastic Gradient MCMC
Stochastic Gradient MCMCKenta Oono
 
多重代入法(Multiple Imputation)の発表資料
多重代入法(Multiple Imputation)の発表資料多重代入法(Multiple Imputation)の発表資料
多重代入法(Multiple Imputation)の発表資料Tomoshige Nakamura
 
とある金融屋の統計技師が時系列解析してみた
とある金融屋の統計技師が時系列解析してみたとある金融屋の統計技師が時系列解析してみた
とある金融屋の統計技師が時系列解析してみたNagi Teramo
 
[part 1]ナレッジグラフ推論チャレンジ・Tech Live!
[part 1]ナレッジグラフ推論チャレンジ・Tech Live![part 1]ナレッジグラフ推論チャレンジ・Tech Live!
[part 1]ナレッジグラフ推論チャレンジ・Tech Live!KnowledgeGraph
 
MLOps Course Slides_JP(配布用).pdf
MLOps Course Slides_JP(配布用).pdfMLOps Course Slides_JP(配布用).pdf
MLOps Course Slides_JP(配布用).pdfYuya Yamamoto
 
「操作変数法」の報告事例
「操作変数法」の報告事例「操作変数法」の報告事例
「操作変数法」の報告事例Yoshitake Takebayashi
 
線形?非線形?
線形?非線形?線形?非線形?
線形?非線形?nishio
 
[DL輪読会]The Neuro-Symbolic Concept Learner: Interpreting Scenes, Words, and Se...
[DL輪読会]The Neuro-Symbolic Concept Learner: Interpreting Scenes, Words, and Se...[DL輪読会]The Neuro-Symbolic Concept Learner: Interpreting Scenes, Words, and Se...
[DL輪読会]The Neuro-Symbolic Concept Learner: Interpreting Scenes, Words, and Se...Deep Learning JP
 
統計的学習理論チュートリアル: 基礎から応用まで (Ibis2012)
統計的学習理論チュートリアル: 基礎から応用まで (Ibis2012)統計的学習理論チュートリアル: 基礎から応用まで (Ibis2012)
統計的学習理論チュートリアル: 基礎から応用まで (Ibis2012)Taiji Suzuki
 
[DL輪読会]Deep Direct Reinforcement Learning for Financial Signal Representation...
[DL輪読会]Deep Direct Reinforcement Learning for Financial Signal Representation...[DL輪読会]Deep Direct Reinforcement Learning for Financial Signal Representation...
[DL輪読会]Deep Direct Reinforcement Learning for Financial Signal Representation...Deep Learning JP
 
数式を使わないプライバシー保護技術
数式を使わないプライバシー保護技術数式を使わないプライバシー保護技術
数式を使わないプライバシー保護技術Hiroshi Nakagawa
 
【DL輪読会】Pervasive Label Errors in Test Sets Destabilize Machine Learning Bench...
【DL輪読会】Pervasive Label Errors in Test Sets Destabilize Machine Learning Bench...【DL輪読会】Pervasive Label Errors in Test Sets Destabilize Machine Learning Bench...
【DL輪読会】Pervasive Label Errors in Test Sets Destabilize Machine Learning Bench...Deep Learning JP
 
Uplift Modelling 入門(1)
Uplift Modelling 入門(1)Uplift Modelling 入門(1)
Uplift Modelling 入門(1)Yohei Sato
 
“機械学習の説明”の信頼性
“機械学習の説明”の信頼性“機械学習の説明”の信頼性
“機械学習の説明”の信頼性Satoshi Hara
 

La actualidad más candente (20)

Classifying and understanding financial data using graph neural network
Classifying and understanding financial data using graph neural networkClassifying and understanding financial data using graph neural network
Classifying and understanding financial data using graph neural network
 
[part 2]ナレッジグラフ推論チャレンジ・Tech Live!
[part 2]ナレッジグラフ推論チャレンジ・Tech Live![part 2]ナレッジグラフ推論チャレンジ・Tech Live!
[part 2]ナレッジグラフ推論チャレンジ・Tech Live!
 
自然言語処理紹介(就職編)
自然言語処理紹介(就職編)自然言語処理紹介(就職編)
自然言語処理紹介(就職編)
 
単一事例研究法と統計的推測:ベイズ流アプローチを架け橋として
単一事例研究法と統計的推測:ベイズ流アプローチを架け橋として単一事例研究法と統計的推測:ベイズ流アプローチを架け橋として
単一事例研究法と統計的推測:ベイズ流アプローチを架け橋として
 
[DL輪読会]“Meta-Learning for Online Update of Recommender Systems. (AAAI 2022)”
[DL輪読会]“Meta-Learning for Online Update of Recommender Systems.  (AAAI 2022)” [DL輪読会]“Meta-Learning for Online Update of Recommender Systems.  (AAAI 2022)”
[DL輪読会]“Meta-Learning for Online Update of Recommender Systems. (AAAI 2022)”
 
Stochastic Gradient MCMC
Stochastic Gradient MCMCStochastic Gradient MCMC
Stochastic Gradient MCMC
 
多重代入法(Multiple Imputation)の発表資料
多重代入法(Multiple Imputation)の発表資料多重代入法(Multiple Imputation)の発表資料
多重代入法(Multiple Imputation)の発表資料
 
Anomaly detection survey
Anomaly detection surveyAnomaly detection survey
Anomaly detection survey
 
とある金融屋の統計技師が時系列解析してみた
とある金融屋の統計技師が時系列解析してみたとある金融屋の統計技師が時系列解析してみた
とある金融屋の統計技師が時系列解析してみた
 
[part 1]ナレッジグラフ推論チャレンジ・Tech Live!
[part 1]ナレッジグラフ推論チャレンジ・Tech Live![part 1]ナレッジグラフ推論チャレンジ・Tech Live!
[part 1]ナレッジグラフ推論チャレンジ・Tech Live!
 
MLOps Course Slides_JP(配布用).pdf
MLOps Course Slides_JP(配布用).pdfMLOps Course Slides_JP(配布用).pdf
MLOps Course Slides_JP(配布用).pdf
 
「操作変数法」の報告事例
「操作変数法」の報告事例「操作変数法」の報告事例
「操作変数法」の報告事例
 
線形?非線形?
線形?非線形?線形?非線形?
線形?非線形?
 
[DL輪読会]The Neuro-Symbolic Concept Learner: Interpreting Scenes, Words, and Se...
[DL輪読会]The Neuro-Symbolic Concept Learner: Interpreting Scenes, Words, and Se...[DL輪読会]The Neuro-Symbolic Concept Learner: Interpreting Scenes, Words, and Se...
[DL輪読会]The Neuro-Symbolic Concept Learner: Interpreting Scenes, Words, and Se...
 
統計的学習理論チュートリアル: 基礎から応用まで (Ibis2012)
統計的学習理論チュートリアル: 基礎から応用まで (Ibis2012)統計的学習理論チュートリアル: 基礎から応用まで (Ibis2012)
統計的学習理論チュートリアル: 基礎から応用まで (Ibis2012)
 
[DL輪読会]Deep Direct Reinforcement Learning for Financial Signal Representation...
[DL輪読会]Deep Direct Reinforcement Learning for Financial Signal Representation...[DL輪読会]Deep Direct Reinforcement Learning for Financial Signal Representation...
[DL輪読会]Deep Direct Reinforcement Learning for Financial Signal Representation...
 
数式を使わないプライバシー保護技術
数式を使わないプライバシー保護技術数式を使わないプライバシー保護技術
数式を使わないプライバシー保護技術
 
【DL輪読会】Pervasive Label Errors in Test Sets Destabilize Machine Learning Bench...
【DL輪読会】Pervasive Label Errors in Test Sets Destabilize Machine Learning Bench...【DL輪読会】Pervasive Label Errors in Test Sets Destabilize Machine Learning Bench...
【DL輪読会】Pervasive Label Errors in Test Sets Destabilize Machine Learning Bench...
 
Uplift Modelling 入門(1)
Uplift Modelling 入門(1)Uplift Modelling 入門(1)
Uplift Modelling 入門(1)
 
“機械学習の説明”の信頼性
“機械学習の説明”の信頼性“機械学習の説明”の信頼性
“機械学習の説明”の信頼性
 

Destacado

テンソル分解の著者名寄せへの応用と潜在変数を持つモデルとの比較
テンソル分解の著者名寄せへの応用と潜在変数を持つモデルとの比較テンソル分解の著者名寄せへの応用と潜在変数を持つモデルとの比較
テンソル分解の著者名寄せへの応用と潜在変数を持つモデルとの比較National Institute of Informatics
 
Sharman 2015 PhD thesis
Sharman 2015 PhD thesisSharman 2015 PhD thesis
Sharman 2015 PhD thesisMurray Sharman
 
Wondrous Wise Words
Wondrous Wise Words Wondrous Wise Words
Wondrous Wise Words OH TEIK BIN
 
Composicion bidimensional (1)
Composicion bidimensional (1)Composicion bidimensional (1)
Composicion bidimensional (1)joselizz
 
두피에좋은음식
두피에좋은음식두피에좋은음식
두피에좋은음식준배 채
 
นิป เอมรัฐ
นิป เอมรัฐนิป เอมรัฐ
นิป เอมรัฐguest6487de
 
Sdc11 feb14 class12
Sdc11 feb14 class12Sdc11 feb14 class12
Sdc11 feb14 class12missjaqui
 
Animation lesson 2
Animation lesson 2Animation lesson 2
Animation lesson 2Ty171
 
Composicion Bidimensional
Composicion BidimensionalComposicion Bidimensional
Composicion BidimensionalMariaPaulaS
 
How to rock the stage! Dr James Whittake and Dr Michelle Dickinson
How to rock the stage! Dr James Whittake and Dr Michelle Dickinson How to rock the stage! Dr James Whittake and Dr Michelle Dickinson
How to rock the stage! Dr James Whittake and Dr Michelle Dickinson Michelle Dickinson
 
Cuestionario de conocimientos de tic ampliado y mejorado
Cuestionario de conocimientos de tic ampliado y mejoradoCuestionario de conocimientos de tic ampliado y mejorado
Cuestionario de conocimientos de tic ampliado y mejoradoJuan Prueba de la Cosa
 
The Defend Trade Secrets Act of 2016 - New Federal Protection for Trade Secre...
The Defend Trade Secrets Act of 2016 - New Federal Protection for Trade Secre...The Defend Trade Secrets Act of 2016 - New Federal Protection for Trade Secre...
The Defend Trade Secrets Act of 2016 - New Federal Protection for Trade Secre...Knobbe Martens - Intellectual Property Law
 
DAMA Webinar: Influencing with Data – Facts Don’t Matter Much!
DAMA Webinar: Influencing with Data – Facts Don’t Matter Much!DAMA Webinar: Influencing with Data – Facts Don’t Matter Much!
DAMA Webinar: Influencing with Data – Facts Don’t Matter Much!DATAVERSITY
 

Destacado (16)

テンソル分解の著者名寄せへの応用と潜在変数を持つモデルとの比較
テンソル分解の著者名寄せへの応用と潜在変数を持つモデルとの比較テンソル分解の著者名寄せへの応用と潜在変数を持つモデルとの比較
テンソル分解の著者名寄せへの応用と潜在変数を持つモデルとの比較
 
Sharman 2015 PhD thesis
Sharman 2015 PhD thesisSharman 2015 PhD thesis
Sharman 2015 PhD thesis
 
EPA CAA Email 9.4.03
EPA CAA Email 9.4.03EPA CAA Email 9.4.03
EPA CAA Email 9.4.03
 
Wondrous Wise Words
Wondrous Wise Words Wondrous Wise Words
Wondrous Wise Words
 
Latihan 1 tata
Latihan 1 tataLatihan 1 tata
Latihan 1 tata
 
Composicion bidimensional (1)
Composicion bidimensional (1)Composicion bidimensional (1)
Composicion bidimensional (1)
 
두피에좋은음식
두피에좋은음식두피에좋은음식
두피에좋은음식
 
นิป เอมรัฐ
นิป เอมรัฐนิป เอมรัฐ
นิป เอมรัฐ
 
Rhoades_logo_color
Rhoades_logo_colorRhoades_logo_color
Rhoades_logo_color
 
Sdc11 feb14 class12
Sdc11 feb14 class12Sdc11 feb14 class12
Sdc11 feb14 class12
 
Animation lesson 2
Animation lesson 2Animation lesson 2
Animation lesson 2
 
Composicion Bidimensional
Composicion BidimensionalComposicion Bidimensional
Composicion Bidimensional
 
How to rock the stage! Dr James Whittake and Dr Michelle Dickinson
How to rock the stage! Dr James Whittake and Dr Michelle Dickinson How to rock the stage! Dr James Whittake and Dr Michelle Dickinson
How to rock the stage! Dr James Whittake and Dr Michelle Dickinson
 
Cuestionario de conocimientos de tic ampliado y mejorado
Cuestionario de conocimientos de tic ampliado y mejoradoCuestionario de conocimientos de tic ampliado y mejorado
Cuestionario de conocimientos de tic ampliado y mejorado
 
The Defend Trade Secrets Act of 2016 - New Federal Protection for Trade Secre...
The Defend Trade Secrets Act of 2016 - New Federal Protection for Trade Secre...The Defend Trade Secrets Act of 2016 - New Federal Protection for Trade Secre...
The Defend Trade Secrets Act of 2016 - New Federal Protection for Trade Secre...
 
DAMA Webinar: Influencing with Data – Facts Don’t Matter Much!
DAMA Webinar: Influencing with Data – Facts Don’t Matter Much!DAMA Webinar: Influencing with Data – Facts Don’t Matter Much!
DAMA Webinar: Influencing with Data – Facts Don’t Matter Much!
 

Más de National Institute of Informatics

Application of a Novel Subject Classification Scheme for a Bibliographic Data...
Application of a Novel Subject Classification Scheme for a Bibliographic Data...Application of a Novel Subject Classification Scheme for a Bibliographic Data...
Application of a Novel Subject Classification Scheme for a Bibliographic Data...National Institute of Informatics
 
Applying a new subject classification scheme for a database by a data-driven ...
Applying a new subject classification scheme for a database by a data-driven ...Applying a new subject classification scheme for a database by a data-driven ...
Applying a new subject classification scheme for a database by a data-driven ...National Institute of Informatics
 
Toward universal information access on the digital object cloud
Toward universal information access on the digital object cloudToward universal information access on the digital object cloud
Toward universal information access on the digital object cloudNational Institute of Informatics
 
Making data typing efforts or automatically detecting data types for automat...
Making data typing efforts or automatically detecting data types  for automat...Making data typing efforts or automatically detecting data types  for automat...
Making data typing efforts or automatically detecting data types for automat...National Institute of Informatics
 
Applying tensor decompositions to author name disambiguation of common Japane...
Applying tensor decompositions to author name disambiguation of common Japane...Applying tensor decompositions to author name disambiguation of common Japane...
Applying tensor decompositions to author name disambiguation of common Japane...National Institute of Informatics
 
Emerging domain agnostic functionalities on the handle-centered networks
Emerging domain agnostic functionalities on the handle-centered networksEmerging domain agnostic functionalities on the handle-centered networks
Emerging domain agnostic functionalities on the handle-centered networksNational Institute of Informatics
 
離散一般化ベータ分布を仮定した研究分野マッピングの導出
離散一般化ベータ分布を仮定した研究分野マッピングの導出離散一般化ベータ分布を仮定した研究分野マッピングの導出
離散一般化ベータ分布を仮定した研究分野マッピングの導出National Institute of Informatics
 
レコードリンケージに基づく科研費分野-WoS分野マッピングの導出
レコードリンケージに基づく科研費分野-WoS分野マッピングの導出レコードリンケージに基づく科研費分野-WoS分野マッピングの導出
レコードリンケージに基づく科研費分野-WoS分野マッピングの導出National Institute of Informatics
 
レコードリンケージに基づく科研費分野-WoS分野マッピング
レコードリンケージに基づく科研費分野-WoS分野マッピングレコードリンケージに基づく科研費分野-WoS分野マッピング
レコードリンケージに基づく科研費分野-WoS分野マッピングNational Institute of Informatics
 
科研費分野-トピック分類マトリックスへの主成分分析の適用
科研費分野-トピック分類マトリックスへの主成分分析の適用科研費分野-トピック分類マトリックスへの主成分分析の適用
科研費分野-トピック分類マトリックスへの主成分分析の適用National Institute of Informatics
 
学術情報流通のための識別子とメタデータDBを対象とした融合研究シーズ探索 - 超高層物理学分野における観測データを例として -
学術情報流通のための識別子とメタデータDBを対象とした融合研究シーズ探索 - 超高層物理学分野における観測データを例として -学術情報流通のための識別子とメタデータDBを対象とした融合研究シーズ探索 - 超高層物理学分野における観測データを例として -
学術情報流通のための識別子とメタデータDBを対象とした融合研究シーズ探索 - 超高層物理学分野における観測データを例として -National Institute of Informatics
 
機械学習を用いたWeb上の産学連携関連文書の抽出
機械学習を用いたWeb上の産学連携関連文書の抽出機械学習を用いたWeb上の産学連携関連文書の抽出
機械学習を用いたWeb上の産学連携関連文書の抽出National Institute of Informatics
 
科研費データベースの分野分類とトピック分類の比較分析
科研費データベースの分野分類とトピック分類の比較分析科研費データベースの分野分類とトピック分類の比較分析
科研費データベースの分野分類とトピック分類の比較分析National Institute of Informatics
 
A SVM Applied Text Categorization of Academia-Industry Collaborative Research...
A SVM Applied Text Categorization of Academia-Industry Collaborative Research...A SVM Applied Text Categorization of Academia-Industry Collaborative Research...
A SVM Applied Text Categorization of Academia-Industry Collaborative Research...National Institute of Informatics
 
Researcher Identifiers and National Federated Search Portal for Japanese Inst...
Researcher Identifiers and National Federated Search Portal for Japanese Inst...Researcher Identifiers and National Federated Search Portal for Japanese Inst...
Researcher Identifiers and National Federated Search Portal for Japanese Inst...National Institute of Informatics
 
著者の同定・識別について- JAIRO著者名検索プロジェクトへ -
著者の同定・識別について- JAIRO著者名検索プロジェクトへ -著者の同定・識別について- JAIRO著者名検索プロジェクトへ -
著者の同定・識別について- JAIRO著者名検索プロジェクトへ -National Institute of Informatics
 
1.研究者リゾルバーとJAIRO著者名検索、2.KAKENデータベースの機能拡張
1.研究者リゾルバーとJAIRO著者名検索、2.KAKENデータベースの機能拡張1.研究者リゾルバーとJAIRO著者名検索、2.KAKENデータベースの機能拡張
1.研究者リゾルバーとJAIRO著者名検索、2.KAKENデータベースの機能拡張National Institute of Informatics
 
ORCIDのプロトタイプシステムと著者ID関連技術の動向
ORCIDのプロトタイプシステムと著者ID関連技術の動向ORCIDのプロトタイプシステムと著者ID関連技術の動向
ORCIDのプロトタイプシステムと著者ID関連技術の動向National Institute of Informatics
 

Más de National Institute of Informatics (19)

Application of a Novel Subject Classification Scheme for a Bibliographic Data...
Application of a Novel Subject Classification Scheme for a Bibliographic Data...Application of a Novel Subject Classification Scheme for a Bibliographic Data...
Application of a Novel Subject Classification Scheme for a Bibliographic Data...
 
Applying a new subject classification scheme for a database by a data-driven ...
Applying a new subject classification scheme for a database by a data-driven ...Applying a new subject classification scheme for a database by a data-driven ...
Applying a new subject classification scheme for a database by a data-driven ...
 
Toward universal information access on the digital object cloud
Toward universal information access on the digital object cloudToward universal information access on the digital object cloud
Toward universal information access on the digital object cloud
 
Making data typing efforts or automatically detecting data types for automat...
Making data typing efforts or automatically detecting data types  for automat...Making data typing efforts or automatically detecting data types  for automat...
Making data typing efforts or automatically detecting data types for automat...
 
Applying tensor decompositions to author name disambiguation of common Japane...
Applying tensor decompositions to author name disambiguation of common Japane...Applying tensor decompositions to author name disambiguation of common Japane...
Applying tensor decompositions to author name disambiguation of common Japane...
 
Emerging domain agnostic functionalities on the handle-centered networks
Emerging domain agnostic functionalities on the handle-centered networksEmerging domain agnostic functionalities on the handle-centered networks
Emerging domain agnostic functionalities on the handle-centered networks
 
研究者識別子の重要性とORCIDアップデート
研究者識別子の重要性とORCIDアップデート研究者識別子の重要性とORCIDアップデート
研究者識別子の重要性とORCIDアップデート
 
離散一般化ベータ分布を仮定した研究分野マッピングの導出
離散一般化ベータ分布を仮定した研究分野マッピングの導出離散一般化ベータ分布を仮定した研究分野マッピングの導出
離散一般化ベータ分布を仮定した研究分野マッピングの導出
 
レコードリンケージに基づく科研費分野-WoS分野マッピングの導出
レコードリンケージに基づく科研費分野-WoS分野マッピングの導出レコードリンケージに基づく科研費分野-WoS分野マッピングの導出
レコードリンケージに基づく科研費分野-WoS分野マッピングの導出
 
レコードリンケージに基づく科研費分野-WoS分野マッピング
レコードリンケージに基づく科研費分野-WoS分野マッピングレコードリンケージに基づく科研費分野-WoS分野マッピング
レコードリンケージに基づく科研費分野-WoS分野マッピング
 
科研費分野-トピック分類マトリックスへの主成分分析の適用
科研費分野-トピック分類マトリックスへの主成分分析の適用科研費分野-トピック分類マトリックスへの主成分分析の適用
科研費分野-トピック分類マトリックスへの主成分分析の適用
 
学術情報流通のための識別子とメタデータDBを対象とした融合研究シーズ探索 - 超高層物理学分野における観測データを例として -
学術情報流通のための識別子とメタデータDBを対象とした融合研究シーズ探索 - 超高層物理学分野における観測データを例として -学術情報流通のための識別子とメタデータDBを対象とした融合研究シーズ探索 - 超高層物理学分野における観測データを例として -
学術情報流通のための識別子とメタデータDBを対象とした融合研究シーズ探索 - 超高層物理学分野における観測データを例として -
 
機械学習を用いたWeb上の産学連携関連文書の抽出
機械学習を用いたWeb上の産学連携関連文書の抽出機械学習を用いたWeb上の産学連携関連文書の抽出
機械学習を用いたWeb上の産学連携関連文書の抽出
 
科研費データベースの分野分類とトピック分類の比較分析
科研費データベースの分野分類とトピック分類の比較分析科研費データベースの分野分類とトピック分類の比較分析
科研費データベースの分野分類とトピック分類の比較分析
 
A SVM Applied Text Categorization of Academia-Industry Collaborative Research...
A SVM Applied Text Categorization of Academia-Industry Collaborative Research...A SVM Applied Text Categorization of Academia-Industry Collaborative Research...
A SVM Applied Text Categorization of Academia-Industry Collaborative Research...
 
Researcher Identifiers and National Federated Search Portal for Japanese Inst...
Researcher Identifiers and National Federated Search Portal for Japanese Inst...Researcher Identifiers and National Federated Search Portal for Japanese Inst...
Researcher Identifiers and National Federated Search Portal for Japanese Inst...
 
著者の同定・識別について- JAIRO著者名検索プロジェクトへ -
著者の同定・識別について- JAIRO著者名検索プロジェクトへ -著者の同定・識別について- JAIRO著者名検索プロジェクトへ -
著者の同定・識別について- JAIRO著者名検索プロジェクトへ -
 
1.研究者リゾルバーとJAIRO著者名検索、2.KAKENデータベースの機能拡張
1.研究者リゾルバーとJAIRO著者名検索、2.KAKENデータベースの機能拡張1.研究者リゾルバーとJAIRO著者名検索、2.KAKENデータベースの機能拡張
1.研究者リゾルバーとJAIRO著者名検索、2.KAKENデータベースの機能拡張
 
ORCIDのプロトタイプシステムと著者ID関連技術の動向
ORCIDのプロトタイプシステムと著者ID関連技術の動向ORCIDのプロトタイプシステムと著者ID関連技術の動向
ORCIDのプロトタイプシステムと著者ID関連技術の動向
 

なぜ研究者の名寄せが必要か ~ 世界の動向と研究者リゾルバー ~

  • 1. なぜ研究者の名寄せが必要か ~世界の動向と研究者リゾルバー~ CSI委託事業ワークショップ「名寄せのこれから~研究者IDサミット~」 2011年2月17日,学術総合センター,主催:金沢大学 蔵川 圭 国立情報学研究所 学術コンテンツサービス研究開発センター http://www.nii.ac.jp/cscenter/
  • 2. 学術研究における貢献 • 学術研究成果の多くは論文として出版され公表 される • すでに存在する論文を引用しながらそれが表す 知識の体系を位置づける • 誰が貢献したか、どのような組織が貢献したか がわかるように内容とともに著者名や所属組織 名が明記される。助成機関に対して謝辞を加え ることも多い • ある研究者がどのくらい知識の体系化に貢献し たかを測ってみたいとき、研究者の論文を並べ てみればよい 2 http://www.nii.ac.jp/cscenter/
  • 3. 名前の曖昧性の問題 (Name Ambiguity Problem) • 同姓同名 • 旧姓 • ペンネーム • 漢字異体字 • ジャーナルごとに異なる姓名表記フォーマット – 姓名の順 – イニシャル表記 – 大文字・小文字 3 http://www.nii.ac.jp/cscenter/
  • 4. 名前の翻字(transliterate) • ラテン文字への翻字によって、同姓同名が増 える 王伟,王薇,王维,王蔚,汪卫,汪玮,汪威,汪巍 Wei Wang “Which Wei Wang?”,Phys. Rev. Lett. 99, 230001 (2007) DOI:10.1103/PhysRevLett.99.230001 4 http://www.nii.ac.jp/cscenter/
  • 5. 名寄せ(Name Disambiguation) • 名前の問題を解決して、同一性を判定すること を「名寄せ」という • 研究者の名寄せによって、 – 研究者ごとに正確に論文やその他研究成果をリスト 化でき、リストは知識体系への貢献度を正確に測る 情報源となる – 研究者が正確に過去の業績によってプロファイルさ れることで、そのプロファイルは新たな研究チームを 構成する際の正確な情報源として活用できる – 学術コミュニケーションにおける様々な場面において 、研究者を特定した情報交換が可能となる 5 http://www.nii.ac.jp/cscenter/
  • 6. 日本の図書館目録 • NACSIS-CAT – 国立情報学研究所の運営 – 日本の大学図書館の所蔵する図書・雑誌の総合目録 – 洋書が多く含まれる – USMARC準拠 – 日本目録規則,およびAACR2 • JAPAN/MARC – 国立国会図書館の運営 – 国会図書館の所蔵する,日本で刊行された出版物および外国で刊行された日 本語出版物の目録 – UNIMARC準拠 目録 – 日本目録規則 参照する • TRC/MARC 参照する – 図書館流通センターの運営 書誌 典拠 – 日本で刊行される出版物の目録 – UNIMARC準拠 – 日本目録規則 著者名 (統一)書名 6 http://www.nii.ac.jp/cscenter/
  • 7. 図書館目録の著者名典拠 • NACSIS-CAT著者名典拠ファイル – 個人名,団体名の典拠 – 個人名1,263,685件(西洋人著者名含む, 2008年12月18日) • JAPAN/MARC典拠ファイル – 個人名,家名,団体名,および統一書名の典拠 – 個人名681,924件(西洋人著者名含む, 2008年7月5日) • TRC/MARC著者名典拠ファイル – 個人名,機関名の典拠 – 個人名566,249件(西洋人著者名含む, 2009年3月29日) 人名データベース 登録件数 同一姓名が 同一姓名が 同一姓名に 同一姓名が (漢字圏の東洋 複数存在す 複数存在す 対する最大 複数存在す 人の統一形標目 る登録件数 る異なり姓 登録件数 る登録件数 を抜粋) 名数 の割合 NACSIS-CAT 著者名典拠ファイル 329,864 32,034 13,344 20 9.71% (2008年12月18日) JAPAN/MARC 典拠ファイル 572,638 73,138 28,067 29 12.77% (2008年7月5日) TRC/MARC 著者名典拠ファイル 464,962 58,979 22,969 27 12.68% (2009年3月29日) 7 http://www.nii.ac.jp/cscenter/
  • 8. 登録件数 登録件数 登録件数 件 10 15 20 25 30 10 15 20 25 件 30 10 15 20 25 件 30 0 5 0 5 0 5 1 1 1 501 501 501 1001 1001 1001 1501 1501 1501 2001 2001 2001 2501 2501 2501 27 29 20 3001 3001 3001 3501 3501 3501 4001 4001 4001 4501 4501 4501 5001 5001 5001 5501 5501 5501 6001 6001 6001 6501 6501 6501 7001 7001 7001 7501 7501 7501 8001 8001 8001 8501 8501 8501 9001 9001 9001 9501 9501 9501 10001 10001 10001 10501 10501 13,344 10501 11001 11001 11001 11501 11501 11501 12001 12001 12001 12501 12501 12501 13001 13001 13001 13501 13501 14001 14001 14501 14501 15001 15001 15501 15501 16001 16001 16501 16501 17001 異なり姓名順位 17001 NACSIS-CAT 17501 JAPAN/MARC 17501 18001 18001 18501 18501 19001 19001 19501 19501 20001 TRC/MARC 22,969 20001 20501 20501 21001 21001 21501 21501 22001 22001 22501 22501 23001 311,174 23501 24001 24501 25001 28,067 25501 著者名典拠における 26001 26501 異なり姓名順位 27001 27501 28001 428,952 異なり姓名順位 異なり姓名ごとの登録件数の分布 8 527,567 http://www.nii.ac.jp/cscenter/
  • 9. 著者名典拠における 異なり姓名順位トップ20 NACSIS--CAT JAPAN/MARC TRC/MARC 順位 姓名 登録件数 姓名 登録件数 姓名 登録件数 1 高橋徹 20 鈴木博 29 鈴木博 27 2 鈴木博 17 田中実 29 田中実 26 3 佐藤進 17 伊藤博 28 小林茂 24 4 田中実 16 小林茂 26 高橋徹 23 5 伊藤博 16 鈴木一郎 24 鈴木実 22 6 高橋進 13 高橋一郎 22 佐藤進 21 7 高橋清 13 佐藤正 22 渡辺誠 19 8 鈴木一郎 13 高橋徹 21 佐藤正 19 9 小林茂 13 鈴木実 21 伊藤博 19 10 吉田豊 13 田中豊 21 田中稔 18 11 高橋誠 12 (李〓) 21 小林一郎 18 12 田中宏 12 鈴木茂 20 鈴木隆 17 13 渡辺誠 12 吉田稔 20 鈴木茂 17 14 渡辺茂 12 田中宏 19 田中宏 17 15 小林哲夫 12 佐藤進 19 吉田豊 17 16 田中明 11 高橋和子 18 佐藤博 17 17 佐藤正 11 渡辺誠 18 高橋進 16 18 中村宏 11 渡辺宏 18 田中豊 16 19 高橋豊 10 高橋清 17 田中茂 16 9 高橋正明 10 (陳〓) 17 田中一郎 16 20 http://www.nii.ac.jp/cscenter/
  • 10. 母集団の大きさに依存する 同姓同名の割合 • 文献によると – 田中康仁,同姓同名の発生頻度,計算言語学 10-1,1977 – 昭和51年当時の日本人の漢字姓名107万人の 名簿を用いて機械的に数え上げ 同姓同名がいる人の割合(%) % 40 30 20 10 0 母集団 0 50 100 150 万人 10 http://www.nii.ac.jp/cscenter/
  • 11. 研究者の名寄せの方法 • 図書館の目録のように、閉じたデータベースの中では 人手で著者に英数字記号の識別子(Identity: ID)を付 けて区別した • 学術論文のデータベースでは、2つの方法がとられて きた – 計算機による名寄せ – 手動で登録 • 新たな名寄せの潮流 – ORCID (Open Researcher and Contributor ID) – 学術コミュニケーションに関与するすべてのステークホル ダーを包含した、研究者にIDを付与するコミュニティを形 成する 11 http://www.nii.ac.jp/cscenter/
  • 12. 学術論文データベースにおける これまでの2つのアプローチ • 計算機による名寄せ – 論文書誌を対象に著者でまとめる – 論文情報システムの著者名検索結果として機能 – プロダクションシステムとして必要な99%以上の精度を求める には程遠い – 例 • Scopus Author Identifier (Elsevier社のScopusに実装) • Distinct Author Identification System (Thomson Reuters社のWeb of Scienceに実装) • 手動で登録 – 著者を対象に論文書誌を集める – 研究者業績ショーケースとして機能 – 簡単に著者と論文書誌を網羅できない – 例 • ResearcherID (Thomson Reuters社) 12 http://www.nii.ac.jp/cscenter/
  • 13. 研究者ID付与コミュニティORCID • Open Researcher and Contributor ID – Open : 公開された – Researcher : 研究者 – Contributor : 貢献者 – ID : 本人証明 • 設立趣旨(Mission Statement) – ORCIDは、学術コミュニケーションにおける著者/貢献者の名 前の曖昧性の問題を解決することを目的とし、個々の研究者 に対する固有の識別子の中央レジストリと、ORCIDと現存する 他の著者IDスキームとの間のオープンで透過的なリンクメカニ ズムを構築することによって実現する。これらの識別子及び識 別子間の関係は研究者のアウトプットにリンクすることが可能 であり、科学的発見プロセスを拡大させ、研究コミュニティにお ける研究助成や協働の効率性を改善する。 • http://www.orcid.org/ 13 http://www.nii.ac.jp/cscenter/
  • 14. ORCIDの参加組織 • 2010年11月では144機関。 – 学術機関47、出版者28、企業19、学会15、政府 11、NPO17、その他7 – 米国70、英国30、ドイツ8、オーストラリア6、日本 3、イタリア3、インド3、スペイン2、中国2、カナ ダ2、トルコ1、スイス1 、スウェーデン1 、韓国1 、 シンガポール1 、セルビア1 、オランダ1 、イスラ エル1 、ギリシャ1 、フランス1 、エジプト1 、コロン ビア1 、ブラジル1 、ベルギー1 、オーストリア1 14 http://www.nii.ac.jp/cscenter/
  • 15. ORCID IDシステム • アイデンティティとして扱う基本的な情報 – 著者/貢献者自身の記述 – 著者/貢献者とその出版物間の関係の記述 • ハイブリッド型による登録 – 著者/貢献者による登録 プロファイル – 組織による登録 ORCID ID 出版物申告 15 http://www.nii.ac.jp/cscenter/
  • 16. ORCID IDシステムのシナリオ エンド パートナー ユーザー システム たとえば、原稿追跡システム( だれが文書Xを書いたか? MTS : Manuscript Tracking System)にシングルサインオン( ID Yの人が書いた、 SSO)して、編集事務局、マーケ または査読した文書はどれか? ティング部門、ロイヤルティ支払 いシステムなどと連絡先情報を 共有 コアシステム (ORCID identity system) 16 http://www.nii.ac.jp/cscenter/
  • 17. プロファイルの交換とマッチング 可能なマッチングアルゴリズム • VIAF(OCLC) • Author Resolver (ProQuest) • OKKAM ORCID F67572010 (By Howard Ratner, ORCID Update, Slides at CrossRef Annual Meeting, in London, 16 Nov. 2010) 17 http://www.nii.ac.jp/cscenter/
  • 18. 著作者にIDを付ける活動 • バーチャル国際典拠ファイル VIAF (Virtual International Authority File), – 米国OCLC – LC – ドイツDNB – フランスBnF • 国際標準名前識別子 ISNI (International Standard Name Identifier), ISO27729 – International Confederation of Societies of Authors and Composers (CISAC) www.cisac.org – International Federation of Reproduction Rights Organisations (IFRRO)www.ifrro.org – International Performers’ Database Association (ipda.sami.se) – Bowker (www.bowker.com ) – Online Computer Library Center (OCLC) (www.oclc.org) – Bibliotheque Nationale de France – The British Library 18 http://www.nii.ac.jp/cscenter/
  • 19. VIAF • 各国の名前典拠ファイルをリンク • 今は個人名のみ • 1050万件(2010-03)の 名前レコード • 抽出元 – 1300万件名前レコード – 8000万件の引用レコード 19 http://www.nii.ac.jp/cscenter/
  • 21. 機関リポジトリを対象とした 著者にIDを付ける活動 • DAI (Digital Author Identifier), オランダ SURF財団 • Names Project, 英国 Mimas, JISC funded • arXiv.org Author Identifiers, 米国コーネル 大学 • Networking Names, 米国OCLC • 研究者リゾルバー,NII 21 http://www.nii.ac.jp/cscenter/
  • 22. JAIRO著者同定 日本の機関リポジトリからJAIROがハーベストした 書誌メタデータに書かれた著者を同定するために 研究者リゾルバーIDと機関のローカル研究者IDとの マッピングテーブル メタデータをハーベストする間、 ローカル研究者IDを解決する 研究者リゾルバー JAIRO NII (国レベル) 書誌メタデータ [ローカル研究者IDが組み込まれている] IR著者名典拠 IR (研究者ディレクトリ) 機関 (機関レベル) 双方のシステムで同一のローカル研究者 IDスキームが使われるべきである 著者名典拠 書誌レコード 22 http://www.nii.ac.jp/cscenter/
  • 23. IRにおける研究者典拠IDの付与 DSpace 1.6 Authority Control 23 http://www.nii.ac.jp/cscenter/
  • 24. 研究者リゾルバーの目的 • 日本の研究者を対象としたWeb上の名前典拠 – Web上にアーカイブされたリソースをターゲット • 例1) 機関リポジトリ • 例2) 論文アーカイブ – さらに、日本の研究組織を対象とした名称典拠 • 2種類のエンティティ、すなわち論文と研究者をベースとした情報マネージメント • 情報の質に応じた研究者情報マネージメント – 研究者情報の品質レベル • 機関担当者による \論文 機関担当者による 研究者自身に 機械による • 研究者自身による \ とりまとめ よるとりまとめ 自動処理 \ • 機械の自動処理による 高 研究者 • Web上のリソースのリンキングハブ 機関担当 研究者ディレクトリ 機関にある – 研究者データベースへ直接リンク 者による ReaD ホームページ 登録 IR • 大学研究者ディレクトリ, KAKEN, ReaD KAKEN 情報の品質レベル 研究者のカバー率 – 学術関連データベースへ 研究者 検索問い合わせURLリンク リゾルバー • Google (Scholar), CiNii, WebcatPlus, ReaD 研究者自 ResearcherID • Linked Data Webのための、 身による 登録 Researchmap 日本の研究者と組織のURI表現 機械によ CiNii 著者検索 Google • 名前解決するWebサービス る自動処 Google 高 理 scholar • NIIの学術関連サービスへの 密接なデータ連携 24 http://www.nii.ac.jp/cscenter/
  • 25. 研究者リゾルバーのアプローチ • 日本の研究者を対象としたURIベースのIDスキーム – 研究者リゾルバーID – http://rns.nii.ac.jp/nr/xxxxxxxxxxxxx (xxxxxxxxxxxxxはID) • KAKENから研究者を初期登録 (2010年3月19日現在、 177,558人) • 機関担当者による、IDに紐づいた研究者プロファイルのアップロード – 研究者リゾルバーIDと、他のIDスキームによるIDリスト • 機関による完全に永続的なID (例、職員番号、同姓同名を区別する) • ・・・・・ • 科研費研究者番号 • ReaD研究者コード • ResearcherID (Thomson Reuters) • 研究者リゾルバーID – 名前 – 所属履歴 – 業績リスト • 大学研究者ディレクトリへの自動リンキング – 大学研究者ディレクトリをWebクローリング – 自動研究者同定 25 http://www.nii.ac.jp/cscenter/
  • 26. 研究者同定スキーム • 研究者が同じ人物であることを示すこと 研究者同定 • 研究者/著者を同定しマネージメントするひとつの方法 – 番号IDスキーム • 13ケタの番号によって研究者を表す • 研究者リゾルバーIDと呼ぶ ID (13ケタの番号) 説明 10000xxxxxxxx 科研費登録者のID割り当て xxxxxxxx は、科研費研究者番号 (8 桁) 200xxxxxxxxxx ReaD登録者のID割り当て(科研費登録者は除く) xxxxxxxxxx は、ReaD研究者コード (10桁) 3xxxxxxxxxxxx それ以外のID割り当て 26 http://www.nii.ac.jp/cscenter/
  • 27. IDの特徴 • KAKEN ID (科研費研究者番号) – 科学研究費補助金における研究者番号 – 文部省(現・文部科学省)が1939年に開始した,多様 な研究分野・研究組織・研究段階を対象とした,日本 で最大唯一の研究費配分制度 – 約18万人が登録 • ReaD ID – JST(科学技術振興機構)が運営する,研究者・研究 機関ディレクトリの研究者ID – 約22万人が登録 – 大学教員,研究スタッフのほか,大学院生含む 27 http://www.nii.ac.jp/cscenter/
  • 28. 機関担当者による データアップローディング 研究者リゾルバーIDと機関のローカル研究者IDとのマッピングテーブルを構築し、 研究者名を解決する 機関は何をすべきか? 1. 機関自身を表明する 研究者リゾルバー 2. 機関のローカル研究者IDを登録するために、 NII a) ローカル研究者IDとそれに紐づいた国内で広く使われている研究者IDを知らせる A: KAKEN ID B:ReaD ID → KAKEN ID または ReaD ID ベースの研究者リゾルバーIDが 登録される a’) ローカル研究者IDを新規登録者として知らせる → 新しい研究者リゾルバーIDが割り当てられる 3. 機関のローカル研究者ID同士のマッピングのために、 a) ローカル研究者IDに紐づいた、別の外部スキーマによる研究者IDを知らせる A: KAKEN ID IR研究者典拠 B: ReaD ID 機関 (研究者ディレクトリ) C: ResearcherID D: その他サービスのIDs…. 4. 研究者のプロファイルをステートするために、 a) 研究者名、所属履歴、研究業績を知らせる 5. 研究者リゾルバーから研究者ディレクトリへ逆リンクをはるために、 a) それぞれのローカル研究者IDに割り当てられた研究者ディレクトリのURLを教える 日本人の名前とデータに適用し、IDマップを構築できるよう ResearcherIDのフォーマットを拡張したXMLファイルをアップロードする 28 http://www.nii.ac.jp/cscenter/
  • 29. 機関担当者の視点 • IR – 機関固有のローカルな研究者IDが埋 め込まれた書誌メタデータが様々な OAIster OAIサービスプロバイダーにハーベスト • IR研究者典拠(研究者ディレクトリ) – 機関がローカルな研究者IDに紐づいた IR JAIRO 研究者プロファイルを研究者を指向し たサービスプロバイダにアップロード – 研究者リゾルバーの研究者プロファイ NDLTD ルには以下の項目が含まれる (Networked Digital Library of Theses and Dissertations) • ローカルな研究者ID • 名前 • 外部サービスのID,たとえば (ResearcherID) – 科研費研究者番号 – ReaD研究者コード – ResearcherID – 研究者リゾルバーID IR研究者典拠 • 個々の研究者の研究者ディレクトリ 研究者リゾルバー (研究者ディレクトリ) URL • 所属履歴 • 業績リスト (ReaD) 29 http://www.nii.ac.jp/cscenter/
  • 30. 異なる研究者リソース間のリンキング • 異なる研究者ID集合間のIDマッチング 研究者ID集合A 研究者ID集合B 30 http://www.nii.ac.jp/cscenter/
  • 31. 研究者Webリソースリンキング • Web上の研究者ID集合 – 大学研究者ディレクトリ – J-Global (ReaD) – KAKEN • 集合間のIDマッチング 大学研究者ディレクトリ B 大学研究者ディレクトリ A 研究者リゾルバー KAKEN J-Global 31 http://www.nii.ac.jp/cscenter/
  • 32. 大学研究者ディレクトリへのリンク • Web上の大学研究者ディレクトリへのクローリ ング – 研究者ページのURLを特定 – それぞれのURLに対して研究者名を特定 • 研究者リゾルバーIDと大学研究者ディレクトリ のローカルIDを同定する方法を適用 • 研究者リゾルバーの研究者ページから大学研 究者ディレクトリの研究者ページURLへリンク 32 http://www.nii.ac.jp/cscenter/
  • 33. 研究者同定のひとつの方法 • KAKENと研究者ディレクトリのそれぞれのID に対して以下のとき、同一人物と判定する – 漢字氏名の一致 – 所属の一致 – 所属内でユニーク名(同姓同名がいない) • IDが以下のとき、同一人物である – KAKEN IDが同一 – ReaD IDが同一 33 http://www.nii.ac.jp/cscenter/
  • 34. システム間連携の概略 2010年度 論文著者フィールドに 機関の永続固定IDを組み込む 機関研究者ディレ 研究者サービス クトリ および 機関研究者ディレクトリ 機関リポジトリ 機関リポジトリ 機関の永続固定IDごとの 機関の永続固定IDごとの 研究者プロファイルと 研究者プロファイルと Web of 業績リスト 業績リスト 研究者と論文のサービス Knowledge ResearcherID (Thomson (Thomson Reuters) Reuters) 機関の永続固定IDと研究者リゾルバーIDを 変換するための質問と応答 JAIRO 論文サービス 研究者リゾルバー 日本の機関リポジトリ (NII) 横断検索サービス KAKEN IDとReaD IDの (NII) KAKEN ID、 CLS マッピングテーブル リンク 研究者姓名、所属、 分野、キーワード KAKEN CiNii データ連携 (NII) ALS (NII) J-Global (Including ReaD) (JST) Researchmap (NII) 34 http://www.nii.ac.jp/cscenter/
  • 35. 研究者リゾルバー β1.0 現在の実装 • 研究者ごとのページ – 現在はKAKENに登録された研究者に対しページを提供 – 約18万研究者 – 同姓同名解決された研究者 • Web上の研究者リソースとのリンク – 直接リンク • KAKEN Webクローリングと • 機関の研究者DB(現在33大学を対象) KAKEN IDマッチング • J-Global (JST 旧ReaD) – 検索問い合わせリンク • Google, Google Scholar, CiNii, Webcat Plus, ReaDへの日本語・英語の氏名,所属 による問い合わせ • 機関担当者による研究者プロファイルと業績リストのアップロード • SemanticWebのための質問応答 – OpenSearch – RDF/XML • 研究者IDリダイレクトWebサービス • http://rns.nii.ac.jp/ 35 http://www.nii.ac.jp/cscenter/
  • 36. 研究者リゾルバー β1.0 研究者ページ(概略) 研究者姓名 (漢字,カタカナ,ローマ字) 研究者基本情報 直接リンク 検索質問フォーマットURLリンク 科研費研究課題の研究分野 科研費研究課題のキーワード このページのURI 36 http://www.nii.ac.jp/cscenter/
  • 37. 研究者リゾルバー β1.0 研究者ページ(上側) 研究者姓名 (漢字,カタカナ,ローマ字) 研究者リゾルバーID 研究者 科研費研究者番号 基本情報 所属 37 http://www.nii.ac.jp/cscenter/
  • 38. 研究者リゾルバー β1.0 研究者ページ(上側) 直接リンク •KAKEN(NII) •大学研究者ディレクトリ •J-Global(ReaD) 38 http://www.nii.ac.jp/cscenter/
  • 39. 研究者リゾルバー β1.0 研究者ページ(上側) 検索質問フォーマットURLリンク (漢字姓名と所属) •Google 39 http://www.nii.ac.jp/cscenter/
  • 40. 研究者リゾルバー β1.0 研究者ページ(上側) 検索質問フォーマットURLリンク (漢字姓名) •CiNii •Webcat Plus •ReaD •Google Scholar •Google 40 http://www.nii.ac.jp/cscenter/
  • 41. 研究者リゾルバー β1.0 研究者ページ(上側) 検索質問フォーマットURLリンク (英語姓名) •CiNii •Webcat Plus •ReaD •Google Scholar •Google 41 http://www.nii.ac.jp/cscenter/
  • 42. 研究者リゾルバー β1.0 研究者ページ(下側) 科研費研究課題の 研究分野 科研費研究課題の キーワード このページの URI 42 http://www.nii.ac.jp/cscenter/
  • 43. Webの波 • Web技術のパラダイムシフト – Web of Documentsから – Web of Dataへ • Linking Open Dataの潮流 – RDFによって事実を記述して、データとして公開 – RDFでは、事実は2つのリソース(URI)と語彙で記 述される • 抽象的な概念を含めてすべてのモノをURIで表現 • モノの関係を表す語彙を定義して、2つのURIの関係を 語彙でつないで表す 43 http://www.nii.ac.jp/cscenter/
  • 44. Linked Data Web of Open Repositories in 2010 - 2015 2010-07-28, Kei Kurakawa, NII URI based Identification of All Resources Fact Descriptions in RDF (Resource Description Framework) Scholarly Communications Vocabulary Open Repositories Open Repositories by Institutions by Institutions dcterms:Agent rdfs:Resource dcterms:creator Open Repositories Open Repositories by Institutions in the Cloud
  • 45. Linked Data Webのための 検索質問応答API • OpenSearch1.1 • RDF/XML 45 http://www.nii.ac.jp/cscenter/
  • 46. 研究者IDリダイレクトWebサービス • 研究者IDとターゲットサービスをURLで指定 して,研究者ページへリダイレクトするWebサ ービス 研究者ID解決して http://rns.nii.ac.jp/services/redire 目的のサービスへ ct?source=resolver&id=1000010 リダイレクト 295694&target=kaken sourceに指定できるID 研究者リゾルバーID KAKEN(NII) ReaD(JST) ResearcherID(Thomson Reuters) 機関の研究者ディレクトリ アップロードした機関のローカル研究者ID 46 http://www.nii.ac.jp/cscenter/
  • 47. サービス連携の例 • 京都大学リポジトリ • 静岡大学リポジトリ(SURE) (KURENAI) – dc.contributor.author – dc.contributor.author – dc.contributor.alternative – dc.contributor.transcription 47 http://www.nii.ac.jp/cscenter/
  • 49. まとめ • 研究者の学術研究の貢献度を正確に測るために は,名前の曖昧性の問題を解決して,研究成果 に記述された著者の名寄せを行う必要がある. • 日本人姓名に関しては,図書館典拠ファイルを調 査したところ,同姓同名が50万人規模で10パー セント以上存在する. • 著者に識別子を付与して名寄せを行う活動は, 世界で行われている • 研究者リゾルバーは,日本の研究者の識別子を 与える 49 http://www.nii.ac.jp/cscenter/