リサーチ・ナビ検索システムの技術

Yoji Kiyota
Yoji KiyotaPrincipal Investigator en LIFULL Co., Ltd.
リサーチ・ナビ検索システムの
      技術
  東京大学情報基盤センター
  学術情報研究部門 助教
     清田 陽司
リサーチ・ナビ検索システムの
        ポイント
• 「テーマグラフ」の表示
 – 件名標目表(NDLSH)とWikipediaのマッシュアップ
• タブデザインの採用
 – 用途に応じて表示内容を自由に切り替え
• さまざまな情報資源を統合して検索
 – PORTAをはじめとする多くの情報資源にアクセス
• レスポンスの向上
 – 検索結果が得られたコンテンツから順次表示
情報探しのニーズ
• Webサーチエンジンで探せる質問=事実を問う
  質問
 – 関東大震災はいつ発生しましたか?
 – ○○ってどんな病気?
• 本当に探し手が知りたいこと
 – 大学の学生「関東大震災についてのレポートを書か
   なきゃいけなんだけど、いったいどんな資料から調べ
   たらいいの?」
 – 難病の患者「この病気について最先端の治療を行っ
   ている病院を探す方法は?」
       情報の調べ方が曖昧な場合が多い
    →調べ方の推薦(レコメンデーション)が必要!
 3
Agenda
• なぜWikipediaを使うのか?
 – Wikipediaはどうやって作られているのか?
 – Wikipediaは信頼できるのか?
 – Wikipediaとどう向き合うべきか?
• テーマグラフのしくみ
 – 検索したキーワードと件名をどう結びつけているの
   か?
• システム開発上の工夫
 – タブデザインの採用
 – Web APIの活用
 – レスポンスの向上
• 図書館がもつ知識の価値の今後は?
Wikipediaとは?
• オンライン百科事典
 – 専門家によるオンライン百科事典プロジェクト
   「Nupedia」を前身として2001年に発足
 – 個人や団体の寄付により運営
• Wikipediaの特徴
 – 誰もが編集に参加できる (資格制限なし)
 – ボランティアによる執筆・編集・運営
 – Wikiシステム(ブラウザでWeb上のテキストを書き
   換えることができる)
 – 内容は自由に複製・配布・改変できる
Wikipediaの信頼性をめぐる議論
• WikipediaとEncyclopædia Britannicaの比較
  – 2005年 Nature 「科学用語について比較したところ、
    Wikipediaの方が誤りが少なかった」
  – Britannicaは反論
• 査読制度なし
  – 「間違いがあれば迅速に訂正できる仕組みを提供す
    る」という考え方
• 引用文献として使えるか?
  – Wikipediaの創始者Jimmy Wales 「Wikipediaを原典と
    して利用すべきではなく、あくまで出発点にすべき」
Wikipediaの秩序維持
誰でも編集できるが自由放任ではない
• ガイドライン (5つの原則)
 – Wikipediaは百科事典
 – 中立的な観点: 出典の明記
 – 利用はフリー: どの個人も特定の項目を支配でき
   ない、著作権侵害の禁止
 – 行動規範: 敬意、礼儀正しさ、冷静の維持
 – 確固としたルールはない: ルールの精神の尊重
• ページ毎のノート (議論、合意形成の場)
• 管理者によるコントロール
 – 保護、削除、投稿ブロック、管理者の選任・解任
調べ方推薦の要件
• カバレッジ
 – どんなキーワードに対しても何かをお薦めして    Web
   欲しい                      情報資源
 – これができないと結局使ってもらえない
                            Wikipedia
• 組織化
 – 「これを見た人はこんな情報も見ています」で
   は不十分!
 – 分類ごとにお薦めすべき情報資源には定番が     図書館
   存在                       情報資源
• 信頼性
 – 「ネットでググる」だけでは不十分!
 – 信頼できる情報資源が必要
 Wikipediaを橋渡しとして、信頼できる情報
 8
 資源をお薦めできないか?
Wikipediaの構造
                  価格
各記事にはカテゴリが        価格(かかく)とは、有形・無形の各種の商品
  付与されている         (サービスを含む)の取引に際して提示される金
                  額を言う。基本的には需要と供給のバランスに
• いわゆるフォークソノ      よって決定される。一般には、値段(ねだん)とも
                  呼ばれる。
  ミーの特徴を有する       …
                  カテゴリ: [マーケティング][経済学][市場]
• カテゴリにもカテゴリ
  を付与できる(ゆるや                社会
                   社会科学
  かな階層構造)                   経済
• 複数の上位概念を与      労働                   産業
  えることができる(多
  重継承)         ビジネススキル                商業
                   経営学           流通
                  マーケティング   経済学       市場
                                           9
                            価格
タクソノミーとフォークソノミー
タクソノミー               フォークソノミー
• トップダウン的な分類         • ボトムアップ的な分類
• ひとつの上位概念           • 複数の上位概念
                            再生可能 半導体
       電気化学           電池    エネルギー 素子

 電離層   電池     磁気化学


燃料電池   太陽電池    蓄電池   燃料電池   太陽電池   トランジスタ



図書館的な分類体系            Web的な分類体系
                                       10
タクソノミー型       社会
  構造
       社会科学   経済


  労働                     産業

ビジネススキル                  商業

       経営学          流通

    マーケティング   経済学        市場

フォークソノミー型
   構造         価格              11
リサーチ・ナビとWikipedia
• Webと図書館をつなぐ中間的な情報資源とし
  いて扱う
• 調べものの出発点として位置づけ
 – Wikipediaの記事を最終的なゴールとはしない
 – Wikipediaへのリンクは「百科事典」タブ内に集約
• 表記揺れ辞書として利用
 – 「線形代数学」と「線型代数学」


                             12
提案: Wikipediaと図書館分類体系の
           対応づけ
図書館の分類体系をWikipediaで拡張してみよう!
• Wikipedia
 – Webの汎用的な情報資源としては最も組織化されてい
   る(Wikipediaカテゴリ)
 – Web上の他の情報資源との親和性をもつ
• 図書館分類体系(件名標目表、書架分類法)
 – 人類が営々と積み重ねてきた知識体系
 – 価値判断に必要な情報資源への有力なポインタ
両者を組み合わせて利用することによって、キー
 ワードから探索テーマ(=件名)を自動導出する
→ 導出された件名に関連する情報資源を提示 13
社会科学(300)                  自然科学(400)    技術(500)

                     「地震防災の事典」(岡              「日本被害地震総覧」
             経済(330) 田恒男ほか, 2000年)
                       社会(360)              地球科学(450) 建築学(520)
                                               (宇佐美龍夫, 2003年)
             経済史(332)   社会福祉(369)            地震学(453) 建築構造(524)
「経済学事典」(日本
経済新聞社, 1996年)
経済史-日本                    災害          地震誌(453.2)      地震
 (332.1)
経済史-日本                         地震災害           地震予知         耐震建築
-平成時代
 (332.107)                          図書館オントロジー
                                     (NDC, NDLSH)
                                       Wikipedia
              経済史         災害
                                     震災がその後の
              日本の       災害と防災の        防災対策に           地震
              経済史         歴史          与えた影響

   平成時代                              地震の歴史         震災を引き起こした
                                                   地震(1995年兵庫県
  震災が日本経済に                                           南部地震) 14
    与えた影響                 阪神・淡路大震災
情報探索の
    スタート地点


         Web情報資源(サーチエンジン)
              フォークソノミー
                                 情
 図書館    Wikipedia                報
 分類体系                            の
 •NDC                            専
                    対応づけ→        門
 •BSH                            性
                    深い情報探
多様な情報資源                          ・信
                      索へ
•入門書                             頼
•レファレンスブック                       性
•各種データベース
•学術雑誌論文
•過去の文献・資料                   15
テーマグラフの導出
• 入力したキーワードにマッチするWikipediaの
  記事を出発点として、カテゴリネットワークを
  芋づる式にたどる
• 探索を発散させないための工夫
 – NDLSHにたどりつかない経路はカットする
 – カテゴリ間の意味の類似度を考慮し、関連性の
   低い経路はカットする


                           16
カテゴリ
                        「電気化学」
  項目                     スコア0.3
            カテゴリ
「燃料電池」
             「電池」
 スコア1.0
            スコア0.7

                          カテゴリ
                         「電子部品」
                          スコア0.3


             カテゴリ
           「自動車工学」
             スコア0.4
                         カテゴリ
                        「自動車」
                        スコア0.35

  カテゴリ
 「節予定」?         カテゴリ
  スコア0.4       「予定」?
               スコア0.3
                            ?      17
性能向上には
電子工学、材料工学、                                        燃料電池の普及がCO2の
                     環境問題解決の切り札と
化学などの分野にまた            して注目されている?                  削減にもたらす効果は?
がった知見が必要?


                  将来の企業経営に与え
                   るインパクトは?




                               燃料電池が一般家庭に                    燃料電池の普及が生態
    エネルギー政策の立案                 普及した場合、電力網の   膨大な研究開発費は自      系にもたらす影響は?
    においてどのような位置                安定性にどのような影響   動車メーカーから投入さ
    づけがなされているか?                   があるか?         れている?
検索システムの画面デザイン
• リサーチ・ナビCMS (Movable Type)と共通の
  デザイン
 – 利用者は両者の違いを意識せず使える
• タブデザインの採用
 – 画面領域の制約の緩和
 – 利用者の目的に応じて振り分け
• 「すべて」タブ内でのサマリ表示
 – コンテンツの俯瞰が可能
• 「検索履歴」リストボックス
 – いつでも立ち戻って調べることができる
(1) 検索キーワードの
                 入力ボックス
                  (4) 検索履歴
                     リストボックス


                       (2) 表示内容切り替えタブ




                   各々のタブ内のコンテンツの
                       サマリー




(3) 検索結果表示
   エリア
調べ方案内




レファレンス共同DB
NDL OPAC
  雑誌記事索引
近代デジタルライブラリー




  参考図書紹介
目次データベースなど
テーマグラフに含まれる件名標目
   日本十進分類法(NDC)
      関連標目
テーマグラフ本体
関連キーワードの
 タグクラウド
様々な情報資源への統合アクセス
• NDL PORTA API
  – 「調べ方ガイド」「国立国会図書館にある本」
• リサーチ・ナビ内部の検索インデックス
  – リサーチ・ナビCMSに搭載されたコンテンツ
  – Wikipedia全文データ
• 関連キーワード抽出
  – Wikipediaから生成した文書=単語マトリックス
• テーマグラフ導出エンジン
cf. 書籍販売WebサイトのAPI
   クリアすべき課題はあるが意義は大きい
検索            検索履歴
 ハイパー
           キーワード            リスト               「すべて」                         ユーザ
  リンク
           入力ボックス          ボックス                 タブ                          インタ
                                                                           フェース
             検索                                                             (Web
                           「キーワード」    「百科事典」           「調べ方」    「本・サイト」    ブラウザ)
             コント
                              タブ        タブ               タブ       タブ
             ローラ




                                                        レファレ
テーマグ    分類導出       関連KW     百科事典     調べ方ガ     NDL目次            NDL書籍   書籍販売
                                                        ンス事例
ラフRPC    RPC        RPC      RPC     イドRPC    検索RPC            検索RPC   サイトRPC
                                                         RPC

                   関連KW
  分類自動導出
                    抽出            Lucene検索エンジン                              バック
   エンジン            エンジン
                                                                            エンド
                                                                            サーバ
    分類体系             KW
                            インデックス   インデックス   インデックス
     DB            マトリックス


  分類体系DB生成         マトリック          Luceneインデクサ
                    ス生成




                                                           PORTA       書籍販売
NDLSH        Wikipedia
                                     リサーチ・ナビCMS             API        サイトAPI
レスポンスの向上
情報資源の中には検索時間がかかるものもある
→ システム全体への影響を最小限に抑える必要

AJAX技術による実装
• システムロジックの大部分をブラウザ側で実行
 – サーバ側の処理負担軽減
• 非同期呼び出し
 – 結果が得られたコンテンツから順次表示
まとめ
• Wikipediaと図書館分類体系の統合利用によって、
  パスファインダーに近い「情報探索のヒント提示」を
  可能とした
   – 情報探索の多様な「切り口」の提示
   – 信頼性のある情報資源への誘導
• 「図書館かWebか」という二項対立ではなく、両者の
  役割を踏まえた見方が大事
   – 図書館: 信頼性、組織化
   – Web: どんなキーワードからでも探せる

                            29
図書館の知識の価値
• Webサーチエンジンの普及に大きな影響を受
  けている
• 図書館の最大の価値=情報資源の多様性
 – 利用者へのプレゼンテーションが非常に重要
 – ランキングではない見せ方
 – 探すプロセスを楽しんでもらう工夫
• 個人の知識欲と図書館の体系をどうつなぐ?
 – 「自分なりの本棚を作る」お手伝いができれば幸
   いです
1 de 30

Recomendados

リテラシー研修 Amano 201210_ss por
リテラシー研修 Amano 201210_ssリテラシー研修 Amano 201210_ss
リテラシー研修 Amano 201210_ssEriko Amano
1.3K vistas39 diapositivas
「Ecm (エンタープライズ・コンテンツ管理)」と市場動向 por
「Ecm (エンタープライズ・コンテンツ管理)」と市場動向「Ecm (エンタープライズ・コンテンツ管理)」と市場動向
「Ecm (エンタープライズ・コンテンツ管理)」と市場動向Osamu Urakawa
4.5K vistas44 diapositivas
20090827 ku-librarians勉強会 #114 : Wikipediaをいかに使いこなすか? ---知識抽出、情報ナビゲーション、そしてトピ... por
20090827 ku-librarians勉強会 #114 : Wikipediaをいかに使いこなすか? ---知識抽出、情報ナビゲーション、そしてトピ...20090827 ku-librarians勉強会 #114 : Wikipediaをいかに使いこなすか? ---知識抽出、情報ナビゲーション、そしてトピ...
20090827 ku-librarians勉強会 #114 : Wikipediaをいかに使いこなすか? ---知識抽出、情報ナビゲーション、そしてトピ...kulibrarians
1.8K vistas83 diapositivas
Ksws3rd nagao keynote(20101218) por
Ksws3rd nagao keynote(20101218)Ksws3rd nagao keynote(20101218)
Ksws3rd nagao keynote(20101218)真 岡本
1.2K vistas50 diapositivas
マイニング探検会#04 por
マイニング探検会#04マイニング探検会#04
マイニング探検会#04Yoji Kiyota
448 vistas12 diapositivas
Infosta実習 発表ver por
Infosta実習 発表verInfosta実習 発表ver
Infosta実習 発表verskdmai
375 vistas42 diapositivas

Más contenido relacionado

Similar a リサーチ・ナビ検索システムの技術

つながる目録、つながるサービス@図書館総合展(2015.11.12) por
つながる目録、つながるサービス@図書館総合展(2015.11.12)つながる目録、つながるサービス@図書館総合展(2015.11.12)
つながる目録、つながるサービス@図書館総合展(2015.11.12)Ikki Ohmukai
3.2K vistas21 diapositivas
ポータル研修 201208 天野_発表用 por
ポータル研修 201208 天野_発表用ポータル研修 201208 天野_発表用
ポータル研修 201208 天野_発表用Eriko Amano
658 vistas15 diapositivas
CiNiiのメタデータ・デザイン@LinkedData勉強会(2012.01.18) por
CiNiiのメタデータ・デザイン@LinkedData勉強会(2012.01.18)CiNiiのメタデータ・デザイン@LinkedData勉強会(2012.01.18)
CiNiiのメタデータ・デザイン@LinkedData勉強会(2012.01.18)Ikki Ohmukai
1.8K vistas15 diapositivas
Organizing of Information Resources = 情報資源組織論. 13 por
Organizing of Information Resources = 情報資源組織論. 13Organizing of Information Resources = 情報資源組織論. 13
Organizing of Information Resources = 情報資源組織論. 13Hakudou Fukuda
78 vistas19 diapositivas
Hasegawa 20100925mslis ver_final por
Hasegawa 20100925mslis ver_finalHasegawa 20100925mslis ver_final
Hasegawa 20100925mslis ver_finalToyohiro Hasegawa
379 vistas24 diapositivas
リンクリゾルバの仕組み por
リンクリゾルバの仕組みリンクリゾルバの仕組み
リンクリゾルバの仕組みWataru ONO
10.9K vistas37 diapositivas

Similar a リサーチ・ナビ検索システムの技術(20)

つながる目録、つながるサービス@図書館総合展(2015.11.12) por Ikki Ohmukai
つながる目録、つながるサービス@図書館総合展(2015.11.12)つながる目録、つながるサービス@図書館総合展(2015.11.12)
つながる目録、つながるサービス@図書館総合展(2015.11.12)
Ikki Ohmukai3.2K vistas
ポータル研修 201208 天野_発表用 por Eriko Amano
ポータル研修 201208 天野_発表用ポータル研修 201208 天野_発表用
ポータル研修 201208 天野_発表用
Eriko Amano658 vistas
CiNiiのメタデータ・デザイン@LinkedData勉強会(2012.01.18) por Ikki Ohmukai
CiNiiのメタデータ・デザイン@LinkedData勉強会(2012.01.18)CiNiiのメタデータ・デザイン@LinkedData勉強会(2012.01.18)
CiNiiのメタデータ・デザイン@LinkedData勉強会(2012.01.18)
Ikki Ohmukai1.8K vistas
Organizing of Information Resources = 情報資源組織論. 13 por Hakudou Fukuda
Organizing of Information Resources = 情報資源組織論. 13Organizing of Information Resources = 情報資源組織論. 13
Organizing of Information Resources = 情報資源組織論. 13
Hakudou Fukuda78 vistas
リンクリゾルバの仕組み por Wataru ONO
リンクリゾルバの仕組みリンクリゾルバの仕組み
リンクリゾルバの仕組み
Wataru ONO10.9K vistas
情報爆発シンポジウム infoplosion por Rakuten Group, Inc.
情報爆発シンポジウム infoplosion情報爆発シンポジウム infoplosion
情報爆発シンポジウム infoplosion
Rakuten Group, Inc.1.4K vistas
学術情報XML推進協議会 第5回総会・講演会(2016) : XML Scholarly Publishing Association; XSPA por Kazuhiro Hayashi
学術情報XML推進協議会 第5回総会・講演会(2016) : XML Scholarly Publishing Association; XSPA学術情報XML推進協議会 第5回総会・講演会(2016) : XML Scholarly Publishing Association; XSPA
学術情報XML推進協議会 第5回総会・講演会(2016) : XML Scholarly Publishing Association; XSPA
Kazuhiro Hayashi1.2K vistas
100622 学術情報セミナー por Shuhei Otani
100622 学術情報セミナー100622 学術情報セミナー
100622 学術情報セミナー
Shuhei Otani506 vistas
20100611 学会とウィキペディアの協力体制の模索 por Tomoaki Watanabe
20100611 学会とウィキペディアの協力体制の模索20100611 学会とウィキペディアの協力体制の模索
20100611 学会とウィキペディアの協力体制の模索
Tomoaki Watanabe581 vistas
UMDS(20110820) por 真 岡本
UMDS(20110820)UMDS(20110820)
UMDS(20110820)
真 岡本539 vistas
セマンティック・ウェブと学術情報サービス@国立国会図書館講演会(2010.07.27) por Ikki Ohmukai
セマンティック・ウェブと学術情報サービス@国立国会図書館講演会(2010.07.27)セマンティック・ウェブと学術情報サービス@国立国会図書館講演会(2010.07.27)
セマンティック・ウェブと学術情報サービス@国立国会図書館講演会(2010.07.27)
Ikki Ohmukai1.2K vistas
理工学部計算機実習0604 por Mitsuru Tanaka
理工学部計算機実習0604理工学部計算機実習0604
理工学部計算機実習0604
Mitsuru Tanaka213 vistas
Code4Lib 2010報告会・発表ダイジェスト por Masao Takaku
Code4Lib 2010報告会・発表ダイジェストCode4Lib 2010報告会・発表ダイジェスト
Code4Lib 2010報告会・発表ダイジェスト
Masao Takaku857 vistas
20031001 ku-librarians勉強会 #49 : レファレンス協同データベース実験事業 por kulibrarians
20031001 ku-librarians勉強会 #49 : レファレンス協同データベース実験事業20031001 ku-librarians勉強会 #49 : レファレンス協同データベース実験事業
20031001 ku-librarians勉強会 #49 : レファレンス協同データベース実験事業
kulibrarians442 vistas
学術情報流通のための識別子とメタデータDBを対象とした融合研究シーズ探索 - 超高層物理学分野における観測データを例として - por National Institute of Informatics
学術情報流通のための識別子とメタデータDBを対象とした融合研究シーズ探索 - 超高層物理学分野における観測データを例として -学術情報流通のための識別子とメタデータDBを対象とした融合研究シーズ探索 - 超高層物理学分野における観測データを例として -
学術情報流通のための識別子とメタデータDBを対象とした融合研究シーズ探索 - 超高層物理学分野における観測データを例として -
TokaiHokurikuUlib(20111003) por 真 岡本
TokaiHokurikuUlib(20111003)TokaiHokurikuUlib(20111003)
TokaiHokurikuUlib(20111003)
真 岡本812 vistas

Más de Yoji Kiyota

テキストアナリティクスの知見を社会に活かすには? -シーズ指向の視点とニーズ指向の視点- por
テキストアナリティクスの知見を社会に活かすには? -シーズ指向の視点とニーズ指向の視点-テキストアナリティクスの知見を社会に活かすには? -シーズ指向の視点とニーズ指向の視点-
テキストアナリティクスの知見を社会に活かすには? -シーズ指向の視点とニーズ指向の視点-Yoji Kiyota
1.1K vistas54 diapositivas
「LIFULL HOME'Sデータセット」提供を通じた不動産テック分野のオープンイノベーション por
「LIFULL HOME'Sデータセット」提供を通じた不動産テック分野のオープンイノベーション「LIFULL HOME'Sデータセット」提供を通じた不動産テック分野のオープンイノベーション
「LIFULL HOME'Sデータセット」提供を通じた不動産テック分野のオープンイノベーションYoji Kiyota
1.5K vistas34 diapositivas
論文執筆の環境をめぐる最新の状況と、学会の査読・編集システムを持続可能とするための方策の検討 por
論文執筆の環境をめぐる最新の状況と、学会の査読・編集システムを持続可能とするための方策の検討論文執筆の環境をめぐる最新の状況と、学会の査読・編集システムを持続可能とするための方策の検討
論文執筆の環境をめぐる最新の状況と、学会の査読・編集システムを持続可能とするための方策の検討Yoji Kiyota
1.6K vistas30 diapositivas
LIFULL HOME'Sにおける不動産物件画像解析 por
LIFULL HOME'Sにおける不動産物件画像解析LIFULL HOME'Sにおける不動産物件画像解析
LIFULL HOME'Sにおける不動産物件画像解析Yoji Kiyota
2K vistas34 diapositivas
第10回ARG WI2研究会 株式会社LIFULL 技術報告 por
第10回ARG WI2研究会 株式会社LIFULL 技術報告第10回ARG WI2研究会 株式会社LIFULL 技術報告
第10回ARG WI2研究会 株式会社LIFULL 技術報告Yoji Kiyota
792 vistas33 diapositivas
SoC2017 不動産テックの研究課題 por
SoC2017 不動産テックの研究課題SoC2017 不動産テックの研究課題
SoC2017 不動産テックの研究課題Yoji Kiyota
810 vistas67 diapositivas

Más de Yoji Kiyota(20)

テキストアナリティクスの知見を社会に活かすには? -シーズ指向の視点とニーズ指向の視点- por Yoji Kiyota
テキストアナリティクスの知見を社会に活かすには? -シーズ指向の視点とニーズ指向の視点-テキストアナリティクスの知見を社会に活かすには? -シーズ指向の視点とニーズ指向の視点-
テキストアナリティクスの知見を社会に活かすには? -シーズ指向の視点とニーズ指向の視点-
Yoji Kiyota1.1K vistas
「LIFULL HOME'Sデータセット」提供を通じた不動産テック分野のオープンイノベーション por Yoji Kiyota
「LIFULL HOME'Sデータセット」提供を通じた不動産テック分野のオープンイノベーション「LIFULL HOME'Sデータセット」提供を通じた不動産テック分野のオープンイノベーション
「LIFULL HOME'Sデータセット」提供を通じた不動産テック分野のオープンイノベーション
Yoji Kiyota1.5K vistas
論文執筆の環境をめぐる最新の状況と、学会の査読・編集システムを持続可能とするための方策の検討 por Yoji Kiyota
論文執筆の環境をめぐる最新の状況と、学会の査読・編集システムを持続可能とするための方策の検討論文執筆の環境をめぐる最新の状況と、学会の査読・編集システムを持続可能とするための方策の検討
論文執筆の環境をめぐる最新の状況と、学会の査読・編集システムを持続可能とするための方策の検討
Yoji Kiyota1.6K vistas
LIFULL HOME'Sにおける不動産物件画像解析 por Yoji Kiyota
LIFULL HOME'Sにおける不動産物件画像解析LIFULL HOME'Sにおける不動産物件画像解析
LIFULL HOME'Sにおける不動産物件画像解析
Yoji Kiyota2K vistas
第10回ARG WI2研究会 株式会社LIFULL 技術報告 por Yoji Kiyota
第10回ARG WI2研究会 株式会社LIFULL 技術報告第10回ARG WI2研究会 株式会社LIFULL 技術報告
第10回ARG WI2研究会 株式会社LIFULL 技術報告
Yoji Kiyota792 vistas
SoC2017 不動産テックの研究課題 por Yoji Kiyota
SoC2017 不動産テックの研究課題SoC2017 不動産テックの研究課題
SoC2017 不動産テックの研究課題
Yoji Kiyota810 vistas
超高齢社会における地域課題の複雑さと「ネットワークが創発する知能」研究への期待 ―不動産・介護・医療分野を例として― por Yoji Kiyota
超高齢社会における地域課題の複雑さと「ネットワークが創発する知能」研究への期待 ―不動産・介護・医療分野を例として―超高齢社会における地域課題の複雑さと「ネットワークが創発する知能」研究への期待 ―不動産・介護・医療分野を例として―
超高齢社会における地域課題の複雑さと「ネットワークが創発する知能」研究への期待 ―不動産・介護・医療分野を例として―
Yoji Kiyota742 vistas
IEEE DSAA 2017投稿呼びかけ por Yoji Kiyota
IEEE DSAA 2017投稿呼びかけIEEE DSAA 2017投稿呼びかけ
IEEE DSAA 2017投稿呼びかけ
Yoji Kiyota822 vistas
住居選択支援を目的としたAI技術適用の試み -ソーシャルメディアへのクラウドソーシング適用および物件画像への深層学習適用- por Yoji Kiyota
住居選択支援を目的としたAI技術適用の試み -ソーシャルメディアへのクラウドソーシング適用および物件画像への深層学習適用-住居選択支援を目的としたAI技術適用の試み -ソーシャルメディアへのクラウドソーシング適用および物件画像への深層学習適用-
住居選択支援を目的としたAI技術適用の試み -ソーシャルメディアへのクラウドソーシング適用および物件画像への深層学習適用-
Yoji Kiyota840 vistas
ライフイベントの決断を支えるオープンイノベーションの取り組み por Yoji Kiyota
ライフイベントの決断を支えるオープンイノベーションの取り組みライフイベントの決断を支えるオープンイノベーションの取り組み
ライフイベントの決断を支えるオープンイノベーションの取り組み
Yoji Kiyota837 vistas
学際領域としての不動産の研究を活性化させるために por Yoji Kiyota
学際領域としての不動産の研究を活性化させるために学際領域としての不動産の研究を活性化させるために
学際領域としての不動産の研究を活性化させるために
Yoji Kiyota654 vistas
「HOME'Sデータセット」を通じた不動産分野の研究活性化 por Yoji Kiyota
「HOME'Sデータセット」を通じた不動産分野の研究活性化「HOME'Sデータセット」を通じた不動産分野の研究活性化
「HOME'Sデータセット」を通じた不動産分野の研究活性化
Yoji Kiyota955 vistas
「HOME'Sデータセット」を活用した不動産物件画像への深層学習の適用の取り組み por Yoji Kiyota
「HOME'Sデータセット」を活用した不動産物件画像への深層学習の適用の取り組み「HOME'Sデータセット」を活用した不動産物件画像への深層学習の適用の取り組み
「HOME'Sデータセット」を活用した不動産物件画像への深層学習の適用の取り組み
Yoji Kiyota7.1K vistas
Code4Lib JAPANカンファレンス2016 in 大阪 por Yoji Kiyota
Code4Lib JAPANカンファレンス2016 in 大阪Code4Lib JAPANカンファレンス2016 in 大阪
Code4Lib JAPANカンファレンス2016 in 大阪
Yoji Kiyota378 vistas
人生の意思決定を支える社会インフラとしての図書館 por Yoji Kiyota
人生の意思決定を支える社会インフラとしての図書館人生の意思決定を支える社会インフラとしての図書館
人生の意思決定を支える社会インフラとしての図書館
Yoji Kiyota721 vistas
「HOME'Sデータセット」提供を通じた不動産領域におけるオープンイノベーション促進の取り組み por Yoji Kiyota
「HOME'Sデータセット」提供を通じた不動産領域におけるオープンイノベーション促進の取り組み「HOME'Sデータセット」提供を通じた不動産領域におけるオープンイノベーション促進の取り組み
「HOME'Sデータセット」提供を通じた不動産領域におけるオープンイノベーション促進の取り組み
Yoji Kiyota3.8K vistas
Mining User Experience through Crowdsourcing: A Property Search Behavior Corp... por Yoji Kiyota
Mining User Experience through Crowdsourcing: A Property Search Behavior Corp...Mining User Experience through Crowdsourcing: A Property Search Behavior Corp...
Mining User Experience through Crowdsourcing: A Property Search Behavior Corp...
Yoji Kiyota1.2K vistas
不動産物件データセットを用いた研究開発事例と、大学との共同研究の取り組みの紹介 por Yoji Kiyota
不動産物件データセットを用いた研究開発事例と、大学との共同研究の取り組みの紹介不動産物件データセットを用いた研究開発事例と、大学との共同研究の取り組みの紹介
不動産物件データセットを用いた研究開発事例と、大学との共同研究の取り組みの紹介
Yoji Kiyota8.9K vistas
「HOME'Sデータセット」提供開始の背景 〜産学間データ共有の課題〜 por Yoji Kiyota
「HOME'Sデータセット」提供開始の背景 〜産学間データ共有の課題〜「HOME'Sデータセット」提供開始の背景 〜産学間データ共有の課題〜
「HOME'Sデータセット」提供開始の背景 〜産学間データ共有の課題〜
Yoji Kiyota3.6K vistas
JSAI2015 ツイートタイムラインへの 階層的クラウドソーシングの適用による 住まい探しユーザの背景ニーズ理解 por Yoji Kiyota
JSAI2015 ツイートタイムラインへの階層的クラウドソーシングの適用による住まい探しユーザの背景ニーズ理解JSAI2015 ツイートタイムラインへの階層的クラウドソーシングの適用による住まい探しユーザの背景ニーズ理解
JSAI2015 ツイートタイムラインへの 階層的クラウドソーシングの適用による 住まい探しユーザの背景ニーズ理解
Yoji Kiyota2.2K vistas

Último

光コラボは契約してはいけない por
光コラボは契約してはいけない光コラボは契約してはいけない
光コラボは契約してはいけないTakuya Matsunaga
25 vistas17 diapositivas
Keycloakの全体像: 基本概念、ユースケース、そして最新の開発動向 por
Keycloakの全体像: 基本概念、ユースケース、そして最新の開発動向Keycloakの全体像: 基本概念、ユースケース、そして最新の開発動向
Keycloakの全体像: 基本概念、ユースケース、そして最新の開発動向Hitachi, Ltd. OSS Solution Center.
89 vistas26 diapositivas
速習! PostgreSQL専用HAソフトウェア: Patroni(PostgreSQL Conference Japan 2023 発表資料) por
速習! PostgreSQL専用HAソフトウェア: Patroni(PostgreSQL Conference Japan 2023 発表資料)速習! PostgreSQL専用HAソフトウェア: Patroni(PostgreSQL Conference Japan 2023 発表資料)
速習! PostgreSQL専用HAソフトウェア: Patroni(PostgreSQL Conference Japan 2023 発表資料)NTT DATA Technology & Innovation
29 vistas38 diapositivas
PCCC23:富士通株式会社 テーマ1「次世代高性能・省電力プロセッサ『FUJITSU-MONAKA』」 por
PCCC23:富士通株式会社 テーマ1「次世代高性能・省電力プロセッサ『FUJITSU-MONAKA』」PCCC23:富士通株式会社 テーマ1「次世代高性能・省電力プロセッサ『FUJITSU-MONAKA』」
PCCC23:富士通株式会社 テーマ1「次世代高性能・省電力プロセッサ『FUJITSU-MONAKA』」PC Cluster Consortium
45 vistas12 diapositivas
PCCC23:東京大学情報基盤センター 「Society5.0の実現を目指す『計算・データ・学習』の融合による革新的スーパーコンピューティング」 por
PCCC23:東京大学情報基盤センター 「Society5.0の実現を目指す『計算・データ・学習』の融合による革新的スーパーコンピューティング」PCCC23:東京大学情報基盤センター 「Society5.0の実現を目指す『計算・データ・学習』の融合による革新的スーパーコンピューティング」
PCCC23:東京大学情報基盤センター 「Society5.0の実現を目指す『計算・データ・学習』の融合による革新的スーパーコンピューティング」PC Cluster Consortium
23 vistas36 diapositivas
The Things Stack説明資料 by The Things Industries por
The Things Stack説明資料 by The Things IndustriesThe Things Stack説明資料 by The Things Industries
The Things Stack説明資料 by The Things IndustriesCRI Japan, Inc.
76 vistas29 diapositivas

Último(12)

光コラボは契約してはいけない por Takuya Matsunaga
光コラボは契約してはいけない光コラボは契約してはいけない
光コラボは契約してはいけない
Takuya Matsunaga25 vistas
速習! PostgreSQL専用HAソフトウェア: Patroni(PostgreSQL Conference Japan 2023 発表資料) por NTT DATA Technology & Innovation
速習! PostgreSQL専用HAソフトウェア: Patroni(PostgreSQL Conference Japan 2023 発表資料)速習! PostgreSQL専用HAソフトウェア: Patroni(PostgreSQL Conference Japan 2023 発表資料)
速習! PostgreSQL専用HAソフトウェア: Patroni(PostgreSQL Conference Japan 2023 発表資料)
PCCC23:富士通株式会社 テーマ1「次世代高性能・省電力プロセッサ『FUJITSU-MONAKA』」 por PC Cluster Consortium
PCCC23:富士通株式会社 テーマ1「次世代高性能・省電力プロセッサ『FUJITSU-MONAKA』」PCCC23:富士通株式会社 テーマ1「次世代高性能・省電力プロセッサ『FUJITSU-MONAKA』」
PCCC23:富士通株式会社 テーマ1「次世代高性能・省電力プロセッサ『FUJITSU-MONAKA』」
PCCC23:東京大学情報基盤センター 「Society5.0の実現を目指す『計算・データ・学習』の融合による革新的スーパーコンピューティング」 por PC Cluster Consortium
PCCC23:東京大学情報基盤センター 「Society5.0の実現を目指す『計算・データ・学習』の融合による革新的スーパーコンピューティング」PCCC23:東京大学情報基盤センター 「Society5.0の実現を目指す『計算・データ・学習』の融合による革新的スーパーコンピューティング」
PCCC23:東京大学情報基盤センター 「Society5.0の実現を目指す『計算・データ・学習』の融合による革新的スーパーコンピューティング」
The Things Stack説明資料 by The Things Industries por CRI Japan, Inc.
The Things Stack説明資料 by The Things IndustriesThe Things Stack説明資料 by The Things Industries
The Things Stack説明資料 by The Things Industries
CRI Japan, Inc.76 vistas
Windows 11 information that can be used at the development site por Atomu Hidaka
Windows 11 information that can be used at the development siteWindows 11 information that can be used at the development site
Windows 11 information that can be used at the development site
Atomu Hidaka90 vistas
SNMPセキュリティ超入門 por mkoda
SNMPセキュリティ超入門SNMPセキュリティ超入門
SNMPセキュリティ超入門
mkoda453 vistas
SSH応用編_20231129.pdf por icebreaker4
SSH応用編_20231129.pdfSSH応用編_20231129.pdf
SSH応用編_20231129.pdf
icebreaker4380 vistas
今、改めて考えるPostgreSQLプラットフォーム - マルチクラウドとポータビリティ -(PostgreSQL Conference Japan 20... por NTT DATA Technology & Innovation
今、改めて考えるPostgreSQLプラットフォーム - マルチクラウドとポータビリティ -(PostgreSQL Conference Japan 20...今、改めて考えるPostgreSQLプラットフォーム - マルチクラウドとポータビリティ -(PostgreSQL Conference Japan 20...
今、改めて考えるPostgreSQLプラットフォーム - マルチクラウドとポータビリティ -(PostgreSQL Conference Japan 20...

リサーチ・ナビ検索システムの技術

  • 1. リサーチ・ナビ検索システムの 技術 東京大学情報基盤センター 学術情報研究部門 助教 清田 陽司
  • 2. リサーチ・ナビ検索システムの ポイント • 「テーマグラフ」の表示 – 件名標目表(NDLSH)とWikipediaのマッシュアップ • タブデザインの採用 – 用途に応じて表示内容を自由に切り替え • さまざまな情報資源を統合して検索 – PORTAをはじめとする多くの情報資源にアクセス • レスポンスの向上 – 検索結果が得られたコンテンツから順次表示
  • 3. 情報探しのニーズ • Webサーチエンジンで探せる質問=事実を問う 質問 – 関東大震災はいつ発生しましたか? – ○○ってどんな病気? • 本当に探し手が知りたいこと – 大学の学生「関東大震災についてのレポートを書か なきゃいけなんだけど、いったいどんな資料から調べ たらいいの?」 – 難病の患者「この病気について最先端の治療を行っ ている病院を探す方法は?」 情報の調べ方が曖昧な場合が多い →調べ方の推薦(レコメンデーション)が必要! 3
  • 4. Agenda • なぜWikipediaを使うのか? – Wikipediaはどうやって作られているのか? – Wikipediaは信頼できるのか? – Wikipediaとどう向き合うべきか? • テーマグラフのしくみ – 検索したキーワードと件名をどう結びつけているの か? • システム開発上の工夫 – タブデザインの採用 – Web APIの活用 – レスポンスの向上 • 図書館がもつ知識の価値の今後は?
  • 5. Wikipediaとは? • オンライン百科事典 – 専門家によるオンライン百科事典プロジェクト 「Nupedia」を前身として2001年に発足 – 個人や団体の寄付により運営 • Wikipediaの特徴 – 誰もが編集に参加できる (資格制限なし) – ボランティアによる執筆・編集・運営 – Wikiシステム(ブラウザでWeb上のテキストを書き 換えることができる) – 内容は自由に複製・配布・改変できる
  • 6. Wikipediaの信頼性をめぐる議論 • WikipediaとEncyclopædia Britannicaの比較 – 2005年 Nature 「科学用語について比較したところ、 Wikipediaの方が誤りが少なかった」 – Britannicaは反論 • 査読制度なし – 「間違いがあれば迅速に訂正できる仕組みを提供す る」という考え方 • 引用文献として使えるか? – Wikipediaの創始者Jimmy Wales 「Wikipediaを原典と して利用すべきではなく、あくまで出発点にすべき」
  • 7. Wikipediaの秩序維持 誰でも編集できるが自由放任ではない • ガイドライン (5つの原則) – Wikipediaは百科事典 – 中立的な観点: 出典の明記 – 利用はフリー: どの個人も特定の項目を支配でき ない、著作権侵害の禁止 – 行動規範: 敬意、礼儀正しさ、冷静の維持 – 確固としたルールはない: ルールの精神の尊重 • ページ毎のノート (議論、合意形成の場) • 管理者によるコントロール – 保護、削除、投稿ブロック、管理者の選任・解任
  • 8. 調べ方推薦の要件 • カバレッジ – どんなキーワードに対しても何かをお薦めして Web 欲しい 情報資源 – これができないと結局使ってもらえない Wikipedia • 組織化 – 「これを見た人はこんな情報も見ています」で は不十分! – 分類ごとにお薦めすべき情報資源には定番が 図書館 存在 情報資源 • 信頼性 – 「ネットでググる」だけでは不十分! – 信頼できる情報資源が必要 Wikipediaを橋渡しとして、信頼できる情報 8 資源をお薦めできないか?
  • 9. Wikipediaの構造 価格 各記事にはカテゴリが 価格(かかく)とは、有形・無形の各種の商品 付与されている (サービスを含む)の取引に際して提示される金 額を言う。基本的には需要と供給のバランスに • いわゆるフォークソノ よって決定される。一般には、値段(ねだん)とも 呼ばれる。 ミーの特徴を有する … カテゴリ: [マーケティング][経済学][市場] • カテゴリにもカテゴリ を付与できる(ゆるや 社会 社会科学 かな階層構造) 経済 • 複数の上位概念を与 労働 産業 えることができる(多 重継承) ビジネススキル 商業 経営学 流通 マーケティング 経済学 市場 9 価格
  • 10. タクソノミーとフォークソノミー タクソノミー フォークソノミー • トップダウン的な分類 • ボトムアップ的な分類 • ひとつの上位概念 • 複数の上位概念 再生可能 半導体 電気化学 電池 エネルギー 素子 電離層 電池 磁気化学 燃料電池 太陽電池 蓄電池 燃料電池 太陽電池 トランジスタ 図書館的な分類体系 Web的な分類体系 10
  • 11. タクソノミー型 社会 構造 社会科学 経済 労働 産業 ビジネススキル 商業 経営学 流通 マーケティング 経済学 市場 フォークソノミー型 構造 価格 11
  • 12. リサーチ・ナビとWikipedia • Webと図書館をつなぐ中間的な情報資源とし いて扱う • 調べものの出発点として位置づけ – Wikipediaの記事を最終的なゴールとはしない – Wikipediaへのリンクは「百科事典」タブ内に集約 • 表記揺れ辞書として利用 – 「線形代数学」と「線型代数学」 12
  • 13. 提案: Wikipediaと図書館分類体系の 対応づけ 図書館の分類体系をWikipediaで拡張してみよう! • Wikipedia – Webの汎用的な情報資源としては最も組織化されてい る(Wikipediaカテゴリ) – Web上の他の情報資源との親和性をもつ • 図書館分類体系(件名標目表、書架分類法) – 人類が営々と積み重ねてきた知識体系 – 価値判断に必要な情報資源への有力なポインタ 両者を組み合わせて利用することによって、キー ワードから探索テーマ(=件名)を自動導出する → 導出された件名に関連する情報資源を提示 13
  • 14. 社会科学(300) 自然科学(400) 技術(500) 「地震防災の事典」(岡 「日本被害地震総覧」 経済(330) 田恒男ほか, 2000年) 社会(360) 地球科学(450) 建築学(520) (宇佐美龍夫, 2003年) 経済史(332) 社会福祉(369) 地震学(453) 建築構造(524) 「経済学事典」(日本 経済新聞社, 1996年) 経済史-日本 災害 地震誌(453.2) 地震 (332.1) 経済史-日本 地震災害 地震予知 耐震建築 -平成時代 (332.107) 図書館オントロジー (NDC, NDLSH) Wikipedia 経済史 災害 震災がその後の 日本の 災害と防災の 防災対策に 地震 経済史 歴史 与えた影響 平成時代 地震の歴史 震災を引き起こした 地震(1995年兵庫県 震災が日本経済に 南部地震) 14 与えた影響 阪神・淡路大震災
  • 15. 情報探索の スタート地点 Web情報資源(サーチエンジン) フォークソノミー 情 図書館 Wikipedia 報 分類体系 の •NDC 専 対応づけ→ 門 •BSH 性 深い情報探 多様な情報資源 ・信 索へ •入門書 頼 •レファレンスブック 性 •各種データベース •学術雑誌論文 •過去の文献・資料 15
  • 16. テーマグラフの導出 • 入力したキーワードにマッチするWikipediaの 記事を出発点として、カテゴリネットワークを 芋づる式にたどる • 探索を発散させないための工夫 – NDLSHにたどりつかない経路はカットする – カテゴリ間の意味の類似度を考慮し、関連性の 低い経路はカットする 16
  • 17. カテゴリ 「電気化学」 項目 スコア0.3 カテゴリ 「燃料電池」 「電池」 スコア1.0 スコア0.7 カテゴリ 「電子部品」 スコア0.3 カテゴリ 「自動車工学」 スコア0.4 カテゴリ 「自動車」 スコア0.35 カテゴリ 「節予定」? カテゴリ スコア0.4 「予定」? スコア0.3 ? 17
  • 18. 性能向上には 電子工学、材料工学、 燃料電池の普及がCO2の 環境問題解決の切り札と 化学などの分野にまた して注目されている? 削減にもたらす効果は? がった知見が必要? 将来の企業経営に与え るインパクトは? 燃料電池が一般家庭に 燃料電池の普及が生態 エネルギー政策の立案 普及した場合、電力網の 膨大な研究開発費は自 系にもたらす影響は? においてどのような位置 安定性にどのような影響 動車メーカーから投入さ づけがなされているか? があるか? れている?
  • 19. 検索システムの画面デザイン • リサーチ・ナビCMS (Movable Type)と共通の デザイン – 利用者は両者の違いを意識せず使える • タブデザインの採用 – 画面領域の制約の緩和 – 利用者の目的に応じて振り分け • 「すべて」タブ内でのサマリ表示 – コンテンツの俯瞰が可能 • 「検索履歴」リストボックス – いつでも立ち戻って調べることができる
  • 20. (1) 検索キーワードの 入力ボックス (4) 検索履歴 リストボックス (2) 表示内容切り替えタブ 各々のタブ内のコンテンツの サマリー (3) 検索結果表示 エリア
  • 22. NDL OPAC 雑誌記事索引 近代デジタルライブラリー 参考図書紹介 目次データベースなど
  • 23. テーマグラフに含まれる件名標目 日本十進分類法(NDC) 関連標目
  • 26. 様々な情報資源への統合アクセス • NDL PORTA API – 「調べ方ガイド」「国立国会図書館にある本」 • リサーチ・ナビ内部の検索インデックス – リサーチ・ナビCMSに搭載されたコンテンツ – Wikipedia全文データ • 関連キーワード抽出 – Wikipediaから生成した文書=単語マトリックス • テーマグラフ導出エンジン cf. 書籍販売WebサイトのAPI クリアすべき課題はあるが意義は大きい
  • 27. 検索 検索履歴 ハイパー キーワード リスト 「すべて」 ユーザ リンク 入力ボックス ボックス タブ インタ フェース 検索 (Web 「キーワード」 「百科事典」 「調べ方」 「本・サイト」 ブラウザ) コント タブ タブ タブ タブ ローラ レファレ テーマグ 分類導出 関連KW 百科事典 調べ方ガ NDL目次 NDL書籍 書籍販売 ンス事例 ラフRPC RPC RPC RPC イドRPC 検索RPC 検索RPC サイトRPC RPC 関連KW 分類自動導出 抽出 Lucene検索エンジン バック エンジン エンジン エンド サーバ 分類体系 KW インデックス インデックス インデックス DB マトリックス 分類体系DB生成 マトリック Luceneインデクサ ス生成 PORTA 書籍販売 NDLSH Wikipedia リサーチ・ナビCMS API サイトAPI
  • 29. まとめ • Wikipediaと図書館分類体系の統合利用によって、 パスファインダーに近い「情報探索のヒント提示」を 可能とした – 情報探索の多様な「切り口」の提示 – 信頼性のある情報資源への誘導 • 「図書館かWebか」という二項対立ではなく、両者の 役割を踏まえた見方が大事 – 図書館: 信頼性、組織化 – Web: どんなキーワードからでも探せる 29
  • 30. 図書館の知識の価値 • Webサーチエンジンの普及に大きな影響を受 けている • 図書館の最大の価値=情報資源の多様性 – 利用者へのプレゼンテーションが非常に重要 – ランキングではない見せ方 – 探すプロセスを楽しんでもらう工夫 • 個人の知識欲と図書館の体系をどうつなぐ? – 「自分なりの本棚を作る」お手伝いができれば幸 いです