SlideShare una empresa de Scribd logo
1 de 25
マイニング探検会 #1 東京大学情報基盤センター 学術情報研究部門 助教 清田 陽司 (兼 株式会社リッテル 上席研究員) 2010年4月9日 @東京大学アントレプレナープラザ会議室
素朴な疑問 そもそも、図書館の価値ってなに? 過去の情報の蓄積と提供 研究・調査・教育のための知的インフラ 情報リテラシーを育てる場 「知る権利」の保証=民主主義を支える柱 etc. まわりの人たちに価値をどうやって伝えるか?
Webが世界に与えたインパクト 最初は「ハッカーのおもちゃ」 まわりの人たちを巻き込んでいくことで爆発的に成長 世界に新たな「知的ゲーム」を提供した 究極の「暇つぶしツール」 参加者の数が価値を生み出している 多くの人々の人生に新たな意味を与えた ゲームの意味を問うことには意味がない! 意味は後から生み出される
知的ゲームの提供者としての図書館 現在の図書館の基盤を築いたのは何か? 誰でも情報に触れられる場を提供したこと 膨大な情報を検索できるツールを提供したこと 価値あるゲームを社会に提供することで認められた Webによってかなりの部分が代替されつつある -> 新たな知的ゲームを創造すべき時期になっている!
新たな知的ゲームを創造するために 多くの人々を巻き込むしかけ 組織の壁を超えた交流 エンターテインメント精神が大事 Webがもつ価値を徹底的に利用 Webを支える「ルール」と「テクニック」を知っておく プログラミングできなくても大丈夫 実際に手を動かして体験学習 図書館パラダイムの再構築 ライブラリアンシップを次の世代に受け継ぐために ひとりひとりが新サービスのプロデューサーとしての役割を果たしていこう!
トピック案 情報検索 Lucene, GETAssoc データマイニング 相関ルール抽出、回帰分析、機械学習、クラスタリング レコメンデーション 協調フィルタリング、プロファイル推定、… テキスト処理 形態素解析、構文解析、固有表現抽出、… 大規模データ処理 Hadoop、Amazon EC2/S3、Google Apps Engine、Windows Azure 信頼性の向上 HDFS、ZooKeeper、… Webインタフェース AJAX、Flash、HTML5、…
API (Application Programming Interface) OS(Windows、MacOS、Linuxなど)やプログラミング言語(C言語、Java、C#など)によって提供 OSやライブラリ内部の機能を利用できる APIの役割 アプリケーション開発においてプログラミングの手間を省く システム間の連携 抽象化 (=人間のレベルに近づける) 簡潔さと柔軟性のトレードオフ 抽象化しすぎると細かな要望に手が回らない
Web API APIの概念をWebの世界に援用 単に「API」といえば「Web API」 Webサービス運営者によって提供 Webサービス内部の機能やデータを利用できる Web APIの役割 新たなWebサービス開発の手間を省く Webサービス間の連携 -> マッシュアップ 抽象化 トレードオフが存在 簡単にするほど細かな処理ができなくなる
Web APIを支える技術 リソースの指定 IPアドレス ドメイン名 URL 通信プロトコル TCP/IP (インターネット) HTTP / HTTPS 	(cf. Z39.50) ファイルフォーマット XML JSON APIへの情報送信 SOAP REST
URL (Uniform Resource Locater) インターネット上のリソースの「住所」 プロトコル+ホスト名+パス名 で構成 http://ja.wikipedia.org/wiki/Wikipedia https://mail.google.com/mail/ ftp://ftp.iij.ad.jp/pub/linux/centos/5/os/x86_64/ ホスト名はドメイン名またはIPアドレス http://124.83.167.215/hl
HTTP(HyperText Transfer Protocol) Webを支える基盤プロトコル(通信規約) ほぼすべてのWebサービスはHTTPを利用 暗号化されたHTTP = HTTPS クライアント=サーバモデル クライアント(ブラウザとか)からのリクエストを受けて、サーバがコンテンツをクライアントに返す いろんなコンテンツを送れる テキスト、画像、動画、プログラム、XML、… サーバがコンテンツをどう作るかは関知せず ディスクにしまってあるコンテンツをそのまま書き出してもよい (静的コンテンツ) プログラムでコンテンツをその場で作ってしまってもよい(動的コンテンツ)
静的コンテンツの場合 GET/ HTTP/1.1 Host: www.mi-tan.jp User-Agent: Mozilla/5.0 ….. サーバ (www.mi-tan.jp) クライアント (ブラウザソフト) URLの入力 インターネット HTTPサーバ コンテンツの表示 HTTP/1.1 200 OK Date: Tue, 06 Apr 2010 13:14:32 GMT  Server: Apache Content-Type: text/html <html> <head><title>マイニング探検会(マイタン) - 図書館の未来を探る勉強会 -</title> </head> <body class=“mainPage”> … </body> <html> <head><title>マイニング探検会(マイタン) - 図書館の未来を探る勉強会 -</title> </head> …
動的コンテンツの場合 GET/search?p=マイニング探検会&ei=UTF-8 HTTP/1.1 Host: search.yahoo.co.jp User-Agent: Mozilla/5.0 サーバ (search.yahoo.co.jp) クライアント (ブラウザソフト) 検索クエリーの入力 インターネット HTTPサーバ コンテンツの表示 HTTP/1.1 200 OK Date: Tue, 06 Apr 2010 13:14:32 GMT  Server: Apache Content-Type: text/html <html> <head><title>「マイニング探検会」の検索結果 - Yahoo!検索</title> </head> <body> … </body> 検索エンジンサーバ 検索インデックス
HTTPリクエストのメソッド GET URL埋め込み形式で情報を送ることができる http://search.yahoo.co.jp/search?p=マイニング探検会&ei=UTF-8 サイズ制限あり (Internet Explorerでは2083bytes) ブラウザから簡単に試せる POST さまざまなコンテンツを送ることができる ファイルをアップロードすることも可能 サイズ制限なし 利用が少し面倒
XML (eXtensible Markup Language) <?xml version="1.0" encoding="UTF-8"?> <レシピ 名前="パン" 準備時間="5分" 調理時間="3時間">   <料理>基本的なパン</料理>    <材料 量='3' 単位='カップ'>小麦粉</材料>    <材料 量='0.25' 単位='オンス'>イースト</材料>    <材料 量='1.5' 単位='カップ' 状態="温かい">水</材料>   <材料 量="1" 単位="ティースプーン">食塩</材料>   <要領>      <手順>全ての材料を一緒にして混ぜます。</手順>     <手順>十分にこねます。</手順>     <手順>布で覆い、暖かい部屋で1時間そのままにして おきます。     </手順>     <手順>もう一度こねます。</手順>     <手順>パン焼きの容器に入れます</手順>     <手順>布で覆い、暖かい部屋で1時間そのままにして おきます。      </手順>      <手順>オーブンに入れて温度を180℃にして30分間 焼きます。      </手順>    </要領> </レシピ> マークアップ言語の規格 電子的文書を記述する規格SGMLの後継 「タグ」で構造を表現できる 応用例 ニュースリーダー (RSS) 電子書籍 (Open eBook) オフィス文書
SOAPとREST SOAP (Simple Object Access Protocol) REST (Representational State Transfer) XMLで記述されたSOAPメッセージを送信 利点 HTTP以外も利用可能 (SMTP) 複雑な指示が送れる 欠点 利用が面倒 キャッシュ不可 URLを情報送信の手段として利用 利点 簡単に利用できる キャッシュ可能 欠点 HTTPに依存 あまり複雑な指示は送れない
紹介するWeb API Amazon Twitter CiNii (国立情報学研究所) PORTA (国立国会図書館) レファレンス共同データベース (国立国会図書館) J-Global (科学技術振興機構)
Amazon Product Advertising API  Amazonの商品情報を利用したサイト構築のための機能を提供 商品検索 検索条件による絞り込み 商品画像の表示 商品情報の取得 レビュー・ランキング・関連商品・販売状態などの取得 アフィリエイトとの連携 (Amazonアソシエイト) サーバーサイド SOAPまたはRESTが利用可能 APIキーの発行が必須 http://developer.amazonwebservices.com/connect/kbcategory.jspa?categoryID=19
Twitter API Twitterのアプリケーションを作るために必要な一通りの機能を提供 タイムラインの取得 ステータスの取得 アカウント情報の取得 発言の投稿 3種類のAPI REST 2種類 (歴史的経緯) Streaming GETメソッド (メッセージ投稿など一部はPOST) 公開ユーザのタイムライン取得以外は認証が必要 ドキュメント http://apiwiki.twitter.com/ 利用例 (自分のタイムライン) http://api.twitter.com/1/statuses/home_timeline.xml
CiNii API NII論文検索の基本的な機能を提供 ツールバーなどからの論文・著者検索 論文・著者詳細情報の取得 CiNii内のコンテンツへの直接リンク GETメソッド REST準拠 フォーマット 検索: RSS or Atom 詳細情報: RDF 認証不要 ドキュメント http://ci.nii.ac.jp/info/ja/if_link_receive.html 利用例 (RSSフィード) http://ci.nii.ac.jp/opensearch/search?q=長尾真&range=0&sortorder=1&start=1&count=20&format=atom
PORTA API NDL PORTAコンテンツの検索とハーベスティング機能を提供 GETメソッド/POSTメソッドが混在 REST/SOAP/Z39.50が混在 認証不要
レファレンス協同データベースAPI 詳細検索画面と同等の検索機能を提供 キーワード検索 (boolean) 館ごとの検索指定 アクセス数ランキング GETメソッド REST準拠 フォーマット XML (独自形式) 認証不要
J-GLOBAL Web API 4つの基本情報を検索可能 「文献」「科学技術用語」「科学物質」「資料」 J-GLOBAL サイトの検索結果一覧と同等レベルの情報を取得可能 取得可能な検索結果 HTML形式 あらかじめレイアウトが決まっていて簡単に実装可。 JSON形式 項目ごとにデータを取得し、自由にレイアウトが可。 WebAPIキーの取得が必要
APIの利用制限 APIキーの発行を受けないと利用できないものがある 呼び出し頻度に注意 過度の呼び出しはサーバに負荷をかける アクセス制限を受けることも 利用規約 非営利利用に制限されているもの リンクを張ることが義務づけられているもの(Amazonなど)
Web API提供の考え方 なぜ公開するのか? お互いハッピーになれるかも? cf. カーリルのスクレイピング 何を公開し、何を公開しないか? 個人情報はNG レコメンデーションは? どうやって普及させるか? APIコンテスト アフィリエイト 開発者(ベンダー含む)との関係をどう築いていくか? サービスとしてどう継続していくか? 標準をどう作っていくか? 営利と非営利の境界線 図書館とWeb書店はどこまで連携可能か?

Más contenido relacionado

Similar a マイニング探検会 #01

アーカイブ(ズ)概論
アーカイブ(ズ)概論アーカイブ(ズ)概論
アーカイブ(ズ)概論Kiyohara Kazuyuki
 
ビッグデータ型AI時代の“人間”のありかた: ネオ・サイバネティクスとICT
ビッグデータ型AI時代の“人間”のありかた: ネオ・サイバネティクスとICT ビッグデータ型AI時代の“人間”のありかた: ネオ・サイバネティクスとICT
ビッグデータ型AI時代の“人間”のありかた: ネオ・サイバネティクスとICT 茂生 河島
 
第4回 SPARC Japan セミナー 2014
第4回 SPARC Japan セミナー 2014第4回 SPARC Japan セミナー 2014
第4回 SPARC Japan セミナー 2014Taro misumi
 
2014/11/28 東京農工大学総合メディアセンターシンポジウム「ラーニング・コモンズとこれからの大学図書館」
2014/11/28 東京農工大学総合メディアセンターシンポジウム「ラーニング・コモンズとこれからの大学図書館」2014/11/28 東京農工大学総合メディアセンターシンポジウム「ラーニング・コモンズとこれからの大学図書館」
2014/11/28 東京農工大学総合メディアセンターシンポジウム「ラーニング・コモンズとこれからの大学図書館」理子 茂出木
 
平成29年度 日本大学文理学部オープンキャンパス 「人工知能ってどんな仕組み?」
平成29年度 日本大学文理学部オープンキャンパス 「人工知能ってどんな仕組み?」平成29年度 日本大学文理学部オープンキャンパス 「人工知能ってどんな仕組み?」
平成29年度 日本大学文理学部オープンキャンパス 「人工知能ってどんな仕組み?」kthrlab
 
ソシオナイト Vol.02「デジタル社会のなかで僕たちは出会う」_河島資料
ソシオナイト Vol.02「デジタル社会のなかで僕たちは出会う」_河島資料ソシオナイト Vol.02「デジタル社会のなかで僕たちは出会う」_河島資料
ソシオナイト Vol.02「デジタル社会のなかで僕たちは出会う」_河島資料茂生 河島
 
9
99
9c a
 
100322 生態学会 若手研究者のキャリア問題改変バージョン
100322 生態学会 若手研究者のキャリア問題改変バージョン100322 生態学会 若手研究者のキャリア問題改変バージョン
100322 生態学会 若手研究者のキャリア問題改変バージョン近畿大学医学部
 
野生の研究について
野生の研究について野生の研究について
野生の研究についてTsubasa Yumura
 
2012年情報社会学会年会知識共有セッション
2012年情報社会学会年会知識共有セッション2012年情報社会学会年会知識共有セッション
2012年情報社会学会年会知識共有セッションAkiko Orita
 
東海ナレッジネットワーク チームシラベルの事例紹介
東海ナレッジネットワーク チームシラベルの事例紹介東海ナレッジネットワーク チームシラベルの事例紹介
東海ナレッジネットワーク チームシラベルの事例紹介Kumiko Korezumi
 
「人工知能で作る楽しい未来」
「人工知能で作る楽しい未来」「人工知能で作る楽しい未来」
「人工知能で作る楽しい未来」Romotive Japan
 
『人工知能のための哲学塾』を読む 三宅陽一郎×大山匠×犬飼博士 トークイベント
『人工知能のための哲学塾』を読む 三宅陽一郎×大山匠×犬飼博士 トークイベント『人工知能のための哲学塾』を読む 三宅陽一郎×大山匠×犬飼博士 トークイベント
『人工知能のための哲学塾』を読む 三宅陽一郎×大山匠×犬飼博士 トークイベントYouichiro Miyake
 
Otsuma(2010706)
Otsuma(2010706)Otsuma(2010706)
Otsuma(2010706)真 岡本
 
EATシリーズ 2006
EATシリーズ 2006EATシリーズ 2006
EATシリーズ 2006Kotaro Miura
 
平成30年度 日本大学文理学部オープンキャンパス 「人工知能ってどんな仕組み?
平成30年度 日本大学文理学部オープンキャンパス 「人工知能ってどんな仕組み?平成30年度 日本大学文理学部オープンキャンパス 「人工知能ってどんな仕組み?
平成30年度 日本大学文理学部オープンキャンパス 「人工知能ってどんな仕組み?kthrlab
 

Similar a マイニング探検会 #01 (20)

アーカイブ(ズ)概論
アーカイブ(ズ)概論アーカイブ(ズ)概論
アーカイブ(ズ)概論
 
ビッグデータ型AI時代の“人間”のありかた: ネオ・サイバネティクスとICT
ビッグデータ型AI時代の“人間”のありかた: ネオ・サイバネティクスとICT ビッグデータ型AI時代の“人間”のありかた: ネオ・サイバネティクスとICT
ビッグデータ型AI時代の“人間”のありかた: ネオ・サイバネティクスとICT
 
第4回 SPARC Japan セミナー 2014
第4回 SPARC Japan セミナー 2014第4回 SPARC Japan セミナー 2014
第4回 SPARC Japan セミナー 2014
 
2014/11/28 東京農工大学総合メディアセンターシンポジウム「ラーニング・コモンズとこれからの大学図書館」
2014/11/28 東京農工大学総合メディアセンターシンポジウム「ラーニング・コモンズとこれからの大学図書館」2014/11/28 東京農工大学総合メディアセンターシンポジウム「ラーニング・コモンズとこれからの大学図書館」
2014/11/28 東京農工大学総合メディアセンターシンポジウム「ラーニング・コモンズとこれからの大学図書館」
 
平成29年度 日本大学文理学部オープンキャンパス 「人工知能ってどんな仕組み?」
平成29年度 日本大学文理学部オープンキャンパス 「人工知能ってどんな仕組み?」平成29年度 日本大学文理学部オープンキャンパス 「人工知能ってどんな仕組み?」
平成29年度 日本大学文理学部オープンキャンパス 「人工知能ってどんな仕組み?」
 
ソシオナイト Vol.02「デジタル社会のなかで僕たちは出会う」_河島資料
ソシオナイト Vol.02「デジタル社会のなかで僕たちは出会う」_河島資料ソシオナイト Vol.02「デジタル社会のなかで僕たちは出会う」_河島資料
ソシオナイト Vol.02「デジタル社会のなかで僕たちは出会う」_河島資料
 
9
99
9
 
Linked Dataアプローチによる芸術情報統合の試み
Linked Dataアプローチによる芸術情報統合の試みLinked Dataアプローチによる芸術情報統合の試み
Linked Dataアプローチによる芸術情報統合の試み
 
100322 生態学会 若手研究者のキャリア問題改変バージョン
100322 生態学会 若手研究者のキャリア問題改変バージョン100322 生態学会 若手研究者のキャリア問題改変バージョン
100322 生態学会 若手研究者のキャリア問題改変バージョン
 
野生の研究について
野生の研究について野生の研究について
野生の研究について
 
230529nagayo
230529nagayo230529nagayo
230529nagayo
 
2012年情報社会学会年会知識共有セッション
2012年情報社会学会年会知識共有セッション2012年情報社会学会年会知識共有セッション
2012年情報社会学会年会知識共有セッション
 
東海ナレッジネットワーク チームシラベルの事例紹介
東海ナレッジネットワーク チームシラベルの事例紹介東海ナレッジネットワーク チームシラベルの事例紹介
東海ナレッジネットワーク チームシラベルの事例紹介
 
「人工知能で作る楽しい未来」
「人工知能で作る楽しい未来」「人工知能で作る楽しい未来」
「人工知能で作る楽しい未来」
 
科学技術コミュニケーションの定義を巡って(ダイジェスト)
科学技術コミュニケーションの定義を巡って(ダイジェスト)科学技術コミュニケーションの定義を巡って(ダイジェスト)
科学技術コミュニケーションの定義を巡って(ダイジェスト)
 
『人工知能のための哲学塾』を読む 三宅陽一郎×大山匠×犬飼博士 トークイベント
『人工知能のための哲学塾』を読む 三宅陽一郎×大山匠×犬飼博士 トークイベント『人工知能のための哲学塾』を読む 三宅陽一郎×大山匠×犬飼博士 トークイベント
『人工知能のための哲学塾』を読む 三宅陽一郎×大山匠×犬飼博士 トークイベント
 
Otsuma(2010706)
Otsuma(2010706)Otsuma(2010706)
Otsuma(2010706)
 
EATシリーズ 2006
EATシリーズ 2006EATシリーズ 2006
EATシリーズ 2006
 
人工知能と身体
人工知能と身体人工知能と身体
人工知能と身体
 
平成30年度 日本大学文理学部オープンキャンパス 「人工知能ってどんな仕組み?
平成30年度 日本大学文理学部オープンキャンパス 「人工知能ってどんな仕組み?平成30年度 日本大学文理学部オープンキャンパス 「人工知能ってどんな仕組み?
平成30年度 日本大学文理学部オープンキャンパス 「人工知能ってどんな仕組み?
 

Más de Yoji Kiyota

テキストアナリティクスの知見を社会に活かすには? -シーズ指向の視点とニーズ指向の視点-
テキストアナリティクスの知見を社会に活かすには? -シーズ指向の視点とニーズ指向の視点-テキストアナリティクスの知見を社会に活かすには? -シーズ指向の視点とニーズ指向の視点-
テキストアナリティクスの知見を社会に活かすには? -シーズ指向の視点とニーズ指向の視点-Yoji Kiyota
 
「LIFULL HOME'Sデータセット」提供を通じた不動産テック分野のオープンイノベーション
「LIFULL HOME'Sデータセット」提供を通じた不動産テック分野のオープンイノベーション「LIFULL HOME'Sデータセット」提供を通じた不動産テック分野のオープンイノベーション
「LIFULL HOME'Sデータセット」提供を通じた不動産テック分野のオープンイノベーションYoji Kiyota
 
論文執筆の環境をめぐる最新の状況と、学会の査読・編集システムを持続可能とするための方策の検討
論文執筆の環境をめぐる最新の状況と、学会の査読・編集システムを持続可能とするための方策の検討論文執筆の環境をめぐる最新の状況と、学会の査読・編集システムを持続可能とするための方策の検討
論文執筆の環境をめぐる最新の状況と、学会の査読・編集システムを持続可能とするための方策の検討Yoji Kiyota
 
LIFULL HOME'Sにおける不動産物件画像解析
LIFULL HOME'Sにおける不動産物件画像解析LIFULL HOME'Sにおける不動産物件画像解析
LIFULL HOME'Sにおける不動産物件画像解析Yoji Kiyota
 
第10回ARG WI2研究会 株式会社LIFULL 技術報告
第10回ARG WI2研究会 株式会社LIFULL 技術報告第10回ARG WI2研究会 株式会社LIFULL 技術報告
第10回ARG WI2研究会 株式会社LIFULL 技術報告Yoji Kiyota
 
SoC2017 不動産テックの研究課題
SoC2017 不動産テックの研究課題SoC2017 不動産テックの研究課題
SoC2017 不動産テックの研究課題Yoji Kiyota
 
超高齢社会における地域課題の複雑さと「ネットワークが創発する知能」研究への期待 ―不動産・介護・医療分野を例として―
超高齢社会における地域課題の複雑さと「ネットワークが創発する知能」研究への期待 ―不動産・介護・医療分野を例として―超高齢社会における地域課題の複雑さと「ネットワークが創発する知能」研究への期待 ―不動産・介護・医療分野を例として―
超高齢社会における地域課題の複雑さと「ネットワークが創発する知能」研究への期待 ―不動産・介護・医療分野を例として―Yoji Kiyota
 
IEEE DSAA 2017投稿呼びかけ
IEEE DSAA 2017投稿呼びかけIEEE DSAA 2017投稿呼びかけ
IEEE DSAA 2017投稿呼びかけYoji Kiyota
 
住居選択支援を目的としたAI技術適用の試み -ソーシャルメディアへのクラウドソーシング適用および物件画像への深層学習適用-
住居選択支援を目的としたAI技術適用の試み -ソーシャルメディアへのクラウドソーシング適用および物件画像への深層学習適用-住居選択支援を目的としたAI技術適用の試み -ソーシャルメディアへのクラウドソーシング適用および物件画像への深層学習適用-
住居選択支援を目的としたAI技術適用の試み -ソーシャルメディアへのクラウドソーシング適用および物件画像への深層学習適用-Yoji Kiyota
 
ライフイベントの決断を支えるオープンイノベーションの取り組み
ライフイベントの決断を支えるオープンイノベーションの取り組みライフイベントの決断を支えるオープンイノベーションの取り組み
ライフイベントの決断を支えるオープンイノベーションの取り組みYoji Kiyota
 
学際領域としての不動産の研究を活性化させるために
学際領域としての不動産の研究を活性化させるために学際領域としての不動産の研究を活性化させるために
学際領域としての不動産の研究を活性化させるためにYoji Kiyota
 
「HOME'Sデータセット」を通じた不動産分野の研究活性化
「HOME'Sデータセット」を通じた不動産分野の研究活性化「HOME'Sデータセット」を通じた不動産分野の研究活性化
「HOME'Sデータセット」を通じた不動産分野の研究活性化Yoji Kiyota
 
「HOME'Sデータセット」を活用した不動産物件画像への深層学習の適用の取り組み
「HOME'Sデータセット」を活用した不動産物件画像への深層学習の適用の取り組み「HOME'Sデータセット」を活用した不動産物件画像への深層学習の適用の取り組み
「HOME'Sデータセット」を活用した不動産物件画像への深層学習の適用の取り組みYoji Kiyota
 
Code4Lib JAPANカンファレンス2016 in 大阪
Code4Lib JAPANカンファレンス2016 in 大阪Code4Lib JAPANカンファレンス2016 in 大阪
Code4Lib JAPANカンファレンス2016 in 大阪Yoji Kiyota
 
人生の意思決定を支える社会インフラとしての図書館
人生の意思決定を支える社会インフラとしての図書館人生の意思決定を支える社会インフラとしての図書館
人生の意思決定を支える社会インフラとしての図書館Yoji Kiyota
 
「HOME'Sデータセット」提供を通じた不動産領域におけるオープンイノベーション促進の取り組み
「HOME'Sデータセット」提供を通じた不動産領域におけるオープンイノベーション促進の取り組み「HOME'Sデータセット」提供を通じた不動産領域におけるオープンイノベーション促進の取り組み
「HOME'Sデータセット」提供を通じた不動産領域におけるオープンイノベーション促進の取り組みYoji Kiyota
 
Mining User Experience through Crowdsourcing: A Property Search Behavior Corp...
Mining User Experience through Crowdsourcing: A Property Search Behavior Corp...Mining User Experience through Crowdsourcing: A Property Search Behavior Corp...
Mining User Experience through Crowdsourcing: A Property Search Behavior Corp...Yoji Kiyota
 
不動産物件データセットを用いた研究開発事例と、大学との共同研究の取り組みの紹介
不動産物件データセットを用いた研究開発事例と、大学との共同研究の取り組みの紹介不動産物件データセットを用いた研究開発事例と、大学との共同研究の取り組みの紹介
不動産物件データセットを用いた研究開発事例と、大学との共同研究の取り組みの紹介Yoji Kiyota
 
「HOME'Sデータセット」提供開始の背景 〜産学間データ共有の課題〜
「HOME'Sデータセット」提供開始の背景 〜産学間データ共有の課題〜「HOME'Sデータセット」提供開始の背景 〜産学間データ共有の課題〜
「HOME'Sデータセット」提供開始の背景 〜産学間データ共有の課題〜Yoji Kiyota
 
JSAI2015 ツイートタイムラインへの 階層的クラウドソーシングの適用による 住まい探しユーザの背景ニーズ理解
JSAI2015 ツイートタイムラインへの階層的クラウドソーシングの適用による住まい探しユーザの背景ニーズ理解JSAI2015 ツイートタイムラインへの階層的クラウドソーシングの適用による住まい探しユーザの背景ニーズ理解
JSAI2015 ツイートタイムラインへの 階層的クラウドソーシングの適用による 住まい探しユーザの背景ニーズ理解Yoji Kiyota
 

Más de Yoji Kiyota (20)

テキストアナリティクスの知見を社会に活かすには? -シーズ指向の視点とニーズ指向の視点-
テキストアナリティクスの知見を社会に活かすには? -シーズ指向の視点とニーズ指向の視点-テキストアナリティクスの知見を社会に活かすには? -シーズ指向の視点とニーズ指向の視点-
テキストアナリティクスの知見を社会に活かすには? -シーズ指向の視点とニーズ指向の視点-
 
「LIFULL HOME'Sデータセット」提供を通じた不動産テック分野のオープンイノベーション
「LIFULL HOME'Sデータセット」提供を通じた不動産テック分野のオープンイノベーション「LIFULL HOME'Sデータセット」提供を通じた不動産テック分野のオープンイノベーション
「LIFULL HOME'Sデータセット」提供を通じた不動産テック分野のオープンイノベーション
 
論文執筆の環境をめぐる最新の状況と、学会の査読・編集システムを持続可能とするための方策の検討
論文執筆の環境をめぐる最新の状況と、学会の査読・編集システムを持続可能とするための方策の検討論文執筆の環境をめぐる最新の状況と、学会の査読・編集システムを持続可能とするための方策の検討
論文執筆の環境をめぐる最新の状況と、学会の査読・編集システムを持続可能とするための方策の検討
 
LIFULL HOME'Sにおける不動産物件画像解析
LIFULL HOME'Sにおける不動産物件画像解析LIFULL HOME'Sにおける不動産物件画像解析
LIFULL HOME'Sにおける不動産物件画像解析
 
第10回ARG WI2研究会 株式会社LIFULL 技術報告
第10回ARG WI2研究会 株式会社LIFULL 技術報告第10回ARG WI2研究会 株式会社LIFULL 技術報告
第10回ARG WI2研究会 株式会社LIFULL 技術報告
 
SoC2017 不動産テックの研究課題
SoC2017 不動産テックの研究課題SoC2017 不動産テックの研究課題
SoC2017 不動産テックの研究課題
 
超高齢社会における地域課題の複雑さと「ネットワークが創発する知能」研究への期待 ―不動産・介護・医療分野を例として―
超高齢社会における地域課題の複雑さと「ネットワークが創発する知能」研究への期待 ―不動産・介護・医療分野を例として―超高齢社会における地域課題の複雑さと「ネットワークが創発する知能」研究への期待 ―不動産・介護・医療分野を例として―
超高齢社会における地域課題の複雑さと「ネットワークが創発する知能」研究への期待 ―不動産・介護・医療分野を例として―
 
IEEE DSAA 2017投稿呼びかけ
IEEE DSAA 2017投稿呼びかけIEEE DSAA 2017投稿呼びかけ
IEEE DSAA 2017投稿呼びかけ
 
住居選択支援を目的としたAI技術適用の試み -ソーシャルメディアへのクラウドソーシング適用および物件画像への深層学習適用-
住居選択支援を目的としたAI技術適用の試み -ソーシャルメディアへのクラウドソーシング適用および物件画像への深層学習適用-住居選択支援を目的としたAI技術適用の試み -ソーシャルメディアへのクラウドソーシング適用および物件画像への深層学習適用-
住居選択支援を目的としたAI技術適用の試み -ソーシャルメディアへのクラウドソーシング適用および物件画像への深層学習適用-
 
ライフイベントの決断を支えるオープンイノベーションの取り組み
ライフイベントの決断を支えるオープンイノベーションの取り組みライフイベントの決断を支えるオープンイノベーションの取り組み
ライフイベントの決断を支えるオープンイノベーションの取り組み
 
学際領域としての不動産の研究を活性化させるために
学際領域としての不動産の研究を活性化させるために学際領域としての不動産の研究を活性化させるために
学際領域としての不動産の研究を活性化させるために
 
「HOME'Sデータセット」を通じた不動産分野の研究活性化
「HOME'Sデータセット」を通じた不動産分野の研究活性化「HOME'Sデータセット」を通じた不動産分野の研究活性化
「HOME'Sデータセット」を通じた不動産分野の研究活性化
 
「HOME'Sデータセット」を活用した不動産物件画像への深層学習の適用の取り組み
「HOME'Sデータセット」を活用した不動産物件画像への深層学習の適用の取り組み「HOME'Sデータセット」を活用した不動産物件画像への深層学習の適用の取り組み
「HOME'Sデータセット」を活用した不動産物件画像への深層学習の適用の取り組み
 
Code4Lib JAPANカンファレンス2016 in 大阪
Code4Lib JAPANカンファレンス2016 in 大阪Code4Lib JAPANカンファレンス2016 in 大阪
Code4Lib JAPANカンファレンス2016 in 大阪
 
人生の意思決定を支える社会インフラとしての図書館
人生の意思決定を支える社会インフラとしての図書館人生の意思決定を支える社会インフラとしての図書館
人生の意思決定を支える社会インフラとしての図書館
 
「HOME'Sデータセット」提供を通じた不動産領域におけるオープンイノベーション促進の取り組み
「HOME'Sデータセット」提供を通じた不動産領域におけるオープンイノベーション促進の取り組み「HOME'Sデータセット」提供を通じた不動産領域におけるオープンイノベーション促進の取り組み
「HOME'Sデータセット」提供を通じた不動産領域におけるオープンイノベーション促進の取り組み
 
Mining User Experience through Crowdsourcing: A Property Search Behavior Corp...
Mining User Experience through Crowdsourcing: A Property Search Behavior Corp...Mining User Experience through Crowdsourcing: A Property Search Behavior Corp...
Mining User Experience through Crowdsourcing: A Property Search Behavior Corp...
 
不動産物件データセットを用いた研究開発事例と、大学との共同研究の取り組みの紹介
不動産物件データセットを用いた研究開発事例と、大学との共同研究の取り組みの紹介不動産物件データセットを用いた研究開発事例と、大学との共同研究の取り組みの紹介
不動産物件データセットを用いた研究開発事例と、大学との共同研究の取り組みの紹介
 
「HOME'Sデータセット」提供開始の背景 〜産学間データ共有の課題〜
「HOME'Sデータセット」提供開始の背景 〜産学間データ共有の課題〜「HOME'Sデータセット」提供開始の背景 〜産学間データ共有の課題〜
「HOME'Sデータセット」提供開始の背景 〜産学間データ共有の課題〜
 
JSAI2015 ツイートタイムラインへの 階層的クラウドソーシングの適用による 住まい探しユーザの背景ニーズ理解
JSAI2015 ツイートタイムラインへの階層的クラウドソーシングの適用による住まい探しユーザの背景ニーズ理解JSAI2015 ツイートタイムラインへの階層的クラウドソーシングの適用による住まい探しユーザの背景ニーズ理解
JSAI2015 ツイートタイムラインへの 階層的クラウドソーシングの適用による 住まい探しユーザの背景ニーズ理解
 

Último

TokyoTechGraduateExaminationPresentation
TokyoTechGraduateExaminationPresentationTokyoTechGraduateExaminationPresentation
TokyoTechGraduateExaminationPresentationYukiTerazawa
 
生成AIの回答内容の修正を課題としたレポートについて:お茶の水女子大学「授業・研究における生成系AIの活用事例」での講演資料
生成AIの回答内容の修正を課題としたレポートについて:お茶の水女子大学「授業・研究における生成系AIの活用事例」での講演資料生成AIの回答内容の修正を課題としたレポートについて:お茶の水女子大学「授業・研究における生成系AIの活用事例」での講演資料
生成AIの回答内容の修正を課題としたレポートについて:お茶の水女子大学「授業・研究における生成系AIの活用事例」での講演資料Takayuki Itoh
 
東京工業大学 環境・社会理工学院 建築学系 大学院入学入試・進学説明会2024_v2
東京工業大学 環境・社会理工学院 建築学系 大学院入学入試・進学説明会2024_v2東京工業大学 環境・社会理工学院 建築学系 大学院入学入試・進学説明会2024_v2
東京工業大学 環境・社会理工学院 建築学系 大学院入学入試・進学説明会2024_v2Tokyo Institute of Technology
 
次世代機の製品コンセプトを描く ~未来の機械を創造してみよう~
次世代機の製品コンセプトを描く ~未来の機械を創造してみよう~次世代機の製品コンセプトを描く ~未来の機械を創造してみよう~
次世代機の製品コンセプトを描く ~未来の機械を創造してみよう~Kochi Eng Camp
 
ゲーム理論 BASIC 演習106 -価格の交渉ゲーム-#ゲーム理論 #gametheory #数学
ゲーム理論 BASIC 演習106 -価格の交渉ゲーム-#ゲーム理論 #gametheory #数学ゲーム理論 BASIC 演習106 -価格の交渉ゲーム-#ゲーム理論 #gametheory #数学
ゲーム理論 BASIC 演習106 -価格の交渉ゲーム-#ゲーム理論 #gametheory #数学ssusere0a682
 
The_Five_Books_Overview_Presentation_2024
The_Five_Books_Overview_Presentation_2024The_Five_Books_Overview_Presentation_2024
The_Five_Books_Overview_Presentation_2024koheioishi1
 
2024年度 東京工業大学 工学院 機械系 大学院 修士課程 入試 説明会 資料
2024年度 東京工業大学 工学院 機械系 大学院 修士課程 入試 説明会 資料2024年度 東京工業大学 工学院 機械系 大学院 修士課程 入試 説明会 資料
2024年度 東京工業大学 工学院 機械系 大学院 修士課程 入試 説明会 資料Tokyo Institute of Technology
 

Último (7)

TokyoTechGraduateExaminationPresentation
TokyoTechGraduateExaminationPresentationTokyoTechGraduateExaminationPresentation
TokyoTechGraduateExaminationPresentation
 
生成AIの回答内容の修正を課題としたレポートについて:お茶の水女子大学「授業・研究における生成系AIの活用事例」での講演資料
生成AIの回答内容の修正を課題としたレポートについて:お茶の水女子大学「授業・研究における生成系AIの活用事例」での講演資料生成AIの回答内容の修正を課題としたレポートについて:お茶の水女子大学「授業・研究における生成系AIの活用事例」での講演資料
生成AIの回答内容の修正を課題としたレポートについて:お茶の水女子大学「授業・研究における生成系AIの活用事例」での講演資料
 
東京工業大学 環境・社会理工学院 建築学系 大学院入学入試・進学説明会2024_v2
東京工業大学 環境・社会理工学院 建築学系 大学院入学入試・進学説明会2024_v2東京工業大学 環境・社会理工学院 建築学系 大学院入学入試・進学説明会2024_v2
東京工業大学 環境・社会理工学院 建築学系 大学院入学入試・進学説明会2024_v2
 
次世代機の製品コンセプトを描く ~未来の機械を創造してみよう~
次世代機の製品コンセプトを描く ~未来の機械を創造してみよう~次世代機の製品コンセプトを描く ~未来の機械を創造してみよう~
次世代機の製品コンセプトを描く ~未来の機械を創造してみよう~
 
ゲーム理論 BASIC 演習106 -価格の交渉ゲーム-#ゲーム理論 #gametheory #数学
ゲーム理論 BASIC 演習106 -価格の交渉ゲーム-#ゲーム理論 #gametheory #数学ゲーム理論 BASIC 演習106 -価格の交渉ゲーム-#ゲーム理論 #gametheory #数学
ゲーム理論 BASIC 演習106 -価格の交渉ゲーム-#ゲーム理論 #gametheory #数学
 
The_Five_Books_Overview_Presentation_2024
The_Five_Books_Overview_Presentation_2024The_Five_Books_Overview_Presentation_2024
The_Five_Books_Overview_Presentation_2024
 
2024年度 東京工業大学 工学院 機械系 大学院 修士課程 入試 説明会 資料
2024年度 東京工業大学 工学院 機械系 大学院 修士課程 入試 説明会 資料2024年度 東京工業大学 工学院 機械系 大学院 修士課程 入試 説明会 資料
2024年度 東京工業大学 工学院 機械系 大学院 修士課程 入試 説明会 資料
 

マイニング探検会 #01

  • 1. マイニング探検会 #1 東京大学情報基盤センター 学術情報研究部門 助教 清田 陽司 (兼 株式会社リッテル 上席研究員) 2010年4月9日 @東京大学アントレプレナープラザ会議室
  • 2. 素朴な疑問 そもそも、図書館の価値ってなに? 過去の情報の蓄積と提供 研究・調査・教育のための知的インフラ 情報リテラシーを育てる場 「知る権利」の保証=民主主義を支える柱 etc. まわりの人たちに価値をどうやって伝えるか?
  • 3. Webが世界に与えたインパクト 最初は「ハッカーのおもちゃ」 まわりの人たちを巻き込んでいくことで爆発的に成長 世界に新たな「知的ゲーム」を提供した 究極の「暇つぶしツール」 参加者の数が価値を生み出している 多くの人々の人生に新たな意味を与えた ゲームの意味を問うことには意味がない! 意味は後から生み出される
  • 4. 知的ゲームの提供者としての図書館 現在の図書館の基盤を築いたのは何か? 誰でも情報に触れられる場を提供したこと 膨大な情報を検索できるツールを提供したこと 価値あるゲームを社会に提供することで認められた Webによってかなりの部分が代替されつつある -> 新たな知的ゲームを創造すべき時期になっている!
  • 5. 新たな知的ゲームを創造するために 多くの人々を巻き込むしかけ 組織の壁を超えた交流 エンターテインメント精神が大事 Webがもつ価値を徹底的に利用 Webを支える「ルール」と「テクニック」を知っておく プログラミングできなくても大丈夫 実際に手を動かして体験学習 図書館パラダイムの再構築 ライブラリアンシップを次の世代に受け継ぐために ひとりひとりが新サービスのプロデューサーとしての役割を果たしていこう!
  • 6. トピック案 情報検索 Lucene, GETAssoc データマイニング 相関ルール抽出、回帰分析、機械学習、クラスタリング レコメンデーション 協調フィルタリング、プロファイル推定、… テキスト処理 形態素解析、構文解析、固有表現抽出、… 大規模データ処理 Hadoop、Amazon EC2/S3、Google Apps Engine、Windows Azure 信頼性の向上 HDFS、ZooKeeper、… Webインタフェース AJAX、Flash、HTML5、…
  • 7. API (Application Programming Interface) OS(Windows、MacOS、Linuxなど)やプログラミング言語(C言語、Java、C#など)によって提供 OSやライブラリ内部の機能を利用できる APIの役割 アプリケーション開発においてプログラミングの手間を省く システム間の連携 抽象化 (=人間のレベルに近づける) 簡潔さと柔軟性のトレードオフ 抽象化しすぎると細かな要望に手が回らない
  • 8. Web API APIの概念をWebの世界に援用 単に「API」といえば「Web API」 Webサービス運営者によって提供 Webサービス内部の機能やデータを利用できる Web APIの役割 新たなWebサービス開発の手間を省く Webサービス間の連携 -> マッシュアップ 抽象化 トレードオフが存在 簡単にするほど細かな処理ができなくなる
  • 9. Web APIを支える技術 リソースの指定 IPアドレス ドメイン名 URL 通信プロトコル TCP/IP (インターネット) HTTP / HTTPS (cf. Z39.50) ファイルフォーマット XML JSON APIへの情報送信 SOAP REST
  • 10. URL (Uniform Resource Locater) インターネット上のリソースの「住所」 プロトコル+ホスト名+パス名 で構成 http://ja.wikipedia.org/wiki/Wikipedia https://mail.google.com/mail/ ftp://ftp.iij.ad.jp/pub/linux/centos/5/os/x86_64/ ホスト名はドメイン名またはIPアドレス http://124.83.167.215/hl
  • 11. HTTP(HyperText Transfer Protocol) Webを支える基盤プロトコル(通信規約) ほぼすべてのWebサービスはHTTPを利用 暗号化されたHTTP = HTTPS クライアント=サーバモデル クライアント(ブラウザとか)からのリクエストを受けて、サーバがコンテンツをクライアントに返す いろんなコンテンツを送れる テキスト、画像、動画、プログラム、XML、… サーバがコンテンツをどう作るかは関知せず ディスクにしまってあるコンテンツをそのまま書き出してもよい (静的コンテンツ) プログラムでコンテンツをその場で作ってしまってもよい(動的コンテンツ)
  • 12. 静的コンテンツの場合 GET/ HTTP/1.1 Host: www.mi-tan.jp User-Agent: Mozilla/5.0 ….. サーバ (www.mi-tan.jp) クライアント (ブラウザソフト) URLの入力 インターネット HTTPサーバ コンテンツの表示 HTTP/1.1 200 OK Date: Tue, 06 Apr 2010 13:14:32 GMT Server: Apache Content-Type: text/html <html> <head><title>マイニング探検会(マイタン) - 図書館の未来を探る勉強会 -</title> </head> <body class=“mainPage”> … </body> <html> <head><title>マイニング探検会(マイタン) - 図書館の未来を探る勉強会 -</title> </head> …
  • 13. 動的コンテンツの場合 GET/search?p=マイニング探検会&ei=UTF-8 HTTP/1.1 Host: search.yahoo.co.jp User-Agent: Mozilla/5.0 サーバ (search.yahoo.co.jp) クライアント (ブラウザソフト) 検索クエリーの入力 インターネット HTTPサーバ コンテンツの表示 HTTP/1.1 200 OK Date: Tue, 06 Apr 2010 13:14:32 GMT Server: Apache Content-Type: text/html <html> <head><title>「マイニング探検会」の検索結果 - Yahoo!検索</title> </head> <body> … </body> 検索エンジンサーバ 検索インデックス
  • 14. HTTPリクエストのメソッド GET URL埋め込み形式で情報を送ることができる http://search.yahoo.co.jp/search?p=マイニング探検会&ei=UTF-8 サイズ制限あり (Internet Explorerでは2083bytes) ブラウザから簡単に試せる POST さまざまなコンテンツを送ることができる ファイルをアップロードすることも可能 サイズ制限なし 利用が少し面倒
  • 15. XML (eXtensible Markup Language) <?xml version="1.0" encoding="UTF-8"?> <レシピ 名前="パン" 準備時間="5分" 調理時間="3時間"> <料理>基本的なパン</料理> <材料 量='3' 単位='カップ'>小麦粉</材料> <材料 量='0.25' 単位='オンス'>イースト</材料> <材料 量='1.5' 単位='カップ' 状態="温かい">水</材料> <材料 量="1" 単位="ティースプーン">食塩</材料> <要領> <手順>全ての材料を一緒にして混ぜます。</手順> <手順>十分にこねます。</手順> <手順>布で覆い、暖かい部屋で1時間そのままにして おきます。 </手順> <手順>もう一度こねます。</手順> <手順>パン焼きの容器に入れます</手順> <手順>布で覆い、暖かい部屋で1時間そのままにして おきます。 </手順> <手順>オーブンに入れて温度を180℃にして30分間 焼きます。 </手順> </要領> </レシピ> マークアップ言語の規格 電子的文書を記述する規格SGMLの後継 「タグ」で構造を表現できる 応用例 ニュースリーダー (RSS) 電子書籍 (Open eBook) オフィス文書
  • 16. SOAPとREST SOAP (Simple Object Access Protocol) REST (Representational State Transfer) XMLで記述されたSOAPメッセージを送信 利点 HTTP以外も利用可能 (SMTP) 複雑な指示が送れる 欠点 利用が面倒 キャッシュ不可 URLを情報送信の手段として利用 利点 簡単に利用できる キャッシュ可能 欠点 HTTPに依存 あまり複雑な指示は送れない
  • 17. 紹介するWeb API Amazon Twitter CiNii (国立情報学研究所) PORTA (国立国会図書館) レファレンス共同データベース (国立国会図書館) J-Global (科学技術振興機構)
  • 18. Amazon Product Advertising API Amazonの商品情報を利用したサイト構築のための機能を提供 商品検索 検索条件による絞り込み 商品画像の表示 商品情報の取得 レビュー・ランキング・関連商品・販売状態などの取得 アフィリエイトとの連携 (Amazonアソシエイト) サーバーサイド SOAPまたはRESTが利用可能 APIキーの発行が必須 http://developer.amazonwebservices.com/connect/kbcategory.jspa?categoryID=19
  • 19. Twitter API Twitterのアプリケーションを作るために必要な一通りの機能を提供 タイムラインの取得 ステータスの取得 アカウント情報の取得 発言の投稿 3種類のAPI REST 2種類 (歴史的経緯) Streaming GETメソッド (メッセージ投稿など一部はPOST) 公開ユーザのタイムライン取得以外は認証が必要 ドキュメント http://apiwiki.twitter.com/ 利用例 (自分のタイムライン) http://api.twitter.com/1/statuses/home_timeline.xml
  • 20. CiNii API NII論文検索の基本的な機能を提供 ツールバーなどからの論文・著者検索 論文・著者詳細情報の取得 CiNii内のコンテンツへの直接リンク GETメソッド REST準拠 フォーマット 検索: RSS or Atom 詳細情報: RDF 認証不要 ドキュメント http://ci.nii.ac.jp/info/ja/if_link_receive.html 利用例 (RSSフィード) http://ci.nii.ac.jp/opensearch/search?q=長尾真&range=0&sortorder=1&start=1&count=20&format=atom
  • 21. PORTA API NDL PORTAコンテンツの検索とハーベスティング機能を提供 GETメソッド/POSTメソッドが混在 REST/SOAP/Z39.50が混在 認証不要
  • 22. レファレンス協同データベースAPI 詳細検索画面と同等の検索機能を提供 キーワード検索 (boolean) 館ごとの検索指定 アクセス数ランキング GETメソッド REST準拠 フォーマット XML (独自形式) 認証不要
  • 23. J-GLOBAL Web API 4つの基本情報を検索可能 「文献」「科学技術用語」「科学物質」「資料」 J-GLOBAL サイトの検索結果一覧と同等レベルの情報を取得可能 取得可能な検索結果 HTML形式 あらかじめレイアウトが決まっていて簡単に実装可。 JSON形式 項目ごとにデータを取得し、自由にレイアウトが可。 WebAPIキーの取得が必要
  • 24. APIの利用制限 APIキーの発行を受けないと利用できないものがある 呼び出し頻度に注意 過度の呼び出しはサーバに負荷をかける アクセス制限を受けることも 利用規約 非営利利用に制限されているもの リンクを張ることが義務づけられているもの(Amazonなど)
  • 25. Web API提供の考え方 なぜ公開するのか? お互いハッピーになれるかも? cf. カーリルのスクレイピング 何を公開し、何を公開しないか? 個人情報はNG レコメンデーションは? どうやって普及させるか? APIコンテスト アフィリエイト 開発者(ベンダー含む)との関係をどう築いていくか? サービスとしてどう継続していくか? 標準をどう作っていくか? 営利と非営利の境界線 図書館とWeb書店はどこまで連携可能か?