Más contenido relacionado
Similar a LODによるオープンガバメント入門 (20)
Más de Rikkyo University (10)
LODによるオープンガバメント入門
- 1. Web標準: LODによる
オープンデータ・オーブンガバメント
の効果と始めかた
(updated)
2012年5月17日
W3C/Keio
慶應義塾大学大学院
政策・メディア研究科
特任助教
深見嘉明
@rhys_no1
These slides are copyright © 2012 W3C (MIT, ERCIM & Keio).
Stata Center photo by See-Ming Lee available under a Creative Commons Attribution Share-Alike 2.0 License http://www.flickr.com/photos/seeminglee/3791607622/
- 2. 1
W3Cの概要
• 世界中の企業・研究機関・団体によって構成
される、ウェブ標準規格を策定する団体
• 加入企業・研究機関・団体の数は300以上。
– http://www.w3.org/Consortium/
Member/List
• 加入企業・団体から参加するエンジニアに
よって議論が進められ、標準規格が策定される。
• 今この瞬間も、電話会議で、メールで、
仕様に関する議論が進められています。
These slides are copyright © 2012 W3C (MIT, ERCIM & Keio).
Stata Center photo by See-Ming Lee available under a Creative Commons Attribution Share-Alike 2.0 License http://www.flickr.com/photos/seeminglee/3791607622/
- 3. 2
「オープンガバメント」
「オープンデータ」
という用語を
よく耳にするように
なりました
These slides are copyright © 2012 W3C (MIT, ERCIM & Keio).
Stata Center photo by See-Ming Lee available under a Creative Commons Attribution Share-Alike 2.0 License http://www.flickr.com/photos/seeminglee/3791607622/
- 4. 3
はじめに考えるべきこと
• 何のための
オープン?
• 誰のための
オープン?
These slides are copyright © 2012 W3C (MIT, ERCIM & Keio).
Stata Center photo by See-Ming Lee available under a Creative Commons Attribution Share-Alike 2.0 License http://www.flickr.com/photos/seeminglee/3791607622/
- 5. 4
これまでの「オープン」
• 議会や審議会、研究会といった政策形成
プロセスの公開
– 動画配信や議事録のウェブ公開等
• 施策立案担当者や議員、首長との、
直接的な意見交換
– TwitterやFacebookといったソーシャル
メディアを介した交流
These slides are copyright © 2012 W3C (MIT, ERCIM & Keio).
Stata Center photo by See-Ming Lee available under a Creative Commons Attribution Share-Alike 2.0 License http://www.flickr.com/photos/seeminglee/3791607622/
- 6. 5
「オープン」に期待されていること
• 行政執行や施策立案に透明性
が確保できる
• 公開されたデータを民間が活
用することによる効率性の向
上と経済の活性化
These slides are copyright © 2012 W3C (MIT, ERCIM & Keio).
Stata Center photo by See-Ming Lee available under a Creative Commons Attribution Share-Alike 2.0 License http://www.flickr.com/photos/seeminglee/3791607622/
- 7. 6
今までの「オープン」はどこ
まで有効だったのか?
• 平日昼間やっている議会や審議会、
誰が見るの?
• 長時間の審議、議論を全部聞くの?
• 議事録などの全文採録を読んで、価値のある
情報を容易に取り出せるのか?
• 特定の個人間のやりとりを一般化して、政策
形成や施策立案に落としこむことは、本当に
効率的なのか?
These slides are copyright © 2012 W3C (MIT, ERCIM & Keio).
Stata Center photo by See-Ming Lee available under a Creative Commons Attribution Share-Alike 2.0 License http://www.flickr.com/photos/seeminglee/3791607622/
- 8. 7
今までの「オープン」はどこ
まで有効だったのか?
• 似たようなデータが各省庁・部局・外郭
団体・自治体等からバラバラに開示されて
いて、活用したいデータがすぐに見つから
ない。
• PDFにデータが記載されていると、それを
入力し直さなければ分析・活用できない。
These slides are copyright © 2012 W3C (MIT, ERCIM & Keio).
Stata Center photo by See-Ming Lee available under a Creative Commons Attribution Share-Alike 2.0 License http://www.flickr.com/photos/seeminglee/3791607622/
- 9. 8
必要とされる「オープン」のかたち
• 議論の中身だけではなく、議論の前提と
なるデータが開示されること。
• データの活用が効率的に進むよう、
– 探しやすく、重複がないような体制でデータ
が開示されること。
– 最初から分析プログラムやアプリケーション
で活用可能なデータ形式・粒度で開示される
こと。
These slides are copyright © 2012 W3C (MIT, ERCIM & Keio).
Stata Center photo by See-Ming Lee available under a Creative Commons Attribution Share-Alike 2.0 License http://www.flickr.com/photos/seeminglee/3791607622/
- 10. 9
具体的にどうするか
• 分析・加工する前の生データ
(raw data)、もしくはそれに近い
データを公開する。
• コンピュータ/プログラムで
扱いやすい形式・フォーマットで
公開する。
• 適切な著作権・情報保護の設定の元、
公開する。
These slides are copyright © 2012 W3C (MIT, ERCIM & Keio).
Stata Center photo by See-Ming Lee available under a Creative Commons Attribution Share-Alike 2.0 License http://www.flickr.com/photos/seeminglee/3791607622/
- 11. 10
回答:Linked Data
• データ公開時のルール
– IDはURI
– RDF (Resource Description Framework)に
従った要素を含む
– データフォーマットは標準的な計算機可読な
ものであればよい。
具体的には、RDF/XML、JSONなど。
– 分類項目や項目の定義=データ構造は、
既存の標準があればそれを用いる。無ければ、
自由に定義してよいが、その定義も公開し、
標準化に向けて提案することが理想。
These slides are copyright © 2012 W3C (MIT, ERCIM & Keio).
Stata Center photo by See-Ming Lee available under a Creative Commons Attribution Share-Alike 2.0 License http://www.flickr.com/photos/seeminglee/3791607622/
- 12. 11
ID=URI
• URI
– Uniform Resource Identifier
– URLとほぼ同義。
「http://」ではじまるアドレス(注)。
• なぜURI?
– ウェブ上の公開に適している
– どこからでも、誰でもアクセス可能
– IDのつけ方に自由度が高い
– 固有性を維持するのが容易
注:厳密には、ウェブサイトのアドレスはURIの一種
These slides are copyright © 2012 W3C (MIT, ERCIM & Keio).
Stata Center photo by See-Ming Lee available under a Creative Commons Attribution Share-Alike 2.0 License http://www.flickr.com/photos/seeminglee/3791607622/
- 13. 12
RDF: Resource Description Framework
• 主語・述語・目的語という
単純な組み合わせ=triple/三つ組
• 他のURI(データリソース)と
リンクする
述語:名前 World Wide
http://
Web
www.w3.org
Consortium
主語 目的語
These slides are copyright © 2012 W3C (MIT, ERCIM & Keio).
Stata Center photo by See-Ming Lee available under a Creative Commons Attribution Share-Alike 2.0 License http://www.flickr.com/photos/seeminglee/3791607622/
- 14. 13
Linked Dataの記述のしかた
• 例:Turtleでの記述
<http://d.hatena.ne.jp/yofukami/about> rdf:type foaf:Person .
<http://d.hatena.ne.jp/yofukami/about> foaf:name "深見嘉明" .
<http://d.hatena.ne.jp/yofukami/about> foaf:gender "mail" .
<http://d.hatena.ne.jp/yofukami/about> foaf:knows
<http://www-kasm.nii.ac.jp/~takeda#me>
<foaf:Person>
<http:// rdfs:type
d.hatena.ne.jp/
yofukami/about>
foaf:knows
<http://www-
kasm.nii.ac.jp/
foaf:name foaf:gender
~takeda#me>
“深見嘉明”
“male”
These slides are copyright © 2012 W3C (MIT, ERCIM & Keio).
Stata Center photo by See-Ming Lee available under a Creative Commons Attribution Share-Alike 2.0 License http://www.flickr.com/photos/seeminglee/3791607622/
- 15. 14
データフォーマットと構造
• コンピュータが処理できれば(machine
readable)、何でも良い、が、RDF/XMLや
JSONが推奨される。
• 構造を示すのは前スライドの “foaf:Person”
などの部分。
• foaf、dc (Dublin Core)等、既存の標準的な
フォーマットがあれば、それに従う。
• Google、Yahoo!、Microsoftが提唱する
schema.orgなど、大手企業も積極的に標準
を提唱・実装。
These slides are copyright © 2012 W3C (MIT, ERCIM & Keio).
Stata Center photo by See-Ming Lee available under a Creative Commons Attribution Share-Alike 2.0 License http://www.flickr.com/photos/seeminglee/3791607622/
- 16. 15
Linked DataとLOD
• LOD= Linked Open Data
• 標準に従って生成・公開されたデータで
あれば、マッシュアップして活用すること
が可能
• だから、フォーマットも、データ構造も、
標準ベースで
• 多様な形態での利用が前提なので、適切な
著作権処理(例えば、CC-BY)がなされるこ
とが望ましい。
These slides are copyright © 2012 W3C (MIT, ERCIM & Keio).
Stata Center photo by See-Ming Lee available under a Creative Commons Attribution Share-Alike 2.0 License http://www.flickr.com/photos/seeminglee/3791607622/
- 17. 16
データ共有プラットフォームとしてのLOD
• 既に各分野でリンクされたデータセットが多数
生成されています
(http://www4.wiwiss.fu-
– 203のデータセット
berlin.de/lodcloud/state/)
– 2500万の RDF triples
– 3億9500万の RDF links
These slides are copyright © 2012 W3C (MIT, ERCIM & Keio).
Stata Center photo by See-Ming Lee available under a Creative Commons Attribution Share-Alike 2.0 License http://www.flickr.com/photos/seeminglee/3791607622/
- 18. 17
Linked Dataの本質
• 世界共通の識別子(Identifier)
• 世界共通の標準フォーマット・
構造の採用
Web全体を
データリソースとして
アプリケーションが
作れる These slides are copyright © 2012 W3C (MIT, ERCIM & Keio).
Stata Center photo by See-Ming Lee available under a Creative Commons Attribution Share-Alike 2.0 License http://www.flickr.com/photos/seeminglee/3791607622/
- 19. 18
エコシステムの構造
3) サービスを創る
2) アプリケーションを創る
1) データを提供する
標準仕様に則っていること
により、より広い層からの
利用を見込むことができる
These slides are copyright © 2012 W3C (MIT, ERCIM & Keio).
Stata Center photo by See-Ming Lee available under a Creative Commons Attribution Share-Alike 2.0 License http://www.flickr.com/photos/seeminglee/3791607622/
- 20. 19
情報開示とオープンデータの差
• 既存の「情報開示」
– 開示までにかかるコスト
が大きい
データ収集
– 特定の分析視点に
加工
された
分析
基づいてデータが
データ
提示される
プレゼン
– 「データそのもの」が
テーション
必要な場合、それを
取り出すコストがかかる
These slides are copyright © 2012 W3C (MIT, ERCIM & Keio).
Stata Center photo by See-Ming Lee available under a Creative Commons Attribution Share-Alike 2.0 License http://www.flickr.com/photos/seeminglee/3791607622/
- 21. 20
情報開示とオープンデータの差
• LODによるオープンデータ
データ データ データ データ
ニーズ
ニーズ
ニーズ
ニーズ
These slides are copyright © 2012 W3C (MIT, ERCIM & Keio).
Stata Center photo by See-Ming Lee available under a Creative Commons Attribution Share-Alike 2.0 License http://www.flickr.com/photos/seeminglee/3791607622/
- 22. 21
情報開示とオープンデータの差
• LODによるオープンデータ
– データ生成・公開/利用の分離
– データ利用に伴う負担の分散化
– 必要なデータを各所から収集して用いる
(マッシュアップ)が容易
– ニーズがある場所で、効率的に
アプリケーションやサービスが
開発される
These slides are copyright © 2012 W3C (MIT, ERCIM & Keio).
Stata Center photo by See-Ming Lee available under a Creative Commons Attribution Share-Alike 2.0 License http://www.flickr.com/photos/seeminglee/3791607622/
- 23. 22
LODによるオープンガバメントの意義
• 負荷分散効果による、データ提供側・利
用者側の負荷低減
• アプリケーションやサービスの
DIY・地産地消を実現
• スケーラビリティ効果
– 効率的な情報発信、サービス提供範囲拡大
– 他所の成功事例を簡単に導入
These slides are copyright © 2012 W3C (MIT, ERCIM & Keio).
Stata Center photo by See-Ming Lee available under a Creative Commons Attribution Share-Alike 2.0 License http://www.flickr.com/photos/seeminglee/3791607622/
- 24. 23
標準という観点から見たLOD
• W3CはRDFという基本
コンセプトと、RDF/
ユーザ
XMLなどのデータ
データ構造 からの
フォーマットの一部のみ 提案
データ
を標準として策定
フォーマット
• データ構造はユーザや
W3C
企業からの提案が
RDF (&others)
デファクトスタンダード
になるのが普通。
These slides are copyright © 2012 W3C (MIT, ERCIM & Keio).
Stata Center photo by See-Ming Lee available under a Creative Commons Attribution Share-Alike 2.0 License http://www.flickr.com/photos/seeminglee/3791607622/
- 25. 24
標準という観点から見たLOD
• 車輪の再発明は避けるべし
• 自身の使い勝手のよいデータ構造
を、どんどん世界標準にするため
の提案をすべき
These slides are copyright © 2012 W3C (MIT, ERCIM & Keio).
Stata Center photo by See-Ming Lee available under a Creative Commons Attribution Share-Alike 2.0 License http://www.flickr.com/photos/seeminglee/3791607622/