SlideShare una empresa de Scribd logo
1 de 106
データ入門
データの基礎から、組織での活用まで
1
GDC : GOVERNMENT DATA COLLEGE
コースの概要
 対象者
- 組織全体の情報戦略、データ管理の担当者、EBPM等のデータ活用戦略の担当者
 内容
- データの価値や意味の理解、データ連携の重要性、
- 組織におけるデータ戦略、アーキテクチャと基盤、データ連携のための仕組み(標準、品質、
ルール)、データ連携、活用の応用、投資対効果
 目指す受講効果
- 組織横断でデータ連携や活用できるためのデータ戦略から、組織横断での環境の整備運用
方策を習得し、具体的な連携業務に活用することができる。
 目指す人材像
- 世界で通用するCDO(Chief Data Officer)候補者
‣ 組織内外のデータ資産を戦略的に活用、管理できる
2
GDC : GOVERNMENT DATA COLLEGE
コースの位置づけ
 データ人材フレームワークの中の実践コース
GDC : GOVERNMENT DATA COLLEGE 3
スキルセット
ロール定義
人材モデル
コースウェア
評価体系
コース
評価
実務
人材定義
フィードバック
アウトライン
 データドリブンの社会とはなにか
 データとはなにか
 日本のデータ戦略
 世界のデータ戦略
 組織におけるデータ戦略
4
 アーキテクチャ
 アーキテクチャを支えるルール管理
 アーキテクチャを支えるデータ標準化
 データ流通を支えるプラットフォーム
 データモデリング
 データ設計
 ベース・レジストリ
GDC : GOVERNMENT DATA COLLEGE
 データ・マネジメント
 データ品質
 データセキュリティ
 データ整備・移行
 APIの設計と利用
 オープンデータ
 データ活用
 投資対効果
 組織と人材
データドリブンな社会とは何か
データの価値を知ろう
5
GDC : GOVERNMENT DATA COLLEGE
「21世紀の石油である」
データとは
6
GDC : GOVERNMENT DATA COLLEGE
データドリブン社会って何なんだ
 自動運転
- 大量のデータを使って、目的地までの移動、障害物の回避をしてくれる。
 Amazon
- 購買履歴から推奨商品を提示してくれる
 チャットボット
- 人と会話してくれる
 クラウドで一気に寡占が進む
 一方で漏えい等の事故も多い 7
GDC : GOVERNMENT DATA COLLEGE
データプラットフォーマーの台頭
 GAFAの台頭ってなんなんだろう
8
データが溜
まる
分析等の
活用でイノ
ベーション
が起こる
高度な
サービスの
提供
利用者が
増加
世界中の優秀な
エンジニアが集中
この動きがグローバルに
展開している
GDC : GOVERNMENT DATA COLLEGE
データが注目されるが対応は不十分
 AIの活用、ビッグデータ解析、EBPM等、データへの注目度が集まっている。
9
AI RPA Block chain IoT
Cloud AR
データを
大量に分析
データを
自動処理する
データの
信頼性を確保する
データを収集する
データで操作する
データで
サービスを作る
データを元に
コンテンツを作る
fintech 5G
データが
価値を担保
データを
高速に転送する
 各分野でデータ活用、データ連携
というが、具体策がない。
 基盤の不足が顕在化。
 人材は育成可能
 データ蓄積は時間がかかる
Q AIを活用するうえで今後改善すべきだと考えていることは何ですか
(n=113、複数回答)
日経xTECH「大手113社にAIの活用状況の調査」( 2018年7-8月)
GDC : GOVERNMENT DATA COLLEGE
社会インフラの変化
 20世紀は、道路や橋や建物がインフラであった。
 21世紀は、データやその連携基盤がインフラになってきている。
010100100100100101010100010101010101010110101010100000101001011101011010
001010010100101010101010010100100100100101010100010101010101010110101010
100000101001011101011010001010010100101010101010000001010010111010110100
010100101001010101010100101001001001001010101000101010101010101010110101
010100000101001011101011010001010010100101011101010101011010101010000010
10010111010110100010100101001010
高度成長期には、
道や工業団地、新興住宅地を整備
(全国総合整備計画)
↓
優良企業や優秀な人が集積
これからは、
光ファイバーや5Gは用意した
データと連携基盤を整備
↓
優良企業や優秀な人が集積
GDC : GOVERNMENT DATA COLLEGE 10
これらのデータを使いこな
せるかどうかでサービスの競
争力が変わり、
豊かに暮らせるかが変わる
社会はデータであふれ
ている
住所
建物名
路線名
施設名
閉店時間
連絡先
アクセス
人口
法人数
交通量
位置データ
画像データ
携帯電話密度データ
運転データ
気温
路面データ
GDC : GOVERNMENT DATA COLLEGE 11
スマートシティのデータを見ると分野横断の必要性がわかる
 従来の都市計画、都市や行政や商業のサービスを包括している。
スマートシティ
インダストリ
デジタル
ガバメント
(台帳類、オープンデータ)
社会インフラ情報 センサーデータ
申請、証明、報告
データ
基本
データ
主要データ
駐車場
交通データ
人口密度データ
音データ
大気データ
廃棄物データ
街灯データ
犯罪データ
都市の3Dモデル
主なサービス領域
モビリティ
安全
健康
エネルギ
水
廃棄物
経済と住居
コミュニティ
国土交通省の実証
 施設データ
 モビリティデータ(人流)
 自動運転データ
 信号灯色データ
 街頭カメラデータ
 カメラによる交通・活動データ
 インフラ維持管理データ
 道路管理データ
 水路水位データ
 環境センサーデータ
 地域電力等データ
 清掃データ
 警備データ
 購買データ
 地域産品データ
 SNSデータ
 健康データ
 鳥獣監視
GDC : GOVERNMENT DATA COLLEGE 12
データによる国際競争力の変化
 先進事例や技術に注目が集まるが、そこで使われるデータが安価に安定的
に供給される持続可能なエコシステムが重要。社会の基本データは、デジタ
ル時代のインフラであり、地力(ポテンシャル)である。
データが整備済みの国・都市 データの整備が遅れている国・都市
土地
データ
インフラ
データ
交通
データ
土地
データ
インフラ
データ
交通
データ
すぐに新ビジネスを開始できる
暮らしやすい 新ビジネスのスタートアップコストが大きい
サービスレベルが向上しない
人や企業、投資は、
より魅力的な場所
へ移動
データが、低品質であったり、利用制限されている場合がある。
データ収集で
コストと時間を浪費
法人
データ
法人
データ
データは最新かつ正確で自由に使える。また、連携している。
実証できても
持続できない
オープン
データ
ベース・レジストリ
+民間データ
プラットフォーム
GDC : GOVERNMENT DATA COLLEGE 13
なぜデータのなのか
 最高のサービスを作るためにバランスを取った推進が必要。
14
プロセスをノウハウ
化して共有する仕組
みが必要
新技術やユーザー
を見て随時変更
変更が可能なシステ
ムが必要
アジャイルとDevOps
が前提
システム標準化は
データとインタフェー
スの標準化が重要
リプレイス前提
ビルディング・ブロッ
ク化
COTS、GOTSの活
用
組織のアンカーとし
ての機能
利活用・管理ルール
の見直しが必要
業務プロセスの見直し
寿命1年
情報システムの見直し
寿命10年
データの見直し
寿命100年
GDC : GOVERNMENT DATA COLLEGE
データは中長期
の視点が必要
データが生み出す価値とは何か
 分析とターゲティング
- 大量データを分析すると傾向が把握できる(銀座に来ている人の住居地分布等)
 単純作業をなくす
- 転記、再入力、照合をなくす(コンピューターは24時間黙々と働き続ける)
 新たなValueを創出
- 保有データの新たな展開(急ブレーキデータを都市計画に使うなど)
- 組み合わせによる価値(気象データとTweetデータで販売量を予測など)
15
GDC : GOVERNMENT DATA COLLEGE
デジタル駆動社会へのアプローチ
 社会のポテンシャルとしてデータを考える。
16
量、多様性、網羅性等、クオリティの高いデータ
データの持つポテンシャルを100%引き出すためのツール・基盤
データ利用、流通が円滑にできるようなルール
基盤
ツール
ルール
データ
(燃料)
AI
先端技術ではない
GDC : GOVERNMENT
DATA COLLEGE
気が付かないうちに社会は変わり始めている
 schema.orgのデータ構造に対応することで、サイトで提供するデータを高度に活用する
ことが可能になる。
17
StartTime
10:00
EndTime
21:00
サイトの中にデータ処理
用のマイクロデータが埋
まっている
GDC : GOVERNMENT DATA COLLEGE
18
相田みつを
http://www.mitsuo.co.jp/museum/
土
の
中
の
水
道
管
高
い
ビ
ル
の
下
の
下
水
大
事
な
も
の
は
表
に
出
な
い
花
を
支
え
る
枝
枝
を
支
え
る
幹
幹
を
支
え
る
根
根
は
見
え
ね
ん
だ
な
GDC : GOVERNMENT DATA COLLEGE
データとはなにか
データについて考える際に、その性質によって扱い等が異なるため、データの基礎を学ぶ
19
GDC : GOVERNMENT DATA COLLEGE
広義と狭義
 広義のデータ(データ戦略などで使われる)
- 「データは万物に関する事実を表現する役割を持つ」(DMBOK 2nd Edition)
- 「デジタルの世界でネットワークなどを通じて連携や交換できる数値から形式化された情
報や知識を全て含む概念」(データ戦略(2020デジタルガバメント閣僚会議))
 狭義のデータ
- 数値や文字等、取得した文字列の集合
20
GDC : GOVERNMENT DATA COLLEGE
人の理解や活動から見たデータ
 「理解のスペクトル」として、知識を軸にデータの流れを整理すると、データは
物事のスタートラインである。
データ 情報 知識 知恵
体験
コンテクスト
刺激 理解
発見
収集
研究
創作
整理
提示
会話
ストーリーテリング
統合化
沈思黙考
評価
解釈
反省
グローバル
ローカル
(共有可能) パーソナル
資料:情報デザイン原論(Robert Jacobson)
編集 編集
21
GDC : GOVERNMENT DATA COLLEGE
オペレーションから見たデータ
 オペレーションでは、業務の流れの中でデータや情報が洗練されていく。
データ
(Data)
情報
(Information)
(確定)情報
(Intelligence)
知恵
( Wisdom )
経験
( Experience )
事象
(Event)
収集
Collect
分析
Analyze
確認
confirm
アクション
(Action)
米国空軍「Information Operations: Wisdom Warfare For 2025(April 1996)」を参考に作成
信号
(Signal)
処理
Process
融合/関連付け
Fuse/Correlate
意志決定Decide
評価Evaluate/Judge
創造/直観Create/intuit
知識
(Knowledge)
位置付け/理解
Orient/Understand
観測
Observe
22
GDC : GOVERNMENT DATA COLLEGE
データのライフサイクルから見たデータ
 ISOの品質管理の視点では、データのライフサイクルの各機能でデータの扱
いを考えている。
23
データ設計 データ収集
データ統合
外部データ
取得
データ
処理
公開
その他の
利用
データ蓄積
直接利用者
外部サービスを通じた
間接利用者
資料:ISO/IEC 25024:2015 Systems and software engineering
-- Systems and software Quality Requirements and Evaluation (SQuaRE)
-- Measurement of data quality
GDC : GOVERNMENT DATA COLLEGE
データのライフサイクルから見たデータ
 米国政府もデータのライフサイクル全体でマネジメントをしている。
24
GDC : GOVERNMENT DATA COLLEGE
資料:Federal Data Strategy Curated Data Skills Catalog
サービスから見たデータ
 データを使ったサービスを行うとき
には、様々な外部連携を考える
必要がある。
 外部サービスの活用がポイント
- クレンジングなどの外部サービスを
使うことによって品質を上げる
(自社でクレンジングツールを作るの
は大変な上に品質が上がらないこ
とが多い)
25
外部のデータを利用する
外部のサービスを利用する
外部がデータを利用する
外部がデータを利用して新
たなサービスを提供する
外部と連携したサービス
を提供する
(ワンストップサービス等)
GDC : GOVERNMENT DATA COLLEGE
資料:Interoperability Maturity Model
関係者
 データオーナー
- データの所有者
 データプロデューサー
- 個々のデータ、情報を収集し、利用可能なデータ化する者
 データプロバイダー
- データを供給する者。データオーナーに代わって供給する場合もある
 データプラットフォーマー
- データを安定的に供給するプロバイダー
- データ交換のプラットフォームの場合も、基礎データのようなデータプロバイダーの場合もある
 サービスプロバイダー
- データへのアクセス管理など、データを管理するのに必要なサービスを提供する者
 データコンシューマー
- 他組織の作ったデータを利用する者 26
GDC : GOVERNMENT DATA COLLEGE
データの種類・分類
 種類
- テキスト、数値、画像、ビデオ、音
 時間軸
- リアルタイムデータ、発生時点で処理されるデータ、バッチ処理されるデータ、アーカイブデータ
 目的別
- マスターデータ、トランザクションデータ、キャッシュデータ
 共有範囲
- オープンデータ、シェアードデータ、クローズデータ
 機密性
- 機密性3、機密性2、機密性1(政府内データの場合)
 個人
- 個人情報、パーソナルデータ、それ以外
27
GDC : GOVERNMENT DATA COLLEGE
データに関する用語
 データモデル
- データの項目名や構造を定めたもの(データの設計図)
- テンプレートや様式は一種のデータモデル
 メタデータ
- データの見出し情報(検索で使用)
‣ 名称、概要、キーワード、作成者、更新日
 データセット
- データの集合体
 データ
- データ値
28
○○会議
資料1
資料2
資料1 資料2
温度
データ
4月分 5月分
データセット
データ
GDC : GOVERNMENT DATA COLLEGE
アナログデータとデジタルデータ
 アナログ情報は実世界の情報
 デジタル情報は情報処理に適した情報
サンプリングでアナログ情報をデジタル
情報にする。
• サンプリング周波数が高いほど元の
情報に近くなる。
• しかし、サンプリング周波数が増えると
情報量が増加する
アナログ
情報
デジタル
情報
アナログ
情報
デジタル
情報
意味を持った情報
数値化された情報
アナログは情報が欠落しても全
体が把握しやすい
VS
デジタルは情報が欠落すると意
味が伝わらないことがある
たすけて
1:た
2:す
3:け
4:て
電話網は帯域確保が必要
インターネットは、
ルーティング&パケットで
相手がいなくても届けておける
GDC : GOVERNMENT DATA COLLEGE
29
構造化データと非構造化データ
 社会のデータは非構造化データが80%
30
病院
建物
診療科
所在(住所)
施設情報
建築物情報
状況
ベッド数
構造化データ
・フォーマット化したデータ
特徴
・小容量
・扱いが容易
非構造化データ
・画像
・会話
・自由記述
特徴
・大容量
・扱いが難しい
GDC : GOVERNMENT DATA COLLEGE
データの特徴
 時間と距離が消滅
- いつでも、どこでも、なんでも
 転写性が高い
- コピーが自在で低コスト
- 劣化のない情報伝達
 検索性の向上
- 全文検索、タグによるサーチ
 蓄積が容易で劣化しない
- メディアの低価格化
 発信が容易
- 誰でも情報発信が可能
 自動処理が可能
- 自動分析、手続きなど
 複数データを使ったプロファイリングが可能
Analog
011101010100100
Digital
3D Printer
Track
匂いや触感以外はほぼ送れる
GDC : GOVERNMENT DATA COLLEGE 31
データは自由である(これまでの呪縛を解き放つ)
 申請書→申請書データ→申請データ
 従来フォーマットを踏襲するのではなく、目的に対して自由に合理的に設計できる
32
× 避難所状況報告書(2日目以降)
自治体コード (指定避難所の場合、記入)
避難所ID (指定避難所の場合、記入)
避難所名 (指定避難所の場合、自動表示)
避難所名(カナ) (指定避難所の場合、自動表示)
避難所略称 (指定避難所の場合、自動表示)
想定収容人数 (指定避難所の場合、自動表示)
避難所電話番号 (指定避難所の場合、自動表示)
状況コード ○未開設 ○開設準備中 ○開設中 ○閉鎖
避難所管理責任者名
メールアドレス
避難所運営会議 ○編成済み ○未編成
運営組織 ○編成済み ○未編成
報告番号 (自動表示)
報告者名
報告者種別 ○避難所管理者 ○救援者 ○避難者
報告日 mm/dd
報告時間 hh:mm 前日 差し引き 収容能力
避難者世帯数 (自動表示) (自動計算) (自動表示)
避難者屋外世帯数 (自動表示) (自動計算) (自動表示)
被災者世帯数 (自動表示) (自動計算) (自動表示)
被災者屋外世帯数 (自動表示) (自動計算) (自動表示)
合計世帯数 (自動計算) (自動表示) (自動計算) (自動表示)
合計屋外世帯数 (自動計算) (自動表示) (自動計算) (自動表示)
避難者数 (自動表示) (自動計算) (自動表示)
避難者屋外数 (自動表示) (自動計算) (自動表示)
被災者数 (自動表示) (自動計算) (自動表示)
被災者屋外数 (自動表示) (自動計算) (自動表示)
合計人数 (自動計算) (自動表示) (自動計算) (自動表示)
合計屋外人数 (自動計算) (自動表示) (自動計算) (自動表示)
土砂崩れ ○未発見 ○あり ○警戒中
ライフライン(水) ○問題なし ○断水
ライフライン(電気) ○問題なし ○停電
ライフライン(ガス) ○問題なし ○ガス停止
ライフライン(電話) ○問題なし ○電話不通
ライフライン(下水道) ○問題なし ○トイレ不可
道路状況 ○通行可 ○片側通行 ○通行不可
渋滞の有無  
水の過不足
食料の過不足
物資の過不足
体調不良の発生状況
体調不良の発生状況
避難所の生活環境
避難所の生活環境
避難所の生活環境
避難者の雰囲気
その他
対応状況
総務班
情報班
保健衛生班
物資班
要援護者対策班
行政担当者
施設管理者
特記
事項 特記事項
世帯
数
人数
地域
状況
対処
すべ
き、
予見
され
る事
項
避難
所
報告方法
○個人空間がある ○寝られる ○座った状態 ○避難所に入れない
○トイレ問題なし ○トイレが常に行列 ○トイレがあふれている ○使えるトイレがない
○ゴミ問題なし ○ゴミがあふれている ○ゴミが異臭を発生 ○ゴミが捨てられない
○問題ない ○日に1回喧嘩が発生 ○日に数回喧嘩
□乳児 □妊婦 □要介護者 □重傷者
○問題なし ○支給可能 ○不足 ○なし
○問題なし ○3食あり ○不足 ○なし
○問題なし ○寝具はある ○衣類はある ○どちらもない
○問題なし ○体調不良者がいる ○体調不良が二割以上 ○体調不良が半数以上
○問題なし ○医師がいて薬品がある ○薬品で対応 ○緊急に必要な医療が受けられない
連絡
事項
今後、対応が必要となる事項
避難所:書いて送信するのは楽
→本部からの支援は遅い
本部:集計が一瞬でできる
→避難所に迅速な支援ができる
• 毎日同じ情報を入力する必
要がない
• 昨日データを読み込んで比
較できる
GDC : GOVERNMENT DATA COLLEGE
データの塊であるドキュメントってそもそもなに
 Documentは、ラテン語のdocumentum(記録)が語源であり、
docu-(教え示す) + -ment(もの)という組み合わせ。(Doctorも
同じ語源)
 紙の書類である必要性はない。
 文書管理システムは、ドキュメント管理システムと考えていく必要がある。
33
GDC : GOVERNMENT DATA COLLEGE
参考:対話や書類による情報伝達量
 メールより電話、電話より会って話した方が情報は伝わる(メラビアンの研究)
- 言葉の内容 7%
‣ テキストや抑揚を付けない音読
- 話し方 38%
‣ 抑揚・調子を伴う音読
- 表情身振り 55%
 だから伝える努力が必要
 空間を伝える努力が必要
- PCのWeb会議よりも会議室の会議システムの方が伝わる
• データが軽いかとかの技術的な制約ではなく、
伝わるかどうかで考える。
GDC : GOVERNMENT DATA COLLEGE 34
参考:スペースによる情報伝達量
 人は視野角と手の届く範囲で仕事をする
- リアル会議がWeb会議よりも伝わるのは、相手の表情や
態度だけではなく、空間を共有しているから。
 サブディスプレイの生産性向上に関する研究
- サブディスプレイを入れただけで大幅に生産性は上がる
- 2万円の投資で生産性が20%とか上がる
35
明らかにディスプレイから得られる
情報量は少ない
一方で、サブディスプレイは有効
DELL「デュアルモニタを使って生産性とユーザーの満足度を高める」
https://www.dell.com/downloads/jp/support/pdf/WhitePaper%20Dell
%20Dual-Monitors%20JA_HR.pdf
GDC : GOVERNMENT DATA COLLEGE
利用面からのデータの整理
データ整備はステップ・バイ・ステップですすめる
36
GDC : GOVERNMENT DATA COLLEGE
見つけられる
こと
使えるデータで
あること
自動処理でき
ること
AI等で解析が
できること
利用サイドからのデータとは
 見つけることから始まり、活用効率を上げていく
データが見つけられなけ
れば、誰にも使われない
データを組み合わせて利
用可能
データが項目に分かれて
いると自動審査ができる
データの各項目を使って
様々な分析が可能
・カタログサイト
・サービスメニュー標準化
・データ標準
・データ品質
・RPA技術
(Robotic Process Automation)
業務の高速化、
効率化を実現
複数データを使った
業務改革を実現
必要なデータを
入手可能
業務高度化を実現
・AI技術
・ビッグデータ解析技術
GDC : GOVERNMENT DATA COLLEGE 37
オープンデータの5スター
 オープンデータの使いやすさという観点から5つの段階を示している。
38
https://5stardata.info/ja/
★
• (どんな形式でも良いので) あなたのデータを
オープンライセンスでWeb上に公開しましょう
★★
• データを構造化データとして公開しましょう (例:
表のスキャン画像よりもExcel)
★★★
• 非独占の形式を使いましょう (例: Excelよりも
CSV)
★★★★
• 物事を示すのにURIを使いましょう,そうすること
で他の人々があなたのデータにリンクすることが
できます
★★★★★
• あなたのデータのコンテキストを提供するために
他のデータへリンクしましょう
GDC : GOVERNMENT DATA COLLEGE
ファイル形式の標準
 コンピュータで扱うためのファイル保存形式の標準
39
Excel
• 一般的事務ソフトなので使える人が多い
• 計算式の活用、文字の色付け等、表現の自由度が高い
• サーバー等の業務用コンピュータでは扱えない
CSV
• シンプルな表なので、再利用性は高いが、表現力はない
PDF
• 利用者の編集に制限が書けられるので原情報が保持される
• コピーができない等、再利用性に課題がある
RDF
• データ項目がバラバラに管理され活用の自由度は高い
• 処理速度が遅い
GDC : GOVERNMENT DATA
COLLEGE
FAIR原則
40
F1. (メタ)データが、グローバ
ルに一意で永続的な識別
子(ID)を有すること。
F2. データがメタデータによっ
て十分に記述されているこ
と。
F3. (メタ)データが検索可能な
リソースとして、登録もしく
はインデックス化されてい
ること。
F4. メタデータが、データの識
別子(ID)を明記しているこ
と。
A1. 標準化された通信プロトコ
ルを使って、(メタ)データを
識別子(ID)により入手でき
ること。
A1.1 そのプロトコルは公開され
ており、無料で、実装に制
限が無いこと。
A1.2 そのプロトコルは必要な
場合は、認証や権限付与の
方法を提供できること。
A2. データが利用不可能となっ
たとしても、メタデータには
アクセスできること。
I1. (メタ)データの知識表現の
ため、形式が定まっていて、
到達可能であり、共有され
ていて、広く適用可能な記
述言語を使うこと。
I2. (メタ)データがFAIR原則に
従う語彙を使っていること。
I3. (メタ)データは、他の(メタ)
データへの特定可能な参照
情報を含んでいること。
R1. メタ(データ)が、正確な関連
属性を豊富に持つこと。
R1.1 (メタ)データが、明確でア
クセス可能なデータ利用ライ
センスと共に公開されている
こと。
R1.2 (メタ)データが、その来歴
と繋がっていること。
R1.3 (メタ)データが、分野ごと
のコミュニティの標準を満た
すこと。
Findable
• 見つけられる
Accessible
• アクセスできる
Interoperable
• 相互運用できる
Reusable
• 再利用できる
 オープンデータの原則として、FORCE11が策定・公開している。
https://www.force11.org/group/fairgroup/fairprinciples
GDC : GOVERNMENT DATA COLLEGE
見つからなければ価値がない。
再利用できなければイライラする。無駄がある。
41
PDF公開の是非
メリット
• 複数形式のファイルを1つのファイルにまとめて公開できる
• 相手が各種アプリを持っていなくても表示できる
デメリット
• 再利用が難しい(コピーも効率的にできない)
• 改ざんを防ぐためにコピー禁止にしても、相手が手で再入力して事故が起こる確率の方がはるかに高い
GDC : GOVERNMENT DATA COLLEGE
データが見つかりやすくする仕組み
メタデータとカタログの活用
42
GDC : GOVERNMENT DATA COLLEGE
メタデータ管理
 メタデータとは、データを管理するための「データに関するデータ(見出し情
報)」である。
- 「タイトル」「分類」「説明」「作成者」「作成日」などの情報を持つ。
 メタデータの効果
- データがかんたんに検索・管理できる
 大量のデータが有る中で、どのようにメタデータを付与して管理するかが課題
になっている。
43
GDC : GOVERNMENT DATA COLLEGE
メタデータのイメージ
メタデータ
44
タイトル 説明 作成者 作成日 備考
**入門 ****** 田中一郎 2020-12-01
++の手引き ****** 佐藤次郎 1987-02-03 廃刊
&&の本質 ****** 近藤太郎 2020-01-05
データ
タイトル:**入門、作成者:田中一郎、作成日:2020-12-01、出版社:**出版、価格:2100円、・・・・・
データ本体を見るのは大変なので、それを検索したり管理するために活用する
GDC : GOVERNMENT DATA COLLEGE
メタデータがついていないために不便な事例
 関連資料が検索できない
- インターネットで「資料2」を発見したときに、そのデータが、どの会議の資料で、関連資
料に何があるのかが検索できない。
 作成日付がわからない
- 資料に日付がないときに、その資料が最新なのか古いのかわからない
 利用条件がわからない
GDC : GOVERNMENT DATA COLLEGE 45
カタログサイト
 データを管理するためのサイトであり。データのメタデータを集積する。
- オープンデータ・カタログ
- レジストリ・カタログ
- コード・カタログ
- API・カタログ
 データカタログは組織ごとに作られることも分野ごとに作られることもある。標準
的なメタデータを使うことで、カタログ間の連携も行われる。
 カタログサイトの構築は、オープンソースであるCKANが使われることがほとんど
である。
46
GDC : GOVERNMENT DATA COLLEGE
カタログ情報の標準のDCAT
 DCATベースで考えることで、整理が
容易になり、汎用性も高まる。
- 現在DCAT2.0でありDCAT3.0を検討中
‣ 品質情報等を強化
47
GDC : GOVERNMENT DATA COLLEGE
カタログ
カタログレ
コード
リソース
データセット
ディストリ
ビューション
データサー
ビス
・・・ ・・・
国土数値情
報
建物 リソース
公共施設
ディストリ
ビューション
データサー
ビス
・・・ ・・・
**会議
第一回 リソース
資料1
ディストリ
ビューション
ビデオスト
リーム
・・・ ・・・
国勢調査
第*回 リソース
調査票1結
果
ディストリ
ビューション
データサー
ビス
・・・ ・・・
DCATイメージ
 様々な情報を階層的
に管理できる
GDC : GOVERNMENT DATA COLLEGE 48
分野ごとのカタログサイト
 データカタログのメタデータは、W3Cが策定するDCATのサブセットが使用され
る場合が多い。図書館や教材は既存のメタデータ構造を持っている。
49
DCAT
BregDCAT
geoDCAT
ベースレジストリ
カタログ
オープンデータカ
タログ
国会図書館
統計
DC-NDL
statDCAT
コードカタログ
スマートシティ
データカタログ
教材カタログ
IEEE-LOM
GDC : GOVERNMENT DATA COLLEGE
カタログのハーベスティング
 データは各分野ごとに収集されることが多く、カタログが分散している。
 これらの複数分野のカタログ情報を収集するのがハーベスティングである。
 CKANとDCATの組み合わせで行われることが多い。
GDC : GOVERNMENT DATA COLLEGE 50
国のカタログ
自治体のカタログ
自治体のカタログ
自治体のカタログ
自治体のカタログ
自治体のカタログ
ハーべスティング機能で
カタログ情報を収集する
データディクショナリ
 データ項目は、様々な組織が定義してゆらぎが発生していることが多い。デー
や管理組織がある組織では、組織内のデータ項目を管理するデータディク
ショナリを用意する場合が多い。
- データディクショナリ項目
‣ 名称、説明、形式、基準日、管理者、類似語等
 データを正しく伝え、管理するには、データ項目の意味を正しく共有しなけれ
ばならない。
51
GDC : GOVERNMENT DATA COLLEGE
データ項目の意味の相違
 データの意味の違いには様々なパターンがある
52
異なるデータ項目名で管理され
ているものを同じものとする
同じデータ項目名で管理されて
いるものを違うものとする
(定義の違い)
同じデータ項目名で管理されて
いるものを違うものとする
(基準の違い)
融資
貸与
貸付
法人名
企業名
会社名
申請書項目
の名前が違う
制度の分類
名が違う
飲み水
生活水
蒸留水
冷却水
何を求めてい
るかわからな
い
「水」を100リットル送ってくだ
さい
「飲み水」を100リットル送っ
てください
売上額(出荷基準)
売上額(請求書発出基準)
売上額
人口(4/1時点)
人口(1/1時点)
人口
GDC : GOVERNMENT DATA COLLEGE
類似の用語の整理
 オントロジー
- タイプ、特性、および関係タイプのセットから
成る世界を記述するためのモデルを指すこと
が多い。(wikipedia)
 シソーラス
- 単語の上位 / 下位関係、部分 / 全体関
係、同義関係、類義関係などによって単語
を分類し、体系づけた類語辞典・辞書。
(wikipedia)
 タクソノミ
- 分類体系
- 自由記述によるデータの揺れを防ぐために、
予め分類を用意しておくことがある。
AとBは正確に一致 AとBはほぼ同じ
AとBは部分一致(関係する)
AはBを包含する AはBに包含される 53
GDC : GOVERNMENT DATA COLLEGE
用語統制の重要性
 データ管理は部品統制と同じ、データアドミニ
ストレータを設置して管理する必要がある
- 用語統制が有る場合
‣ 0.1~0.2用語/項目(異音同義の発生)
- 用語統制が無い場合
‣ 3.3~3.5用語/項目
統制や再利用が無く個別開発を続ければ、
無駄や複雑度は限りなく増大する
以下のような長いデータ項目名は多くの場合混乱している
データ項目名称 (用語分解)
顧客申込番号 ⇒ 顧客+申込+番号
お客様申込NO ⇒ お客様+申込+NO
用語種類
用語
データ項目
GDC : GOVERNMENT DATA COLLEGE 54
用語統制の例:フィンランドの法律エディター
 法律策定ツールの中に用語の統制を支援する機能を実装している。
GDC : GOVERNMENT DATA COLLEGE 55
カタログは統制されている
 一般にカタログは、「分類されたメニュー」と、「標準化された個票のコンテンツ」で構成される。
 行政のWebサイトや市民ガイドも、「サービス分類」と「標準化された個別サービスに関するコ
ンテンツ」で構成される。
56
https://www.furusato-tax.jp/
http://www.city.mitaka.tokyo.jp/
GDC : GOVERNMENT DATA COLLEGE
サービス・カタログ
 行政サービスは、「サービス・カタログ」で検討されている。
- 欧州全体でのサービス・カタログの共通化の検討が行われている
 中小企業向けの情報提供サイトのミラサポではサービス・カタログが試行され
ている。
- 「販路拡大」というメニュー項目に対して、「制度」「事例」等が検索されるようになってい
る。
 市民向けサービスでは、ユニバーサル・メニュー協会の「ユニバーサル・メニュー」
が使われることが多い。
57
GDC : GOVERNMENT DATA COLLEGE
タグの重要性
 情報の検索や分析をするときには、多くの場合、タグを元に情報整理を行っ
ていく。
GDC : GOVERNMENT DATA COLLEGE 58
資料:ミラサポplus
組織のタグ
目的のタグ
タグの難しさ
 従業員の地位の区分は、調査目的別にバラバラでマッシュアップが難しい。
GDC : GOVERNMENT DATA COLLEGE 59
総務省|統計基準・統計分類|「従業上の地位」に関する区分 (soumu.go.jp)
タグのマッピング
 タグの変更は影響範囲が大きいため担当者が踏み切れない。
- 利用側でコード変換テーブルを作成したりしている。
GDC : GOVERNMENT DATA COLLEGE 60
gBizINFOのマスターコード
(日本標準産業分類) 政府統一資格情報 営業品目名 政府調達 品目分類名
・・・
E18
プラスチック製品製
造業(別掲を除く)
102 ゴム・皮革・プラスチック製品類 202
ゴム・皮革・プラスチック製品
類
5
人造樹脂、ゴム、皮革、毛皮及びこれらの製
品
E19 ゴム製品製造業 102 ゴム・皮革・プラスチック製品類 202
ゴム・皮革・プラスチック製品
類
5
人造樹脂、ゴム、皮革、毛皮及びこれらの製
品
E20
なめし革・同製品・
毛皮製造業
102 ゴム・皮革・プラスチック製品類 202
ゴム・皮革・プラスチック製品
類
5
人造樹脂、ゴム、皮革、毛皮及びこれらの製
品
・・・
R89 自動車整備業
311 車両整備 51 自動車の保守及び修理サービス
52
モーターサイクル、カタピラを有する軽自動
車の保守及び修理のサービス
・・・
日本のデータ戦略
データ戦略(第1次取りまとめ)2020-12-21 デジタル・ガバメント閣僚会議
GDC : GOVERNMENT DATA COLLEGE 61
背景
 社会のデジタル化に伴い、データは智恵・価値・競争力の源泉となってきている。
- 豊かな生活と活動しやすい事業環境に必須の条件になってきている。
- 各国は自国の持つ特徴をデータを使って強化したり、新領域に進出することで、国際競
争力という側面からデータの戦略的な整備や活用を推進している。
 AI等の技術変化やグローバル化によるパラダイム変化が起こっている。
 データの活用が広がり、プライバシーやセキュリティなどに関わるリスクが急速に増
大している。
 DFFT(Data Free Flow with Trust)等の国際連携の取り組みが求められている。
GDC : GOVERNMENT DATA COLLEGE 62
新型コロナウイルス感染症による影響
 急激な社会変化とデジタル化への移行により、データをめぐる課題に直面した。
- データ
‣ 社会の基本データが利用可能なように整備されていなかった
‣ データの存在が確認できなかったり、データが存在していても技術的、制度的に利用できないものがあった。
- ツール
‣ データ連携ツールやプラットフォームが十分に整備されてこなかった
- ルール
‣ データの品質管理体型や標準の整備ができていなかった。
‣ ルールを迅速に適応させる仕組みがなかった。
‣ 自分自身のデータを使うため等のデータ共有の仕組みの検討が十分でなかった。
 これまで先送りしてきた課題が、顕在化した。
GDC : GOVERNMENT DATA COLLEGE 63
データ戦略により注目される行政機関の役割
 行政機関は、国内最大のデータホルダーであり、そのシステムや行動が我が国の経
済社会産業全体に大きな影響を及ぼすこととなる。
- 基本情報の提供
- ルールの整備
 行政機関は、デジタル社会における「プラットフォーム中のプラットフォーム」としての
役割であることを自覚し、行政機関自身のデジタル化に留まるのではなく、社会全
体の高度化に寄与することが求められている。
GDC : GOVERNMENT DATA COLLEGE 64
ビジョン
 「現実のフィジカル空間とサイバー空間を融合させたデジタルツインの実現によ
り、経済発展と社会的課題の解決を両立し、新たな価値を創出する人間
中心の社会」により、豊かな人間社会を支えることを目指す。
 政府の全体ビジョンであるSociety5.0のビジョンとも合致している。データ利
活用の視点から言い換えると、「自由なデータの活用や流通が行われながら
も信頼・安全性とのバランスが取れた社会」といえる。
GDC : GOVERNMENT DATA COLLEGE 65
実現する社会
GDC : GOVERNMENT DATA COLLEGE 66
理念と原則
 理念
信頼を基盤に、個人と社会の利便性のバランスの取れた仕組みを実現する。(データを安心して効
率的に使える社会)
 原則
1. 自分で決められる、勝手に使われない(コントローラビリティ・プライバシーの確保)
2. つながる(相互運用性・効率性向上)
3. いつでもどこでもすぐに使える(可用性・迅速性・広域性)
4. 安心して使える(セキュリティ・信頼・品質)
5. みんなで創る(共創・新たな価値の創出)
GDC : GOVERNMENT DATA COLLEGE 67
アーキテクチャ
 データ戦略は、分野横断に適用される。そのため、Society5.0の参照アー
キテクチャに基づき整理を図っている。
GDC : GOVERNMENT DATA COLLEGE 68
インフラ
データ
(ベース・レジストリ等)
連携基盤(ツール)
利活用環境
ルール
行政 民間
重点的に取組むべき分野
データがつながることで「新たな価値を創出」
・データ標準
・データ品質
・連携ツール
・データモデル
・情報銀行
・データ取引市場
・トラスト
・標準化
、共通化
・ワンストップ
・ワンスオンリー
・データ流通
・データ活用
価
値
デ
ー
タ
環
境
整
備
社
会
実
装
と
業
務
改
革
戦略・政策
ルール
組織
ビジネス
利活用機能
データ
データ連携
アセット
セ
キ
ュ
リ
テ
ィ
・
認
証
Society5.0参照アーキテクチャ データ戦略のアーキテクチャ
セ
キ
ュ
リ
テ
ィ
・
認
証
医療、教育、防災、農業、
インフラ、スマートシティ
※データ連携に必要なルールと連携基盤(ツール)を提供するものが
プラットフォーム
第一次取りまとめとしての整理
 今回の取りまとめは、すぐにでも着手すべき事項を取りまとめ、今後のデータ
戦略を先導していくことを目的としている。
- 「データ」
‣ データ整備が不足していることから、ベースレジストリを軸に、データ全体の整備を進めていく
- 「プラットフォーム(ルールとツール)」
‣ 迅速にサービス実現を図るために、ルールとツールを一体で整備していく
- 「ルール(トラスト)」
‣ ルールの中でもトラストは重要な項目であるから、プラットフォームとは別に集中的に検討を進めていく
GDC : GOVERNMENT DATA COLLEGE 69
データ
 ベース・レジストリの整備→戦略の別紙のベース・レジストリ・ロードマップで整理
- ベース・レジストリを指定し、優先順位に従い段階的に導入する。
 行政データ全体の整備
- データ標準や品質体系、マネジメント体系を整備する。
 オープンデータの推進
- 再利用性の高いオープンデータを推進する。
 データマネジメントの推進
- システムライフサイクルを通じたデータマネジメントを実現する。
GDC : GOVERNMENT DATA COLLEGE 70
プラットフォーム
 分野横断プラットフォーム
- アーキテクチャ体系の整備
- 共通ルールの整備
- データ標準、データ品質体系の整備
- ツール開発
 各ドメインのプラットフォーム
- 健康・医療、教育、防災、農業、インフラ、スマートシティ
GDC : GOVERNMENT DATA COLLEGE 71
統合イノベーション戦略、AI
戦略、スーパーシティ・プログ
ラムなどの政府の関連した
取り組みと協力して推進
ルール(トラスト)
 トラスト・フレームワークの整備
- 主体・意思
‣ 意思表示の証明(意思表明が本人によってなされたものであること等の証明)
- 事実・情報
‣ 発行元証明(発行した自然人、組織、機器が信頼できるか等の証明)
- 存在・時刻
‣ 存在証明(何らかの情報が、ある時点において存在し、それ以降は改ざんされていないことの証明)
GDC : GOVERNMENT DATA COLLEGE 72
今後検討を進めていく領域
 データ利活用の環境整備
- 情報銀行やPDS、データ取引市場のあり方
 民間保有データの扱い
- 公共性の高い民間データの扱い
- 民間データ流通のためのルール整備
 デジタルインフラの整備
- ネットワークとクラウド活用
GDC : GOVERNMENT DATA COLLEGE 73
社会のプラットフォーム
として推進
人材と組織
 人材体系の整備
- 人材定義
- 採用・評価体系の整備
- トレーニングコースの整備
- 公務員のリテラシー向上
 組織整備
- CDOの設置
- データオーソリティの整備
GDC : GOVERNMENT DATA COLLEGE 74
政府が先行的に
データ人材を育成
ロードマップ
ステージ 01
最低限の基盤整備
先行プロジェクトの開始
データ戦略の強化
ステージ 02
基盤整備と展開
データの拡充と品質向上
トラスト基盤の整備
成果公開
ステージ 03
基盤の拡張
データの拡充
成果公開
ステージ 04
データ駆動社会
75
2021年9月 2025年 2030年
TrustとJapan qualityによる持続可能な社会の実現
GDC : GOVERNMENT DATA COLLEGE
別紙 ベース・レジストリ・ロードマップ
 ベース・レジストリの定義と指定
 ルール整備
 体制整備
GDC : GOVERNMENT DATA COLLEGE 76
 データ整備
 データガバナンス
- マスタデータ・マネジメント
- データセキュリティ
 データモデル
- データ標準
- メタデータ・マネジメント
 推進のための仕組み
- レジストリカタログ、コードカタログ
- データ品質管理
 人材育成
- トレーニングコース
アクション(2020-2021) ゴール(2025, 2030)
2025
2030
プラットフォーム、ルール
の整備完了
データの整備完了
各種戦略群とデータ戦略の整合性
 デジタル社会を支える戦略群をデータ戦
略の各要素が支えている。
 アーキテクチャで整理することで、全体の
整合性を取り、抜け漏れのない検討を
実現している。
GDC : GOVERNMENT DATA COLLEGE 77
※archimate®で記載
推進体制
GDC : GOVERNMENT DATA COLLEGE 78
データ戦略
タスクフォース
(戦略)
IT室
データ班
(戦略、OD、BR)
CIO補佐官TF
経済産業省
情報プロジェクト室
(先行PJ(法人))
情報経済課
(DFFT、市場)
IPA
DADC
(アーキテクチャ)
社会基盤センター
(IMI)
総務省
(トラスト)
CSTI
(戦略・国際・PF)
知財本部
(市場・標準)
2021第1四半期での取り組み状況
1. ベース・レジストリの指定
- 第一次とりまとめのベース・レジストリ・ロードマップにおける重点整備対象候補のうち、社会的ニーズ、経済効果、即効性の観点に基づき、ベース・レジストリの指定を検
討中。具体のデータの抱える課題についてデータホルダの関係省庁と調整中。
2. オープンデータ基本指針の改正
- 第一次とりまとめにおけるオープンデータの機械判読性強化のため、公開を推奨するデータの具体化、機械判読性原則の強化などの観点から、オープンデータ基本指
針の見直しを図り、改正案を策定した。
3. データ標準
- 外部とのデータ連携が想定される行政データのデータ標準を検討中。まずは、具体的には、「1.申請 2.証明 3.事例 4.行政サービス 5.イベント 6.報告書 7.支援機
関 8.サービスカタログ 9.調達」を策定予定。
4. 品質管理ガイドブック
- データの利活用や管理が効率的に行われるようにするため、容易なデータ品質の評価、品質評価の共有等の観点による評価モデルが必要である。評価モデルを中心と
して、継続的な品質改善を可能とするフレームワークとして、品質管理ガイドラインを検討中。実際の評価の実施のあり方については、引き続き検討する。
5. プラットフォーム
- 重点的に取り組むべき分野でのプラットフォームのあり方について、関係省庁と引き続き検討する。
6. 民間保有データの利活用を促進するためのデータ取扱いルール
- IT室・知財事務局において、民間保有データの利活用を促進するためのデータ取扱いルールについて検討した。(詳細は資料2)
7. トラスト
- 第一次とりまとめにて包括的なトラストの枠組みを示し、 トラストアンカー機能や各種トラストサービスの検討における論点を示したところ。トラストに関するワーキングチー
ムの設置に向けた準備を実施
8. データ人材育成
- データ社会に対応したサステイナブルな人材体系となる、教材(Web)と統一研修の試行による人材フレームワークを策定中。
GDC : GOVERNMENT
DATA COLLEGE
79
今後の方向性
 3月末予定であった、ベースレジストリの指定や各種データ標準の公表を早
急に実施。
 夏までに、データ戦略の第二次とりまとめを実施予定。
GDC : GOVERNMENT DATA COLLEGE 80
世界のデータ戦略
世界はどこに向かっているのか
81
GDC : GOVERNMENT DATA COLLEGE
世界の取り組み
原則 戦略の柱
European
Commissio
n
2020-2
データの可用性
マーケットでの不均衡
データの相互運用性と品質
データガバナンス
データインフラストラクチャと技術
スキルとデータリテラシー
サイバーセキュリティ
データ アクセスと利活用のための組織間のガバナンス フレームワーク
イネーブラー: データのホスティング、処理、使用、相互運用性のためのヨーロッパの能
力とインフラストラクチャの強化とデータへの投資
能力:個人のエンパワーメント、スキルとSMEへの投資
戦略的セクターと公共の関心領域における共通の欧州データ空間
United
States
2019-6
倫理を守る
責任を行使する
透明性の向上
関連性を確保
既存データの利活用
将来の用途を予測
応答性を実証
学習への投資
データ リーダーの育成
説明責任の実践
データを大切にし、公共の利用を促進する文化を構築する
データの管理、管理、保護
効率的で適切なデータ利用の促進
United
Kingdom
2019-9
データ基盤
データスキル
データの可用性
責任のもてるデータ
経済全体のデータの価値を引き出す。
成長促進と信頼できるデータ体制の確保。
政府によるデータの使用を変革し、効率性を高め、公共サービスを向上させる。
データが依存するインフラストラクチャのセキュリティと復元性を確保する。
国際的なデータの流れを支持する。"
Canada
2019-8
クライアント中心
信頼される
アジャイル
オープン
可能にする
目的への一致
サービスの改善
データからより大きなパブリックバリュー
データの使いやすさと可用性が向上
個人の情報とプライバシーの保護を設計による
価値ある戦略的資産として扱われるデータの信頼できる健全なガバナンス
エビデンスに基づく意思決定の増加
結果に関するより良いレポート
政府間の連携の強化」
Singapore
2018-6
データアーキテクチャ
データインフラストラクチャ
データ教育
ユースケース
統合データ管理フレームワーク
政府データアーキテクチャ
ビジョン
データの価値に注目
原則のポイント
安心して安定的に使えること
そのための仕組みの整備
人材への投資
先進各国がデータが競争力を左
右するものとして戦略を策定し強
力に進めている
プラットフォームとデータスペー
スに向かっている
- FIWARE, GAIA-X等
GDC : GOVERNMENT DATA COLLEGE 82
データ戦略推進の流れ
欧州は、基盤整備が終わり、実務的に導入をする加速領域に入ってきている。
CEF2
データ 連携を支える
ビルディ ング・ ブロッ ク 群
次期ISA2
イ ンタ オペラ ビリ ティ を支えるデータ や標
準、 支援ツール群、 セマンティ ッ ク ス
LagalTech
eProcuremen
t
フ レーム
ワーク
人材
( リ ーダー
シッ プ含
む)
・ ・ ・ ・
( 応用)
GAIA-X
IDS
Digital
Europe
Program
• オープンデータ 等の様々なデータ の供給
• 産業データ 取引の仕組み
応用
CEF
digital
ISA2
2020-12-31
2009
2014
2027
米国は、現状整理やルールやガイダンスの整備が終わり、これから基盤整備を本格化する。
Federal
Data
Strategy
・ 原則
・ 実施項目
Data.gov、
NIEM
等、
個々の
取り 組み
2019-6
アク ショ ンプラ ン2020
基本データ のイ ンベント リ 、
GeoPlace等のデータ 基盤整備
アク ショ ンプラ ン2020
体制、 スキル、 データ 作成支援、
標準、 ガバナンスガイ ド
予算
・ 現状整理( 各省の意識づけ)
・ 基本ツールの整備
2020-01 2020-12
データ
整備
アク ショ ンプラ ン
2021
アク ショ ンプラ ン
2021
・ 各省の成熟度向上
Federal
Data
Strategy
・ 原則
・ 実施項目
2030
( 調整中)
・ ・ ・ ・
( 応用)
アク ショ ンプラ ン
2021
先進取り組みとの比較
データ
連係
インタ
オペラ
ビリティ
業務
データ標準
セマンティック
ス
eID
法律 調達
コンテキスト
ブローカー
データ品質
ブロックチェー
ン
GAIA-X IDS
Data保護等
ツール群
European data
portal
地理空間
(INSPIRE)
ベースレジスト
リ
テストベッド
クラス図 BPMN
eArchiving
eDelivery eInvoicing
eSignature
CEF(Connecting European Facility)
データ標準
データ品質フ
レーム
Resource.
data.gov
Data.gov
Geoplace、
NGDA
プライオリティ
データ
現状調査
スキルフレーム
クラス図 BPMN
リーダーシッ
プ・体制
予算
現状調査
データ人材
リーダーシッ
プ・体制
ガイド群
連携ツール
行政
サービス
行政
サービス
準公共分野
行政
サービス
Data.go.jp 分野間連携基
盤
連携ツール
データ標準 データ品質
地理空間
ベースレジスト
リ
現状調査
データ人材
リーダーシッ
プ・体制
欧州(2020年末) 米国(2020年末) 日本(2020年度末)
トラスト基盤
欧州、米国は2020年末が戦略のマイルストンになっており、成果を出してきている。日本も急速に
取り組みを進めているものの、人材・体制の整っている欧米のスピードについていくのが大変。
緑は本格導入・運用中
白は推進中
組織
Inventory.
data.gov
レジストリ・カタ
ログ
Validationツー
ル群
データ
E
I
F
ア
ー
キ
テ
ク
チ
ャ
地理空間情報の扱い
 地理空間情報は専門性が高いことから、GXMLやCityGML等の検討が別
途行われている。
 ただし、社会の基本情報として重要なことから、連携が検討されている。
GDC : GOVERNMENT DATA COLLEGE 85
開店時間など
の情報
都市モデルに関連情報を組み合わせることで様々なサービス高度化ができる
統計情報の扱い
 統計情報は様々なデータと組み合わせるために有効な基盤情報であり、世
界中に専門組織があり検討を進めている。
 カタログメタデータのDCATを拡張し統計用モデルであるstatDCATを整備し
ている。
- 統計データ標準であるSDMXからの追加
- 統計用コントロールドボキャブラリの追加
GDC : GOVERNMENT DATA COLLEGE 86
各国の取り組み
87
GDC : GOVERNMENT DATA COLLEGE
A EUROPEAN STRATEGY FOR DATA(2020-2)
88
The problems
 Availability of data
 Imbalances in market power
 Data interoperability and quality
 Data governance
 Data infrastructures and technologies
 Empowering individuals to exercise their rights
 Skills and data literacy
 Cybersecurity
B. Enablers: Investments in data and strengthening Europe’s capabilities and infrastructures for
hosting, processing and using data, interoperability
Key actions
• Invest in a High Impact project on European dating standards for data sharing, best
practices, tools) and governance mechanisms, as well as the European federation of
energy-efficient and trustworthy cloud infrastructures and related services, with a view to
facilitating combined investments of €4-6 billion, of which the Commission could aim at
investing €2 billion. First implementation phase foreseen for 2022;
• Sign Memoranda of Understanding with Member States on cloud federation, Q3 2020;
• Launch a European cloud services marketplace, integrating the full stack of cloud service
offering, Q4 2022;
• Create an EU (self-)regulatory cloud rulebook, Q2 2022.
C. Competences: Empowering individuals, investing in skills and in SMEs
Key action
• Explore enhancing the portability right for individuals under Article 20 of the GDPR giving them more control
over who can access and use machine-generated data (possibly as part of the Data Act in 2021).
D. Common European data spaces in strategic sectors and domains of public interest
• A Common European industrial (manufacturing) data space,
• A Common European Green Deal data space,
• A Common European mobility data space
• A Common European health data space,
• A Common European financial data space,
• A Common European energy data space,
• A Common European agriculture data space,
• Common European data spaces for public administration,
• A Common European skills data space,
The strategy
A. A cross-sectoral governance framework for
data access and use
Key actions
• Propose a legislative framework for the governance of
common European data spaces, Q4 2020
• Adopt a spaces, encompassing data sharing
architectures (includan implementing act on high-
value data-sets, Q1 2021
• Propose, as appropriate, a Data Act, 2021
• Analysis of the importance of data in the digital
economy (e.g. through the Observatory of the Online
Platform Economy), and review of the existing policy
framework in the context of the Digital Services Act
package (Q4 2020).
An open, but proactive international approach
Key action Create a framework to measure data flows and estimate their economic value within Europe, as well as between Europe and the rest of the world, Q4 2021.
GDC : GOVERNMENT DATA COLLEGE
GDC : GOVERNMENT DATA
COLLEGE
89
制度的な基盤整備を推進
GDC : GOVERNMENT DATA
COLLEGE 90
データスペースを重視した戦略へ
米国のFEDERAL DATA STRATEGY(2019-06)
 行政のデータの価値を最大化して、行政効率化と社会活動の円滑化の両
立を目指す。
91
1. Uphold Ethics
2. Exercise Responsibility
3. Promote Transparency
4. Ensure Relevance
5. Harness Existing Data
6. Anticipate Future Uses
7. Demonstrate Responsiveness
8. Invest in Learning
9. Develop Data Leaders
10. Practice Accountability
Principles 1. 倫理を守る
2. 責任を遂行する
3. 透明性を高める
4. 関連性を確認する
5. 既存データを活用する
6. 将来の使用を予測する
7. 応答性を実証する
8. 学習に投資する
9. データ リーダーを作る
10. 説明責任を実践する
ETHICAL GOVERNANCE
倫理的ガバナンス
CONSCIOUS DESIGN
意識的なデザイン
LEARNING CULTURE
学習文化
GDC : GOVERNMENT DATA COLLEGE
今後5年から10年で行う40の実践項目
92
Building a Culture that Values Data and Promotes Public Use
Practices 1-10
1.Identify Data Needs to Answer Key Agency Questions
2.Assess and Balance the Needs of Stakeholders
3.Champion Data Use
4.Use Data to Guide Decision-Making
5.Prepare to Share
6.Convey Insights from Data
7.Increase Accountability of Federal Spending
8.Monitor and Address Public Perceptions
9.Connect Data Functions Across Agencies
10.Provide Resources Explicitly to Leverage Data Asset
Governing, Managing, and Protecting Data
Practices 11-26
11.Prioritize Data Governance
12.Govern Data to Protect Confidentiality and Privacy
13.Protect Data Integrity
14.Convey Data Authenticity
15.Assess Maturity
16.Inventory Data Assets
17.Recognize the Value of Data Assets
18.Manage with a Long View
19.Maintain Data Documentation
20.Leverage Data Standards
21.Align Agreements with Data Management Requirements
22.Identify Opportunities to Overcome Resource Obstacles
23.Allow Amendment
24.Enhance Data Preservation
25.Coordinate Federal Data Assets
26.Share Data Between State, Local, and Tribal Governments and Federal Agencies
データを大切にし、公共利用を促進する文化の構築
プラクティス 1-10
1.各組織に対して回答すべき主要なデータを定義する
2.ステークホルダーのニーズを、評価し、バランスをとる
3.データの使用を奨励する
4.意思決定のためにデータを使用する
5.共有の準備をする
6.データからインサイトを得る
7.連邦政府支出の説明責任を高める
8.一般の認識をモニターし、対処する
9.複数の機関間でデータ機能を接続する
10.データ資産を活用するためのリソースの明示的な提供
データのガバナンス、管理、保護
プラクティス 11-26
11.データガバナンスの優先順位付け
12.機密性とプライバシーを保護するためのデータの管理
13.データの整合性を守る
14.データの信頼性を確保する
15.成熟度を評価する
16.データ資産をインベントリにする
17.データ資産の価値を認識する
18.長いビューで管理する
19.データドキュメントの更新
20.データ標準の活用
21.データ管理要件に合わせた契約
22.リソースの障壁を克服するための機会を定義する
23.修正を許可
24.データ保存の強化
25.連邦データ資産を調整する
26.州政府、地方政府、部族政府および連邦政府機関間でデータを共有する
国、自治体を通じたベースレジス
トリ、データ標準、品質の強化
ワンスオンリー
重要データの特定
データの活用と共有の推進
GDC : GOVERNMENT DATA COLLEGE
今後5年から10年で行う40の実践項目
93
Promoting Efficient and Appropriate Data Use
Practices 27-40
27.Increase Capacity for Data Management and Analysis
28.Align Quality with Intended Use
29.Design Data for Use and Re-Use
30.Communicate Planned and Potential Uses of Data
31.Explicitly Communicate Allowable Use
32.Harness Safe Data Linkage
33.Promote Wide Access
34.Diversify Data Access Methods
35.Review Data Releases for Disclosure Risk
36.Leverage Partnerships
37.Leverage Buying Power
38.Leverage Collaborative Computing Platforms
39.Support Federal Stakeholders
40.Support Non-Federal Stakeholders
効率的かつ適切なデータ利用の促進
プラクティス 27-40
27.データ管理と分析のための能力向上
28.使用目的と品質の整理をする
29.使用および再利用のためのデータの設計
30.データの計画された使用内容やデータの持つポテンシャルを検討する
31.許可された使用内容を明示的に公開する
32.セーフデータリンケージの利用
33.幅広いアクセスを促進する
34.データ アクセス方法の多様化
35.開示リスクに関するデータリリースのレビュー
36.パートナーシップの活用
37.購買力を活用
38.コラボレーション コンピューティング プラットフォームの活用
39.連邦政府の利害関係者を支援する
40.非連邦政府の利害関係者をサポート
優れた設計、ルール公開、アクセス方法の多
様化、プラットフォームの活用、人材育成・支援
GDC : GOVERNMENT DATA COLLEGE
2020 ACTION PLAN
94
Agency Actions
1: Identify Data Needs to Answer Priority Agency Questions
2: Constitute a Diverse Data Governance Body
3: Assess Data and Related Infrastructure Maturity
4: Identify Opportunities to Increase Staff Data Skills
5: Identify Priority Data Assets for Agency Open Data Plans
6: Publish and Update Data Inventories
Community of Practice Actions
7: Launch a Federal Chief Data Officer Council
8: Improve Data and Model Resources for AI Research and Development
9: Improve Financial Management Data Standards
10: Integrate Geospatial Data Practices into the Federal Data Enterprise
Shared Solution Actions
11: Develop a Repository of Federal Enterprise Data Resources
12: Create OMB Federal Data Policy Committee
13: Develop a Curated Data Skills Catalog
14: Develop a Data Ethics Framework
15: Develop a Data Protection Toolkit
16: Pilot a One-stop Standard Research Application
17: Pilot an Automated Tool for Information Collection Reviews that Supports
Data Inventory Creation and Updates
18: Pilot Enhanced Data Management Tool for Federal Agencies
19: Develop Data Quality Measuring and Reporting Guidance
20: Develop a Data Standards Repository
各組織のアクション
1: 各組織に対し、優先的に回答すべきデータを定義する
2: 多様なデータガバナンス機関を構成する
3: データと関連するインフラストラクチャの成熟度を評価する
4: スタッフデータスキルを向上させる機会を定義する
5: 各組織のオープンデータ計画のための優先データ資産を定義する
6: データ インベントリの公開と更新
実践チームのコミュニティによるアクション
7: 連邦最高データ責任者(CDO)会議を立ち上げる
8: AI研究開発のためのデータとモデルリソースの改善
9: 財務管理データ基準の改善
10: 地理空間データプラクティスを連邦データ体系に統合する
共有ソリューションによるアクション
11: 連邦組織横断データリソースのリポジトリを開発する
12: OMBに連邦データ政策委員会を設置する
13: 統合データスキルカタログを開発する
14: データ倫理フレームワークを開発する
15: データ保護ツールキットを開発する
16: ワンストップ標準研究アプリケーションの試行をする
17: データ インベントリの作成と更新をサポートする情報収集レビュー用の自
動化ツールの試行をする
18: 連邦政府機関のための拡張データ管理ツールの施行をする
19: データ品質測定およびレポートガイダンスを開発する
20: データ標準リポジトリを開発する
2020年中に、ベースとなるデータの定義と体制の整備、品質などのルール整備を行う
GDC : GOVERNMENT DATA COLLEGE
英国のNATIONAL DATA STRATEGY(2020-09)
 社会に5つのOpportunitiesを与えることを目指しており、一番下のレイヤー
にベースレジストリーも含まれる
95
1. Boosting productivity and trade
2. Supporting new businesses and
jobs
3. Increasing the speed, efficiency
and scope of scientific research
4. Driving better delivery of policy
and public services
5. Creating a fairer society for all
GDC : GOVERNMENT DATA COLLEGE
カナダのDATA STRATEGY(2019-8)
 行政を中核にしたデータ
戦略を策定
96
クライアント中心
信頼される
アジャイル
オープン
可能にする
目的への一致
GDC : GOVERNMENT DATA COLLEGE
シンガポールのGOVERNMENT DATA STRATEGY(2018-6)
 スマートネーションの一環でデータ戦略を整備
97
4つの柱
• Data Architecture
• Digital Infrastructure
• Data Education
• Use Cases
Core government data assets will be consolidated, and made
discoverable and accessible within 7 working days. All core
data fields must also be machine readable and API-ready.
GDC : GOVERNMENT DATA COLLEGE
組織におけるデータ戦略
具体的な取り組み
98
GDC : GOVERNMENT DATA COLLEGE
攻めと守りのデータ戦略
 組織戦略を実現するためにデータ戦略はある。
 データ戦略は、データ分析などを駆使して競争優位を確立するための攻めのデータ戦略と、データ
を確実に管理し組織の基盤として固めていく守りのデータ戦略がある。
- データの漏洩などにより組織に致命的なダメージを受けることを防ぐことができる。
 攻めと守りの戦略に共通するのは、データのアーキテクチャを整理し体系的に管理をしていくことで
ある。
99
攻めの戦略 守りの戦略
主要な目的 戦略ポジションと利益の改善 セキュリティやプライバシー、完全性、法
令遵守やガバナンスの確保
コアな活動 データ分析、モデリング、ビジュアライゼー
ション、トランスフォーメーション、拡張
データの抽出、標準化、保存、アクセスの
最適化
データ管理の適用 フレキシブル コントロール
アーキテクチャ マルチソースベース シングルソースベース
https://hbr.org/2017/05/whats-your-data-strategy
GDC : GOVERNMENT DATA COLLEGE
データ戦略の基本
 組織目標の定義
- 組織戦略を実現するために、どのようなデータ利活用モデルや基盤を目指すのかを明確にする。
 組織内外のデータの把握
- 組織内のデータの現状(何をどう持っていて、きちんと管理されているか)を把握するとともに、シナジー
が生まれる、もしくは販売可能性などの把握を行う。
 データチームの設立
- データ戦略を推進するのに必要はリソースを定義する。CDO(Chief Data Officer)、ガバナンスボー
ドやDMO(Data Management Office)を設置する
- データは部門横断の改革を伴うため、強力なリーダーシップとガバナンス体制を整備する。
 データアーキテクチャの構築
- データを利活用、ガバナンスするためのアーキテクチャを整備し、組織内のデータ全体を可視化する
 変更管理
- ビジネス変更も含め、全体の変更の流れを管理する。
100
GDC : GOVERNMENT DATA COLLEGE
データ戦略のキモ
 データ戦略で重要なことはつながることである。
- 自分の組織だけでデータを集めることは 大変である 。
 早くサービスを立ち上げたり サービス高度化するには 外部のデータを積極的
に使っていくことが重要になる。また、外部にデータを売るチャンスも生まれてく
る 。
 そのためには データのインタオペラビリティが非常に重要になる 。
101
GDC : GOVERNMENT DATA COLLEGE
データは量があることで価値が高まる
 データは量が多いほど分析の可能性が高まり、様々な分析ができるようにな
る。
 GAFAは、データの量が集まり、高度なリコメンデーションなどができることにより
さらに利用が増えて情報が集まるというスパイラルアップの流れになっている。
 ただ単にデータの量を集めるのではなく、データの密度も重要になる。
- レストランガイドが各国や地域で生き残るのは、全体の量ではなく地域の情報密度で
優位性を確保しているから。
102
GDC : GOVERNMENT DATA COLLEGE
データの価値を上げる
 データの価値を高めるには、データの品質を上げることが重要である。
- 正確性を上げる
- 網羅性を上げる
- 最新性を上げる 等
 同じ情報でも、100mメッシュの情報と500mメッシュの情報では価格が違う。
 データの使用目的に合わせて、過剰品質にしないことが重要。
- 外部から購入するときにも、適正品質の情報を求めることで調達コストを下げれる場合がある
103
GDC : GOVERNMENT DATA COLLEGE
データを集めるには信頼(TRUST)が重要
 お金をその辺の人に預けないように、データも信頼ができない人には預けない。
 安心というブランドイメージの構築や取り組みの透明性開示による信頼確保
が重要になる。
104
ゲストで取引する 会員登録して取引する
利用者は、メリットと信頼性をもとに会員登録するか判断する
GDC : GOVERNMENT DATA COLLEGE
隠れた資産を活用することが重要
 既存の組織が持っている業務データ、簡単に集められるデータが意外に価値
を持っていたりする。
- 災害後の通行可能マップ
‣ カーナビ情報を集めることで走行可能道路が分かる
- 東京アメッシュ
‣ 下水道処理場の施設管理のための降雨予測情報を公開
‣ https://tokyo-ame.jwa.or.jp/
- SaftyMap
‣ 車の急ブレーキ情報等を集めて公開
‣ https://safetymap.jp/
105
GDC : GOVERNMENT DATA COLLEGE
ダッシュボードの活用
 トップの人が意思決定に必要な情報を、ダッシュボード化して見せていくことが
必要。
 警告が出ているところに対処しているだけで、状況は相当改善する。
106
GDC : GOVERNMENT DATA COLLEGE

Más contenido relacionado

La actualidad más candente

Data platformdesign
Data platformdesignData platformdesign
Data platformdesignRyoma Nagata
 
Hyperledger Fabric Private Chaincodeについて
Hyperledger Fabric Private ChaincodeについてHyperledger Fabric Private Chaincodeについて
Hyperledger Fabric Private ChaincodeについてHyperleger Tokyo Meetup
 
今なら間に合う分散型IDとEntra Verified ID
今なら間に合う分散型IDとEntra Verified ID今なら間に合う分散型IDとEntra Verified ID
今なら間に合う分散型IDとEntra Verified IDNaohiro Fujie
 
CRF を使った Web 本文抽出
CRF を使った Web 本文抽出CRF を使った Web 本文抽出
CRF を使った Web 本文抽出Shuyo Nakatani
 
ディープラーニングの最新動向
ディープラーニングの最新動向ディープラーニングの最新動向
ディープラーニングの最新動向Preferred Networks
 
ブロックチェーンを活用した自己主権型IDとは
ブロックチェーンを活用した自己主権型IDとはブロックチェーンを活用した自己主権型IDとは
ブロックチェーンを活用した自己主権型IDとはTIS Blockchain Promotion Office
 
【DL輪読会】Where do Models go Wrong? Parameter-Space Saliency Maps for Explainabi...
【DL輪読会】Where do Models go Wrong? Parameter-Space Saliency Maps for Explainabi...【DL輪読会】Where do Models go Wrong? Parameter-Space Saliency Maps for Explainabi...
【DL輪読会】Where do Models go Wrong? Parameter-Space Saliency Maps for Explainabi...Deep Learning JP
 
2022年3月18日 「なにが違うの?デジタルツインとメタバース(日経メタバースシンポジウム資料)」
2022年3月18日 「なにが違うの?デジタルツインとメタバース(日経メタバースシンポジウム資料)」2022年3月18日 「なにが違うの?デジタルツインとメタバース(日経メタバースシンポジウム資料)」
2022年3月18日 「なにが違うの?デジタルツインとメタバース(日経メタバースシンポジウム資料)」SHOGO NUMAKURA
 
SSIとDIDで何を解決したいのか?(β版)
SSIとDIDで何を解決したいのか?(β版)SSIとDIDで何を解決したいのか?(β版)
SSIとDIDで何を解決したいのか?(β版)Naohiro Fujie
 
MicrosoftのDID/VC実装概要
MicrosoftのDID/VC実装概要MicrosoftのDID/VC実装概要
MicrosoftのDID/VC実装概要Naohiro Fujie
 
【DL輪読会】“Gestalt Principles Emerge When Learning Universal Sound Source Separa...
【DL輪読会】“Gestalt Principles Emerge When Learning Universal Sound Source Separa...【DL輪読会】“Gestalt Principles Emerge When Learning Universal Sound Source Separa...
【DL輪読会】“Gestalt Principles Emerge When Learning Universal Sound Source Separa...Deep Learning JP
 
[DL輪読会]HoloGAN: Unsupervised learning of 3D representations from natural images
[DL輪読会]HoloGAN: Unsupervised learning of 3D representations from natural images[DL輪読会]HoloGAN: Unsupervised learning of 3D representations from natural images
[DL輪読会]HoloGAN: Unsupervised learning of 3D representations from natural imagesDeep Learning JP
 
ChatGPT + LlamaIndex 0 .6 による チャットボット の実装
ChatGPT + LlamaIndex 0  .6 による チャットボット の実装ChatGPT + LlamaIndex 0  .6 による チャットボット の実装
ChatGPT + LlamaIndex 0 .6 による チャットボット の実装Takanari Tokuwa
 
深層学習によるHuman Pose Estimationの基礎
深層学習によるHuman Pose Estimationの基礎深層学習によるHuman Pose Estimationの基礎
深層学習によるHuman Pose Estimationの基礎Takumi Ohkuma
 
異音検知プラットフォーム開発におけるMLOpsの実際と考察 - MLOps コミュニティ #3
異音検知プラットフォーム開発におけるMLOpsの実際と考察 - MLOps コミュニティ #3 異音検知プラットフォーム開発におけるMLOpsの実際と考察 - MLOps コミュニティ #3
異音検知プラットフォーム開発におけるMLOpsの実際と考察 - MLOps コミュニティ #3 Shota Saitoh
 
データファブリック実現のためのプロジェクトの進め方とは
データファブリック実現のためのプロジェクトの進め方とはデータファブリック実現のためのプロジェクトの進め方とは
データファブリック実現のためのプロジェクトの進め方とはDenodo
 
【論文紹介】 Spatial Temporal Graph Convolutional Networks for Skeleton-Based Acti...
【論文紹介】Spatial Temporal Graph Convolutional Networks for Skeleton-Based Acti...【論文紹介】Spatial Temporal Graph Convolutional Networks for Skeleton-Based Acti...
【論文紹介】 Spatial Temporal Graph Convolutional Networks for Skeleton-Based Acti...ddnpaa
 
モデルアーキテクチャ観点からの高速化2019
モデルアーキテクチャ観点からの高速化2019モデルアーキテクチャ観点からの高速化2019
モデルアーキテクチャ観点からの高速化2019Yusuke Uchida
 
【DL輪読会】StyleCLIP: Text-Driven Manipulation of StyleGAN Imagery
【DL輪読会】StyleCLIP: Text-Driven Manipulation of StyleGAN Imagery【DL輪読会】StyleCLIP: Text-Driven Manipulation of StyleGAN Imagery
【DL輪読会】StyleCLIP: Text-Driven Manipulation of StyleGAN ImageryDeep Learning JP
 
SQL Server 使いのための Azure Synapse Analytics - Spark 入門
SQL Server 使いのための Azure Synapse Analytics - Spark 入門SQL Server 使いのための Azure Synapse Analytics - Spark 入門
SQL Server 使いのための Azure Synapse Analytics - Spark 入門Daiyu Hatakeyama
 

La actualidad más candente (20)

Data platformdesign
Data platformdesignData platformdesign
Data platformdesign
 
Hyperledger Fabric Private Chaincodeについて
Hyperledger Fabric Private ChaincodeについてHyperledger Fabric Private Chaincodeについて
Hyperledger Fabric Private Chaincodeについて
 
今なら間に合う分散型IDとEntra Verified ID
今なら間に合う分散型IDとEntra Verified ID今なら間に合う分散型IDとEntra Verified ID
今なら間に合う分散型IDとEntra Verified ID
 
CRF を使った Web 本文抽出
CRF を使った Web 本文抽出CRF を使った Web 本文抽出
CRF を使った Web 本文抽出
 
ディープラーニングの最新動向
ディープラーニングの最新動向ディープラーニングの最新動向
ディープラーニングの最新動向
 
ブロックチェーンを活用した自己主権型IDとは
ブロックチェーンを活用した自己主権型IDとはブロックチェーンを活用した自己主権型IDとは
ブロックチェーンを活用した自己主権型IDとは
 
【DL輪読会】Where do Models go Wrong? Parameter-Space Saliency Maps for Explainabi...
【DL輪読会】Where do Models go Wrong? Parameter-Space Saliency Maps for Explainabi...【DL輪読会】Where do Models go Wrong? Parameter-Space Saliency Maps for Explainabi...
【DL輪読会】Where do Models go Wrong? Parameter-Space Saliency Maps for Explainabi...
 
2022年3月18日 「なにが違うの?デジタルツインとメタバース(日経メタバースシンポジウム資料)」
2022年3月18日 「なにが違うの?デジタルツインとメタバース(日経メタバースシンポジウム資料)」2022年3月18日 「なにが違うの?デジタルツインとメタバース(日経メタバースシンポジウム資料)」
2022年3月18日 「なにが違うの?デジタルツインとメタバース(日経メタバースシンポジウム資料)」
 
SSIとDIDで何を解決したいのか?(β版)
SSIとDIDで何を解決したいのか?(β版)SSIとDIDで何を解決したいのか?(β版)
SSIとDIDで何を解決したいのか?(β版)
 
MicrosoftのDID/VC実装概要
MicrosoftのDID/VC実装概要MicrosoftのDID/VC実装概要
MicrosoftのDID/VC実装概要
 
【DL輪読会】“Gestalt Principles Emerge When Learning Universal Sound Source Separa...
【DL輪読会】“Gestalt Principles Emerge When Learning Universal Sound Source Separa...【DL輪読会】“Gestalt Principles Emerge When Learning Universal Sound Source Separa...
【DL輪読会】“Gestalt Principles Emerge When Learning Universal Sound Source Separa...
 
[DL輪読会]HoloGAN: Unsupervised learning of 3D representations from natural images
[DL輪読会]HoloGAN: Unsupervised learning of 3D representations from natural images[DL輪読会]HoloGAN: Unsupervised learning of 3D representations from natural images
[DL輪読会]HoloGAN: Unsupervised learning of 3D representations from natural images
 
ChatGPT + LlamaIndex 0 .6 による チャットボット の実装
ChatGPT + LlamaIndex 0  .6 による チャットボット の実装ChatGPT + LlamaIndex 0  .6 による チャットボット の実装
ChatGPT + LlamaIndex 0 .6 による チャットボット の実装
 
深層学習によるHuman Pose Estimationの基礎
深層学習によるHuman Pose Estimationの基礎深層学習によるHuman Pose Estimationの基礎
深層学習によるHuman Pose Estimationの基礎
 
異音検知プラットフォーム開発におけるMLOpsの実際と考察 - MLOps コミュニティ #3
異音検知プラットフォーム開発におけるMLOpsの実際と考察 - MLOps コミュニティ #3 異音検知プラットフォーム開発におけるMLOpsの実際と考察 - MLOps コミュニティ #3
異音検知プラットフォーム開発におけるMLOpsの実際と考察 - MLOps コミュニティ #3
 
データファブリック実現のためのプロジェクトの進め方とは
データファブリック実現のためのプロジェクトの進め方とはデータファブリック実現のためのプロジェクトの進め方とは
データファブリック実現のためのプロジェクトの進め方とは
 
【論文紹介】 Spatial Temporal Graph Convolutional Networks for Skeleton-Based Acti...
【論文紹介】Spatial Temporal Graph Convolutional Networks for Skeleton-Based Acti...【論文紹介】Spatial Temporal Graph Convolutional Networks for Skeleton-Based Acti...
【論文紹介】 Spatial Temporal Graph Convolutional Networks for Skeleton-Based Acti...
 
モデルアーキテクチャ観点からの高速化2019
モデルアーキテクチャ観点からの高速化2019モデルアーキテクチャ観点からの高速化2019
モデルアーキテクチャ観点からの高速化2019
 
【DL輪読会】StyleCLIP: Text-Driven Manipulation of StyleGAN Imagery
【DL輪読会】StyleCLIP: Text-Driven Manipulation of StyleGAN Imagery【DL輪読会】StyleCLIP: Text-Driven Manipulation of StyleGAN Imagery
【DL輪読会】StyleCLIP: Text-Driven Manipulation of StyleGAN Imagery
 
SQL Server 使いのための Azure Synapse Analytics - Spark 入門
SQL Server 使いのための Azure Synapse Analytics - Spark 入門SQL Server 使いのための Azure Synapse Analytics - Spark 入門
SQL Server 使いのための Azure Synapse Analytics - Spark 入門
 

Similar a 210413 data101day1

AIを取り巻く基準について
AIを取り巻く基準についてAIを取り巻く基準について
AIを取り巻く基準についてNoriyasu Higashino
 
超高速開発の基礎概念 20141119 0
超高速開発の基礎概念 20141119 0超高速開発の基礎概念 20141119 0
超高速開発の基礎概念 20141119 0正善 大島
 
In-Database Analyticsの必要性と可能性
In-Database Analyticsの必要性と可能性In-Database Analyticsの必要性と可能性
In-Database Analyticsの必要性と可能性Satoshi Nagayasu
 
ドメイン駆動設計と要求開発
ドメイン駆動設計と要求開発ドメイン駆動設計と要求開発
ドメイン駆動設計と要求開発Kent Ishizawa
 
シングルソースパネルにおける品質管理技法と発展的活用@JMRAカンファレンス2015
シングルソースパネルにおける品質管理技法と発展的活用@JMRAカンファレンス2015シングルソースパネルにおける品質管理技法と発展的活用@JMRAカンファレンス2015
シングルソースパネルにおける品質管理技法と発展的活用@JMRAカンファレンス2015中野暁
 
データマネジメント2014
データマネジメント2014データマネジメント2014
データマネジメント2014Talend KK
 
Code for Japan データアカデミー研修 2018年度(概要)
Code for Japan データアカデミー研修 2018年度(概要)Code for Japan データアカデミー研修 2018年度(概要)
Code for Japan データアカデミー研修 2018年度(概要)Hiroyuki Ichikawa
 
データジャーナリズム―異業種のコラボレーションがニュースを変える― (2013年12月)
データジャーナリズム―異業種のコラボレーションがニュースを変える― (2013年12月)データジャーナリズム―異業種のコラボレーションがニュースを変える― (2013年12月)
データジャーナリズム―異業種のコラボレーションがニュースを変える― (2013年12月)yuzoakakura
 
20150630_ビッグデータプロジェクトを加速させるための仕組みと運用 -米国の最新フレームワーク動向とデータアドミニストレータの役割の変化- by 笹原英司
20150630_ビッグデータプロジェクトを加速させるための仕組みと運用 -米国の最新フレームワーク動向とデータアドミニストレータの役割の変化- by 笹原英司20150630_ビッグデータプロジェクトを加速させるための仕組みと運用 -米国の最新フレームワーク動向とデータアドミニストレータの役割の変化- by 笹原英司
20150630_ビッグデータプロジェクトを加速させるための仕組みと運用 -米国の最新フレームワーク動向とデータアドミニストレータの役割の変化- by 笹原英司Insight Technology, Inc.
 
ビッグデータプロジェクトを加速させるための 仕組みと運用
ビッグデータプロジェクトを加速させるための仕組みと運用ビッグデータプロジェクトを加速させるための仕組みと運用
ビッグデータプロジェクトを加速させるための 仕組みと運用Eiji Sasahara, Ph.D., MBA 笹原英司
 
Rdra4 dddワークショップ
Rdra4 dddワークショップRdra4 dddワークショップ
Rdra4 dddワークショップZenji Kanzaki
 
データサイエンティストとは? そのスキル/ナレッジレベル定義の必要性
データサイエンティストとは? そのスキル/ナレッジレベル定義の必要性データサイエンティストとは? そのスキル/ナレッジレベル定義の必要性
データサイエンティストとは? そのスキル/ナレッジレベル定義の必要性BrainPad Inc.
 
Tableau Blueprintの概要 for JTUG/RETAIL 2019/10/16
Tableau Blueprintの概要 for JTUG/RETAIL 2019/10/16Tableau Blueprintの概要 for JTUG/RETAIL 2019/10/16
Tableau Blueprintの概要 for JTUG/RETAIL 2019/10/16Ryusuke Ashiya
 
避けては通れないビッグデータ周辺の重要課題
避けては通れないビッグデータ周辺の重要課題避けては通れないビッグデータ周辺の重要課題
避けては通れないビッグデータ周辺の重要課題kurikiyo
 
SLASH-7ご説明資料
SLASH-7ご説明資料SLASH-7ご説明資料
SLASH-7ご説明資料pLucky
 
ビックデータ分析基盤の成⻑の軌跡
ビックデータ分析基盤の成⻑の軌跡ビックデータ分析基盤の成⻑の軌跡
ビックデータ分析基盤の成⻑の軌跡Recruit Lifestyle Co., Ltd.
 
マーケティング本部データ戦略部データインフラグループ 採用ピッチ.pdf
マーケティング本部データ戦略部データインフラグループ 採用ピッチ.pdfマーケティング本部データ戦略部データインフラグループ 採用ピッチ.pdf
マーケティング本部データ戦略部データインフラグループ 採用ピッチ.pdf合同会社 DMM.com
 
自治体データの利活用(データアカデミー)
自治体データの利活用(データアカデミー)自治体データの利活用(データアカデミー)
自治体データの利活用(データアカデミー)Hiroyuki Ichikawa
 
Developers Summit 2022 プロダクト開発速度とデータの組織的価値をセットで飛躍的に高める開発戦略
Developers Summit 2022 プロダクト開発速度とデータの組織的価値をセットで飛躍的に高める開発戦略Developers Summit 2022 プロダクト開発速度とデータの組織的価値をセットで飛躍的に高める開発戦略
Developers Summit 2022 プロダクト開発速度とデータの組織的価値をセットで飛躍的に高める開発戦略Takanori Kawahara
 
初めてのデータ分析基盤構築をまかされた、その時何を考えておくと良いのか
初めてのデータ分析基盤構築をまかされた、その時何を考えておくと良いのか初めてのデータ分析基盤構築をまかされた、その時何を考えておくと良いのか
初めてのデータ分析基盤構築をまかされた、その時何を考えておくと良いのかTechon Organization
 

Similar a 210413 data101day1 (20)

AIを取り巻く基準について
AIを取り巻く基準についてAIを取り巻く基準について
AIを取り巻く基準について
 
超高速開発の基礎概念 20141119 0
超高速開発の基礎概念 20141119 0超高速開発の基礎概念 20141119 0
超高速開発の基礎概念 20141119 0
 
In-Database Analyticsの必要性と可能性
In-Database Analyticsの必要性と可能性In-Database Analyticsの必要性と可能性
In-Database Analyticsの必要性と可能性
 
ドメイン駆動設計と要求開発
ドメイン駆動設計と要求開発ドメイン駆動設計と要求開発
ドメイン駆動設計と要求開発
 
シングルソースパネルにおける品質管理技法と発展的活用@JMRAカンファレンス2015
シングルソースパネルにおける品質管理技法と発展的活用@JMRAカンファレンス2015シングルソースパネルにおける品質管理技法と発展的活用@JMRAカンファレンス2015
シングルソースパネルにおける品質管理技法と発展的活用@JMRAカンファレンス2015
 
データマネジメント2014
データマネジメント2014データマネジメント2014
データマネジメント2014
 
Code for Japan データアカデミー研修 2018年度(概要)
Code for Japan データアカデミー研修 2018年度(概要)Code for Japan データアカデミー研修 2018年度(概要)
Code for Japan データアカデミー研修 2018年度(概要)
 
データジャーナリズム―異業種のコラボレーションがニュースを変える― (2013年12月)
データジャーナリズム―異業種のコラボレーションがニュースを変える― (2013年12月)データジャーナリズム―異業種のコラボレーションがニュースを変える― (2013年12月)
データジャーナリズム―異業種のコラボレーションがニュースを変える― (2013年12月)
 
20150630_ビッグデータプロジェクトを加速させるための仕組みと運用 -米国の最新フレームワーク動向とデータアドミニストレータの役割の変化- by 笹原英司
20150630_ビッグデータプロジェクトを加速させるための仕組みと運用 -米国の最新フレームワーク動向とデータアドミニストレータの役割の変化- by 笹原英司20150630_ビッグデータプロジェクトを加速させるための仕組みと運用 -米国の最新フレームワーク動向とデータアドミニストレータの役割の変化- by 笹原英司
20150630_ビッグデータプロジェクトを加速させるための仕組みと運用 -米国の最新フレームワーク動向とデータアドミニストレータの役割の変化- by 笹原英司
 
ビッグデータプロジェクトを加速させるための 仕組みと運用
ビッグデータプロジェクトを加速させるための仕組みと運用ビッグデータプロジェクトを加速させるための仕組みと運用
ビッグデータプロジェクトを加速させるための 仕組みと運用
 
Rdra4 dddワークショップ
Rdra4 dddワークショップRdra4 dddワークショップ
Rdra4 dddワークショップ
 
データサイエンティストとは? そのスキル/ナレッジレベル定義の必要性
データサイエンティストとは? そのスキル/ナレッジレベル定義の必要性データサイエンティストとは? そのスキル/ナレッジレベル定義の必要性
データサイエンティストとは? そのスキル/ナレッジレベル定義の必要性
 
Tableau Blueprintの概要 for JTUG/RETAIL 2019/10/16
Tableau Blueprintの概要 for JTUG/RETAIL 2019/10/16Tableau Blueprintの概要 for JTUG/RETAIL 2019/10/16
Tableau Blueprintの概要 for JTUG/RETAIL 2019/10/16
 
避けては通れないビッグデータ周辺の重要課題
避けては通れないビッグデータ周辺の重要課題避けては通れないビッグデータ周辺の重要課題
避けては通れないビッグデータ周辺の重要課題
 
SLASH-7ご説明資料
SLASH-7ご説明資料SLASH-7ご説明資料
SLASH-7ご説明資料
 
ビックデータ分析基盤の成⻑の軌跡
ビックデータ分析基盤の成⻑の軌跡ビックデータ分析基盤の成⻑の軌跡
ビックデータ分析基盤の成⻑の軌跡
 
マーケティング本部データ戦略部データインフラグループ 採用ピッチ.pdf
マーケティング本部データ戦略部データインフラグループ 採用ピッチ.pdfマーケティング本部データ戦略部データインフラグループ 採用ピッチ.pdf
マーケティング本部データ戦略部データインフラグループ 採用ピッチ.pdf
 
自治体データの利活用(データアカデミー)
自治体データの利活用(データアカデミー)自治体データの利活用(データアカデミー)
自治体データの利活用(データアカデミー)
 
Developers Summit 2022 プロダクト開発速度とデータの組織的価値をセットで飛躍的に高める開発戦略
Developers Summit 2022 プロダクト開発速度とデータの組織的価値をセットで飛躍的に高める開発戦略Developers Summit 2022 プロダクト開発速度とデータの組織的価値をセットで飛躍的に高める開発戦略
Developers Summit 2022 プロダクト開発速度とデータの組織的価値をセットで飛躍的に高める開発戦略
 
初めてのデータ分析基盤構築をまかされた、その時何を考えておくと良いのか
初めてのデータ分析基盤構築をまかされた、その時何を考えておくと良いのか初めてのデータ分析基盤構築をまかされた、その時何を考えておくと良いのか
初めてのデータ分析基盤構築をまかされた、その時何を考えておくと良いのか
 

Más de Kenji Hiramoto

220111 global e participation workshop
220111 global e participation workshop220111 global e participation workshop
220111 global e participation workshopKenji Hiramoto
 
210629data strategy servicecatalogue
210629data strategy servicecatalogue210629data strategy servicecatalogue
210629data strategy servicecatalogueKenji Hiramoto
 
210618 c4jdatastrategy
210618 c4jdatastrategy210618 c4jdatastrategy
210618 c4jdatastrategyKenji Hiramoto
 
210512opengovernment101
210512opengovernment101210512opengovernment101
210512opengovernment101Kenji Hiramoto
 
2020-12-21 data strategy in Japan
2020-12-21 data strategy in Japan2020-12-21 data strategy in Japan
2020-12-21 data strategy in JapanKenji Hiramoto
 
(old version)2020-12-21 data strategy in Japan
 (old version)2020-12-21 data strategy in Japan (old version)2020-12-21 data strategy in Japan
(old version)2020-12-21 data strategy in JapanKenji Hiramoto
 
191018 data interoperability
191018 data interoperability191018 data interoperability
191018 data interoperabilityKenji Hiramoto
 
191226 baseregistries summary
191226 baseregistries summary191226 baseregistries summary
191226 baseregistries summaryKenji Hiramoto
 

Más de Kenji Hiramoto (20)

Notice
NoticeNotice
Notice
 
220401IMI2.pptx
220401IMI2.pptx220401IMI2.pptx
220401IMI2.pptx
 
220209 nds
220209 nds220209 nds
220209 nds
 
220111 global e participation workshop
220111 global e participation workshop220111 global e participation workshop
220111 global e participation workshop
 
210629data strategy servicecatalogue
210629data strategy servicecatalogue210629data strategy servicecatalogue
210629data strategy servicecatalogue
 
210618 c4jdatastrategy
210618 c4jdatastrategy210618 c4jdatastrategy
210618 c4jdatastrategy
 
210512opengovernment101
210512opengovernment101210512opengovernment101
210512opengovernment101
 
210508 legaltech
210508 legaltech210508 legaltech
210508 legaltech
 
2020-12-21 data strategy in Japan
2020-12-21 data strategy in Japan2020-12-21 data strategy in Japan
2020-12-21 data strategy in Japan
 
(old version)2020-12-21 data strategy in Japan
 (old version)2020-12-21 data strategy in Japan (old version)2020-12-21 data strategy in Japan
(old version)2020-12-21 data strategy in Japan
 
191018 data interoperability
191018 data interoperability191018 data interoperability
191018 data interoperability
 
Measures for covid19
Measures for covid19 Measures for covid19
Measures for covid19
 
Law modeling report
Law modeling reportLaw modeling report
Law modeling report
 
191226 baseregistries summary
191226 baseregistries summary191226 baseregistries summary
191226 baseregistries summary
 
191228Base registries
191228Base registries191228Base registries
191228Base registries
 
191228smartcity
191228smartcity191228smartcity
191228smartcity
 
191008 harnessing ai
191008 harnessing ai191008 harnessing ai
191008 harnessing ai
 
2019 c4j kuyo
2019 c4j kuyo2019 c4j kuyo
2019 c4j kuyo
 
190927 govtechconf
190927 govtechconf190927 govtechconf
190927 govtechconf
 
190914 foss4g p
190914 foss4g p190914 foss4g p
190914 foss4g p
 

210413 data101day1