SlideShare una empresa de Scribd logo
1 de 42
© 2020 NTT DATA Corporation 1 © 2020 NTT DATA Corporation
NTTデータ テクノロジーカンファレンス 2020
データ活用を俊敏に進めるためのDataOps実践方法と
その高度化のためのナレッジグラフ活用の取り組み
2020年10月14日
株式会社NTTデータ デジタル技術部
八木香充 / 大山真実
© 2020 NTT DATA Corporation
DXからDataOpsへ
2
© 2020 NTT DATA Corporation 3
DX(デジタルトランスフォーメーション)とは?
現行
ビジネス
デジタル
ビジネス
DX
アプリケーション
モダナイズ
データ活用
© 2020 NTT DATA Corporation 4
DataOpsはシステム化フェーズで特に重要になる
MLOps MLOps MLOps
DataOps DataOps
実証実験(PoC)フェーズ システム化フェーズ 基幹系更改フェーズ
一部データでスピーディーに
低コストで繰り返しモデル開発
全量データをスピーディーにモデ
ルに供給するシステムを開発
データ構造を最適化するため
既存APをモダナイズ
データをいかに素早く分析側に
供給できるかが重要なポイント
データ活用基盤への素早いデータ供
給のために既存アプリケーションの
モダナイズが必要
データ活用 アプリケーションモダナイズ
アプリケーション
モダナイズ
© 2020 NTT DATA Corporation
DataOpsとは?
5
© 2020 NTT DATA Corporation 6
データを活用できている企業は少ない
データを全社的に利活用できている日本企業は 20% (※1)
利活用
できている
(※1)https://www.gartner.com/jp/newsroom/press-releases/pr-20190527
DataOps が有効な武器のひとつ
© 2020 NTT DATA Corporation 7
DataOpsの定義
組織全体のデータ管理者とデータ消費者の間のデータフローの
コミュニケーション、統合、自動化を改善することに
焦点を当てた協調的なデータ管理手法(※)
(※)https://www.gartner.com/en/information-technology/glossary/dataops
© 2020 NTT DATA Corporation 8
DataOpsは、情報系と何がちがうのか?
データ量
分析内容
定型
非定型
情報系
少 多
DataOps
双方向性
データ分析者が必要としているデータを供給す
るため、データ分析者からのフィードバックを重
要視する。
スピード
データ分析者の要望をこまめに取り入れるため、
すばやい構築を行う。
© 2020 NTT DATA Corporation 9
DataOpsの登場人物
データエンジニア データスチュワード データサイエンティスト
データ共有のパイプラインを構築し、メン
テナンスを行うエンジニア。
データエンジニアとデータサイエンティスト
をつなぐコミュニケーター。データガバナン
スに関する責任者でもある。
統計や機械学習を駆使して、データを
分析しビジネスに貢献する。
DataOpsで特に重要な役割
© 2020 NTT DATA Corporation
データスチュワードによる
DataOpsの実践
10
© 2020 NTT DATA Corporation 11
NTTデータが考えるDataOpsとは?
スピード 双方性
目的意識 Oneチーム
SE、データエンジニア、機械学習エ
ンジニア、データサイエンティストが
1つチームとなり、データスチュワー
ドを中心としてDataOpsを実現す
る必要がある。
データ供給者側も、データ分析者
の目的を意識しながら、データ供
給基盤を構築しないと、手段と目
的が入れ替わる危険がある。
© 2020 NTT DATA Corporation 12
DataOps実現へのロードマップ
レベル1
古いDWHが乱立して
おり、分析もアドホック
に実施されている。
レベル2 レベル3
データがサイロ化
手動で
データを整理・統合
自動で
データを整理・統合
データスチュワードが中
心となり、データ統合
を進めている。
自然言語処理やグラ
フテクノロジーを使って
データ統合を自動化。
DataOps オントロジー
NLP
PoC
データスチュワード
まずはここをめざす
© 2020 NTT DATA Corporation 13
よくあるデータ分析基盤
見えていない領域
データ加工 DWH1 DM1
システム A
DM2
システム B
データサイエンティスト A
データサイエンティスト B
分析基盤 B
分析基盤 A
© 2020 NTT DATA Corporation 14
【レベル1】 各所でサイロ化が進んでいる
見えていない領域
データ加工 DWH1 DM1
システム A
DM2
システム B
データサイエンティスト A
データサイエンティスト B
分析基盤 B
分析基盤 A
システム間のサイロ化
上流-下流のサイロ化
© 2020 NTT DATA Corporation 15
【レベル1】 サイロ化に起因してさまざまな課題が発生する
見えていない領域
データ加工 DWH1 DM1
システム A
DM2
システム B
データサイエンティスト A
データサイエンティスト B
システムの違い
ベンダの違い
セキュリティ要件の違い
データ活用への意識の違い
加工処理が属人化
分析基盤 B
DSとデータエンジニアの連携不足
コミュニケーション不足
コード体系の違い
更新頻度の違い
データ品質の違い
データに関する問い合わせ窓口なし
ベンダの違い
類似処理が放置
仕様が不明確
分析基盤 A
システムのデータ変更
紙媒体・Excel
類似データが大量
© 2020 NTT DATA Corporation 16
【レベル2】 データスチュワードがまず担当者をつなぐ
見えていない領域
データ加工 DWH1 DM1
システム A
DM2
システム B
データサイエンティスト A
データサイエンティスト B
システムの違い
ベンダの違い
セキュリティ要件の違い
データ活用への意識の違い
加工処理が属人化
分析基盤 B
DSとデータエンジニアの連携不足
コミュニケーション不足
コード体系の違い
更新頻度の違い
データ品質の違い
データに関する問い合わせ窓口なし
ベンダの違い
類似処理が放置
仕様が不明確
分析基盤 A
システムのデータ変更
紙媒体・Excel
データスチュワード
最適化
名寄せ
調査
ヒヤリング
類似データが大量
© 2020 NTT DATA Corporation 17
【レベル2】 担当者を起点にしてシステムを全方位的につなぐ
見えていない領域
データ加工 DWH1 DM1
システム A
DM2
システム B
データサイエンティスト A
データサイエンティスト B
システムの違い
ベンダの違い
セキュリティ要件の違い
データ活用への意識の違い
加工処理が属人化
分析基盤 B
DSとデータエンジニアの連携不足
コミュニケーション不足
コード体系の違い
更新頻度の違い
データ品質の違い
データに関する問い合わせ窓口なし
ベンダの違い
類似処理が放置
仕様が不明確
分析基盤 A
システムのデータ変更
紙媒体・Excel
データスチュワード
最適化
名寄せ
調査
ヒヤリング
類似データが大量
© 2020 NTT DATA Corporation 18
DataOps実践のために大事なこと
コミュニケーション
お客様業務・分析・システムを理
解することで、システムと経営をつ
なぎ、組織間のサイロを打破してい
く。自律的な働きが重要。
標準化→自動化
データスチュワードによって暗黙知
の形式知化をすすめ、さらに標準
化から自動化することで人的作業
を縮小していく。
品質の維持
データ品質・サービス品質を維持
するため、定量的監視を行う。
特に業務要件に近いものは、ド
キュメンテーションにより理解を促進
する取り組みも重要。
© 2020 NTT DATA Corporation 19
ここまでのまとめ
レベル1
古いDWHが乱立して
おり、分析もアドホック
に実施されている。
レベル2 レベル3
データがサイロ化
手動で
データを整理・統合
自動で
データを整理・統合
データスチュワードが中
心となり、データ統合
を進めている。
自然言語処理やグラ
フテクノロジーを使って
データ統合を自動化。
DataOps オントロジー
NLP
PoC
データスチュワード
ここまでのおはなし
© 2020 NTT DATA Corporation 20
ここまでのまとめ
ここからのおはなし
レベル1
古いDWHが乱立して
おり、分析もアドホック
に実施されている。
レベル2 レベル3
データがサイロ化
手動で
データを整理・統合
自動で
データを整理・統合
データスチュワードが中
心となり、データ統合
を進めている。
自然言語処理やグラ
フテクノロジーを使って
データ統合を自動化。
DataOps オントロジー
NLP
PoC
データスチュワード
© 2020 NTT DATA Corporation
ナレッジグラフによる
メタデータ活用の取り組み
21
© 2020 NTT DATA Corporation 22
© 2020 NTT DATA Corporation 22
データスチュワード業務の効率化・高度化を目指して
IT部門
DB, DWH, ETLなど IT部門エンジニア
事業部B
ビジネスユーザ
事業部A
ビジネスユーザ
・・・
データスチュワード
© 2020 NTT DATA Corporation 23
© 2020 NTT DATA Corporation 23
データスチュワード業務の効率化・高度化を目指して
IT部門
DB, DWH, ETLなど IT部門エンジニア
事業部B
ビジネスユーザ
事業部A
ビジネスユーザ
・・・
データスチュワード
現状の理解
 ヒヤリング
 ドキュメント調査
© 2020 NTT DATA Corporation 24
© 2020 NTT DATA Corporation 24
データスチュワード業務の効率化・高度化を目指して
IT部門
DB, DWH, ETLなど IT部門エンジニア
事業部B
ビジネスユーザ
事業部A
ビジネスユーザ
・・・
データスチュワード
現状の理解
 ヒヤリング
 ドキュメント調査
あるべき姿の提案とそのための作業
 新たなデータ活用の提案
 データの処理と配置の最適化
© 2020 NTT DATA Corporation 25
© 2020 NTT DATA Corporation 25
DB, DWH, ETLなど IT部門エンジニア
データスチュワード業務の効率化・高度化を目指して
IT部門 事業部B
ビジネスユーザ
事業部B
ビジネスユーザ
・・・
データスチュワー
ド
あるべき姿の提案とそのための作業
 新たなデータ活用の提案
 データの処理と配置の最適化
多くの企業ではシステムとデータの
現状を理解するためのコストが増大している
• 多種多様な大量のデータが存在
• ビジネス知識の共有の難しさ
現状の理解
 ヒヤリング
 ドキュメント調査
© 2020 NTT DATA Corporation 26
© 2020 NTT DATA Corporation 26
DB, DWH, ETLなど IT部門エンジニア
データスチュワード業務の効率化・高度化を目指して
IT部門 事業部B
ビジネスユーザ
事業部B
ビジネスユーザ
・・・
データスチュワー
ド
あるべき姿の提案とそのための作業
 新たなデータ活用の提案
 データの処理と配置の最適化
多くの企業ではシステムとデータの
現状を理解するためのコストが増大している
• 多種多様な大量のデータが存在
• ビジネス知識の共有の難しさ
現状の理解
 ヒヤリング
 ドキュメント調査
ナレッジグラフによるメタデータ活用!
これらの課題解決を技術の力で支援したい
© 2020 NTT DATA Corporation 27
© 2020 NTT DATA Corporation 27
ナレッジグラフとは?
現実世界の実体(Entity)同士の関係やそれを説明する情報を
グラフ構造で表現したもの
人間と機械が理解できる
RDF(Resource Description Framework)
• W3Cで標準化されている情報の関係をグラフ構
造で表現するための仕組み
機械的に推論することができる
OWL(Web ontology language)
• W3Cで標準化されているオントロジーを表現す
るための仕組み
• 階層化された分類や分類同士の関係、それら
のルールを機械が理解可能な形で表現する
ナレッジグラフの例
http://mowl-power.cs.man.ac.uk/protegeowltutorial/resources/ProtegeOWLTutorialP4_v1_3.pdf
© 2020 NTT DATA Corporation 28
© 2020 NTT DATA Corporation 28
NTTデータによるナレッジグラフを中心とした取り組み
© 2020 NTT DATA Corporation 29
© 2020 NTT DATA Corporation 29
メタデータとは?
データを説明するデータのこと
データはメタデータを付与されて始めて人間が理解できるようになる。
Business Metadata Social Metadata
Technical Metadata Operational Metadata
• 各部署ごとのビジネス知識
例:ビジネス用語集、業務プロセス文書、ドキュメント化さ
れていないビジネスノウハウなど
• データに関わるステークホルダー同士のコミュニケーション
例:データ分析者によるデータの使いやすさの評価
• 組織外部のデータと組織内部のデータの関係
例:3rdパーティデータに関する情報
• データベースやファイルサーバの設計書、設定ファイル
例:ER図、データベースのスキーマ設計図
• 実際にデータベースやファイルサーバに保存されているメタ
データ
• データの処理に関わる設計書
例:バッチ処理設計書、ETLフロー設計書
• データ処理の履歴・リソース情報
例:データの変更履歴、ジョブ実行時のパフォーマンス情報
© 2020 NTT DATA Corporation 30
© 2020 NTT DATA Corporation 30
メタデータをナレッジグラフとして統合する
どこにどのようなデータがあるのか明らかにする
 ビジネスの実体(Entity)と物理データを結びつける
(例:事業部門Aの「SS-001」のデータが「CSA01」テーブルにあることがわかる)
データの価値を明らかにする
 データの重要度、価値を理解できる(例:アクセス頻度、データの履歴・用途)
 不要/冗長なデータや処理を発見できる
© 2020 NTT DATA Corporation 31
© 2020 NTT DATA Corporation 31
ナレッジグラフでデータの流れと価値を可視化する
どこにどのようなデータがあるのか明らかにする
最もビジネスに価値をもたらすデータからデータ活用を進めることができる
データの処理と配置を最適化してデータ活用基盤のコスト最適化ができる
 ビジネスの実体(Entity)と物理データを結びつける
(例:事業部門Aの「SS-001」のデータが「CSA01」テーブルにあることがわかる)
データの価値を明らかにする
 データの重要度、価値を理解できる(例:アクセス頻度、データの用途)
 不要/冗長なデータや処理を発見できる
© 2020 NTT DATA Corporation 32
© 2020 NTT DATA Corporation 32
ナレッジグラフによるメタデータ活用実現に向けた取り組み
メタデータをどのように集めてナレッジグラフに統合するか?
課題
© 2020 NTT DATA Corporation 33
© 2020 NTT DATA Corporation 33
ナレッジグラフによるメタデータ活用実現に向けた取り組み
メタデータをどのように集めてナレッジグラフに統合するか?
課題
NTTデータによる「データカタログソリューション」
ビジネスメタデータをどのように集めるか?
© 2020 NTT DATA Corporation 34
© 2020 NTT DATA Corporation 34
NTTデータによる「データカタログソリューション」
NTTデータ流通サービス事業部の「Data-Driven Catalog」
© 2020 NTT DATA Corporation 35
© 2020 NTT DATA Corporation 35
NTTデータによる「データカタログ実践事例」
こちらの発表にぜひご注目ください!
© 2020 NTT DATA Corporation 36
© 2020 NTT DATA Corporation 36
ナレッジグラフによるメタデータ活用実現に向けた取り組み
メタデータをどのように集めてナレッジグラフに統合するか?
課題
NTTデータによる「データカタログソリューション」
NTT ソフトウェアイノベーションセンタによる「協働型機械学習技術」
ビジネスメタデータをどのように集めるか?
© 2020 NTT DATA Corporation 37
© 2020 NTT DATA Corporation 37
NTT ソフトウェアイノベーションセンタによる
「協働型機械学習技術」
こちらの発表にぜひご注目ください!
© 2020 NTT DATA Corporation 38
© 2020 NTT DATA Corporation 38
ナレッジグラフによるメタデータ活用実現に向けた取り組み
メタデータをどのように集めてナレッジグラフに統合するか?
課題
NTTデータによる「データカタログソリューション」
NTT ソフトウェアイノベーションセンタによる「協働型機械学習技術」
NTTデータによる「ドメイン特化BERT」
ビジネスメタデータをどのように集めるか?
自然文で記述されているメタデータをどのように集めるか?
© 2020 NTT DATA Corporation 39
© 2020 NTT DATA Corporation 39
NTTデータによる「ドメイン特化BERT」
こちらの発表にぜひご注目ください!
© 2020 NTT DATA Corporation 40
© 2020 NTT DATA Corporation 40
ナレッジグラフによるメタデータ活用実現に向けた取り組み
メタデータをどのように集めてナレッジグラフに統合するか?
課題
NTTデータによる「データカタログソリューション」
NTT ソフトウェアイノベーションセンタによる「協働型機械学習技術」
NTTデータによる「ドメイン特化BERT」
ABLERによる「ナレッジグラフ構築FW」
ビジネスメタデータをどのように集めるか?
自然文で記述されているメタデータをどのように集めるか?
ナレッジグラフの構築を如何に機械化・自動化するか?
© 2020 NTT DATA Corporation 41
© 2020 NTT DATA Corporation 41
データスチュワード業務の効率化・高度化を目指して
IT部門
DB, DWH, ETLなど IT部門エンジニア
事業部B
ビジネスユーザ
事業部A
ビジネスユーザ
・・・
データスチュワード
ナレッジグラフ
テクニカルメタデータ、オペレーショナ
ルメタデータをナレッジグラフに統合
ビジネスメタデータ、ソーシャルメ
タデータをナレッジグラフに統合
インターネット
Linked Open Data をナ
レッジグラフに統合
データカタログ
ビジネス文書
データカタログ
ビジネス文書
機械学習によるビジネス
メタデータ入力支援機能
自然言語処理技術による自
然文からの情報抽出機能
• 最もビジネスに価値をもたらすデータから
データ活用を進めることができる
• データの処理と配置を最適化して
データ活用基盤のコスト最適化ができる
© 2020 NTT DATA Corporation

Más contenido relacionado

La actualidad más candente

Data-centricなML開発
Data-centricなML開発Data-centricなML開発
Data-centricなML開発Takeshi Suzuki
 
Data platformdesign
Data platformdesignData platformdesign
Data platformdesignRyoma Nagata
 
イミュータブルデータモデルの極意
イミュータブルデータモデルの極意イミュータブルデータモデルの極意
イミュータブルデータモデルの極意Yoshitaka Kawashima
 
datatech-jp Casual Talks#3 データエンジニアを採用するための試行錯誤
datatech-jp Casual Talks#3  データエンジニアを採用するための試行錯誤datatech-jp Casual Talks#3  データエンジニアを採用するための試行錯誤
datatech-jp Casual Talks#3 データエンジニアを採用するための試行錯誤株式会社MonotaRO Tech Team
 
オントロジー工学に基づくセマンティック技術(2)ナレッジグラフ入門
オントロジー工学に基づくセマンティック技術(2)ナレッジグラフ入門オントロジー工学に基づくセマンティック技術(2)ナレッジグラフ入門
オントロジー工学に基づくセマンティック技術(2)ナレッジグラフ入門Kouji Kozaki
 
深層学習による自然言語処理入門: word2vecからBERT, GPT-3まで
深層学習による自然言語処理入門: word2vecからBERT, GPT-3まで深層学習による自然言語処理入門: word2vecからBERT, GPT-3まで
深層学習による自然言語処理入門: word2vecからBERT, GPT-3までYahoo!デベロッパーネットワーク
 
リクルートにおけるデータのインフラ化への取組
リクルートにおけるデータのインフラ化への取組リクルートにおけるデータのインフラ化への取組
リクルートにおけるデータのインフラ化への取組Recruit Technologies
 
大規模データ活用向けストレージレイヤソフトのこれまでとこれから(NTTデータ テクノロジーカンファレンス 2019 講演資料、2019/09/05)
大規模データ活用向けストレージレイヤソフトのこれまでとこれから(NTTデータ テクノロジーカンファレンス 2019 講演資料、2019/09/05)大規模データ活用向けストレージレイヤソフトのこれまでとこれから(NTTデータ テクノロジーカンファレンス 2019 講演資料、2019/09/05)
大規模データ活用向けストレージレイヤソフトのこれまでとこれから(NTTデータ テクノロジーカンファレンス 2019 講演資料、2019/09/05)NTT DATA Technology & Innovation
 
Prophet入門【Python編】Facebookの時系列予測ツール
Prophet入門【Python編】Facebookの時系列予測ツールProphet入門【Python編】Facebookの時系列予測ツール
Prophet入門【Python編】Facebookの時系列予測ツールhoxo_m
 
爆速クエリエンジン”Presto”を使いたくなる話
爆速クエリエンジン”Presto”を使いたくなる話爆速クエリエンジン”Presto”を使いたくなる話
爆速クエリエンジン”Presto”を使いたくなる話Kentaro Yoshida
 
MLOps に基づく AI/ML 実運用最前線 ~画像、動画データにおける MLOps 事例のご紹介~(映像情報メディア学会2021年冬季大会企画セッショ...
MLOps に基づく AI/ML 実運用最前線 ~画像、動画データにおける MLOps 事例のご紹介~(映像情報メディア学会2021年冬季大会企画セッショ...MLOps に基づく AI/ML 実運用最前線 ~画像、動画データにおける MLOps 事例のご紹介~(映像情報メディア学会2021年冬季大会企画セッショ...
MLOps に基づく AI/ML 実運用最前線 ~画像、動画データにおける MLOps 事例のご紹介~(映像情報メディア学会2021年冬季大会企画セッショ...NTT DATA Technology & Innovation
 
AIビジネス推進人材に必要なスキルとその育成方法
AIビジネス推進人材に必要なスキルとその育成方法AIビジネス推進人材に必要なスキルとその育成方法
AIビジネス推進人材に必要なスキルとその育成方法munjapan
 
データ収集の基本と「JapanTaxi」アプリにおける実践例
データ収集の基本と「JapanTaxi」アプリにおける実践例データ収集の基本と「JapanTaxi」アプリにおける実践例
データ収集の基本と「JapanTaxi」アプリにおける実践例Tetsutaro Watanabe
 
大量のデータ処理や分析に使えるOSS Apache Spark入門 - Open Source Conference2020 Online/Fukuoka...
大量のデータ処理や分析に使えるOSS Apache Spark入門 - Open Source Conference2020 Online/Fukuoka...大量のデータ処理や分析に使えるOSS Apache Spark入門 - Open Source Conference2020 Online/Fukuoka...
大量のデータ処理や分析に使えるOSS Apache Spark入門 - Open Source Conference2020 Online/Fukuoka...NTT DATA Technology & Innovation
 
PySparkによるジョブを、より速く、よりスケーラブルに実行するための最善の方法 ※講演は翻訳資料にて行います。 - Getting the Best...
PySparkによるジョブを、より速く、よりスケーラブルに実行するための最善の方法  ※講演は翻訳資料にて行います。 - Getting the Best...PySparkによるジョブを、より速く、よりスケーラブルに実行するための最善の方法  ※講演は翻訳資料にて行います。 - Getting the Best...
PySparkによるジョブを、より速く、よりスケーラブルに実行するための最善の方法 ※講演は翻訳資料にて行います。 - Getting the Best...Holden Karau
 
実務と論文で学ぶジョブレコメンデーション最前線2022
実務と論文で学ぶジョブレコメンデーション最前線2022実務と論文で学ぶジョブレコメンデーション最前線2022
実務と論文で学ぶジョブレコメンデーション最前線2022Teruyuki Sakaue
 
【DL輪読会】GPT-4Technical Report
【DL輪読会】GPT-4Technical Report【DL輪読会】GPT-4Technical Report
【DL輪読会】GPT-4Technical ReportDeep Learning JP
 
MLflowで学ぶMLOpsことはじめ
MLflowで学ぶMLOpsことはじめMLflowで学ぶMLOpsことはじめ
MLflowで学ぶMLOpsことはじめKenichi Sonoda
 

La actualidad más candente (20)

Data-centricなML開発
Data-centricなML開発Data-centricなML開発
Data-centricなML開発
 
Data platformdesign
Data platformdesignData platformdesign
Data platformdesign
 
イミュータブルデータモデルの極意
イミュータブルデータモデルの極意イミュータブルデータモデルの極意
イミュータブルデータモデルの極意
 
datatech-jp Casual Talks#3 データエンジニアを採用するための試行錯誤
datatech-jp Casual Talks#3  データエンジニアを採用するための試行錯誤datatech-jp Casual Talks#3  データエンジニアを採用するための試行錯誤
datatech-jp Casual Talks#3 データエンジニアを採用するための試行錯誤
 
オントロジー工学に基づくセマンティック技術(2)ナレッジグラフ入門
オントロジー工学に基づくセマンティック技術(2)ナレッジグラフ入門オントロジー工学に基づくセマンティック技術(2)ナレッジグラフ入門
オントロジー工学に基づくセマンティック技術(2)ナレッジグラフ入門
 
深層学習による自然言語処理入門: word2vecからBERT, GPT-3まで
深層学習による自然言語処理入門: word2vecからBERT, GPT-3まで深層学習による自然言語処理入門: word2vecからBERT, GPT-3まで
深層学習による自然言語処理入門: word2vecからBERT, GPT-3まで
 
リクルートにおけるデータのインフラ化への取組
リクルートにおけるデータのインフラ化への取組リクルートにおけるデータのインフラ化への取組
リクルートにおけるデータのインフラ化への取組
 
DBpedia Japaneseとは?
DBpedia Japaneseとは?DBpedia Japaneseとは?
DBpedia Japaneseとは?
 
大規模データ活用向けストレージレイヤソフトのこれまでとこれから(NTTデータ テクノロジーカンファレンス 2019 講演資料、2019/09/05)
大規模データ活用向けストレージレイヤソフトのこれまでとこれから(NTTデータ テクノロジーカンファレンス 2019 講演資料、2019/09/05)大規模データ活用向けストレージレイヤソフトのこれまでとこれから(NTTデータ テクノロジーカンファレンス 2019 講演資料、2019/09/05)
大規模データ活用向けストレージレイヤソフトのこれまでとこれから(NTTデータ テクノロジーカンファレンス 2019 講演資料、2019/09/05)
 
Prophet入門【Python編】Facebookの時系列予測ツール
Prophet入門【Python編】Facebookの時系列予測ツールProphet入門【Python編】Facebookの時系列予測ツール
Prophet入門【Python編】Facebookの時系列予測ツール
 
爆速クエリエンジン”Presto”を使いたくなる話
爆速クエリエンジン”Presto”を使いたくなる話爆速クエリエンジン”Presto”を使いたくなる話
爆速クエリエンジン”Presto”を使いたくなる話
 
MLOps に基づく AI/ML 実運用最前線 ~画像、動画データにおける MLOps 事例のご紹介~(映像情報メディア学会2021年冬季大会企画セッショ...
MLOps に基づく AI/ML 実運用最前線 ~画像、動画データにおける MLOps 事例のご紹介~(映像情報メディア学会2021年冬季大会企画セッショ...MLOps に基づく AI/ML 実運用最前線 ~画像、動画データにおける MLOps 事例のご紹介~(映像情報メディア学会2021年冬季大会企画セッショ...
MLOps に基づく AI/ML 実運用最前線 ~画像、動画データにおける MLOps 事例のご紹介~(映像情報メディア学会2021年冬季大会企画セッショ...
 
AIビジネス推進人材に必要なスキルとその育成方法
AIビジネス推進人材に必要なスキルとその育成方法AIビジネス推進人材に必要なスキルとその育成方法
AIビジネス推進人材に必要なスキルとその育成方法
 
データ収集の基本と「JapanTaxi」アプリにおける実践例
データ収集の基本と「JapanTaxi」アプリにおける実践例データ収集の基本と「JapanTaxi」アプリにおける実践例
データ収集の基本と「JapanTaxi」アプリにおける実践例
 
大量のデータ処理や分析に使えるOSS Apache Spark入門 - Open Source Conference2020 Online/Fukuoka...
大量のデータ処理や分析に使えるOSS Apache Spark入門 - Open Source Conference2020 Online/Fukuoka...大量のデータ処理や分析に使えるOSS Apache Spark入門 - Open Source Conference2020 Online/Fukuoka...
大量のデータ処理や分析に使えるOSS Apache Spark入門 - Open Source Conference2020 Online/Fukuoka...
 
Apache Atlasの現状とデータガバナンス事例 #hadoopreading
Apache Atlasの現状とデータガバナンス事例 #hadoopreadingApache Atlasの現状とデータガバナンス事例 #hadoopreading
Apache Atlasの現状とデータガバナンス事例 #hadoopreading
 
PySparkによるジョブを、より速く、よりスケーラブルに実行するための最善の方法 ※講演は翻訳資料にて行います。 - Getting the Best...
PySparkによるジョブを、より速く、よりスケーラブルに実行するための最善の方法  ※講演は翻訳資料にて行います。 - Getting the Best...PySparkによるジョブを、より速く、よりスケーラブルに実行するための最善の方法  ※講演は翻訳資料にて行います。 - Getting the Best...
PySparkによるジョブを、より速く、よりスケーラブルに実行するための最善の方法 ※講演は翻訳資料にて行います。 - Getting the Best...
 
実務と論文で学ぶジョブレコメンデーション最前線2022
実務と論文で学ぶジョブレコメンデーション最前線2022実務と論文で学ぶジョブレコメンデーション最前線2022
実務と論文で学ぶジョブレコメンデーション最前線2022
 
【DL輪読会】GPT-4Technical Report
【DL輪読会】GPT-4Technical Report【DL輪読会】GPT-4Technical Report
【DL輪読会】GPT-4Technical Report
 
MLflowで学ぶMLOpsことはじめ
MLflowで学ぶMLOpsことはじめMLflowで学ぶMLOpsことはじめ
MLflowで学ぶMLOpsことはじめ
 

Similar a データ活用を俊敏に進めるためのDataOps実践方法とその高度化のためのナレッジグラフ活用の取り組み(NTTデータ テクノロジーカンファレンス 2020 発表資料)

NTTデータが考えるデータ基盤の次の一手 ~AI活用のために知っておくべき新潮流とは?~(NTTデータ テクノロジーカンファレンス 2020 発表資料)
NTTデータが考えるデータ基盤の次の一手 ~AI活用のために知っておくべき新潮流とは?~(NTTデータ テクノロジーカンファレンス 2020 発表資料)NTTデータが考えるデータ基盤の次の一手 ~AI活用のために知っておくべき新潮流とは?~(NTTデータ テクノロジーカンファレンス 2020 発表資料)
NTTデータが考えるデータ基盤の次の一手 ~AI活用のために知っておくべき新潮流とは?~(NTTデータ テクノロジーカンファレンス 2020 発表資料)NTT DATA Technology & Innovation
 
Open Cloud Innovation2016 day1(これからのデータ分析者とエンジニアに必要なdatascienceexperienceツールと...
Open Cloud Innovation2016 day1(これからのデータ分析者とエンジニアに必要なdatascienceexperienceツールと...Open Cloud Innovation2016 day1(これからのデータ分析者とエンジニアに必要なdatascienceexperienceツールと...
Open Cloud Innovation2016 day1(これからのデータ分析者とエンジニアに必要なdatascienceexperienceツールと...Atsushi Tsuchiya
 
Attunityのソリューションと異種データベース・クラウド移行事例のご紹介
Attunityのソリューションと異種データベース・クラウド移行事例のご紹介Attunityのソリューションと異種データベース・クラウド移行事例のご紹介
Attunityのソリューションと異種データベース・クラウド移行事例のご紹介Insight Technology, Inc.
 
[de:code 2019 振り返り Night!] Data Platform
[de:code 2019 振り返り Night!] Data Platform[de:code 2019 振り返り Night!] Data Platform
[de:code 2019 振り返り Night!] Data PlatformNaoki (Neo) SATO
 
Attunity社のソリューションの日本国内外適用事例及びロードマップ紹介[ATTUNITY & インサイトテクノロジー IoT / Big Data フ...
Attunity社のソリューションの日本国内外適用事例及びロードマップ紹介[ATTUNITY & インサイトテクノロジー IoT / Big Data フ...Attunity社のソリューションの日本国内外適用事例及びロードマップ紹介[ATTUNITY & インサイトテクノロジー IoT / Big Data フ...
Attunity社のソリューションの日本国内外適用事例及びロードマップ紹介[ATTUNITY & インサイトテクノロジー IoT / Big Data フ...Insight Technology, Inc.
 
Talend 2013年概要
Talend 2013年概要Talend 2013年概要
Talend 2013年概要Talend KK
 
DX実践!~ビジネスアジリティ向上とマイクロサービス技術GraphQLの活用~(NTTデータ テクノロジーカンファレンス 2020 発表資料)
DX実践!~ビジネスアジリティ向上とマイクロサービス技術GraphQLの活用~(NTTデータ テクノロジーカンファレンス 2020 発表資料)DX実践!~ビジネスアジリティ向上とマイクロサービス技術GraphQLの活用~(NTTデータ テクノロジーカンファレンス 2020 発表資料)
DX実践!~ビジネスアジリティ向上とマイクロサービス技術GraphQLの活用~(NTTデータ テクノロジーカンファレンス 2020 発表資料)NTT DATA Technology & Innovation
 
Datalake最新情報セミナー
Datalake最新情報セミナーDatalake最新情報セミナー
Datalake最新情報セミナーmtanaka0111
 
避けては通れないビッグデータ周辺の重要課題
避けては通れないビッグデータ周辺の重要課題避けては通れないビッグデータ周辺の重要課題
避けては通れないビッグデータ周辺の重要課題kurikiyo
 
基調講演「データのグループウェア化」
基調講演「データのグループウェア化」基調講演「データのグループウェア化」
基調講演「データのグループウェア化」Cybozucommunity
 
【de:code 2020】 Power Platform で広がるデータ インテグレーションの世界 (1/2)
【de:code 2020】 Power Platform で広がるデータ インテグレーションの世界 (1/2)【de:code 2020】 Power Platform で広がるデータ インテグレーションの世界 (1/2)
【de:code 2020】 Power Platform で広がるデータ インテグレーションの世界 (1/2)日本マイクロソフト株式会社
 
DeNA のデータ活用を支える BigQuery データの民主化とガバナンス強化の軌跡 | Google Cloud INSIDE Games & App...
DeNA のデータ活用を支える BigQuery データの民主化とガバナンス強化の軌跡 | Google Cloud INSIDE Games & App...DeNA のデータ活用を支える BigQuery データの民主化とガバナンス強化の軌跡 | Google Cloud INSIDE Games & App...
DeNA のデータ活用を支える BigQuery データの民主化とガバナンス強化の軌跡 | Google Cloud INSIDE Games & App...Google Cloud Platform - Japan
 
データファブリックによるトランザクションの速度でアナリティクスを提供
データファブリックによるトランザクションの速度でアナリティクスを提供データファブリックによるトランザクションの速度でアナリティクスを提供
データファブリックによるトランザクションの速度でアナリティクスを提供Denodo
 
データを事業に活かすために必要なデータ基盤とは
データを事業に活かすために必要なデータ基盤とはデータを事業に活かすために必要なデータ基盤とは
データを事業に活かすために必要なデータ基盤とはgriddb
 
【Webinar-Slide】Talend2012年の戦略
【Webinar-Slide】Talend2012年の戦略【Webinar-Slide】Talend2012年の戦略
【Webinar-Slide】Talend2012年の戦略Talend KK
 
社内外のデータを徹底的に活用する!
社内外のデータを徹底的に活用する!社内外のデータを徹底的に活用する!
社内外のデータを徹底的に活用する!Talend KK
 
新時代のITインフラ -技術トレンドとユーザー企業の構え- (20100512)
新時代のITインフラ -技術トレンドとユーザー企業の構え- (20100512)新時代のITインフラ -技術トレンドとユーザー企業の構え- (20100512)
新時代のITインフラ -技術トレンドとユーザー企業の構え- (20100512)Jun Kawahara
 
ノーツが日本を救う(2002/3/13)
ノーツが日本を救う(2002/3/13)ノーツが日本を救う(2002/3/13)
ノーツが日本を救う(2002/3/13)伸夫 森本
 
IOT and Lean Manifacturing
IOT and Lean ManifacturingIOT and Lean Manifacturing
IOT and Lean ManifacturingOsaka University
 

Similar a データ活用を俊敏に進めるためのDataOps実践方法とその高度化のためのナレッジグラフ活用の取り組み(NTTデータ テクノロジーカンファレンス 2020 発表資料) (20)

NTTデータが考えるデータ基盤の次の一手 ~AI活用のために知っておくべき新潮流とは?~(NTTデータ テクノロジーカンファレンス 2020 発表資料)
NTTデータが考えるデータ基盤の次の一手 ~AI活用のために知っておくべき新潮流とは?~(NTTデータ テクノロジーカンファレンス 2020 発表資料)NTTデータが考えるデータ基盤の次の一手 ~AI活用のために知っておくべき新潮流とは?~(NTTデータ テクノロジーカンファレンス 2020 発表資料)
NTTデータが考えるデータ基盤の次の一手 ~AI活用のために知っておくべき新潮流とは?~(NTTデータ テクノロジーカンファレンス 2020 発表資料)
 
Open Cloud Innovation2016 day1(これからのデータ分析者とエンジニアに必要なdatascienceexperienceツールと...
Open Cloud Innovation2016 day1(これからのデータ分析者とエンジニアに必要なdatascienceexperienceツールと...Open Cloud Innovation2016 day1(これからのデータ分析者とエンジニアに必要なdatascienceexperienceツールと...
Open Cloud Innovation2016 day1(これからのデータ分析者とエンジニアに必要なdatascienceexperienceツールと...
 
Attunityのソリューションと異種データベース・クラウド移行事例のご紹介
Attunityのソリューションと異種データベース・クラウド移行事例のご紹介Attunityのソリューションと異種データベース・クラウド移行事例のご紹介
Attunityのソリューションと異種データベース・クラウド移行事例のご紹介
 
[de:code 2019 振り返り Night!] Data Platform
[de:code 2019 振り返り Night!] Data Platform[de:code 2019 振り返り Night!] Data Platform
[de:code 2019 振り返り Night!] Data Platform
 
Attunity社のソリューションの日本国内外適用事例及びロードマップ紹介[ATTUNITY & インサイトテクノロジー IoT / Big Data フ...
Attunity社のソリューションの日本国内外適用事例及びロードマップ紹介[ATTUNITY & インサイトテクノロジー IoT / Big Data フ...Attunity社のソリューションの日本国内外適用事例及びロードマップ紹介[ATTUNITY & インサイトテクノロジー IoT / Big Data フ...
Attunity社のソリューションの日本国内外適用事例及びロードマップ紹介[ATTUNITY & インサイトテクノロジー IoT / Big Data フ...
 
Talend 2013年概要
Talend 2013年概要Talend 2013年概要
Talend 2013年概要
 
DX実践!~ビジネスアジリティ向上とマイクロサービス技術GraphQLの活用~(NTTデータ テクノロジーカンファレンス 2020 発表資料)
DX実践!~ビジネスアジリティ向上とマイクロサービス技術GraphQLの活用~(NTTデータ テクノロジーカンファレンス 2020 発表資料)DX実践!~ビジネスアジリティ向上とマイクロサービス技術GraphQLの活用~(NTTデータ テクノロジーカンファレンス 2020 発表資料)
DX実践!~ビジネスアジリティ向上とマイクロサービス技術GraphQLの活用~(NTTデータ テクノロジーカンファレンス 2020 発表資料)
 
Datalake最新情報セミナー
Datalake最新情報セミナーDatalake最新情報セミナー
Datalake最新情報セミナー
 
避けては通れないビッグデータ周辺の重要課題
避けては通れないビッグデータ周辺の重要課題避けては通れないビッグデータ周辺の重要課題
避けては通れないビッグデータ周辺の重要課題
 
基調講演「データのグループウェア化」
基調講演「データのグループウェア化」基調講演「データのグループウェア化」
基調講演「データのグループウェア化」
 
【de:code 2020】 Power Platform で広がるデータ インテグレーションの世界 (1/2)
【de:code 2020】 Power Platform で広がるデータ インテグレーションの世界 (1/2)【de:code 2020】 Power Platform で広がるデータ インテグレーションの世界 (1/2)
【de:code 2020】 Power Platform で広がるデータ インテグレーションの世界 (1/2)
 
DeNA のデータ活用を支える BigQuery データの民主化とガバナンス強化の軌跡 | Google Cloud INSIDE Games & App...
DeNA のデータ活用を支える BigQuery データの民主化とガバナンス強化の軌跡 | Google Cloud INSIDE Games & App...DeNA のデータ活用を支える BigQuery データの民主化とガバナンス強化の軌跡 | Google Cloud INSIDE Games & App...
DeNA のデータ活用を支える BigQuery データの民主化とガバナンス強化の軌跡 | Google Cloud INSIDE Games & App...
 
データファブリックによるトランザクションの速度でアナリティクスを提供
データファブリックによるトランザクションの速度でアナリティクスを提供データファブリックによるトランザクションの速度でアナリティクスを提供
データファブリックによるトランザクションの速度でアナリティクスを提供
 
データを事業に活かすために必要なデータ基盤とは
データを事業に活かすために必要なデータ基盤とはデータを事業に活かすために必要なデータ基盤とは
データを事業に活かすために必要なデータ基盤とは
 
【Webinar-Slide】Talend2012年の戦略
【Webinar-Slide】Talend2012年の戦略【Webinar-Slide】Talend2012年の戦略
【Webinar-Slide】Talend2012年の戦略
 
社内外のデータを徹底的に活用する!
社内外のデータを徹底的に活用する!社内外のデータを徹底的に活用する!
社内外のデータを徹底的に活用する!
 
新時代のITインフラ -技術トレンドとユーザー企業の構え- (20100512)
新時代のITインフラ -技術トレンドとユーザー企業の構え- (20100512)新時代のITインフラ -技術トレンドとユーザー企業の構え- (20100512)
新時代のITインフラ -技術トレンドとユーザー企業の構え- (20100512)
 
Strata conference 2012
Strata conference 2012Strata conference 2012
Strata conference 2012
 
ノーツが日本を救う(2002/3/13)
ノーツが日本を救う(2002/3/13)ノーツが日本を救う(2002/3/13)
ノーツが日本を救う(2002/3/13)
 
IOT and Lean Manifacturing
IOT and Lean ManifacturingIOT and Lean Manifacturing
IOT and Lean Manifacturing
 

Más de NTT DATA Technology & Innovation

OSSデータベースの開発コミュニティに参加しよう! (DEIM2024 発表資料)
OSSデータベースの開発コミュニティに参加しよう! (DEIM2024 発表資料)OSSデータベースの開発コミュニティに参加しよう! (DEIM2024 発表資料)
OSSデータベースの開発コミュニティに参加しよう! (DEIM2024 発表資料)NTT DATA Technology & Innovation
 
COPY FROMで異常データをスキップできるようになった話(第45回 PostgreSQLアンカンファレンス@オンライン 発表資料)
COPY FROMで異常データをスキップできるようになった話(第45回 PostgreSQLアンカンファレンス@オンライン 発表資料)COPY FROMで異常データをスキップできるようになった話(第45回 PostgreSQLアンカンファレンス@オンライン 発表資料)
COPY FROMで異常データをスキップできるようになった話(第45回 PostgreSQLアンカンファレンス@オンライン 発表資料)NTT DATA Technology & Innovation
 
Cloud Skills Challenge 2023 winter 〜Azureを頑張る理由と頑張り方
Cloud Skills Challenge 2023 winter 〜Azureを頑張る理由と頑張り方Cloud Skills Challenge 2023 winter 〜Azureを頑張る理由と頑張り方
Cloud Skills Challenge 2023 winter 〜Azureを頑張る理由と頑張り方NTT DATA Technology & Innovation
 
Unlocking Transformation: Implementing GitOps Practices in Conservative Organ...
Unlocking Transformation: Implementing GitOps Practices in Conservative Organ...Unlocking Transformation: Implementing GitOps Practices in Conservative Organ...
Unlocking Transformation: Implementing GitOps Practices in Conservative Organ...NTT DATA Technology & Innovation
 
Databricksチューニングあれこれ(JEDAI 2023 X‘mas/忘年会 Meetup! LT登壇資料)
Databricksチューニングあれこれ(JEDAI 2023 X‘mas/忘年会 Meetup! LT登壇資料)Databricksチューニングあれこれ(JEDAI 2023 X‘mas/忘年会 Meetup! LT登壇資料)
Databricksチューニングあれこれ(JEDAI 2023 X‘mas/忘年会 Meetup! LT登壇資料)NTT DATA Technology & Innovation
 
詳説探究!Cloud Native Databaseの現在地点(CloudNative Days Tokyo 2023 発表資料)
詳説探究!Cloud Native Databaseの現在地点(CloudNative Days Tokyo 2023 発表資料)詳説探究!Cloud Native Databaseの現在地点(CloudNative Days Tokyo 2023 発表資料)
詳説探究!Cloud Native Databaseの現在地点(CloudNative Days Tokyo 2023 発表資料)NTT DATA Technology & Innovation
 
今、改めて考えるPostgreSQLプラットフォーム - マルチクラウドとポータビリティ -(PostgreSQL Conference Japan 20...
今、改めて考えるPostgreSQLプラットフォーム - マルチクラウドとポータビリティ -(PostgreSQL Conference Japan 20...今、改めて考えるPostgreSQLプラットフォーム - マルチクラウドとポータビリティ -(PostgreSQL Conference Japan 20...
今、改めて考えるPostgreSQLプラットフォーム - マルチクラウドとポータビリティ -(PostgreSQL Conference Japan 20...NTT DATA Technology & Innovation
 
速習! PostgreSQL専用HAソフトウェア: Patroni(PostgreSQL Conference Japan 2023 発表資料)
速習! PostgreSQL専用HAソフトウェア: Patroni(PostgreSQL Conference Japan 2023 発表資料)速習! PostgreSQL専用HAソフトウェア: Patroni(PostgreSQL Conference Japan 2023 発表資料)
速習! PostgreSQL専用HAソフトウェア: Patroni(PostgreSQL Conference Japan 2023 発表資料)NTT DATA Technology & Innovation
 
pgvectorを使ってChatGPTとPostgreSQLを連携してみよう!(PostgreSQL Conference Japan 2023 発表資料)
pgvectorを使ってChatGPTとPostgreSQLを連携してみよう!(PostgreSQL Conference Japan 2023 発表資料)pgvectorを使ってChatGPTとPostgreSQLを連携してみよう!(PostgreSQL Conference Japan 2023 発表資料)
pgvectorを使ってChatGPTとPostgreSQLを連携してみよう!(PostgreSQL Conference Japan 2023 発表資料)NTT DATA Technology & Innovation
 
マネージドPostgreSQLの実現に向けたPostgreSQL機能向上(PostgreSQL Conference Japan 2023 発表資料)
マネージドPostgreSQLの実現に向けたPostgreSQL機能向上(PostgreSQL Conference Japan 2023 発表資料)マネージドPostgreSQLの実現に向けたPostgreSQL機能向上(PostgreSQL Conference Japan 2023 発表資料)
マネージドPostgreSQLの実現に向けたPostgreSQL機能向上(PostgreSQL Conference Japan 2023 発表資料)NTT DATA Technology & Innovation
 
最新機能までを総ざらい!PostgreSQLの注目機能を振り返る(第32回 中国地方DB勉強会 in 岡山 発表資料)
最新機能までを総ざらい!PostgreSQLの注目機能を振り返る(第32回 中国地方DB勉強会 in 岡山 発表資料)最新機能までを総ざらい!PostgreSQLの注目機能を振り返る(第32回 中国地方DB勉強会 in 岡山 発表資料)
最新機能までを総ざらい!PostgreSQLの注目機能を振り返る(第32回 中国地方DB勉強会 in 岡山 発表資料)NTT DATA Technology & Innovation
 
PostgreSQLのバグとの付き合い方 ~バグの調査からコミュニティへの報告、修正パッチ投稿まで~(Open Source Conference 202...
PostgreSQLのバグとの付き合い方 ~バグの調査からコミュニティへの報告、修正パッチ投稿まで~(Open Source Conference 202...PostgreSQLのバグとの付き合い方 ~バグの調査からコミュニティへの報告、修正パッチ投稿まで~(Open Source Conference 202...
PostgreSQLのバグとの付き合い方 ~バグの調査からコミュニティへの報告、修正パッチ投稿まで~(Open Source Conference 202...NTT DATA Technology & Innovation
 
骨抜きアジャイルの骨を生み出す 〜私(スクラムマスター)のXP学習記録〜(XP祭り2023 発表資料)
骨抜きアジャイルの骨を生み出す 〜私(スクラムマスター)のXP学習記録〜(XP祭り2023 発表資料)骨抜きアジャイルの骨を生み出す 〜私(スクラムマスター)のXP学習記録〜(XP祭り2023 発表資料)
骨抜きアジャイルの骨を生み出す 〜私(スクラムマスター)のXP学習記録〜(XP祭り2023 発表資料)NTT DATA Technology & Innovation
 
機械学習モデルを REST API としてサービングするシステム開発における上流プロセスの絞り込みと効果検証(PM学会2023年度秋季研究発表大会 発表資料)
機械学習モデルを REST API としてサービングするシステム開発における上流プロセスの絞り込みと効果検証(PM学会2023年度秋季研究発表大会 発表資料)機械学習モデルを REST API としてサービングするシステム開発における上流プロセスの絞り込みと効果検証(PM学会2023年度秋季研究発表大会 発表資料)
機械学習モデルを REST API としてサービングするシステム開発における上流プロセスの絞り込みと効果検証(PM学会2023年度秋季研究発表大会 発表資料)NTT DATA Technology & Innovation
 
ChatGPTのデータソースにPostgreSQLを使う[詳細版](オープンデベロッパーズカンファレンス2023 発表資料)
ChatGPTのデータソースにPostgreSQLを使う[詳細版](オープンデベロッパーズカンファレンス2023 発表資料)ChatGPTのデータソースにPostgreSQLを使う[詳細版](オープンデベロッパーズカンファレンス2023 発表資料)
ChatGPTのデータソースにPostgreSQLを使う[詳細版](オープンデベロッパーズカンファレンス2023 発表資料)NTT DATA Technology & Innovation
 
PostgreSQL on Kubernetes: Realizing High Availability with PGO (Postgres Ibiz...
PostgreSQL on Kubernetes: Realizing High Availability with PGO (Postgres Ibiz...PostgreSQL on Kubernetes: Realizing High Availability with PGO (Postgres Ibiz...
PostgreSQL on Kubernetes: Realizing High Availability with PGO (Postgres Ibiz...NTT DATA Technology & Innovation
 
オンプレミス回帰の動きに備えよ ~クラウドの手法をオンプレミスでも実現するには~(CloudNative Days Fukuoka 2023 発表資料)
オンプレミス回帰の動きに備えよ ~クラウドの手法をオンプレミスでも実現するには~(CloudNative Days Fukuoka 2023 発表資料)オンプレミス回帰の動きに備えよ ~クラウドの手法をオンプレミスでも実現するには~(CloudNative Days Fukuoka 2023 発表資料)
オンプレミス回帰の動きに備えよ ~クラウドの手法をオンプレミスでも実現するには~(CloudNative Days Fukuoka 2023 発表資料)NTT DATA Technology & Innovation
 
Prometheus Operator 入門(Kubernetes Novice Tokyo #26 発表資料)
Prometheus Operator 入門(Kubernetes Novice Tokyo #26 発表資料)Prometheus Operator 入門(Kubernetes Novice Tokyo #26 発表資料)
Prometheus Operator 入門(Kubernetes Novice Tokyo #26 発表資料)NTT DATA Technology & Innovation
 
ChatGPTのデータソースにPostgreSQLを使う(第42回PostgreSQLアンカンファレンス@オンライン 発表資料)
ChatGPTのデータソースにPostgreSQLを使う(第42回PostgreSQLアンカンファレンス@オンライン 発表資料)ChatGPTのデータソースにPostgreSQLを使う(第42回PostgreSQLアンカンファレンス@オンライン 発表資料)
ChatGPTのデータソースにPostgreSQLを使う(第42回PostgreSQLアンカンファレンス@オンライン 発表資料)NTT DATA Technology & Innovation
 
PGCon 2023 参加報告(第42回PostgreSQLアンカンファレンス@オンライン 発表資料)
PGCon 2023 参加報告(第42回PostgreSQLアンカンファレンス@オンライン 発表資料)PGCon 2023 参加報告(第42回PostgreSQLアンカンファレンス@オンライン 発表資料)
PGCon 2023 参加報告(第42回PostgreSQLアンカンファレンス@オンライン 発表資料)NTT DATA Technology & Innovation
 

Más de NTT DATA Technology & Innovation (20)

OSSデータベースの開発コミュニティに参加しよう! (DEIM2024 発表資料)
OSSデータベースの開発コミュニティに参加しよう! (DEIM2024 発表資料)OSSデータベースの開発コミュニティに参加しよう! (DEIM2024 発表資料)
OSSデータベースの開発コミュニティに参加しよう! (DEIM2024 発表資料)
 
COPY FROMで異常データをスキップできるようになった話(第45回 PostgreSQLアンカンファレンス@オンライン 発表資料)
COPY FROMで異常データをスキップできるようになった話(第45回 PostgreSQLアンカンファレンス@オンライン 発表資料)COPY FROMで異常データをスキップできるようになった話(第45回 PostgreSQLアンカンファレンス@オンライン 発表資料)
COPY FROMで異常データをスキップできるようになった話(第45回 PostgreSQLアンカンファレンス@オンライン 発表資料)
 
Cloud Skills Challenge 2023 winter 〜Azureを頑張る理由と頑張り方
Cloud Skills Challenge 2023 winter 〜Azureを頑張る理由と頑張り方Cloud Skills Challenge 2023 winter 〜Azureを頑張る理由と頑張り方
Cloud Skills Challenge 2023 winter 〜Azureを頑張る理由と頑張り方
 
Unlocking Transformation: Implementing GitOps Practices in Conservative Organ...
Unlocking Transformation: Implementing GitOps Practices in Conservative Organ...Unlocking Transformation: Implementing GitOps Practices in Conservative Organ...
Unlocking Transformation: Implementing GitOps Practices in Conservative Organ...
 
Databricksチューニングあれこれ(JEDAI 2023 X‘mas/忘年会 Meetup! LT登壇資料)
Databricksチューニングあれこれ(JEDAI 2023 X‘mas/忘年会 Meetup! LT登壇資料)Databricksチューニングあれこれ(JEDAI 2023 X‘mas/忘年会 Meetup! LT登壇資料)
Databricksチューニングあれこれ(JEDAI 2023 X‘mas/忘年会 Meetup! LT登壇資料)
 
詳説探究!Cloud Native Databaseの現在地点(CloudNative Days Tokyo 2023 発表資料)
詳説探究!Cloud Native Databaseの現在地点(CloudNative Days Tokyo 2023 発表資料)詳説探究!Cloud Native Databaseの現在地点(CloudNative Days Tokyo 2023 発表資料)
詳説探究!Cloud Native Databaseの現在地点(CloudNative Days Tokyo 2023 発表資料)
 
今、改めて考えるPostgreSQLプラットフォーム - マルチクラウドとポータビリティ -(PostgreSQL Conference Japan 20...
今、改めて考えるPostgreSQLプラットフォーム - マルチクラウドとポータビリティ -(PostgreSQL Conference Japan 20...今、改めて考えるPostgreSQLプラットフォーム - マルチクラウドとポータビリティ -(PostgreSQL Conference Japan 20...
今、改めて考えるPostgreSQLプラットフォーム - マルチクラウドとポータビリティ -(PostgreSQL Conference Japan 20...
 
速習! PostgreSQL専用HAソフトウェア: Patroni(PostgreSQL Conference Japan 2023 発表資料)
速習! PostgreSQL専用HAソフトウェア: Patroni(PostgreSQL Conference Japan 2023 発表資料)速習! PostgreSQL専用HAソフトウェア: Patroni(PostgreSQL Conference Japan 2023 発表資料)
速習! PostgreSQL専用HAソフトウェア: Patroni(PostgreSQL Conference Japan 2023 発表資料)
 
pgvectorを使ってChatGPTとPostgreSQLを連携してみよう!(PostgreSQL Conference Japan 2023 発表資料)
pgvectorを使ってChatGPTとPostgreSQLを連携してみよう!(PostgreSQL Conference Japan 2023 発表資料)pgvectorを使ってChatGPTとPostgreSQLを連携してみよう!(PostgreSQL Conference Japan 2023 発表資料)
pgvectorを使ってChatGPTとPostgreSQLを連携してみよう!(PostgreSQL Conference Japan 2023 発表資料)
 
マネージドPostgreSQLの実現に向けたPostgreSQL機能向上(PostgreSQL Conference Japan 2023 発表資料)
マネージドPostgreSQLの実現に向けたPostgreSQL機能向上(PostgreSQL Conference Japan 2023 発表資料)マネージドPostgreSQLの実現に向けたPostgreSQL機能向上(PostgreSQL Conference Japan 2023 発表資料)
マネージドPostgreSQLの実現に向けたPostgreSQL機能向上(PostgreSQL Conference Japan 2023 発表資料)
 
最新機能までを総ざらい!PostgreSQLの注目機能を振り返る(第32回 中国地方DB勉強会 in 岡山 発表資料)
最新機能までを総ざらい!PostgreSQLの注目機能を振り返る(第32回 中国地方DB勉強会 in 岡山 発表資料)最新機能までを総ざらい!PostgreSQLの注目機能を振り返る(第32回 中国地方DB勉強会 in 岡山 発表資料)
最新機能までを総ざらい!PostgreSQLの注目機能を振り返る(第32回 中国地方DB勉強会 in 岡山 発表資料)
 
PostgreSQLのバグとの付き合い方 ~バグの調査からコミュニティへの報告、修正パッチ投稿まで~(Open Source Conference 202...
PostgreSQLのバグとの付き合い方 ~バグの調査からコミュニティへの報告、修正パッチ投稿まで~(Open Source Conference 202...PostgreSQLのバグとの付き合い方 ~バグの調査からコミュニティへの報告、修正パッチ投稿まで~(Open Source Conference 202...
PostgreSQLのバグとの付き合い方 ~バグの調査からコミュニティへの報告、修正パッチ投稿まで~(Open Source Conference 202...
 
骨抜きアジャイルの骨を生み出す 〜私(スクラムマスター)のXP学習記録〜(XP祭り2023 発表資料)
骨抜きアジャイルの骨を生み出す 〜私(スクラムマスター)のXP学習記録〜(XP祭り2023 発表資料)骨抜きアジャイルの骨を生み出す 〜私(スクラムマスター)のXP学習記録〜(XP祭り2023 発表資料)
骨抜きアジャイルの骨を生み出す 〜私(スクラムマスター)のXP学習記録〜(XP祭り2023 発表資料)
 
機械学習モデルを REST API としてサービングするシステム開発における上流プロセスの絞り込みと効果検証(PM学会2023年度秋季研究発表大会 発表資料)
機械学習モデルを REST API としてサービングするシステム開発における上流プロセスの絞り込みと効果検証(PM学会2023年度秋季研究発表大会 発表資料)機械学習モデルを REST API としてサービングするシステム開発における上流プロセスの絞り込みと効果検証(PM学会2023年度秋季研究発表大会 発表資料)
機械学習モデルを REST API としてサービングするシステム開発における上流プロセスの絞り込みと効果検証(PM学会2023年度秋季研究発表大会 発表資料)
 
ChatGPTのデータソースにPostgreSQLを使う[詳細版](オープンデベロッパーズカンファレンス2023 発表資料)
ChatGPTのデータソースにPostgreSQLを使う[詳細版](オープンデベロッパーズカンファレンス2023 発表資料)ChatGPTのデータソースにPostgreSQLを使う[詳細版](オープンデベロッパーズカンファレンス2023 発表資料)
ChatGPTのデータソースにPostgreSQLを使う[詳細版](オープンデベロッパーズカンファレンス2023 発表資料)
 
PostgreSQL on Kubernetes: Realizing High Availability with PGO (Postgres Ibiz...
PostgreSQL on Kubernetes: Realizing High Availability with PGO (Postgres Ibiz...PostgreSQL on Kubernetes: Realizing High Availability with PGO (Postgres Ibiz...
PostgreSQL on Kubernetes: Realizing High Availability with PGO (Postgres Ibiz...
 
オンプレミス回帰の動きに備えよ ~クラウドの手法をオンプレミスでも実現するには~(CloudNative Days Fukuoka 2023 発表資料)
オンプレミス回帰の動きに備えよ ~クラウドの手法をオンプレミスでも実現するには~(CloudNative Days Fukuoka 2023 発表資料)オンプレミス回帰の動きに備えよ ~クラウドの手法をオンプレミスでも実現するには~(CloudNative Days Fukuoka 2023 発表資料)
オンプレミス回帰の動きに備えよ ~クラウドの手法をオンプレミスでも実現するには~(CloudNative Days Fukuoka 2023 発表資料)
 
Prometheus Operator 入門(Kubernetes Novice Tokyo #26 発表資料)
Prometheus Operator 入門(Kubernetes Novice Tokyo #26 発表資料)Prometheus Operator 入門(Kubernetes Novice Tokyo #26 発表資料)
Prometheus Operator 入門(Kubernetes Novice Tokyo #26 発表資料)
 
ChatGPTのデータソースにPostgreSQLを使う(第42回PostgreSQLアンカンファレンス@オンライン 発表資料)
ChatGPTのデータソースにPostgreSQLを使う(第42回PostgreSQLアンカンファレンス@オンライン 発表資料)ChatGPTのデータソースにPostgreSQLを使う(第42回PostgreSQLアンカンファレンス@オンライン 発表資料)
ChatGPTのデータソースにPostgreSQLを使う(第42回PostgreSQLアンカンファレンス@オンライン 発表資料)
 
PGCon 2023 参加報告(第42回PostgreSQLアンカンファレンス@オンライン 発表資料)
PGCon 2023 参加報告(第42回PostgreSQLアンカンファレンス@オンライン 発表資料)PGCon 2023 参加報告(第42回PostgreSQLアンカンファレンス@オンライン 発表資料)
PGCon 2023 参加報告(第42回PostgreSQLアンカンファレンス@オンライン 発表資料)
 

Último

UPWARD_share_company_information_20240415.pdf
UPWARD_share_company_information_20240415.pdfUPWARD_share_company_information_20240415.pdf
UPWARD_share_company_information_20240415.pdffurutsuka
 
20240412_HCCJP での Windows Server 2025 Active Directory
20240412_HCCJP での Windows Server 2025 Active Directory20240412_HCCJP での Windows Server 2025 Active Directory
20240412_HCCJP での Windows Server 2025 Active Directoryosamut
 
[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略
[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略
[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略Ryo Sasaki
 
IoT in the era of generative AI, Thanks IoT ALGYAN.pptx
IoT in the era of generative AI, Thanks IoT ALGYAN.pptxIoT in the era of generative AI, Thanks IoT ALGYAN.pptx
IoT in the era of generative AI, Thanks IoT ALGYAN.pptxAtomu Hidaka
 
Amazon SES を勉強してみる その12024/04/12の勉強会で発表されたものです。
Amazon SES を勉強してみる その12024/04/12の勉強会で発表されたものです。Amazon SES を勉強してみる その12024/04/12の勉強会で発表されたものです。
Amazon SES を勉強してみる その12024/04/12の勉強会で発表されたものです。iPride Co., Ltd.
 
新人研修のまとめ 2024/04/12の勉強会で発表されたものです。
新人研修のまとめ       2024/04/12の勉強会で発表されたものです。新人研修のまとめ       2024/04/12の勉強会で発表されたものです。
新人研修のまとめ 2024/04/12の勉強会で発表されたものです。iPride Co., Ltd.
 
スマートフォンを用いた新生児あやし動作の教示システム
スマートフォンを用いた新生児あやし動作の教示システムスマートフォンを用いた新生児あやし動作の教示システム
スマートフォンを用いた新生児あやし動作の教示システムsugiuralab
 
PHP-Conference-Odawara-2024-04-000000000
PHP-Conference-Odawara-2024-04-000000000PHP-Conference-Odawara-2024-04-000000000
PHP-Conference-Odawara-2024-04-000000000Shota Ito
 
Postman LT Fukuoka_Quick Prototype_By Daniel
Postman LT Fukuoka_Quick Prototype_By DanielPostman LT Fukuoka_Quick Prototype_By Daniel
Postman LT Fukuoka_Quick Prototype_By Danieldanielhu54
 

Último (9)

UPWARD_share_company_information_20240415.pdf
UPWARD_share_company_information_20240415.pdfUPWARD_share_company_information_20240415.pdf
UPWARD_share_company_information_20240415.pdf
 
20240412_HCCJP での Windows Server 2025 Active Directory
20240412_HCCJP での Windows Server 2025 Active Directory20240412_HCCJP での Windows Server 2025 Active Directory
20240412_HCCJP での Windows Server 2025 Active Directory
 
[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略
[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略
[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略
 
IoT in the era of generative AI, Thanks IoT ALGYAN.pptx
IoT in the era of generative AI, Thanks IoT ALGYAN.pptxIoT in the era of generative AI, Thanks IoT ALGYAN.pptx
IoT in the era of generative AI, Thanks IoT ALGYAN.pptx
 
Amazon SES を勉強してみる その12024/04/12の勉強会で発表されたものです。
Amazon SES を勉強してみる その12024/04/12の勉強会で発表されたものです。Amazon SES を勉強してみる その12024/04/12の勉強会で発表されたものです。
Amazon SES を勉強してみる その12024/04/12の勉強会で発表されたものです。
 
新人研修のまとめ 2024/04/12の勉強会で発表されたものです。
新人研修のまとめ       2024/04/12の勉強会で発表されたものです。新人研修のまとめ       2024/04/12の勉強会で発表されたものです。
新人研修のまとめ 2024/04/12の勉強会で発表されたものです。
 
スマートフォンを用いた新生児あやし動作の教示システム
スマートフォンを用いた新生児あやし動作の教示システムスマートフォンを用いた新生児あやし動作の教示システム
スマートフォンを用いた新生児あやし動作の教示システム
 
PHP-Conference-Odawara-2024-04-000000000
PHP-Conference-Odawara-2024-04-000000000PHP-Conference-Odawara-2024-04-000000000
PHP-Conference-Odawara-2024-04-000000000
 
Postman LT Fukuoka_Quick Prototype_By Daniel
Postman LT Fukuoka_Quick Prototype_By DanielPostman LT Fukuoka_Quick Prototype_By Daniel
Postman LT Fukuoka_Quick Prototype_By Daniel
 

データ活用を俊敏に進めるためのDataOps実践方法とその高度化のためのナレッジグラフ活用の取り組み(NTTデータ テクノロジーカンファレンス 2020 発表資料)

  • 1. © 2020 NTT DATA Corporation 1 © 2020 NTT DATA Corporation NTTデータ テクノロジーカンファレンス 2020 データ活用を俊敏に進めるためのDataOps実践方法と その高度化のためのナレッジグラフ活用の取り組み 2020年10月14日 株式会社NTTデータ デジタル技術部 八木香充 / 大山真実
  • 2. © 2020 NTT DATA Corporation DXからDataOpsへ 2
  • 3. © 2020 NTT DATA Corporation 3 DX(デジタルトランスフォーメーション)とは? 現行 ビジネス デジタル ビジネス DX アプリケーション モダナイズ データ活用
  • 4. © 2020 NTT DATA Corporation 4 DataOpsはシステム化フェーズで特に重要になる MLOps MLOps MLOps DataOps DataOps 実証実験(PoC)フェーズ システム化フェーズ 基幹系更改フェーズ 一部データでスピーディーに 低コストで繰り返しモデル開発 全量データをスピーディーにモデ ルに供給するシステムを開発 データ構造を最適化するため 既存APをモダナイズ データをいかに素早く分析側に 供給できるかが重要なポイント データ活用基盤への素早いデータ供 給のために既存アプリケーションの モダナイズが必要 データ活用 アプリケーションモダナイズ アプリケーション モダナイズ
  • 5. © 2020 NTT DATA Corporation DataOpsとは? 5
  • 6. © 2020 NTT DATA Corporation 6 データを活用できている企業は少ない データを全社的に利活用できている日本企業は 20% (※1) 利活用 できている (※1)https://www.gartner.com/jp/newsroom/press-releases/pr-20190527 DataOps が有効な武器のひとつ
  • 7. © 2020 NTT DATA Corporation 7 DataOpsの定義 組織全体のデータ管理者とデータ消費者の間のデータフローの コミュニケーション、統合、自動化を改善することに 焦点を当てた協調的なデータ管理手法(※) (※)https://www.gartner.com/en/information-technology/glossary/dataops
  • 8. © 2020 NTT DATA Corporation 8 DataOpsは、情報系と何がちがうのか? データ量 分析内容 定型 非定型 情報系 少 多 DataOps 双方向性 データ分析者が必要としているデータを供給す るため、データ分析者からのフィードバックを重 要視する。 スピード データ分析者の要望をこまめに取り入れるため、 すばやい構築を行う。
  • 9. © 2020 NTT DATA Corporation 9 DataOpsの登場人物 データエンジニア データスチュワード データサイエンティスト データ共有のパイプラインを構築し、メン テナンスを行うエンジニア。 データエンジニアとデータサイエンティスト をつなぐコミュニケーター。データガバナン スに関する責任者でもある。 統計や機械学習を駆使して、データを 分析しビジネスに貢献する。 DataOpsで特に重要な役割
  • 10. © 2020 NTT DATA Corporation データスチュワードによる DataOpsの実践 10
  • 11. © 2020 NTT DATA Corporation 11 NTTデータが考えるDataOpsとは? スピード 双方性 目的意識 Oneチーム SE、データエンジニア、機械学習エ ンジニア、データサイエンティストが 1つチームとなり、データスチュワー ドを中心としてDataOpsを実現す る必要がある。 データ供給者側も、データ分析者 の目的を意識しながら、データ供 給基盤を構築しないと、手段と目 的が入れ替わる危険がある。
  • 12. © 2020 NTT DATA Corporation 12 DataOps実現へのロードマップ レベル1 古いDWHが乱立して おり、分析もアドホック に実施されている。 レベル2 レベル3 データがサイロ化 手動で データを整理・統合 自動で データを整理・統合 データスチュワードが中 心となり、データ統合 を進めている。 自然言語処理やグラ フテクノロジーを使って データ統合を自動化。 DataOps オントロジー NLP PoC データスチュワード まずはここをめざす
  • 13. © 2020 NTT DATA Corporation 13 よくあるデータ分析基盤 見えていない領域 データ加工 DWH1 DM1 システム A DM2 システム B データサイエンティスト A データサイエンティスト B 分析基盤 B 分析基盤 A
  • 14. © 2020 NTT DATA Corporation 14 【レベル1】 各所でサイロ化が進んでいる 見えていない領域 データ加工 DWH1 DM1 システム A DM2 システム B データサイエンティスト A データサイエンティスト B 分析基盤 B 分析基盤 A システム間のサイロ化 上流-下流のサイロ化
  • 15. © 2020 NTT DATA Corporation 15 【レベル1】 サイロ化に起因してさまざまな課題が発生する 見えていない領域 データ加工 DWH1 DM1 システム A DM2 システム B データサイエンティスト A データサイエンティスト B システムの違い ベンダの違い セキュリティ要件の違い データ活用への意識の違い 加工処理が属人化 分析基盤 B DSとデータエンジニアの連携不足 コミュニケーション不足 コード体系の違い 更新頻度の違い データ品質の違い データに関する問い合わせ窓口なし ベンダの違い 類似処理が放置 仕様が不明確 分析基盤 A システムのデータ変更 紙媒体・Excel 類似データが大量
  • 16. © 2020 NTT DATA Corporation 16 【レベル2】 データスチュワードがまず担当者をつなぐ 見えていない領域 データ加工 DWH1 DM1 システム A DM2 システム B データサイエンティスト A データサイエンティスト B システムの違い ベンダの違い セキュリティ要件の違い データ活用への意識の違い 加工処理が属人化 分析基盤 B DSとデータエンジニアの連携不足 コミュニケーション不足 コード体系の違い 更新頻度の違い データ品質の違い データに関する問い合わせ窓口なし ベンダの違い 類似処理が放置 仕様が不明確 分析基盤 A システムのデータ変更 紙媒体・Excel データスチュワード 最適化 名寄せ 調査 ヒヤリング 類似データが大量
  • 17. © 2020 NTT DATA Corporation 17 【レベル2】 担当者を起点にしてシステムを全方位的につなぐ 見えていない領域 データ加工 DWH1 DM1 システム A DM2 システム B データサイエンティスト A データサイエンティスト B システムの違い ベンダの違い セキュリティ要件の違い データ活用への意識の違い 加工処理が属人化 分析基盤 B DSとデータエンジニアの連携不足 コミュニケーション不足 コード体系の違い 更新頻度の違い データ品質の違い データに関する問い合わせ窓口なし ベンダの違い 類似処理が放置 仕様が不明確 分析基盤 A システムのデータ変更 紙媒体・Excel データスチュワード 最適化 名寄せ 調査 ヒヤリング 類似データが大量
  • 18. © 2020 NTT DATA Corporation 18 DataOps実践のために大事なこと コミュニケーション お客様業務・分析・システムを理 解することで、システムと経営をつ なぎ、組織間のサイロを打破してい く。自律的な働きが重要。 標準化→自動化 データスチュワードによって暗黙知 の形式知化をすすめ、さらに標準 化から自動化することで人的作業 を縮小していく。 品質の維持 データ品質・サービス品質を維持 するため、定量的監視を行う。 特に業務要件に近いものは、ド キュメンテーションにより理解を促進 する取り組みも重要。
  • 19. © 2020 NTT DATA Corporation 19 ここまでのまとめ レベル1 古いDWHが乱立して おり、分析もアドホック に実施されている。 レベル2 レベル3 データがサイロ化 手動で データを整理・統合 自動で データを整理・統合 データスチュワードが中 心となり、データ統合 を進めている。 自然言語処理やグラ フテクノロジーを使って データ統合を自動化。 DataOps オントロジー NLP PoC データスチュワード ここまでのおはなし
  • 20. © 2020 NTT DATA Corporation 20 ここまでのまとめ ここからのおはなし レベル1 古いDWHが乱立して おり、分析もアドホック に実施されている。 レベル2 レベル3 データがサイロ化 手動で データを整理・統合 自動で データを整理・統合 データスチュワードが中 心となり、データ統合 を進めている。 自然言語処理やグラ フテクノロジーを使って データ統合を自動化。 DataOps オントロジー NLP PoC データスチュワード
  • 21. © 2020 NTT DATA Corporation ナレッジグラフによる メタデータ活用の取り組み 21
  • 22. © 2020 NTT DATA Corporation 22 © 2020 NTT DATA Corporation 22 データスチュワード業務の効率化・高度化を目指して IT部門 DB, DWH, ETLなど IT部門エンジニア 事業部B ビジネスユーザ 事業部A ビジネスユーザ ・・・ データスチュワード
  • 23. © 2020 NTT DATA Corporation 23 © 2020 NTT DATA Corporation 23 データスチュワード業務の効率化・高度化を目指して IT部門 DB, DWH, ETLなど IT部門エンジニア 事業部B ビジネスユーザ 事業部A ビジネスユーザ ・・・ データスチュワード 現状の理解  ヒヤリング  ドキュメント調査
  • 24. © 2020 NTT DATA Corporation 24 © 2020 NTT DATA Corporation 24 データスチュワード業務の効率化・高度化を目指して IT部門 DB, DWH, ETLなど IT部門エンジニア 事業部B ビジネスユーザ 事業部A ビジネスユーザ ・・・ データスチュワード 現状の理解  ヒヤリング  ドキュメント調査 あるべき姿の提案とそのための作業  新たなデータ活用の提案  データの処理と配置の最適化
  • 25. © 2020 NTT DATA Corporation 25 © 2020 NTT DATA Corporation 25 DB, DWH, ETLなど IT部門エンジニア データスチュワード業務の効率化・高度化を目指して IT部門 事業部B ビジネスユーザ 事業部B ビジネスユーザ ・・・ データスチュワー ド あるべき姿の提案とそのための作業  新たなデータ活用の提案  データの処理と配置の最適化 多くの企業ではシステムとデータの 現状を理解するためのコストが増大している • 多種多様な大量のデータが存在 • ビジネス知識の共有の難しさ 現状の理解  ヒヤリング  ドキュメント調査
  • 26. © 2020 NTT DATA Corporation 26 © 2020 NTT DATA Corporation 26 DB, DWH, ETLなど IT部門エンジニア データスチュワード業務の効率化・高度化を目指して IT部門 事業部B ビジネスユーザ 事業部B ビジネスユーザ ・・・ データスチュワー ド あるべき姿の提案とそのための作業  新たなデータ活用の提案  データの処理と配置の最適化 多くの企業ではシステムとデータの 現状を理解するためのコストが増大している • 多種多様な大量のデータが存在 • ビジネス知識の共有の難しさ 現状の理解  ヒヤリング  ドキュメント調査 ナレッジグラフによるメタデータ活用! これらの課題解決を技術の力で支援したい
  • 27. © 2020 NTT DATA Corporation 27 © 2020 NTT DATA Corporation 27 ナレッジグラフとは? 現実世界の実体(Entity)同士の関係やそれを説明する情報を グラフ構造で表現したもの 人間と機械が理解できる RDF(Resource Description Framework) • W3Cで標準化されている情報の関係をグラフ構 造で表現するための仕組み 機械的に推論することができる OWL(Web ontology language) • W3Cで標準化されているオントロジーを表現す るための仕組み • 階層化された分類や分類同士の関係、それら のルールを機械が理解可能な形で表現する ナレッジグラフの例 http://mowl-power.cs.man.ac.uk/protegeowltutorial/resources/ProtegeOWLTutorialP4_v1_3.pdf
  • 28. © 2020 NTT DATA Corporation 28 © 2020 NTT DATA Corporation 28 NTTデータによるナレッジグラフを中心とした取り組み
  • 29. © 2020 NTT DATA Corporation 29 © 2020 NTT DATA Corporation 29 メタデータとは? データを説明するデータのこと データはメタデータを付与されて始めて人間が理解できるようになる。 Business Metadata Social Metadata Technical Metadata Operational Metadata • 各部署ごとのビジネス知識 例:ビジネス用語集、業務プロセス文書、ドキュメント化さ れていないビジネスノウハウなど • データに関わるステークホルダー同士のコミュニケーション 例:データ分析者によるデータの使いやすさの評価 • 組織外部のデータと組織内部のデータの関係 例:3rdパーティデータに関する情報 • データベースやファイルサーバの設計書、設定ファイル 例:ER図、データベースのスキーマ設計図 • 実際にデータベースやファイルサーバに保存されているメタ データ • データの処理に関わる設計書 例:バッチ処理設計書、ETLフロー設計書 • データ処理の履歴・リソース情報 例:データの変更履歴、ジョブ実行時のパフォーマンス情報
  • 30. © 2020 NTT DATA Corporation 30 © 2020 NTT DATA Corporation 30 メタデータをナレッジグラフとして統合する どこにどのようなデータがあるのか明らかにする  ビジネスの実体(Entity)と物理データを結びつける (例:事業部門Aの「SS-001」のデータが「CSA01」テーブルにあることがわかる) データの価値を明らかにする  データの重要度、価値を理解できる(例:アクセス頻度、データの履歴・用途)  不要/冗長なデータや処理を発見できる
  • 31. © 2020 NTT DATA Corporation 31 © 2020 NTT DATA Corporation 31 ナレッジグラフでデータの流れと価値を可視化する どこにどのようなデータがあるのか明らかにする 最もビジネスに価値をもたらすデータからデータ活用を進めることができる データの処理と配置を最適化してデータ活用基盤のコスト最適化ができる  ビジネスの実体(Entity)と物理データを結びつける (例:事業部門Aの「SS-001」のデータが「CSA01」テーブルにあることがわかる) データの価値を明らかにする  データの重要度、価値を理解できる(例:アクセス頻度、データの用途)  不要/冗長なデータや処理を発見できる
  • 32. © 2020 NTT DATA Corporation 32 © 2020 NTT DATA Corporation 32 ナレッジグラフによるメタデータ活用実現に向けた取り組み メタデータをどのように集めてナレッジグラフに統合するか? 課題
  • 33. © 2020 NTT DATA Corporation 33 © 2020 NTT DATA Corporation 33 ナレッジグラフによるメタデータ活用実現に向けた取り組み メタデータをどのように集めてナレッジグラフに統合するか? 課題 NTTデータによる「データカタログソリューション」 ビジネスメタデータをどのように集めるか?
  • 34. © 2020 NTT DATA Corporation 34 © 2020 NTT DATA Corporation 34 NTTデータによる「データカタログソリューション」 NTTデータ流通サービス事業部の「Data-Driven Catalog」
  • 35. © 2020 NTT DATA Corporation 35 © 2020 NTT DATA Corporation 35 NTTデータによる「データカタログ実践事例」 こちらの発表にぜひご注目ください!
  • 36. © 2020 NTT DATA Corporation 36 © 2020 NTT DATA Corporation 36 ナレッジグラフによるメタデータ活用実現に向けた取り組み メタデータをどのように集めてナレッジグラフに統合するか? 課題 NTTデータによる「データカタログソリューション」 NTT ソフトウェアイノベーションセンタによる「協働型機械学習技術」 ビジネスメタデータをどのように集めるか?
  • 37. © 2020 NTT DATA Corporation 37 © 2020 NTT DATA Corporation 37 NTT ソフトウェアイノベーションセンタによる 「協働型機械学習技術」 こちらの発表にぜひご注目ください!
  • 38. © 2020 NTT DATA Corporation 38 © 2020 NTT DATA Corporation 38 ナレッジグラフによるメタデータ活用実現に向けた取り組み メタデータをどのように集めてナレッジグラフに統合するか? 課題 NTTデータによる「データカタログソリューション」 NTT ソフトウェアイノベーションセンタによる「協働型機械学習技術」 NTTデータによる「ドメイン特化BERT」 ビジネスメタデータをどのように集めるか? 自然文で記述されているメタデータをどのように集めるか?
  • 39. © 2020 NTT DATA Corporation 39 © 2020 NTT DATA Corporation 39 NTTデータによる「ドメイン特化BERT」 こちらの発表にぜひご注目ください!
  • 40. © 2020 NTT DATA Corporation 40 © 2020 NTT DATA Corporation 40 ナレッジグラフによるメタデータ活用実現に向けた取り組み メタデータをどのように集めてナレッジグラフに統合するか? 課題 NTTデータによる「データカタログソリューション」 NTT ソフトウェアイノベーションセンタによる「協働型機械学習技術」 NTTデータによる「ドメイン特化BERT」 ABLERによる「ナレッジグラフ構築FW」 ビジネスメタデータをどのように集めるか? 自然文で記述されているメタデータをどのように集めるか? ナレッジグラフの構築を如何に機械化・自動化するか?
  • 41. © 2020 NTT DATA Corporation 41 © 2020 NTT DATA Corporation 41 データスチュワード業務の効率化・高度化を目指して IT部門 DB, DWH, ETLなど IT部門エンジニア 事業部B ビジネスユーザ 事業部A ビジネスユーザ ・・・ データスチュワード ナレッジグラフ テクニカルメタデータ、オペレーショナ ルメタデータをナレッジグラフに統合 ビジネスメタデータ、ソーシャルメ タデータをナレッジグラフに統合 インターネット Linked Open Data をナ レッジグラフに統合 データカタログ ビジネス文書 データカタログ ビジネス文書 機械学習によるビジネス メタデータ入力支援機能 自然言語処理技術による自 然文からの情報抽出機能 • 最もビジネスに価値をもたらすデータから データ活用を進めることができる • データの処理と配置を最適化して データ活用基盤のコスト最適化ができる
  • 42. © 2020 NTT DATA Corporation

Notas del editor

  1. ・デジタルトランスフォーメーションは、現行ビジネスをデジタル企業に変革するプロセスそのもの。 ・DXには一般的に、人や組織の改革も含まれますが、ここではシステム観点でDXを述べる。
  2. ・DXの2つの要素をさらに分解したのが、この図になります。 ・データ活用は実証実験(いわゆるPoC)フェーズとシステム化フェーズに分けられます。 ・PoCフェーズでは分析の実験を繰り返すことで、ビジネス価値の高い分析内容を見つけ出すことに注力し、効果ありとされたものについて次のシステム化フェーズに進みます。 ・ここで今回の話題の中心となるDataOpsが登場しますが、ここではデータをいかに素早く分析側に供給できるかが、重要なポイントになります。 ・さらに次のフェーズに進むと、データを作り出す源泉システムについて、データ活用基盤への素早いデータ供給のためにモダナイズが必要となります。 --- 取り回しをよくする、柔軟性を上げることを主眼に置くことが多いが、 データ活用をする側から見た、モダナイズの意識を モノリスの悪さ=データ活用ができないからだ。という人は少ない。 データ活用ができないから、モダナイズしたいというお客様は少ないので、そこを強調する必要がある。
  3. ・各社様々な定義がありますが、ここではガートナー社の定義を引用させていただきたいと思います。
  4. データサイエンティスト:統計や機械学習を駆使して、データを分析する人。 データスチュワード:データ利用者とデータ供給者をつなぐ橋渡し役。データのガバナンスに対する責任者。 データエンジニア:データ共有のパイプラインを構築し、メンテナンスするエンジニア。
  5. ・最終的な目的はデータを使ってビジネスに価値を生み出すことであり、データ供給基盤を構築することが目的ではありません。 ・データを供給する側もこの意識をもって取り組まなければ、手段と目的が入れ替わってしまう懸念がある。 ・データ分析においてはより高度な専門性が求められるため、一人の人材ですべての領域をカバーすることは難しくなっている。 ・したがって様々なロールが一つのチームとしてふるまうことで、DataOpsを実現することができる。
  6. ・我々はDataOps実現のロードマップとして3つのレベルを定義している。 ・レベル1はなにも取り組みがなされていない状況だが、我々はお客様に最低限レベル2を達成することを目標にしていただきたいと考えています。 ・ここからはレベル1のサイロ状態をどのようにして、レベル2に引き上げていくのかというお話をするつもりである。 ・なおレベル3については後半に大山よりお話があります。 ------ ・レベル2までは最低限しなくちゃいけないよ。 ・データスチュワードのみなさんが何をしなければならないか?DataOps ・情報活用基盤をDataOpsにしたいCIO向け  スチュワードが大事  レベル1レベル2が大事 スチュワードへの話なのか、CIOへの話なのかがわかりにくい。
  7. ・我々は様々なお客様を支援させていただいているが、多くのお客様のデータ分析基盤はこの図のようになっている。 ・分析基盤がゼロということはまれで、むしろ複数のシステムや分析基盤が乱立していることがおおい。
  8. だいたいエンタープライズのお客様のところに行くと、見えない壁が立っている状態。システム間、上流下流 ヒトの説得 関係者が大量にいて関係調整大変 システムと同時に担当者がサイロ化している。 また分析と源泉システムとの距離が遠いことが問題。
  9. 代表的な課題をマッピングするとこのようになる。 実はDataOpsを実現するにあたっての課題を洗い出すだけでも、かなりの労力を有する。 ある程度発生するであろう課題に目途をつけておかないと、どこから手を付けてよいか、将来どのような点で躓くのかが、わからなくなる。 ・NTTデータ流のDataOpsを実現をブロックしている理由にしたい。 ・データシチズンは用意されたDMを利用するので、DSだけがいる
  10. ・関係者の利害関係を調整しながら、暗黙知を形式知化していく。
  11. 最終的には上流~下流をつなぐ(これをデータリネージュと呼ぶ) また、サイロ化されたシステムをつなぐことで、データ仕様の統一やアーキテクチャの最適化を行う。 これらをデータガバナンスツールで記録・管理することでデータの透明性を高めていく。 現時点のアーキテクチャを明確にし、業務的に意味のある形で記録する作業がいまはほぼ人手になっている(※)大山くんへのつなぎ
  12. ・特定の担当者が仕様を把握している状態を解消して、担当者間の引継ぎやお客さまの内製化を進めやすくする必要がある。
  13. ここまでな人間系のお話を中心にしてきた。 ・レベル2までは最低限しなくちゃいけないよ。 ・データスチュワードのみなさんが何をしなければならないか?DataOps ・情報活用基盤をDataOpsにしたいCIO向け  スチュワードが大事  レベル1レベル2が大事 スチュワードへの話なのか、CIOへの話なのかがわかりにくい。