SlideShare una empresa de Scribd logo
1 de 23
Descargar para leer sin conexión
<#>
12台でやってみた!
DWHソフトウェアアプライアンス
Db2 Warehouse
~ DWH + Docker +Spark 統合による機械学習基盤としての価値 ~
2017年9月7日
日本アイ・ビー・エム 榎本康孝
1
本日お伝えしたい内容
Db2 Warehouse 概要
Db2 Warehouse 機械学習基盤としての価値
Db2 Warehouse を実際に使ってみてどうだったか?
(インサイトテクノロジー 平間様 検証結果のご紹介)
まとめ & 評価版のご紹介
2
What is Db2 Warehouse ?
Db2 Warehouse
Container
Download and Deploy
Any Public and Private Cloud
Elastic Scalability
・最大60ノードまで拡張可能なスケーラビリティ
・スケールアップ & アウト自動チューニング
・データベースサイズの柔軟な拡張
3
Load and Go
・コンテナをデプロイ後、直ぐにDB利用可能。予め分析用途に
最適化され、物理設計、インデックスチューニング不要。
データロード後すぐに分析できる簡易性。
High Speed & Machine Learning
・インメモリカラムストア & MPPアーキテクチャ
・列圧縮、検索対象外データの読み飛ばし(データスキッピング)
・DWH & Spark統合による機械学習処理の効率化
What is Db2 Warehouse ?
Write Once, Run Anywhere
・Common SQL Engine, Netezza & Oracle互換機能
・Dockerコンテナポータビリティ
・プライベートクラウド、マルチクラウド対応
Data Virtualization & Move
・FluidQueryによるRDB, Hadoopとのデータ連携
・DB Migrationによる高速データ移動
(Netezza->Db2 Wh, Db2 Wh ->Db2 Wh)
Flexible Price & Low TCO
・クラウド利用を想定したVPC単位の月額ライセンス課金
・開発、運用管理コスト低減によるTCO低減
1月 12月
Oracle Netezza SQLserver
Db2 Family & Hadoop
Powered by FluidQuery
4
Elastic Scalability & Auto Scaling
最小1ノード1コアから最大60ノードまで柔軟に拡張可能な
並列アーキテクチャより、DWH基盤の拡張、統合の要件に
柔軟に対応可能
後ほど技術検証結果にて3~12ノード構成を使用した
Db2 Warehouse 検証結果をご紹介いたします。
EXP3524
8
9
16
17
System x3650 M40 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
System x3650 M40 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
EXP3524
8
9
16
17
SMP構成
MPP構成
5
© 2017 IBM Corporation
Db2 Warehouse & Spark統合による
機械学習処理基盤としての価値
6
© 2017 IBM Corporation
分析:データの理解からルールの理解
•売上推移の把握
•特異な動きの発見
•詳細な見える化
BIレポーティング
非定型クエリ
データのビジネスへの貢献度
7
© 2017 IBM Corporation8
分析:データの理解からルールの理解
•売上推移の把握
•特異な動きの発見
•詳細な見える化
BIレポーティング
非定型クエリ
データマイニング
予測モデル
分析の高速化
最適化
•高利益商品のドライバは?
•LTV最大化のキーファクタは?
•データ活用の最大化
•リアルタイムデータ
データのビジネスへの貢献度
© 2017 IBM Corporation
高度な分析の適用(機械学習的手法の例)
9
標準SQLを超える分析機能/表現が必要
© 2017 IBM Corporation
機械学習を利用したデータ分析アプローチ例
データ
準備
モデル
作成
モデルの
適用評価
予測に活用
課題解決に対して明示的なステップをプログラムするのではなく、統計的、探索的な
手法でデータからパターンの発見や予測を行い、課題解決を図るアプローチを取る。
分析に必要な時間の大部分(80%)がデータ準備を占める
大量データに対しても、効率的かつ素早くデータを探索、加工、
抽出、モデル化、評価適用の試行錯誤の実施が求められる
ビジネス課題解決に向けた仮説の構築
評価を元にさらなる改善を行う
10
© 2017 IBM Corporation
Db2 Warehouse Spark統合環境
Db2 Warehouse サーバー
Db2 Warehouse コンテナ
スケーラブルクラスタファイルシステム
テキスト
ファイル
並列分散処理、MLlib
非構造化データ処理
構造化データ蓄積、
分析、加工、抽出
Rstudio
Container
Jupyter
Notebook
Container
※Db2 Warehouse用に
カスタマイズされた
Jupyter Notebook
コンテナを利用可能
Db2 Warehouseコンテナからデータを移動させないで分析処理を実施
MPP DWHとSpark統合により、機械学習データ分析処理を効率化。
Db2 Warehouse Spark 統合構成イメージ図
11
構造化データ
機
械
学
習
データ
サイエンティスト
BI/ビジネスアナリスト
BIツール
構造化データを対象
とした分析レポート
仮説検証型の
インタラクティブな
データ探索、分析
SQLベースアプリ
Webコンソール
O
L
A
P
D
W
H
© 2017 IBM Corporation
Db2 Warehouse ホストサーバー
Db2 Warehouse ホストサーバー
Db2 Warehouse Spark統合 機械学習基盤の特長
②.データ準備の高速化 (SQL predicate push down)
データの加工、フィルタ処理をDB側にSQL文としてオフロード
最も時間のかかるデータ準備作業をMPP DWH処理性能で高速化
③.データ準備、モデル作成、適用評価作業の高速化
・DWH & Spark間のデータ転送を内部ソケット通信で高速化
・Spark PartitionとMPP DWH Partitionが連動して分散並列処理を実施
④.多彩な方法でSpark機械学習処理を実行可能
・予め実装されたAnalyticsプロシージャによるSpark MLlibの利用
・REST API/SQL/BIツール/OSシェル等、各種方法から呼び出し可能
①.DWHとSpark環境をDocker Runコマンドで
簡単にセットアップできる
⑤.SparkアプリケーションをEnd-to-Endで管理
・Juypter Notebookで作成したSparkアプリケーションを1クリックでデプロイ。
・Webコンソールで実行中のSparkアプリケーションを監視可能
Db2 Warehouse ホストサーバー
Db2 Warehouse コンテナ
並列分散処理
分析フレームワーク
構造化データ
蓄積、分析、検索
SQL push down
結果セット抽出
12
© 2017 IBM Corporation
DB
Coordinator
Spark Driver
Jupyter Server
Data
Partition
s
Worker
DB
Data
Nod
es
Cluster Mgr
Master
Executor
Worker
Executor
Worker
Executor
Worker
Executor
ML SP &
Submit SP
Client App
DB
Data
Nod
es
DB
Data
Nod
es
DB
Data
Nod
es
DB
Data
Nod
es
DB
Data
Nod
es
DB
Data
Nod
es
DB
Data
Nod
es
Data
Partition
s
Data
Partitions
Data
Partition
s
Data
Partition
s
Data
Partitions
Data
Partition
s
Data
Partition
s
Data
Partitions
Data
Partition
s
Data
Partition
s
Data
Partitions
DB
Data
Nodes
DB
Data
Nodes
DB
Data
Nodes
DB
Data
Nodes
Spark Kernels
Head Node
参考: Db2 Warehouse with Spark ハイレベルアーキテクチャ
Data Node
[Spark Apps実行方法]
1.Spark-submit.sh
2.Submit Stored Procedure
3.ML Stored Procedure
4.REST API
5.Jupyter Notebook
Data
Partition
s
DB
Data
Nod
es
DB
Data
Nod
es
Data
Partition
s
Data
Partitions
DB
Data
Nodes
Worker
Executor
Db2 Warehouse
Web Console
13
© 2017 IBM Corporation
Db2 Warehouse サーバーDb2 Warehouse サーバーDb2 Warehouse サーバーDb2 Warehouse サーバー
Db2 Warehouse コンテナ
・非構造化データの持つ複雑な特徴をSparkで抽出、変換、DWHへそのままロード
・構造化データとしてBI用途利用、構造化したデータから機械学習処理への応用
Cloudant
(JSON/NoSQL DB)
Db2 Warehouse Spark統合 機械学習基盤の活用例
半構造化、非構造化データ
スケーラブルクラスタファイルシステム
テキスト
ファイル
Object
Storage
(テキストファイル等)
構造化データ
非構造化データETL処理構造化データ蓄積、分析
データの探索、分析
14
E
T
L
D
W
H
ETL
BI/ビジネスアナリスト
BIツール
構造化データを対象
とした分析レポート
SQLベースアプリ
Webコンソール
O
L
A
P
© 2017 IBM Corporation
Db2 Warehouse サーバーDb2 Warehouse サーバーDb2 Warehouse サーバーDb2 Warehouseサーバー
・Db2 Warehouse & Sparkストリーミングを活用したIoTデータのリアルタイム分析
・データ抽出、変換、格納、可視化のためのデータ基盤を単一基盤で実現
Db2 Warehouse コンテナ
Sparkストリーミング+Db2 Warehouseによる、IoTリアルタイムデータ分析
Db2 Warehouse Spark統合 機械学習基盤の活用例
Apache Kafka
データキューイング
スケーラブルクラスタファイルシステム
テキスト
ファイル
Spark Stream処理データ蓄積、分析、抽出
15
S
T
R
E
A
M
デ
|
タ
収
集
データの探索、分析
BI/ビジネスアナリスト
BIツール
構造化データを対象
とした分析レポート
SQLベースアプリ
Webコンソール
D
W
H
O
L
A
P
© 2017 IBM Corporation
Db2 Warehouse Spark統合メリットのまとめ
・DWHとSpark統合により、構造化、非構造化データに対する
機械学習データ分析環境を迅速にセットアップ、スモールスタート可能。
・DWHに蓄積された大量データから効率的かつスピーディに
データを準備し、機械学習の試行処理を実施できる仕組みを提供。
Db2 Warehouse評価版を
ぜひお試しください。
16
© 2017 IBM Corporation
Db2 Warehouse 検証結果ご紹介
12台でやってみた!
DWHソフトウェアアプライアンス Db2 Warehouse
~ DWH + Docker +Spark 統合による機械学習基盤としての価値 ~
17
© 2017 IBM Corporation
セッションのまとめ
・DockerコンテナベースのDWHソフトウェアアプライアンスとして、
高速性、拡張性、簡易性を備え、場所を選ばず配置、移動可能。
(Private Cloud , Hybrid Data Warehouse 用途で強み)
・DWHとSpark統合により、構造化、非構造化データに対する
機械学習環境を迅速にセットアップ、スモールスタートで開始できる。
・DWHに蓄積された大量データを活用した機械学習処理を効率的に
実施する仕組みを提供
Db2 Warehouse評価版を
ぜひお試しください。
18
© 2017 IBM Corporation
【参考】Db2 Warehouse 評価版の使用
Db2 Warehouse 評価版をDocker Hubから入手するには、以下の手順を実施してください。
(注:評価版試用期間は90日間です。)
1. Docker HubサイトにてDocker IDの作成を行います。
https://hub.docker.com/
2. Docker Hubにログイン後、右上のプルダウンメニューから
Settingを選択し、初期パスワードを変更します。
3. Db2 Warehouseのサイトにアクセスし「Start Your Free Trial」を選択します。
https://www.ibm.com/ms-en/marketplace/db2-warehouse
4. IBM IDとパスワードを入力します。
(IBM IDをまだ作成していない場合は、IBM IDを作成してください)
5. Docker IDを登録すると、24時間以内に承認メールが届きます。
その後、Docker Hubからのpull(ダウンロード)が可能になります。
19
© 2017 IBM Corporation
【参考】Db2 Warehouse(旧dashDB Local) – Spark Demo動画
dashDB Local In-DB Analytics for Spark Demo Video
https://www.youtube.com/playlist?list=PLQ6CoZ-HctoUFVPWnX4qdkQFMvu_heqE7
20
© 2017 IBM Corporation
【参考】Db2 Warehouse(旧dashDB Local) –Demo動画
dashDB Local for private cloud and SDEs Demo Video
https://www.youtube.com/playlist?list=PLHML2rQ3S7uZu4qFpApwUdERnx8VJO6OR
21
© 2017 IBM Corporation
【参考】Db2 Warehouse(旧dashDB Local) 導入ガイド
Db2 Warehouse 評価版 シングル構成 参考導入手順書
https://www-01.ibm.com/marketing/iwm/dre/signup?source=mrs-form-11354&S_PKG=ov56016&lang=ja_JP
Db2 Warehouse Knowledge Center
https://www.ibm.com/support/knowledgecenter/en/SS6NHC/com.ibm.swg.im.dashdb.kc.doc/welcome.html
22
© 2017 IBM Corporation
数クリックでお手軽に試したいときはこちら
利用上の注意/制限:開発用途のみに使用ください/コミュニティサポートの製品です
Db2を始めませんか?
Download & Go! たった15分でお手元にDb2がインストール
http://ibm.biz/db2dev_com
http://ibm.biz/db2dev_c
他社のデータベース含めDBの知識がある方にオススメです
全機能が無償でじっくり試せます
23

Más contenido relacionado

La actualidad más candente

[db tech showcase Tokyo 2015] B34:データの仮想化を具体化するIBMのロジカルデータウェアハウス by 日本アイ・ビー・エ...
[db tech showcase Tokyo 2015] B34:データの仮想化を具体化するIBMのロジカルデータウェアハウス by 日本アイ・ビー・エ...[db tech showcase Tokyo 2015] B34:データの仮想化を具体化するIBMのロジカルデータウェアハウス by 日本アイ・ビー・エ...
[db tech showcase Tokyo 2015] B34:データの仮想化を具体化するIBMのロジカルデータウェアハウス by 日本アイ・ビー・エ...Insight Technology, Inc.
 
[db tech showcase Tokyo 2015] B12:カラムストアデータベースの技術と活用法 by 日本電気株式会社 田村稔
[db tech showcase Tokyo 2015] B12:カラムストアデータベースの技術と活用法 by 日本電気株式会社 田村稔[db tech showcase Tokyo 2015] B12:カラムストアデータベースの技術と活用法 by 日本電気株式会社 田村稔
[db tech showcase Tokyo 2015] B12:カラムストアデータベースの技術と活用法 by 日本電気株式会社 田村稔Insight Technology, Inc.
 
[db tech showcase Tokyo 2017] E23: クラウド異種データベース(AWS)へのデータベース移行時の注意点 ~レプリケーション...
[db tech showcase Tokyo 2017] E23: クラウド異種データベース(AWS)へのデータベース移行時の注意点 ~レプリケーション...[db tech showcase Tokyo 2017] E23: クラウド異種データベース(AWS)へのデータベース移行時の注意点 ~レプリケーション...
[db tech showcase Tokyo 2017] E23: クラウド異種データベース(AWS)へのデータベース移行時の注意点 ~レプリケーション...Insight Technology, Inc.
 
[db tech showcase Tokyo 2017] E34: データベース・サービスを好きなところで動かそう Db2 Warehouse by 日...
[db tech showcase Tokyo 2017] E34: データベース・サービスを好きなところで動かそう Db2 Warehouse by 日...[db tech showcase Tokyo 2017] E34: データベース・サービスを好きなところで動かそう Db2 Warehouse by 日...
[db tech showcase Tokyo 2017] E34: データベース・サービスを好きなところで動かそう Db2 Warehouse by 日...Insight Technology, Inc.
 
[db tech showcase Tokyo 2017] B22: DevOpsにおけるDelphix(デルフィックス)by Delphix Softw...
[db tech showcase Tokyo 2017] B22: DevOpsにおけるDelphix(デルフィックス)by Delphix Softw...[db tech showcase Tokyo 2017] B22: DevOpsにおけるDelphix(デルフィックス)by Delphix Softw...
[db tech showcase Tokyo 2017] B22: DevOpsにおけるDelphix(デルフィックス)by Delphix Softw...Insight Technology, Inc.
 
分析指向データレイク実現の次の一手 ~Delta Lake、なにそれおいしいの?~(NTTデータ テクノロジーカンファレンス 2020 発表資料)
分析指向データレイク実現の次の一手 ~Delta Lake、なにそれおいしいの?~(NTTデータ テクノロジーカンファレンス 2020 発表資料)分析指向データレイク実現の次の一手 ~Delta Lake、なにそれおいしいの?~(NTTデータ テクノロジーカンファレンス 2020 発表資料)
分析指向データレイク実現の次の一手 ~Delta Lake、なにそれおいしいの?~(NTTデータ テクノロジーカンファレンス 2020 発表資料)NTT DATA Technology & Innovation
 
[db tech showcase Tokyo 2015] E26 Couchbaseの最新情報/JBoss Data Virtualizationで仮想...
[db tech showcase Tokyo 2015] E26 Couchbaseの最新情報/JBoss Data Virtualizationで仮想...[db tech showcase Tokyo 2015] E26 Couchbaseの最新情報/JBoss Data Virtualizationで仮想...
[db tech showcase Tokyo 2015] E26 Couchbaseの最新情報/JBoss Data Virtualizationで仮想...Masahiro Tomisugi
 
Data Scientists Love SQL Server
Data Scientists Love SQL ServerData Scientists Love SQL Server
Data Scientists Love SQL ServerTomoyuki Oota
 
Apache Drill で JSON 形式の オープンデータを分析してみる - db tech showcase Tokyo 2015 2015/06/11
Apache Drill で JSON 形式の オープンデータを分析してみる - db tech showcase Tokyo 2015 2015/06/11Apache Drill で JSON 形式の オープンデータを分析してみる - db tech showcase Tokyo 2015 2015/06/11
Apache Drill で JSON 形式の オープンデータを分析してみる - db tech showcase Tokyo 2015 2015/06/11MapR Technologies Japan
 
[db tech showcase Tokyo 2015] B36:Hitachi Advanced Data Binder 実践SQLチューニング方法 ...
[db tech showcase Tokyo 2015] B36:Hitachi Advanced Data Binder 実践SQLチューニング方法 ...[db tech showcase Tokyo 2015] B36:Hitachi Advanced Data Binder 実践SQLチューニング方法 ...
[db tech showcase Tokyo 2015] B36:Hitachi Advanced Data Binder 実践SQLチューニング方法 ...Insight Technology, Inc.
 
[db tech showcase Tokyo 2015] D13:PCIeフラッシュで、高可用性高性能データベースシステム?! by 株式会社HGSTジ...
[db tech showcase Tokyo 2015] D13:PCIeフラッシュで、高可用性高性能データベースシステム?! by 株式会社HGSTジ...[db tech showcase Tokyo 2015] D13:PCIeフラッシュで、高可用性高性能データベースシステム?! by 株式会社HGSTジ...
[db tech showcase Tokyo 2015] D13:PCIeフラッシュで、高可用性高性能データベースシステム?! by 株式会社HGSTジ...Insight Technology, Inc.
 
[db tech showcase Tokyo 2017] AzureでOSS DB/データ処理基盤のPaaSサービスを使ってみよう (Azure Dat...
[db tech showcase Tokyo 2017] AzureでOSS DB/データ処理基盤のPaaSサービスを使ってみよう (Azure Dat...[db tech showcase Tokyo 2017] AzureでOSS DB/データ処理基盤のPaaSサービスを使ってみよう (Azure Dat...
[db tech showcase Tokyo 2017] AzureでOSS DB/データ処理基盤のPaaSサービスを使ってみよう (Azure Dat...Naoki (Neo) SATO
 
[db tech showcase Tokyo 2015] E27: Neo4jグラフデータベース by クリエーションライン株式会社 李昌桓
[db tech showcase Tokyo 2015] E27: Neo4jグラフデータベース by クリエーションライン株式会社 李昌桓[db tech showcase Tokyo 2015] E27: Neo4jグラフデータベース by クリエーションライン株式会社 李昌桓
[db tech showcase Tokyo 2015] E27: Neo4jグラフデータベース by クリエーションライン株式会社 李昌桓Insight Technology, Inc.
 
事例から見るNoSQLの使い方 - db tech showcase Tokyo 2015 2015/06/11
事例から見るNoSQLの使い方 - db tech showcase Tokyo 2015 2015/06/11事例から見るNoSQLの使い方 - db tech showcase Tokyo 2015 2015/06/11
事例から見るNoSQLの使い方 - db tech showcase Tokyo 2015 2015/06/11MapR Technologies Japan
 
[db tech showcase Tokyo 2017] D33: Deep Learningや、Analyticsのワークロードを加速するには-Ten...
[db tech showcase Tokyo 2017] D33: Deep Learningや、Analyticsのワークロードを加速するには-Ten...[db tech showcase Tokyo 2017] D33: Deep Learningや、Analyticsのワークロードを加速するには-Ten...
[db tech showcase Tokyo 2017] D33: Deep Learningや、Analyticsのワークロードを加速するには-Ten...Insight Technology, Inc.
 
[db tech showcase Tokyo 2017] A32: Attunity Replicate + Kafka + Hadoop マルチデータ...
[db tech showcase Tokyo 2017] A32: Attunity Replicate + Kafka + Hadoop マルチデータ...[db tech showcase Tokyo 2017] A32: Attunity Replicate + Kafka + Hadoop マルチデータ...
[db tech showcase Tokyo 2017] A32: Attunity Replicate + Kafka + Hadoop マルチデータ...Insight Technology, Inc.
 
Db2 & Db2 Warehouse v11.5.4 最新情報アップデート2020年8月25日
Db2 & Db2 Warehouse v11.5.4 最新情報アップデート2020年8月25日Db2 & Db2 Warehouse v11.5.4 最新情報アップデート2020年8月25日
Db2 & Db2 Warehouse v11.5.4 最新情報アップデート2020年8月25日IBM Analytics Japan
 
SQL Server エンジニア のための コンテナ入門(k8s編)
SQL Server エンジニア のための コンテナ入門(k8s編)SQL Server エンジニア のための コンテナ入門(k8s編)
SQL Server エンジニア のための コンテナ入門(k8s編)Tomoyuki Oota
 
Percona ServerをMySQL 5.6と5.7用に作るエンジニアリング(そしてMongoDBのヒント)
Percona ServerをMySQL 5.6と5.7用に作るエンジニアリング(そしてMongoDBのヒント)Percona ServerをMySQL 5.6と5.7用に作るエンジニアリング(そしてMongoDBのヒント)
Percona ServerをMySQL 5.6と5.7用に作るエンジニアリング(そしてMongoDBのヒント)Colin Charles
 
Nosqlの基礎知識(2013年7月講義資料)
Nosqlの基礎知識(2013年7月講義資料)Nosqlの基礎知識(2013年7月講義資料)
Nosqlの基礎知識(2013年7月講義資料)CLOUDIAN KK
 

La actualidad más candente (20)

[db tech showcase Tokyo 2015] B34:データの仮想化を具体化するIBMのロジカルデータウェアハウス by 日本アイ・ビー・エ...
[db tech showcase Tokyo 2015] B34:データの仮想化を具体化するIBMのロジカルデータウェアハウス by 日本アイ・ビー・エ...[db tech showcase Tokyo 2015] B34:データの仮想化を具体化するIBMのロジカルデータウェアハウス by 日本アイ・ビー・エ...
[db tech showcase Tokyo 2015] B34:データの仮想化を具体化するIBMのロジカルデータウェアハウス by 日本アイ・ビー・エ...
 
[db tech showcase Tokyo 2015] B12:カラムストアデータベースの技術と活用法 by 日本電気株式会社 田村稔
[db tech showcase Tokyo 2015] B12:カラムストアデータベースの技術と活用法 by 日本電気株式会社 田村稔[db tech showcase Tokyo 2015] B12:カラムストアデータベースの技術と活用法 by 日本電気株式会社 田村稔
[db tech showcase Tokyo 2015] B12:カラムストアデータベースの技術と活用法 by 日本電気株式会社 田村稔
 
[db tech showcase Tokyo 2017] E23: クラウド異種データベース(AWS)へのデータベース移行時の注意点 ~レプリケーション...
[db tech showcase Tokyo 2017] E23: クラウド異種データベース(AWS)へのデータベース移行時の注意点 ~レプリケーション...[db tech showcase Tokyo 2017] E23: クラウド異種データベース(AWS)へのデータベース移行時の注意点 ~レプリケーション...
[db tech showcase Tokyo 2017] E23: クラウド異種データベース(AWS)へのデータベース移行時の注意点 ~レプリケーション...
 
[db tech showcase Tokyo 2017] E34: データベース・サービスを好きなところで動かそう Db2 Warehouse by 日...
[db tech showcase Tokyo 2017] E34: データベース・サービスを好きなところで動かそう Db2 Warehouse by 日...[db tech showcase Tokyo 2017] E34: データベース・サービスを好きなところで動かそう Db2 Warehouse by 日...
[db tech showcase Tokyo 2017] E34: データベース・サービスを好きなところで動かそう Db2 Warehouse by 日...
 
[db tech showcase Tokyo 2017] B22: DevOpsにおけるDelphix(デルフィックス)by Delphix Softw...
[db tech showcase Tokyo 2017] B22: DevOpsにおけるDelphix(デルフィックス)by Delphix Softw...[db tech showcase Tokyo 2017] B22: DevOpsにおけるDelphix(デルフィックス)by Delphix Softw...
[db tech showcase Tokyo 2017] B22: DevOpsにおけるDelphix(デルフィックス)by Delphix Softw...
 
分析指向データレイク実現の次の一手 ~Delta Lake、なにそれおいしいの?~(NTTデータ テクノロジーカンファレンス 2020 発表資料)
分析指向データレイク実現の次の一手 ~Delta Lake、なにそれおいしいの?~(NTTデータ テクノロジーカンファレンス 2020 発表資料)分析指向データレイク実現の次の一手 ~Delta Lake、なにそれおいしいの?~(NTTデータ テクノロジーカンファレンス 2020 発表資料)
分析指向データレイク実現の次の一手 ~Delta Lake、なにそれおいしいの?~(NTTデータ テクノロジーカンファレンス 2020 発表資料)
 
[db tech showcase Tokyo 2015] E26 Couchbaseの最新情報/JBoss Data Virtualizationで仮想...
[db tech showcase Tokyo 2015] E26 Couchbaseの最新情報/JBoss Data Virtualizationで仮想...[db tech showcase Tokyo 2015] E26 Couchbaseの最新情報/JBoss Data Virtualizationで仮想...
[db tech showcase Tokyo 2015] E26 Couchbaseの最新情報/JBoss Data Virtualizationで仮想...
 
Data Scientists Love SQL Server
Data Scientists Love SQL ServerData Scientists Love SQL Server
Data Scientists Love SQL Server
 
Apache Drill で JSON 形式の オープンデータを分析してみる - db tech showcase Tokyo 2015 2015/06/11
Apache Drill で JSON 形式の オープンデータを分析してみる - db tech showcase Tokyo 2015 2015/06/11Apache Drill で JSON 形式の オープンデータを分析してみる - db tech showcase Tokyo 2015 2015/06/11
Apache Drill で JSON 形式の オープンデータを分析してみる - db tech showcase Tokyo 2015 2015/06/11
 
[db tech showcase Tokyo 2015] B36:Hitachi Advanced Data Binder 実践SQLチューニング方法 ...
[db tech showcase Tokyo 2015] B36:Hitachi Advanced Data Binder 実践SQLチューニング方法 ...[db tech showcase Tokyo 2015] B36:Hitachi Advanced Data Binder 実践SQLチューニング方法 ...
[db tech showcase Tokyo 2015] B36:Hitachi Advanced Data Binder 実践SQLチューニング方法 ...
 
[db tech showcase Tokyo 2015] D13:PCIeフラッシュで、高可用性高性能データベースシステム?! by 株式会社HGSTジ...
[db tech showcase Tokyo 2015] D13:PCIeフラッシュで、高可用性高性能データベースシステム?! by 株式会社HGSTジ...[db tech showcase Tokyo 2015] D13:PCIeフラッシュで、高可用性高性能データベースシステム?! by 株式会社HGSTジ...
[db tech showcase Tokyo 2015] D13:PCIeフラッシュで、高可用性高性能データベースシステム?! by 株式会社HGSTジ...
 
[db tech showcase Tokyo 2017] AzureでOSS DB/データ処理基盤のPaaSサービスを使ってみよう (Azure Dat...
[db tech showcase Tokyo 2017] AzureでOSS DB/データ処理基盤のPaaSサービスを使ってみよう (Azure Dat...[db tech showcase Tokyo 2017] AzureでOSS DB/データ処理基盤のPaaSサービスを使ってみよう (Azure Dat...
[db tech showcase Tokyo 2017] AzureでOSS DB/データ処理基盤のPaaSサービスを使ってみよう (Azure Dat...
 
[db tech showcase Tokyo 2015] E27: Neo4jグラフデータベース by クリエーションライン株式会社 李昌桓
[db tech showcase Tokyo 2015] E27: Neo4jグラフデータベース by クリエーションライン株式会社 李昌桓[db tech showcase Tokyo 2015] E27: Neo4jグラフデータベース by クリエーションライン株式会社 李昌桓
[db tech showcase Tokyo 2015] E27: Neo4jグラフデータベース by クリエーションライン株式会社 李昌桓
 
事例から見るNoSQLの使い方 - db tech showcase Tokyo 2015 2015/06/11
事例から見るNoSQLの使い方 - db tech showcase Tokyo 2015 2015/06/11事例から見るNoSQLの使い方 - db tech showcase Tokyo 2015 2015/06/11
事例から見るNoSQLの使い方 - db tech showcase Tokyo 2015 2015/06/11
 
[db tech showcase Tokyo 2017] D33: Deep Learningや、Analyticsのワークロードを加速するには-Ten...
[db tech showcase Tokyo 2017] D33: Deep Learningや、Analyticsのワークロードを加速するには-Ten...[db tech showcase Tokyo 2017] D33: Deep Learningや、Analyticsのワークロードを加速するには-Ten...
[db tech showcase Tokyo 2017] D33: Deep Learningや、Analyticsのワークロードを加速するには-Ten...
 
[db tech showcase Tokyo 2017] A32: Attunity Replicate + Kafka + Hadoop マルチデータ...
[db tech showcase Tokyo 2017] A32: Attunity Replicate + Kafka + Hadoop マルチデータ...[db tech showcase Tokyo 2017] A32: Attunity Replicate + Kafka + Hadoop マルチデータ...
[db tech showcase Tokyo 2017] A32: Attunity Replicate + Kafka + Hadoop マルチデータ...
 
Db2 & Db2 Warehouse v11.5.4 最新情報アップデート2020年8月25日
Db2 & Db2 Warehouse v11.5.4 最新情報アップデート2020年8月25日Db2 & Db2 Warehouse v11.5.4 最新情報アップデート2020年8月25日
Db2 & Db2 Warehouse v11.5.4 最新情報アップデート2020年8月25日
 
SQL Server エンジニア のための コンテナ入門(k8s編)
SQL Server エンジニア のための コンテナ入門(k8s編)SQL Server エンジニア のための コンテナ入門(k8s編)
SQL Server エンジニア のための コンテナ入門(k8s編)
 
Percona ServerをMySQL 5.6と5.7用に作るエンジニアリング(そしてMongoDBのヒント)
Percona ServerをMySQL 5.6と5.7用に作るエンジニアリング(そしてMongoDBのヒント)Percona ServerをMySQL 5.6と5.7用に作るエンジニアリング(そしてMongoDBのヒント)
Percona ServerをMySQL 5.6と5.7用に作るエンジニアリング(そしてMongoDBのヒント)
 
Nosqlの基礎知識(2013年7月講義資料)
Nosqlの基礎知識(2013年7月講義資料)Nosqlの基礎知識(2013年7月講義資料)
Nosqlの基礎知識(2013年7月講義資料)
 

Similar a [db tech showcase Tokyo 2017] E35: 12台でやってみた!DWHソフトウェアアプライアンス Db2 Warehouse ~ DWH + Docker +Spark 統合による機械学習基盤としての価値 ~ by 日本アイ・ビー・エム株式会社 榎本康孝

Db2 Warehouse Spark利用ガイド チュートリアル編
Db2 Warehouse Spark利用ガイド チュートリアル編Db2 Warehouse Spark利用ガイド チュートリアル編
Db2 Warehouse Spark利用ガイド チュートリアル編IBM Analytics Japan
 
【株式会社ラック様】ハイブリッド・クラウド時代の データベース活用 ~事例・スタートアップ・メニューご紹介~
【株式会社ラック様】ハイブリッド・クラウド時代の データベース活用 ~事例・スタートアップ・メニューご紹介~【株式会社ラック様】ハイブリッド・クラウド時代の データベース活用 ~事例・スタートアップ・メニューご紹介~
【株式会社ラック様】ハイブリッド・クラウド時代の データベース活用 ~事例・スタートアップ・メニューご紹介~IBM Analytics Japan
 
トランザクションもDWHもクラウドで 2015年10月~IBM OnDemandセミナー
トランザクションもDWHもクラウドで 2015年10月~IBM OnDemandセミナートランザクションもDWHもクラウドで 2015年10月~IBM OnDemandセミナー
トランザクションもDWHもクラウドで 2015年10月~IBM OnDemandセミナーTakayuki Nakayama
 
2012年1月技術ひろば
2012年1月技術ひろば2012年1月技術ひろば
2012年1月技術ひろば貴仁 大和屋
 
Db2 Warehouse ご紹介資料 20170922
Db2 Warehouse ご紹介資料 20170922Db2 Warehouse ご紹介資料 20170922
Db2 Warehouse ご紹介資料 20170922IBM Analytics Japan
 
Db2 Warehouse セッション資料 db tech showcase
Db2 Warehouse セッション資料 db tech showcase Db2 Warehouse セッション資料 db tech showcase
Db2 Warehouse セッション資料 db tech showcase IBM Analytics Japan
 
ビッグデータ処理データベースの全体像と使い分け - 2017年 Version -
ビッグデータ処理データベースの全体像と使い分け - 2017年 Version - ビッグデータ処理データベースの全体像と使い分け - 2017年 Version -
ビッグデータ処理データベースの全体像と使い分け - 2017年 Version - Tetsutaro Watanabe
 
試して学べるクラウド技術! OpenShift
試して学べるクラウド技術! OpenShift試して学べるクラウド技術! OpenShift
試して学べるクラウド技術! OpenShiftEtsuji Nakai
 
夏サミ2013 Hadoopを使わない独自の分散処理環境の構築とその運用
夏サミ2013 Hadoopを使わない独自の分散処理環境の構築とその運用夏サミ2013 Hadoopを使わない独自の分散処理環境の構築とその運用
夏サミ2013 Hadoopを使わない独自の分散処理環境の構築とその運用Developers Summit
 
既存システムへの新技術活用法 ~fluntd/MongoDB~
既存システムへの新技術活用法 ~fluntd/MongoDB~既存システムへの新技術活用法 ~fluntd/MongoDB~
既存システムへの新技術活用法 ~fluntd/MongoDB~じゅん なかざ
 
ビッグデータやIoTシステムを支えるデータベース 『GridDB』
ビッグデータやIoTシステムを支えるデータベース 『GridDB』ビッグデータやIoTシステムを支えるデータベース 『GridDB』
ビッグデータやIoTシステムを支えるデータベース 『GridDB』griddb
 
[db tech showcase OSS 2017] A24: マイクロソフトと OSS Database - Azure Database for M...
[db tech showcase OSS 2017] A24: マイクロソフトと OSS Database - Azure Database for M...[db tech showcase OSS 2017] A24: マイクロソフトと OSS Database - Azure Database for M...
[db tech showcase OSS 2017] A24: マイクロソフトと OSS Database - Azure Database for M...Insight Technology, Inc.
 
(インテージテクノスフィア)FY20_技術探究委員会_高速分散技術分科会活動報告
(インテージテクノスフィア)FY20_技術探究委員会_高速分散技術分科会活動報告(インテージテクノスフィア)FY20_技術探究委員会_高速分散技術分科会活動報告
(インテージテクノスフィア)FY20_技術探究委員会_高速分散技術分科会活動報告INTAGEGROUP
 
スケーラブルで手間なく動かせる!もうすぐ 一般提供開始 Azure Database for MySQL / PostgreSQL
スケーラブルで手間なく動かせる!もうすぐ 一般提供開始 Azure Database for MySQL / PostgreSQLスケーラブルで手間なく動かせる!もうすぐ 一般提供開始 Azure Database for MySQL / PostgreSQL
スケーラブルで手間なく動かせる!もうすぐ 一般提供開始 Azure Database for MySQL / PostgreSQLMicrosoft Azure Japan
 
Azure Antenna AI 概要
Azure Antenna AI 概要Azure Antenna AI 概要
Azure Antenna AI 概要Miho Yamamoto
 
Db2リブランディングと製品動向 201707
Db2リブランディングと製品動向 201707Db2リブランディングと製品動向 201707
Db2リブランディングと製品動向 201707IBM Analytics Japan
 
【de:code 2020】 Power Platform で広がるデータ インテグレーションの世界 (1/2)
【de:code 2020】 Power Platform で広がるデータ インテグレーションの世界 (1/2)【de:code 2020】 Power Platform で広がるデータ インテグレーションの世界 (1/2)
【de:code 2020】 Power Platform で広がるデータ インテグレーションの世界 (1/2)日本マイクロソフト株式会社
 
AndroidでActiveRecordライクにDBを使う
AndroidでActiveRecordライクにDBを使うAndroidでActiveRecordライクにDBを使う
AndroidでActiveRecordライクにDBを使うFujimura Munehiko
 
Snowflake Architecture and Performance(db tech showcase Tokyo 2018)
Snowflake Architecture and Performance(db tech showcase Tokyo 2018)Snowflake Architecture and Performance(db tech showcase Tokyo 2018)
Snowflake Architecture and Performance(db tech showcase Tokyo 2018)Mineaki Motohashi
 
【de:code 2020】 Azure Synapse Analytics 技術編 ~ 最新の統合分析プラットフォームによる新しい価値の創出(前編)
【de:code 2020】 Azure Synapse Analytics 技術編 ~ 最新の統合分析プラットフォームによる新しい価値の創出(前編)【de:code 2020】 Azure Synapse Analytics 技術編 ~ 最新の統合分析プラットフォームによる新しい価値の創出(前編)
【de:code 2020】 Azure Synapse Analytics 技術編 ~ 最新の統合分析プラットフォームによる新しい価値の創出(前編)日本マイクロソフト株式会社
 

Similar a [db tech showcase Tokyo 2017] E35: 12台でやってみた!DWHソフトウェアアプライアンス Db2 Warehouse ~ DWH + Docker +Spark 統合による機械学習基盤としての価値 ~ by 日本アイ・ビー・エム株式会社 榎本康孝 (20)

Db2 Warehouse Spark利用ガイド チュートリアル編
Db2 Warehouse Spark利用ガイド チュートリアル編Db2 Warehouse Spark利用ガイド チュートリアル編
Db2 Warehouse Spark利用ガイド チュートリアル編
 
【株式会社ラック様】ハイブリッド・クラウド時代の データベース活用 ~事例・スタートアップ・メニューご紹介~
【株式会社ラック様】ハイブリッド・クラウド時代の データベース活用 ~事例・スタートアップ・メニューご紹介~【株式会社ラック様】ハイブリッド・クラウド時代の データベース活用 ~事例・スタートアップ・メニューご紹介~
【株式会社ラック様】ハイブリッド・クラウド時代の データベース活用 ~事例・スタートアップ・メニューご紹介~
 
トランザクションもDWHもクラウドで 2015年10月~IBM OnDemandセミナー
トランザクションもDWHもクラウドで 2015年10月~IBM OnDemandセミナートランザクションもDWHもクラウドで 2015年10月~IBM OnDemandセミナー
トランザクションもDWHもクラウドで 2015年10月~IBM OnDemandセミナー
 
2012年1月技術ひろば
2012年1月技術ひろば2012年1月技術ひろば
2012年1月技術ひろば
 
Db2 Warehouse ご紹介資料 20170922
Db2 Warehouse ご紹介資料 20170922Db2 Warehouse ご紹介資料 20170922
Db2 Warehouse ご紹介資料 20170922
 
Db2 Warehouse セッション資料 db tech showcase
Db2 Warehouse セッション資料 db tech showcase Db2 Warehouse セッション資料 db tech showcase
Db2 Warehouse セッション資料 db tech showcase
 
ビッグデータ処理データベースの全体像と使い分け - 2017年 Version -
ビッグデータ処理データベースの全体像と使い分け - 2017年 Version - ビッグデータ処理データベースの全体像と使い分け - 2017年 Version -
ビッグデータ処理データベースの全体像と使い分け - 2017年 Version -
 
試して学べるクラウド技術! OpenShift
試して学べるクラウド技術! OpenShift試して学べるクラウド技術! OpenShift
試して学べるクラウド技術! OpenShift
 
夏サミ2013 Hadoopを使わない独自の分散処理環境の構築とその運用
夏サミ2013 Hadoopを使わない独自の分散処理環境の構築とその運用夏サミ2013 Hadoopを使わない独自の分散処理環境の構築とその運用
夏サミ2013 Hadoopを使わない独自の分散処理環境の構築とその運用
 
既存システムへの新技術活用法 ~fluntd/MongoDB~
既存システムへの新技術活用法 ~fluntd/MongoDB~既存システムへの新技術活用法 ~fluntd/MongoDB~
既存システムへの新技術活用法 ~fluntd/MongoDB~
 
ビッグデータやIoTシステムを支えるデータベース 『GridDB』
ビッグデータやIoTシステムを支えるデータベース 『GridDB』ビッグデータやIoTシステムを支えるデータベース 『GridDB』
ビッグデータやIoTシステムを支えるデータベース 『GridDB』
 
[db tech showcase OSS 2017] A24: マイクロソフトと OSS Database - Azure Database for M...
[db tech showcase OSS 2017] A24: マイクロソフトと OSS Database - Azure Database for M...[db tech showcase OSS 2017] A24: マイクロソフトと OSS Database - Azure Database for M...
[db tech showcase OSS 2017] A24: マイクロソフトと OSS Database - Azure Database for M...
 
(インテージテクノスフィア)FY20_技術探究委員会_高速分散技術分科会活動報告
(インテージテクノスフィア)FY20_技術探究委員会_高速分散技術分科会活動報告(インテージテクノスフィア)FY20_技術探究委員会_高速分散技術分科会活動報告
(インテージテクノスフィア)FY20_技術探究委員会_高速分散技術分科会活動報告
 
スケーラブルで手間なく動かせる!もうすぐ 一般提供開始 Azure Database for MySQL / PostgreSQL
スケーラブルで手間なく動かせる!もうすぐ 一般提供開始 Azure Database for MySQL / PostgreSQLスケーラブルで手間なく動かせる!もうすぐ 一般提供開始 Azure Database for MySQL / PostgreSQL
スケーラブルで手間なく動かせる!もうすぐ 一般提供開始 Azure Database for MySQL / PostgreSQL
 
Azure Antenna AI 概要
Azure Antenna AI 概要Azure Antenna AI 概要
Azure Antenna AI 概要
 
Db2リブランディングと製品動向 201707
Db2リブランディングと製品動向 201707Db2リブランディングと製品動向 201707
Db2リブランディングと製品動向 201707
 
【de:code 2020】 Power Platform で広がるデータ インテグレーションの世界 (1/2)
【de:code 2020】 Power Platform で広がるデータ インテグレーションの世界 (1/2)【de:code 2020】 Power Platform で広がるデータ インテグレーションの世界 (1/2)
【de:code 2020】 Power Platform で広がるデータ インテグレーションの世界 (1/2)
 
AndroidでActiveRecordライクにDBを使う
AndroidでActiveRecordライクにDBを使うAndroidでActiveRecordライクにDBを使う
AndroidでActiveRecordライクにDBを使う
 
Snowflake Architecture and Performance(db tech showcase Tokyo 2018)
Snowflake Architecture and Performance(db tech showcase Tokyo 2018)Snowflake Architecture and Performance(db tech showcase Tokyo 2018)
Snowflake Architecture and Performance(db tech showcase Tokyo 2018)
 
【de:code 2020】 Azure Synapse Analytics 技術編 ~ 最新の統合分析プラットフォームによる新しい価値の創出(前編)
【de:code 2020】 Azure Synapse Analytics 技術編 ~ 最新の統合分析プラットフォームによる新しい価値の創出(前編)【de:code 2020】 Azure Synapse Analytics 技術編 ~ 最新の統合分析プラットフォームによる新しい価値の創出(前編)
【de:code 2020】 Azure Synapse Analytics 技術編 ~ 最新の統合分析プラットフォームによる新しい価値の創出(前編)
 

Más de Insight Technology, Inc.

グラフデータベースは如何に自然言語を理解するか?
グラフデータベースは如何に自然言語を理解するか?グラフデータベースは如何に自然言語を理解するか?
グラフデータベースは如何に自然言語を理解するか?Insight Technology, Inc.
 
Great performance at scale~次期PostgreSQL12のパーティショニング性能の実力に迫る~
Great performance at scale~次期PostgreSQL12のパーティショニング性能の実力に迫る~Great performance at scale~次期PostgreSQL12のパーティショニング性能の実力に迫る~
Great performance at scale~次期PostgreSQL12のパーティショニング性能の実力に迫る~Insight Technology, Inc.
 
事例を通じて機械学習とは何かを説明する
事例を通じて機械学習とは何かを説明する事例を通じて機械学習とは何かを説明する
事例を通じて機械学習とは何かを説明するInsight Technology, Inc.
 
仮想通貨ウォレットアプリで理解するデータストアとしてのブロックチェーン
仮想通貨ウォレットアプリで理解するデータストアとしてのブロックチェーン仮想通貨ウォレットアプリで理解するデータストアとしてのブロックチェーン
仮想通貨ウォレットアプリで理解するデータストアとしてのブロックチェーンInsight Technology, Inc.
 
MBAAで覚えるDBREの大事なおしごと
MBAAで覚えるDBREの大事なおしごとMBAAで覚えるDBREの大事なおしごと
MBAAで覚えるDBREの大事なおしごとInsight Technology, Inc.
 
グラフデータベースは如何に自然言語を理解するか?
グラフデータベースは如何に自然言語を理解するか?グラフデータベースは如何に自然言語を理解するか?
グラフデータベースは如何に自然言語を理解するか?Insight Technology, Inc.
 
DBREから始めるデータベースプラットフォーム
DBREから始めるデータベースプラットフォームDBREから始めるデータベースプラットフォーム
DBREから始めるデータベースプラットフォームInsight Technology, Inc.
 
SQL Server エンジニアのためのコンテナ入門
SQL Server エンジニアのためのコンテナ入門SQL Server エンジニアのためのコンテナ入門
SQL Server エンジニアのためのコンテナ入門Insight Technology, Inc.
 
db tech showcase2019オープニングセッション @ 森田 俊哉
db tech showcase2019オープニングセッション @ 森田 俊哉 db tech showcase2019オープニングセッション @ 森田 俊哉
db tech showcase2019オープニングセッション @ 森田 俊哉 Insight Technology, Inc.
 
db tech showcase2019 オープニングセッション @ 石川 雅也
db tech showcase2019 オープニングセッション @ 石川 雅也db tech showcase2019 オープニングセッション @ 石川 雅也
db tech showcase2019 オープニングセッション @ 石川 雅也Insight Technology, Inc.
 
db tech showcase2019 オープニングセッション @ マイナー・アレン・パーカー
db tech showcase2019 オープニングセッション @ マイナー・アレン・パーカー db tech showcase2019 オープニングセッション @ マイナー・アレン・パーカー
db tech showcase2019 オープニングセッション @ マイナー・アレン・パーカー Insight Technology, Inc.
 
難しいアプリケーション移行、手軽に試してみませんか?
難しいアプリケーション移行、手軽に試してみませんか?難しいアプリケーション移行、手軽に試してみませんか?
難しいアプリケーション移行、手軽に試してみませんか?Insight Technology, Inc.
 
Attunityのソリューションと異種データベース・クラウド移行事例のご紹介
Attunityのソリューションと異種データベース・クラウド移行事例のご紹介Attunityのソリューションと異種データベース・クラウド移行事例のご紹介
Attunityのソリューションと異種データベース・クラウド移行事例のご紹介Insight Technology, Inc.
 
そのデータベース、クラウドで使ってみませんか?
そのデータベース、クラウドで使ってみませんか?そのデータベース、クラウドで使ってみませんか?
そのデータベース、クラウドで使ってみませんか?Insight Technology, Inc.
 
コモディティサーバー3台で作る高速処理 “ハイパー・コンバージド・データベース・インフラストラクチャー(HCDI)” システム『Insight Qube』...
コモディティサーバー3台で作る高速処理 “ハイパー・コンバージド・データベース・インフラストラクチャー(HCDI)” システム『Insight Qube』...コモディティサーバー3台で作る高速処理 “ハイパー・コンバージド・データベース・インフラストラクチャー(HCDI)” システム『Insight Qube』...
コモディティサーバー3台で作る高速処理 “ハイパー・コンバージド・データベース・インフラストラクチャー(HCDI)” システム『Insight Qube』...Insight Technology, Inc.
 
複数DBのバックアップ・切り戻し運用手順が異なって大変?!運用性の大幅改善、その先に。。
複数DBのバックアップ・切り戻し運用手順が異なって大変?!運用性の大幅改善、その先に。。 複数DBのバックアップ・切り戻し運用手順が異なって大変?!運用性の大幅改善、その先に。。
複数DBのバックアップ・切り戻し運用手順が異なって大変?!運用性の大幅改善、その先に。。 Insight Technology, Inc.
 
Attunity社のソリューションの日本国内外適用事例及びロードマップ紹介[ATTUNITY & インサイトテクノロジー IoT / Big Data フ...
Attunity社のソリューションの日本国内外適用事例及びロードマップ紹介[ATTUNITY & インサイトテクノロジー IoT / Big Data フ...Attunity社のソリューションの日本国内外適用事例及びロードマップ紹介[ATTUNITY & インサイトテクノロジー IoT / Big Data フ...
Attunity社のソリューションの日本国内外適用事例及びロードマップ紹介[ATTUNITY & インサイトテクノロジー IoT / Big Data フ...Insight Technology, Inc.
 
レガシーに埋もれたデータをリアルタイムでクラウドへ [ATTUNITY & インサイトテクノロジー IoT / Big Data フォーラム 2018]
レガシーに埋もれたデータをリアルタイムでクラウドへ [ATTUNITY & インサイトテクノロジー IoT / Big Data フォーラム 2018]レガシーに埋もれたデータをリアルタイムでクラウドへ [ATTUNITY & インサイトテクノロジー IoT / Big Data フォーラム 2018]
レガシーに埋もれたデータをリアルタイムでクラウドへ [ATTUNITY & インサイトテクノロジー IoT / Big Data フォーラム 2018]Insight Technology, Inc.
 

Más de Insight Technology, Inc. (20)

グラフデータベースは如何に自然言語を理解するか?
グラフデータベースは如何に自然言語を理解するか?グラフデータベースは如何に自然言語を理解するか?
グラフデータベースは如何に自然言語を理解するか?
 
Docker and the Oracle Database
Docker and the Oracle DatabaseDocker and the Oracle Database
Docker and the Oracle Database
 
Great performance at scale~次期PostgreSQL12のパーティショニング性能の実力に迫る~
Great performance at scale~次期PostgreSQL12のパーティショニング性能の実力に迫る~Great performance at scale~次期PostgreSQL12のパーティショニング性能の実力に迫る~
Great performance at scale~次期PostgreSQL12のパーティショニング性能の実力に迫る~
 
事例を通じて機械学習とは何かを説明する
事例を通じて機械学習とは何かを説明する事例を通じて機械学習とは何かを説明する
事例を通じて機械学習とは何かを説明する
 
仮想通貨ウォレットアプリで理解するデータストアとしてのブロックチェーン
仮想通貨ウォレットアプリで理解するデータストアとしてのブロックチェーン仮想通貨ウォレットアプリで理解するデータストアとしてのブロックチェーン
仮想通貨ウォレットアプリで理解するデータストアとしてのブロックチェーン
 
MBAAで覚えるDBREの大事なおしごと
MBAAで覚えるDBREの大事なおしごとMBAAで覚えるDBREの大事なおしごと
MBAAで覚えるDBREの大事なおしごと
 
グラフデータベースは如何に自然言語を理解するか?
グラフデータベースは如何に自然言語を理解するか?グラフデータベースは如何に自然言語を理解するか?
グラフデータベースは如何に自然言語を理解するか?
 
DBREから始めるデータベースプラットフォーム
DBREから始めるデータベースプラットフォームDBREから始めるデータベースプラットフォーム
DBREから始めるデータベースプラットフォーム
 
SQL Server エンジニアのためのコンテナ入門
SQL Server エンジニアのためのコンテナ入門SQL Server エンジニアのためのコンテナ入門
SQL Server エンジニアのためのコンテナ入門
 
Lunch & Learn, AWS NoSQL Services
Lunch & Learn, AWS NoSQL ServicesLunch & Learn, AWS NoSQL Services
Lunch & Learn, AWS NoSQL Services
 
db tech showcase2019オープニングセッション @ 森田 俊哉
db tech showcase2019オープニングセッション @ 森田 俊哉 db tech showcase2019オープニングセッション @ 森田 俊哉
db tech showcase2019オープニングセッション @ 森田 俊哉
 
db tech showcase2019 オープニングセッション @ 石川 雅也
db tech showcase2019 オープニングセッション @ 石川 雅也db tech showcase2019 オープニングセッション @ 石川 雅也
db tech showcase2019 オープニングセッション @ 石川 雅也
 
db tech showcase2019 オープニングセッション @ マイナー・アレン・パーカー
db tech showcase2019 オープニングセッション @ マイナー・アレン・パーカー db tech showcase2019 オープニングセッション @ マイナー・アレン・パーカー
db tech showcase2019 オープニングセッション @ マイナー・アレン・パーカー
 
難しいアプリケーション移行、手軽に試してみませんか?
難しいアプリケーション移行、手軽に試してみませんか?難しいアプリケーション移行、手軽に試してみませんか?
難しいアプリケーション移行、手軽に試してみませんか?
 
Attunityのソリューションと異種データベース・クラウド移行事例のご紹介
Attunityのソリューションと異種データベース・クラウド移行事例のご紹介Attunityのソリューションと異種データベース・クラウド移行事例のご紹介
Attunityのソリューションと異種データベース・クラウド移行事例のご紹介
 
そのデータベース、クラウドで使ってみませんか?
そのデータベース、クラウドで使ってみませんか?そのデータベース、クラウドで使ってみませんか?
そのデータベース、クラウドで使ってみませんか?
 
コモディティサーバー3台で作る高速処理 “ハイパー・コンバージド・データベース・インフラストラクチャー(HCDI)” システム『Insight Qube』...
コモディティサーバー3台で作る高速処理 “ハイパー・コンバージド・データベース・インフラストラクチャー(HCDI)” システム『Insight Qube』...コモディティサーバー3台で作る高速処理 “ハイパー・コンバージド・データベース・インフラストラクチャー(HCDI)” システム『Insight Qube』...
コモディティサーバー3台で作る高速処理 “ハイパー・コンバージド・データベース・インフラストラクチャー(HCDI)” システム『Insight Qube』...
 
複数DBのバックアップ・切り戻し運用手順が異なって大変?!運用性の大幅改善、その先に。。
複数DBのバックアップ・切り戻し運用手順が異なって大変?!運用性の大幅改善、その先に。。 複数DBのバックアップ・切り戻し運用手順が異なって大変?!運用性の大幅改善、その先に。。
複数DBのバックアップ・切り戻し運用手順が異なって大変?!運用性の大幅改善、その先に。。
 
Attunity社のソリューションの日本国内外適用事例及びロードマップ紹介[ATTUNITY & インサイトテクノロジー IoT / Big Data フ...
Attunity社のソリューションの日本国内外適用事例及びロードマップ紹介[ATTUNITY & インサイトテクノロジー IoT / Big Data フ...Attunity社のソリューションの日本国内外適用事例及びロードマップ紹介[ATTUNITY & インサイトテクノロジー IoT / Big Data フ...
Attunity社のソリューションの日本国内外適用事例及びロードマップ紹介[ATTUNITY & インサイトテクノロジー IoT / Big Data フ...
 
レガシーに埋もれたデータをリアルタイムでクラウドへ [ATTUNITY & インサイトテクノロジー IoT / Big Data フォーラム 2018]
レガシーに埋もれたデータをリアルタイムでクラウドへ [ATTUNITY & インサイトテクノロジー IoT / Big Data フォーラム 2018]レガシーに埋もれたデータをリアルタイムでクラウドへ [ATTUNITY & インサイトテクノロジー IoT / Big Data フォーラム 2018]
レガシーに埋もれたデータをリアルタイムでクラウドへ [ATTUNITY & インサイトテクノロジー IoT / Big Data フォーラム 2018]
 

[db tech showcase Tokyo 2017] E35: 12台でやってみた!DWHソフトウェアアプライアンス Db2 Warehouse ~ DWH + Docker +Spark 統合による機械学習基盤としての価値 ~ by 日本アイ・ビー・エム株式会社 榎本康孝

  • 1. <#> 12台でやってみた! DWHソフトウェアアプライアンス Db2 Warehouse ~ DWH + Docker +Spark 統合による機械学習基盤としての価値 ~ 2017年9月7日 日本アイ・ビー・エム 榎本康孝 1
  • 2. 本日お伝えしたい内容 Db2 Warehouse 概要 Db2 Warehouse 機械学習基盤としての価値 Db2 Warehouse を実際に使ってみてどうだったか? (インサイトテクノロジー 平間様 検証結果のご紹介) まとめ & 評価版のご紹介 2
  • 3. What is Db2 Warehouse ? Db2 Warehouse Container Download and Deploy Any Public and Private Cloud Elastic Scalability ・最大60ノードまで拡張可能なスケーラビリティ ・スケールアップ & アウト自動チューニング ・データベースサイズの柔軟な拡張 3 Load and Go ・コンテナをデプロイ後、直ぐにDB利用可能。予め分析用途に 最適化され、物理設計、インデックスチューニング不要。 データロード後すぐに分析できる簡易性。 High Speed & Machine Learning ・インメモリカラムストア & MPPアーキテクチャ ・列圧縮、検索対象外データの読み飛ばし(データスキッピング) ・DWH & Spark統合による機械学習処理の効率化
  • 4. What is Db2 Warehouse ? Write Once, Run Anywhere ・Common SQL Engine, Netezza & Oracle互換機能 ・Dockerコンテナポータビリティ ・プライベートクラウド、マルチクラウド対応 Data Virtualization & Move ・FluidQueryによるRDB, Hadoopとのデータ連携 ・DB Migrationによる高速データ移動 (Netezza->Db2 Wh, Db2 Wh ->Db2 Wh) Flexible Price & Low TCO ・クラウド利用を想定したVPC単位の月額ライセンス課金 ・開発、運用管理コスト低減によるTCO低減 1月 12月 Oracle Netezza SQLserver Db2 Family & Hadoop Powered by FluidQuery 4
  • 5. Elastic Scalability & Auto Scaling 最小1ノード1コアから最大60ノードまで柔軟に拡張可能な 並列アーキテクチャより、DWH基盤の拡張、統合の要件に 柔軟に対応可能 後ほど技術検証結果にて3~12ノード構成を使用した Db2 Warehouse 検証結果をご紹介いたします。 EXP3524 8 9 16 17 System x3650 M40 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 System x3650 M40 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 EXP3524 8 9 16 17 SMP構成 MPP構成 5
  • 6. © 2017 IBM Corporation Db2 Warehouse & Spark統合による 機械学習処理基盤としての価値 6
  • 7. © 2017 IBM Corporation 分析:データの理解からルールの理解 •売上推移の把握 •特異な動きの発見 •詳細な見える化 BIレポーティング 非定型クエリ データのビジネスへの貢献度 7
  • 8. © 2017 IBM Corporation8 分析:データの理解からルールの理解 •売上推移の把握 •特異な動きの発見 •詳細な見える化 BIレポーティング 非定型クエリ データマイニング 予測モデル 分析の高速化 最適化 •高利益商品のドライバは? •LTV最大化のキーファクタは? •データ活用の最大化 •リアルタイムデータ データのビジネスへの貢献度
  • 9. © 2017 IBM Corporation 高度な分析の適用(機械学習的手法の例) 9 標準SQLを超える分析機能/表現が必要
  • 10. © 2017 IBM Corporation 機械学習を利用したデータ分析アプローチ例 データ 準備 モデル 作成 モデルの 適用評価 予測に活用 課題解決に対して明示的なステップをプログラムするのではなく、統計的、探索的な 手法でデータからパターンの発見や予測を行い、課題解決を図るアプローチを取る。 分析に必要な時間の大部分(80%)がデータ準備を占める 大量データに対しても、効率的かつ素早くデータを探索、加工、 抽出、モデル化、評価適用の試行錯誤の実施が求められる ビジネス課題解決に向けた仮説の構築 評価を元にさらなる改善を行う 10
  • 11. © 2017 IBM Corporation Db2 Warehouse Spark統合環境 Db2 Warehouse サーバー Db2 Warehouse コンテナ スケーラブルクラスタファイルシステム テキスト ファイル 並列分散処理、MLlib 非構造化データ処理 構造化データ蓄積、 分析、加工、抽出 Rstudio Container Jupyter Notebook Container ※Db2 Warehouse用に カスタマイズされた Jupyter Notebook コンテナを利用可能 Db2 Warehouseコンテナからデータを移動させないで分析処理を実施 MPP DWHとSpark統合により、機械学習データ分析処理を効率化。 Db2 Warehouse Spark 統合構成イメージ図 11 構造化データ 機 械 学 習 データ サイエンティスト BI/ビジネスアナリスト BIツール 構造化データを対象 とした分析レポート 仮説検証型の インタラクティブな データ探索、分析 SQLベースアプリ Webコンソール O L A P D W H
  • 12. © 2017 IBM Corporation Db2 Warehouse ホストサーバー Db2 Warehouse ホストサーバー Db2 Warehouse Spark統合 機械学習基盤の特長 ②.データ準備の高速化 (SQL predicate push down) データの加工、フィルタ処理をDB側にSQL文としてオフロード 最も時間のかかるデータ準備作業をMPP DWH処理性能で高速化 ③.データ準備、モデル作成、適用評価作業の高速化 ・DWH & Spark間のデータ転送を内部ソケット通信で高速化 ・Spark PartitionとMPP DWH Partitionが連動して分散並列処理を実施 ④.多彩な方法でSpark機械学習処理を実行可能 ・予め実装されたAnalyticsプロシージャによるSpark MLlibの利用 ・REST API/SQL/BIツール/OSシェル等、各種方法から呼び出し可能 ①.DWHとSpark環境をDocker Runコマンドで 簡単にセットアップできる ⑤.SparkアプリケーションをEnd-to-Endで管理 ・Juypter Notebookで作成したSparkアプリケーションを1クリックでデプロイ。 ・Webコンソールで実行中のSparkアプリケーションを監視可能 Db2 Warehouse ホストサーバー Db2 Warehouse コンテナ 並列分散処理 分析フレームワーク 構造化データ 蓄積、分析、検索 SQL push down 結果セット抽出 12
  • 13. © 2017 IBM Corporation DB Coordinator Spark Driver Jupyter Server Data Partition s Worker DB Data Nod es Cluster Mgr Master Executor Worker Executor Worker Executor Worker Executor ML SP & Submit SP Client App DB Data Nod es DB Data Nod es DB Data Nod es DB Data Nod es DB Data Nod es DB Data Nod es DB Data Nod es Data Partition s Data Partitions Data Partition s Data Partition s Data Partitions Data Partition s Data Partition s Data Partitions Data Partition s Data Partition s Data Partitions DB Data Nodes DB Data Nodes DB Data Nodes DB Data Nodes Spark Kernels Head Node 参考: Db2 Warehouse with Spark ハイレベルアーキテクチャ Data Node [Spark Apps実行方法] 1.Spark-submit.sh 2.Submit Stored Procedure 3.ML Stored Procedure 4.REST API 5.Jupyter Notebook Data Partition s DB Data Nod es DB Data Nod es Data Partition s Data Partitions DB Data Nodes Worker Executor Db2 Warehouse Web Console 13
  • 14. © 2017 IBM Corporation Db2 Warehouse サーバーDb2 Warehouse サーバーDb2 Warehouse サーバーDb2 Warehouse サーバー Db2 Warehouse コンテナ ・非構造化データの持つ複雑な特徴をSparkで抽出、変換、DWHへそのままロード ・構造化データとしてBI用途利用、構造化したデータから機械学習処理への応用 Cloudant (JSON/NoSQL DB) Db2 Warehouse Spark統合 機械学習基盤の活用例 半構造化、非構造化データ スケーラブルクラスタファイルシステム テキスト ファイル Object Storage (テキストファイル等) 構造化データ 非構造化データETL処理構造化データ蓄積、分析 データの探索、分析 14 E T L D W H ETL BI/ビジネスアナリスト BIツール 構造化データを対象 とした分析レポート SQLベースアプリ Webコンソール O L A P
  • 15. © 2017 IBM Corporation Db2 Warehouse サーバーDb2 Warehouse サーバーDb2 Warehouse サーバーDb2 Warehouseサーバー ・Db2 Warehouse & Sparkストリーミングを活用したIoTデータのリアルタイム分析 ・データ抽出、変換、格納、可視化のためのデータ基盤を単一基盤で実現 Db2 Warehouse コンテナ Sparkストリーミング+Db2 Warehouseによる、IoTリアルタイムデータ分析 Db2 Warehouse Spark統合 機械学習基盤の活用例 Apache Kafka データキューイング スケーラブルクラスタファイルシステム テキスト ファイル Spark Stream処理データ蓄積、分析、抽出 15 S T R E A M デ | タ 収 集 データの探索、分析 BI/ビジネスアナリスト BIツール 構造化データを対象 とした分析レポート SQLベースアプリ Webコンソール D W H O L A P
  • 16. © 2017 IBM Corporation Db2 Warehouse Spark統合メリットのまとめ ・DWHとSpark統合により、構造化、非構造化データに対する 機械学習データ分析環境を迅速にセットアップ、スモールスタート可能。 ・DWHに蓄積された大量データから効率的かつスピーディに データを準備し、機械学習の試行処理を実施できる仕組みを提供。 Db2 Warehouse評価版を ぜひお試しください。 16
  • 17. © 2017 IBM Corporation Db2 Warehouse 検証結果ご紹介 12台でやってみた! DWHソフトウェアアプライアンス Db2 Warehouse ~ DWH + Docker +Spark 統合による機械学習基盤としての価値 ~ 17
  • 18. © 2017 IBM Corporation セッションのまとめ ・DockerコンテナベースのDWHソフトウェアアプライアンスとして、 高速性、拡張性、簡易性を備え、場所を選ばず配置、移動可能。 (Private Cloud , Hybrid Data Warehouse 用途で強み) ・DWHとSpark統合により、構造化、非構造化データに対する 機械学習環境を迅速にセットアップ、スモールスタートで開始できる。 ・DWHに蓄積された大量データを活用した機械学習処理を効率的に 実施する仕組みを提供 Db2 Warehouse評価版を ぜひお試しください。 18
  • 19. © 2017 IBM Corporation 【参考】Db2 Warehouse 評価版の使用 Db2 Warehouse 評価版をDocker Hubから入手するには、以下の手順を実施してください。 (注:評価版試用期間は90日間です。) 1. Docker HubサイトにてDocker IDの作成を行います。 https://hub.docker.com/ 2. Docker Hubにログイン後、右上のプルダウンメニューから Settingを選択し、初期パスワードを変更します。 3. Db2 Warehouseのサイトにアクセスし「Start Your Free Trial」を選択します。 https://www.ibm.com/ms-en/marketplace/db2-warehouse 4. IBM IDとパスワードを入力します。 (IBM IDをまだ作成していない場合は、IBM IDを作成してください) 5. Docker IDを登録すると、24時間以内に承認メールが届きます。 その後、Docker Hubからのpull(ダウンロード)が可能になります。 19
  • 20. © 2017 IBM Corporation 【参考】Db2 Warehouse(旧dashDB Local) – Spark Demo動画 dashDB Local In-DB Analytics for Spark Demo Video https://www.youtube.com/playlist?list=PLQ6CoZ-HctoUFVPWnX4qdkQFMvu_heqE7 20
  • 21. © 2017 IBM Corporation 【参考】Db2 Warehouse(旧dashDB Local) –Demo動画 dashDB Local for private cloud and SDEs Demo Video https://www.youtube.com/playlist?list=PLHML2rQ3S7uZu4qFpApwUdERnx8VJO6OR 21
  • 22. © 2017 IBM Corporation 【参考】Db2 Warehouse(旧dashDB Local) 導入ガイド Db2 Warehouse 評価版 シングル構成 参考導入手順書 https://www-01.ibm.com/marketing/iwm/dre/signup?source=mrs-form-11354&S_PKG=ov56016&lang=ja_JP Db2 Warehouse Knowledge Center https://www.ibm.com/support/knowledgecenter/en/SS6NHC/com.ibm.swg.im.dashdb.kc.doc/welcome.html 22
  • 23. © 2017 IBM Corporation 数クリックでお手軽に試したいときはこちら 利用上の注意/制限:開発用途のみに使用ください/コミュニティサポートの製品です Db2を始めませんか? Download & Go! たった15分でお手元にDb2がインストール http://ibm.biz/db2dev_com http://ibm.biz/db2dev_c 他社のデータベース含めDBの知識がある方にオススメです 全機能が無償でじっくり試せます 23