SlideShare una empresa de Scribd logo
1 de 76
Descargar para leer sin conexión
Copyright © 2015, Oracle and/or its affiliates. All rights reserved. |
Oracle DBとHadoop連携の勘所
日本オラクル株式会社
クラウド・テクノロジー事業統括
クラウド・テクノロジー製品戦略統括本部
ビッグデータ&セキュリティ技術部
立山 重幸(Shigeyuki.Tateyama@oracle.com)
Copyright © 2015, Oracle and/or its affiliates. All rights reserved. |
• 以下の事項は、弊社の一般的な製品の方向性に関する概要を説明す
るものです。また、情報提供を唯一の目的とするものであり、いか
なる契約にも組み込むことはできません。以下の事項は、マテリア
ルやコード、機能を提供することをコミットメント(確約)するも
のではないため、購買決定を行う際の判断材料になさらないで下さ
い。オラクル製品に関して記載されている機能の開発、リリースお
よび時期については、弊社の裁量により決定されます。
2
OracleとJavaは、Oracle Corporation 及びその子会社、関連会社の米国及びその他の国における登録商標です。
文中の社名、商品名等は各社の商標または登録商標である場合があります。
Copyright © 2015, Oracle and/or its affiliates. All rights reserved. |
本資料と、セッション動画公開について
• 本資料は、2015年12月9日に開催された、『Oracle DBA & Developer
Day 2015』のセッション公開資料です
• セッション内容の動画については、他セッションとあわせて下記に
公開されておりますので、あわせてご参照いただければと存じます
3
リンクはこちら
Copyright © 2015, Oracle and/or its affiliates. All rights reserved. | 4
ビッグデータ& IoT お客様事例 抜粋
投影のみ
Copyright © 2015, Oracle and/or its affiliates. All rights reserved. |
Agenda
どうして、こんなにHadoop
やNOSQLの事例が増えて
来たのだろう?
5
Copyright © 2015, Oracle and/or its affiliates. All rights reserved. |
Oracle DB & Hadoop & NOSQL 共存共栄
6
スループット 高
バッチ処理
レイテンシ 低
オンライン処理
流行らな
かったRDB
Oracle DBは、堅牢性、安定性、パフォーマンスが
優れている
⇒これからも企業システムの主役であり続ける
しかしながら、ビッグデータやIoTなど、試験的な試
みに対するROIを得るために、目的別に機能特化
した低コストな環境を利用する事が定着してきた
Copyright © 2015, Oracle and/or its affiliates. All rights reserved. | 7
Facebook – HadoopとRDBMSの連携例
主な利用用途
• 定期的なレポート生成
• 広告キャンペーンの効果測定
• ページビュー、滞在時間等の集計
• リコメンド情報の生成
• ログデータの長期保持
• ログデータを利用したスパムボットからのユーザの保護
RDBMSとの併用
Hadoop単体では、リアルタイム処理に弱いため、高速なレ
スポンスが求められるデータに関しては、RDBMS(Oracle /
MySQL)に最終的に格納
FacebookのようなHadoopを多用している企業でも、最終的にRDBMSにデータを格納して活用
 HadoopとRDBMSの連携の需要は大きい
出典 Apache Hadoop FileSystem and its Usage in Facebook
Dhruba Borthakur
http://cloud.berkeley.edu/data/hdfs.pdf
Copyright © 2015, Oracle and/or its affiliates. All rights reserved. |
業務
アプリケーション
オペレーショナル
レポーティング
DWH
(RDBMS)
Oracle社としても
HadoopとRDBMSの強みを組みあわせる事を推奨
ソーシャルメディア
Internet of Things
73°
ビッグデータ
マネジメント基盤
Data Reservoir
(Hadoop)
8
アナリティクス
Copyright © 2015, Oracle and/or its affiliates. All rights reserved. |
Oracle社が提供するHadoopマシン
Big Data Appliance X5-2
Sun Oracle X5-2L Servers × 18node:
• 2 * 18 Core Intel Xeon E5 Processors
• 128 GB Memory
• 96TB Disk space
Integrated Software (4.3):
• Oracle Linux6.7, Oracle JDK 8
• Oracle Big Data SQL 2.0*
• Cloudera Distribution of Apache Hadoop 5.4 – EDH Edition
• Cloudera Manager 5.4
• Oracle R Distribution 3.1.1-2
• Oracle NoSQL Database CE 3.2.4
9
•Oracle Big Data SQL はオプションライセンス
Copyright © 2015, Oracle and/or its affiliates. All rights reserved. |
Agenda
HadoopとRDBMSは、
どう住み分けるべきか?
10
Copyright © 2015, Oracle and/or its affiliates. All rights reserved. |
Oracle Big Data Management System
データの特性による典型パターン 適材適所のデータ配置例
パターン・データ特性
Data Reservoir
(Big Data Appliance)
Data WareHouse
(Exadata)
データ
容量
データ密度・
データ価値
低い 高い
フォーマット
変更頻度
多い 少ない
粒度 細かい 粗い
参照頻度 少ない 多い
ETL処理 ETL処理と生データ保持 ETL処理、生データ 処理後データ
センサーデータ、
ログデータ、GPSデータ、SNS
等
既存のRDBMS内のデータ(マ
スターデータ/
トランザクションデータ)
明細データ サマリデータ
経年データ アクティブデータ
ETL処理前の生データ ETL処理後データ
11
Copyright © 2015, Oracle and/or its affiliates. All rights reserved. |
ユースケース:大量データ保持基盤(CDWH)
データレザボアとして必要な情報を一元化
12
社内システム群
センサーデータなど
Web Log
セントラル
データウェアハウス
としてのHadoop
RDBMSを
利用したデータマート
BIツールを
利用した分析
目的:集約した大量のデータを
相対的に安価に保持、加工、集
約する
目的:ユーザに利用しやすい形
でセキュアにデータを提供
Copyright © 2015, Oracle and/or its affiliates. All rights reserved. |
Why Hadoop?
• 相対的に安価に大量のデータを保持
– 複数事業部のデータを集約
– Web logやセンサーデータ、デバイス生成のデータなどストレージ容量の制約
で、これまで廃棄していたデータの保持
• 計算処理をオフロード
– データの正規化、加工、集計の負荷をRDBMSからオフロード
– 並列分散処理はHadoopがもっとも得意とするところ
13
Copyright © 2015, Oracle and/or its affiliates. All rights reserved. |
Hadoop + RDB組み合わせの実装上の課題
14
社内システム群
センサーデータなど
Web Log
セントラル
データウェアハウス
としてのHadoop
RDBMSを
利用したデータマート
BIツールを
利用した分析
HadoopとRDBMSという異なる技術要素の連携が課題になる
TO hadoop IN hadoop FROM hadoop
Copyright © 2015, Oracle and/or its affiliates. All rights reserved. |
Agenda
どんな方法で
連携出来るのか?
15
Copyright © 2015, Oracle and/or its affiliates. All rights reserved. |
Hadoop+RDBの連携技術 サマリ
16
Sqoop
Copy to BDA
一般的なHadoop機能
Oracle独自機能
SPARK
Oracle Table Access
for Hadoop & Spark
File
HDFS API
Flume
TO hadoop IN hadoop FROM hadoop
Hive
MapReduce
Sqoop
Oracle Loader
for Hadoop
Oracle
Big Data SQL
Oracle Data Integrator
Copyright © 2015, Oracle and/or its affiliates. All rights reserved. |
Agenda
TO hadoop
17
Copyright © 2015, Oracle and/or its affiliates. All rights reserved. |
Apache Sqoop
連携元 各種RDBMS
連携タイミング バッチ
データ・ロスの
可能性
連係中に障害等で処理が
停止した場合は、連係中の
HDFSデータの消去と再実
行で対応
HDFS以外の連
携先
HBase, Hive
特徴 Cloudera Enterpriseにサ
ポートが含まれる
• RDBMSとのバッチ連係のための
ソフトウェア
– RDBMSからHadoopへの連係(import)、Hadoooから
RDBMSへの連係(export)の双方向の連係に対応
– JDBCが利用可能な各種RDBMSに対応
– Client SoftwareであるSqoop1とサーバー型のSqoop2が
存在
Sqoop
18
Copyright © 2015, Oracle and/or its affiliates. All rights reserved. |
Sqoopの動作
19
HDFS MapReduce DB
M1
M2
File
node1
node2
nodex
File
並列Select
並列Select
データ転送
データ転送
変換
変換
書込
書込
コマンド例:
sqoop import
--connect jdbc:oracle:thin:@hostname:port:instance
--username ユーザ名 --password パスワード
--table 表名 –target-dir HDFSディレクトリ
- m 4
4つのMapperが、JDBC経由で--tableで指定されたテーブルにSQLを実行し、取得したデータをコード変換やCSV
へのフォーマット変換を行った後に、--target-dirで指定したHDFSディレクトリに書き込みを行う
M3
M4
File
File
並列Select
並列Select
データ転送
データ転送
変換
変換
書込
書込
Sqoop
Copyright © 2015, Oracle and/or its affiliates. All rights reserved. |
Copy to BDA (Oracle Big Data SQL機能)
連携元 Exadata
Oracle Database 11.2以上
連携タイミング バッチ
データ・ロスの
可能性
連係中に障害等で処理が
停止した場合は、連係中の
HDFSデータの消去とコピー
で対応
HDFS以外の連
携先
Hive
特徴 DataPump形式の論理バッ
クアップを取得している場
合は、バックアップをそのま
まBDA側で利用可能
• DataPump形式のファイルをHiveやBig
Data SQLから利用可能に
– DataPump形式のファイルをHDFSにコピーしておけば、そ
のファイルをHive StorageHandler経由で利用可能
– DataPumpの取得元は、ライセンス上の制約から、現時
点では、Exadataのみ
– Impalaなどのように、Hive StorageHandlerを利用できな
いソフトウェアからはアクセスできない
Big Data Appliance
+
Cloudera Hadoop
Exadata
+
Oracle Database
Copy files
to BDA
Big Data SQL
Copy to BDA
20
Copyright © 2015, Oracle and/or its affiliates. All rights reserved. |
Copy to BDAのイメージ
21
Copy to BDA
①表データおよびメタデータを含む
pump形式ファイルを生成
CREATE TABLE table_name ORGANIZATION EXTERNAL
( TYPE oracle_datapump
DEFAULT DIRECTORY database_directory
LOCATION ('filename1.dmp','filename2.dmp'...) )
PARALLEL n
AS SELECT * FROM tablename;
②HDFSにファイルをコピー
hadoop fs -put filename*.dmp hdfs_directory
③Hive表の作成
CREATE EXTERNAL TABLE tablename
ROW FORMAT SERDE
'oracle.hadoop.hive.datapump.DPSerDe'
STORED AS INPUTFORMAT
'oracle.hadoop.hive.datapump.DPInputFormat'
OUTPUTFORMAT
'org.apache.hadoop.hive.ql.io.HiveIgnoreKeyTextOutput
Format'
LOCATION 'hdfs_directory’
列定義は不要
Copyright © 2015, Oracle and/or its affiliates. All rights reserved. |
Sqoop vs Copy To BDA
Apache Sqoop CopyTo BDA
連携元 〇 JDBC提供されているRDBMS
HSQLDB,MySQL,Oracle,PostgreSQLは個別DB対応機
能あり
△ Exadata (Oracle Database 11.2)
HDFSへの出力形式 〇 SequenceFile, Avro, Text, Hive表 △ Hive表(DataPump形式)
連携時の実行速度 ○ 特定列のレンジで分散されて処理されるため、一様分
布している列が存在しないと速度が出にくい
△ DataPumpを出力するファイルシステムのIO性能および
HDFSへの転送速度に大きく依存
設定の容易性 〇 パラメータによる設定
ODIを利用してGUIから設定可能
実行はMapReduceの起動
〇 (利点) DataPumpファイルにメタデータを内包しているので、
Hive側で列定義等が不要
(欠点) DataPumpの出力、HDFSへのコピー、Hive表の作成
いう3ステップが必要
その他制約事項 Big Data SQL必須
Impalaなどのように、Hive StorageHandlerを利用できない
ソフトウェアからはアクセスできない
総評 汎用性に強みあり。 ソースがExadataかつ、活用パターンがBig Data SQL経由
のみの場合は有効
22
Copy to BDA
Sqoop
Copyright © 2015, Oracle and/or its affiliates. All rights reserved. |
Oracle Table Access for Hadoop(Oracle Big Data Appliance機能)
HiveやSpark SQLからOracle Databaseのデータにアクセス
Big Data Appliance
Cloudera Hadoop
Oracle Database
HCatalog
StorageHandler
JDBC
• Oracle DBからのデータの移動
の必要なく、Hive SQL, Spark
SQLからOracle DBのデータに
アクセス可能
• バッチ処理時のマスタ参照など
に有効
23
Oracle Table Access
for Hadoop & Spark
Copyright © 2015, Oracle and/or its affiliates. All rights reserved. |
Hive表のDDL
24
CREATE EXTERNAL TABLE orders_ora(
trx_nbr STRING,
・・・
curr_ind STRING
)
STORED BY 'oracle.hcat.osh.OracleStorageHandler'
WITH SERDEPROPERTIES (
‘oracle.hcat.osh.columns.mapping’ = ‘trx_nbr,・・・,curr_ind')
TBLPROPERTIES (
'mapreduce.jdbc.url' = 'jdbc:oracle:thin:@DBServer:1521/dbname',
'mapreduce.jdbc.username' = ‘username',
'mapreduce.jdbc.password' = ‘password',
'mapreduce.jdbc.input.table.name' = ‘tablename',
'oracle.hcat.osh.splitterKind' = 'ROW_SPLITTER',
'oracle.hcat.osh.rowsPerSplit' = '1500'
);
Oracle Table Access for Hadoop and Spark用の
Storage Handler
Hive表の各列に対応するOracle Database側の
列名をカンマ区切りでHiveの列順に記述
Oracle Databaseへの接続情報
データの分割・並列度をどのように決定するか(Splitter)
Oracle Table Access
for Hadoop & Spark
Copyright © 2015, Oracle and/or its affiliates. All rights reserved. |
並列度およびデータ分割(Splitter)
• 以下のSplitterを設定可能 (oracle.hcat.osh.splitterKind に設定)
– SINGLE_SPLITTER
• Mapperの起動数は常に1つ
– ROW_SPLITTER
• 一定行数で分割して並列処理
• Mapperの起動数は、以下のうち小さい方
– oracle.hcat.osh.rowsPerSplit
– oracle.hcat.osh.maxSplits (ROW_SPLITTERを利用した時のmaxSplitsのデフォルト値は1のためmaxSplitsを明示的に指定しないと並列
処理されない)
– BLOCK_SPLITTER
• データ・ブロックをもとに分割。並列度は oracle.hcat.osh.maxSplits (デフォルト値は1)を超えない。
• 利用するOracle DatabaseユーザーにはSYS.DBA_EXTENTS表の参照権限が必要。権限が無い場合はSINGLE_SPLITTERを使って実行される
• パーティション表および索引構成表に対しては設定不可
– PARTITION_SPLITTER
• パーティション単位で分割。並列度は oracle.hcat.osh.maxSplits を超えない。
25
Oracle Table Access
for Hadoop & Spark
Copyright © 2015, Oracle and/or its affiliates. All rights reserved. |
Agenda
TO hadoop
File
26
Copyright © 2015, Oracle and/or its affiliates. All rights reserved. |
• HDFS NFS Gateway
– NFS Mountにより、通常の
ファイルシステムと同様
の操作感。ただしrandom
writeはサポートされない
ので要注意
• HttpFS
– HTTPでHDFSへファイルを
送受信
– HTTPアクセスできればよ
いので、クライアント側
に特別な設定・ソフト
ウェアは不要。クライア
ントはGatewayサーバーに
HTTPでアクセスできれば
よい
27
• HDFS API
– JavaやCなどのAPI経由での
アクセス
– プロキシなどを経由しな
いので、もっとも高速
HDFSへのファイル転送
典型的な利用シーン:
管理用シェルスクリプトなど
通常のOSコマンドで、HDFSを
操作したい場合
典型的な利用シーン:
- クライアント側にライブラリ等
を配置できない場合
- APIが提供されていない言語
からの利用
典型的な利用シーン:
- Java, Cプログラムからの利用
HDFS API
Copyright © 2015, Oracle and/or its affiliates. All rights reserved. | 28
Hadoopコマンド(File system shell)例
https://hadoop.apache.org/docs/current/hadoop-project-dist/hadoop-common/FileSystemShell.html
コマンド 説明
hadoop fs –ls hdfsディレクトリ HDFSディレクトリの一覧を表示
hadoop fs –put file.txt hdfsディレクトリ ローカルにあるfile.txtをHDFSディレクトリにコピー
Hadoop fs –cat hdfsディレクトリ/file.txt HDFS上にあるfile.txtを表示
Hadoop fs –rm hdfsディレクトリ/file.txt HDFS上にあるfile.txtを削除
HDFS API
Copyright © 2015, Oracle and/or its affiliates. All rights reserved. |
Apache Flume
• 準リアルタイム データ収集のための効率的な基盤
– Big Data Applianceに含まれる
– 特にログファイルの準リアルタイムの収集に強みをもつ
• ファイル単位ではなくログに出力されたものを順次収集 (TailSuorce)
– Agentを複数配置することでスケールアウト可能
29
HDFS
Agent1
Agent
ログの転送
Agent
Agent2
Agent3
Agent4
Thirft, JMS, HTTP等
多様なソースに対応
収集したデータの格納先は
Apache HBaseやApache Solr
等にも対応
連携元 ファイル(tail –F 方式で順次
読み取り), Thrift, JMS, Avro,
HTTP, Syslog等
連携タイミン
グ
準リアルタイム
データ・ロスの
可能性
連携中にAgentが受信した
データを送信前にファイル
or DBに永続化することでき、
データロスを防ぐことが可能
HDFS以外の
連携先
Avro, Thrift, IRC, HBase, Solr,
Elastic Search, Kafka
特徴 Big Data Applianceではサ
ポートこみで利用可能
公式サイト https://flume.apache.org/
Flume
Copyright © 2015, Oracle and/or its affiliates. All rights reserved. |
Agenda
IN hadoop
30
Copyright © 2015, Oracle and/or its affiliates. All rights reserved. |
Hadoop仲間のエコシステム
31
HDFS
分散ファイルシステム
Spark
インメモリの分散処理フレームワーク
MapReduce
分散処理フレームワーク
Hive
SQLエ
ンジン
YARN
分散処理のリソース管理
Mahout
機械
学習
Pig
手続型
データ処理
MLLib
機械学習
GraphX
グラフ分析
SparkSQL
SQLエンジン Impala
SQLエ
ンジン
その他
アプリ
ケーショ
ン
Copyright © 2015, Oracle and/or its affiliates. All rights reserved. |
バッチ処理用言語
MapReduce , Pig , Hive
•MapReduceはパワフルな半面、習得が難しい
•HiveやPigであればスクリプトやSQLなどで比較的容易な操作が可能になる
•内部的にはMapReduceを実行している
•HiveはFacebook , PigはYahoo!によって開発された
•Hive
•Pig
Select * FROM purchases Where price > 10000 ORDER BY storeid
Purchases = LOAD “/user/data/purchases” AS (itemID , price ,puchaseID);
Bigticket = FILTER purchases BY price > 10000 ;
・・・
32
Copyright © 2015, Oracle and/or its affiliates. All rights reserved. |
バッチ処理用言語
MapReduce , Pig , Hive
•Hive vs Pig
Hive Pig
Language HiveQL (SQLライク) Pig Latin (データフロー型言語)
スキーマ テーブル定義はメタデータとして
管理される
StorageHandlerにより、様々な
フォーマットをパース可能
スキーマは、あってもなくても良い
実行時に定義可能
クライアント
からのアクセス
コマンドラインツール
JDBC, ODBC, Thrift
コマンドラインツール
PigServer ( Java API)
33
Copyright © 2015, Oracle and/or its affiliates. All rights reserved. |
Hive
SQLライクな言語で分散処理を実現
HDFS上では、データは種々
のフォーマットの
ファイルとして存在
HiveQLによる
処理の記述
HDFS
Hive
Engine
MapReduce
Hive
Metastore
Hive MapReduce
HiveQLを解釈して、
MapReduceとして実行
= SQLとMapReduceの
橋渡し
表定義や、ファイルの
フォーマットなどを管理。
CREATE TABLE文で情報
が格納される
Hive Metastoreの情報に
従って、ファイル取得、
フォーマット解釈
34
Copyright © 2015, Oracle and/or its affiliates. All rights reserved. |
CREATE TABLE 文の例
CREATE TABLE TEST_TABLE (
ORG_BSNS_UNIT_KEY decimal(30),
BSNS_UNIT_CD string,
DAY_ACT_CONDITION_KEY decimal(30),
BSNS_ENT_KEY decimal(30),
BSNS_ENT_CD string,
EMP_KEY decimal(30))
ROW FORMAT DELIMITED FIELDS TERMINATED BY ','
STORED AS TEXTFILE;
区切り文字が”,”のテキストファイル
= CSVファイルとして定義
35
Copyright © 2015, Oracle and/or its affiliates. All rights reserved. |
INSERT SELECT句や、CREATE TABLE AS SELECTによる処理
Hiveによるデータ処理の例
36
INSERT OVERWRITE TABLE table_a
SELECT ….
CREATE TABLE result_table
AS SELECT ….
SELECTの結果をテーブルに挿入。
OVERWRITE句を使用した場合は、既存
データは消去。使用しない場合は追記
新規に結果格納用のテーブルを作成
Copyright © 2015, Oracle and/or its affiliates. All rights reserved. |
Oracle Data Integrator
Oracle Data Integrator Application Adapters for Hadoop
Oracle Data Integrator for Big Data
• ファイル/RDBMSからHiveへのロード
• Hive を利用したデータの検証と変換
• FileもしくはHiveからOracleへのロード
37
Map Reduceによるデータ加工やETL処理、DBへのデータロードをGUIで定義可能
Hadoop Cluster
f(x) MapReduce
Data Load
Oracle Database
Oracle Data Integrator
Application Adapters for Hadoop
• 追加オプションでSparkやPigのコードを
生成する事が可能
• Hadoopの最新技術を活用した、
高速なインメモリ処理がGUIで定義可能に
Oracle Data Integrator
Copyright © 2015, Oracle and/or its affiliates. All rights reserved. |
論理的にデータフローをデザインするだけで、
ナレッジモジュールによりSqoopやHiveなどの物理デザインを作成できる
38
Logical and Physical Design with ODI
論理デザイン
物理デザイン
Oracle
MySQL
Hive
Sqoop
Sqoop
IKM
LKM
LKM
Oracle
Hive
MySQL
Hive
Oracle Data Integrator
Copyright © 2015, Oracle and/or its affiliates. All rights reserved. |
Hive: Execute Transformation
Hive
SQL
Oracle Data Integrator
39
Copyright © 2015, Oracle and/or its affiliates. All rights reserved. |
Pig: Execute Transformation Oracle Data Integrator
40
Copyright © 2015, Oracle and/or its affiliates. All rights reserved. |
Spark: Execute Transformation Oracle Data Integrator
41
Copyright © 2015, Oracle and/or its affiliates. All rights reserved. |
Agenda
FROM hadoop
42
Copyright © 2015, Oracle and/or its affiliates. All rights reserved. |
HadoopとRDBMSの連携の問題点
• NTTデータ殿による金融機関の市場リスク管理のバッチ処理をHadoopで行った検証結果
金融システムへの最新技術の適用 「大量データ分析処理技術『Hadoop』」(後篇)
http://e-public.nttdata.co.jp/topics_detail4/id=176
バッチ処理自体は速くなった
RDBMSへのロードに時間がかかり
トータルではあまり速くなっていないしかし
Open SourceのHadoopとOracle DBとの連携製品(Sqoop もしくはそれを拡張したOraOop)もあるが十
分な速度がでず、処理全体の中でボトルネックになっている
43
Copyright © 2015, Oracle and/or its affiliates. All rights reserved. |
Oracle Loader for Hadoop
44
• Hadoop上のデータを並列処理
でOracle DBに高速データロード
(15TB/時間)
• データロード時のOracle DBへの
負荷を最小化
• 自動ロードバランスによるデータ
ロード処理時間の短縮
• ケルベロス認証のサポートJSON
Log
files
Hive
Text ParquetAvro Sequence
files
Compressed
files
And more …
Oracle Loader
for Hadoop
(Oracle Big Data Connectors機能)
Copyright © 2015, Oracle and/or its affiliates. All rights reserved. |
Oracle Loader for Hadoop
45
HDFS上の対応フォーマット
形式 摘要
Hive Hiveテーブルからの読み取り
テキスト(可変長、正規表現) HDFS上のデリミタ区切りのファイルもしくは、フォーマット
を正規表現で記述可能なファイルからの読み取り
任意のフォーマット InputFormatを独自に実装可能
データベースへのロード方式
方式 摘要
OCI Direct Path ロードに最適化されたDirect Path Loadモードを利用する
ため高速
データベースバッファを経由せず、直接データブロックを
生成するため高速
JDBC JDBCによる接続、ロード。
Offline ロードに最適化されたファイル(Data PumpもしくはCSV)を
HDFS上に生成
高速化を支える仕組み
•通常のJDBCインタフェースの他に、ロード
に最適化されたDirect Path Loadを利用する
ことが可能
• Oracle DatabaseのPartitionごとに並列に
ロード処理を行うことが可能なため高速
•データのサンプリングを行うことにより、ロー
ド処理を行うReducerの数を適切に割り当て
ることで、処理完了までの時間を短縮(後述)
パーティション対応したData PumpをMapReduceで作成し、Direct Pathでロードする仕組み
Oracle Loader
for Hadoop
Copyright © 2015, Oracle and/or its affiliates. All rights reserved. |
Oracle Loader for Hadoop
46
時間
Reduce1
Reduce2
Reduce3
Reduce4
※ maxSamplesPctとmaxLoadFactorと loadCIの組み合わせによっては、統計的に条件を満たせないこともある。
その場合には、サンプリングに基づいたロードバランスを実施しない。一般的にはデフォルト値が効果的。
以下のパラメータを使い、サンプリングの精度を設定可能
パーティションごとのデータに偏りがある場合でも、
パーティションに割り当てるReducerの数を調整して
最適なロードバランスを実現
Partitionごとにロードを行う場合でも、Partition間
のデータの偏りをサンプリングで検知して、割り当
てるReducerの数を調整する。
結果、各Reducerの処理量が平準化され、トータル
の処理時間の短縮が実現される。
パラメータ パラメータの意味
enableSampling サンプリングを行うかどうか
maxSamplesPct 元データのうち最大どれだけの割合のデータをサンプリングするかを指定
(default:0.01)
maxLoadFactor どのreducerも、ここで設定した割合以上のオーバーロードが起きない
(default:0.05)
loadCI 統計的に、ここで指定した確率でmaxLoadFactor以内のオーバーロードに収まる
(1から有意水準を引いた値)(default:0.95)
Oracle Loader
for Hadoop
Copyright © 2015, Oracle and/or its affiliates. All rights reserved. |
Oracle Big Data SQL
47
Smart Scan
クエリをExadataの
ストレージサーバーにオフロード
Storage Index
クエリに必要な
データブロックのみをスキャン
SQL一つで、
必要なデータが
高速にセキュアに返される
Smart Scan
クエリをBig Data Applianceの
データノードにオフロード
Storage Index
クエリに必要な
データブロックのみをスキャン
SQL
必要データ
のみ移動
SQL
Big Data Appliance
+
Hadoop/NoSQL
Exadata
+
Oracle Database 12c
Hive
metadata
Oracle DBの外部表からHDFSのデータを参照する仕組み
既存のアプリ、ツール、スキル
そのままで全てのデータがクエリ可能
Oracle
Big Data SQL
Copyright © 2015, Oracle and/or its affiliates. All rights reserved. |
Oracle Big Data SQL
selectlast_name, state,
movie,genre
frommovielogm,customer c
wheregenre=‘comedy’
andc.custid=m.custid
Smart Scan:ローカルでの絞り込み・データ転送の極小化
1
NameNode/Hive Metastoreから
以下の情報取得:
• データの保持場所
• データの構造
• 対象のブロック数
1
2
Big Data SQL Serverが並列読込み:
• DataNodeが並列にデータアクセス
• 行と列の絞り込み
2
HiveMetastore
HDFS
NameNode
3
データベースサーバーでの処理
• 関連するデータのみ転送されてくる
• データベースのテーブルとジョイン
• データベースセキュリティポリシーの適用
3
HDFSDataNode
BDS Server
HDFSDataNode
BDS Server
customer
DB
Hadoop
48
Oracle
Big Data SQL
Copyright © 2015, Oracle and/or its affiliates. All rights reserved. |
Big Data SQL 1.0 & 1.1
• Hadoop側の並列度はDB側に依存
– DB側に不要なPQプロセスが乱立
– 明示的な並列度指定が必要
Big Data SQL 2.0
• HadoopとDBの並列度を個別割り当て
• Auto DoPで常に最適な並列度
– 平均40%パフォーマンス向上
• StorageHandler サポート
– And more…
Big Data SQL 2.0:
並列化の仕組みとStorageHandler対応が拡張
Oracle
Big Data SQL
49
Copyright © 2015, Oracle and/or its affiliates. All rights reserved. | 50
BDS1.1 vs BDS2.0
並列度 社内検証結果
投影のみ
Copyright © 2015, Oracle and/or its affiliates. All rights reserved. |
StorageHandlers: HDFS以外の仕組みにも拡張できる
Hive Metastore
Oracle Big Data SQL
Hive StorageHandlers
Oracle
Big Data SQL
51
Copyright © 2015, Oracle and/or its affiliates. All rights reserved. | 52
DEMO
Copyright © 2015, Oracle and/or its affiliates. All rights reserved. |
Big Data SQL 1.0 & 1.1
• クエリの度に全てのブロックを
読み取り
– ブロックあたり256MBのI/Oが発生
Big Data SQL 2.0
• 初回アクセス時に自動的にStorage
Indexを作成
• 2回目からは不要なI/Oをスキップ
• 平均65% 高速化
– 絞り込み条件が強いクエリの場合、
100倍以上高速化するものも
Big Data SQL 2.0:
Storage Indexing
Oracle
Big Data SQL
53
Copyright © 2015, Oracle and/or its affiliates. All rights reserved. |
Oracle Big Data SQL
Storage Index:スキャン対象を絞込み、クエリ時間とデータIOを削減
54
HDFS
Field1, Field2,
1001
1010
1045
1109
1043
1001
1045
1609
1043
11455
1909
12430
13010
10450
1909
2043
Field3, … , Fieldn
HDFS
Block1
(256MB)
HDFS
Block2
(256MB)
Index
B1 – Movie_ID
Min: 1001
Max: 1609
B2 – Movie_ID
Min: 1909
Max: 13010
Example:
Find all ratings from
movies with a
MOVIE_ID of 1109
✓
✗
• 自動的にHDFS上のデータブロッ
ク毎のIndexの最大値と最小値を
作成
• スキャン前に目的のデータが最
大値-最小値の間にあるかを確認
• 最大値-最小値の間になければ、
スキャンを行わず、クエリにか
かる時間と、HDFSからのI/Oを削
減
平均65%、最大100倍高速化
Oracle
Big Data SQL
Copyright © 2015, Oracle and/or its affiliates. All rights reserved. | 55
Big Data SQL 2.0: Selected TPC-DS Speed Ups
Query Elapsed Time Times Faster
without SI with SI
42 141.7s 12.3s 11.5
52 148.6s 26.3s 5.7
53 151.6s 44.3s 3.4
55 124.6s 11.0s 11.3
59 238.1s 63.5s 3.7
65 294.3s 76.1s 3.9
68 125.8s 8.9s 14.1
73 120.9s 10.2s 11.9
79 132.6s 11.9s 11.1
89 362.0s 67.1s 5.4
98 252.2s 13.1s 19.3
Oracle
Big Data SQL
Copyright © 2015, Oracle and/or its affiliates. All rights reserved. | 56
BDS1.1 vs BDS2.0
並列度 社内検証結果
投影のみ
Copyright © 2015, Oracle and/or its affiliates. All rights reserved. |
今後さらに高速化機能を追加予定
57
投影のみ
Copyright © 2015, Oracle and/or its affiliates. All rights reserved. |
Big Data SQL: 制約もなくしていく予定
58
投影のみ
Copyright © 2015, Oracle and/or its affiliates. All rights reserved. |
Big Data SQLのビジョン
全ての仕組みに共通のインターフェースを提供する
59
Copyright © 2015, Oracle and/or its affiliates. All rights reserved. |
Hadoop+RDBの連携技術 サマリ
60
Sqoop
Copy to BDA
一般的なHadoop機能
Oracle独自機能
SPARK
Oracle Table Access
for Hadoop & Spark
File
HDFS API
Flume
TO hadoop IN hadoop FROM hadoop
Hive
MapReduce
Sqoop
Oracle Loader
for Hadoop
Oracle
Big Data SQL
Oracle Data Integrator
Copyright © 2015, Oracle and/or its affiliates. All rights reserved. |
Agenda
バッチではなくリアルタイム
連携が求められた時は?
61
Copyright © 2015, Oracle and/or its affiliates. All rights reserved. |
(準)リアルタイム処理
62
リアルタイム処理:
Spark Streaming
(BDAに含まれる)
Custom
Applications
Events
メッセージング・システム
Apache Kafka
N対Mの連係の際には
特に有用
Oracle GoldenGate for Big Data
Copyright © 2015, Oracle and/or its affiliates. All rights reserved. |
Agenda
運用面ではどうなんだろう?
63
Copyright © 2015, Oracle and/or its affiliates. All rights reserved. |
Enterprise Manager連携
• Big Data ApplianceはEnterprise Managerによる管理機能を提供
• ハードウェアの管理機能は、Exadata用のプラグインを流用
• ソフトウェアの管理機能は、Cloudera Managerと連携
64
基本的にはExadataと同じ監視が可能
Copyright © 2015, Oracle and/or its affiliates. All rights reserved. |
統合システム管理
BDA を Oracle Enterprise Manager
• ハードウェアとHadoopサービスのヘルス
チェック、死活監視、パフォーマンスの
監視
– 詳細な解析が必要な場合はCloudera Manager
にドリルダウン
• 統合されたインシデント管理
65
Copyright © 2015, Oracle and/or its affiliates. All rights reserved. |
Hadoop Cluster
• 全体のシステムパフォーマ
ンスを監視
• HDFSの格納量、MapReduce
アクティビティ、ホスト利
用率などのトレンドを確認
– 詳細な分析が必要な場合は
Cloudera Managerにドリルダウ
ン
Performance Summary
66
Copyright © 2015, Oracle and/or its affiliates. All rights reserved. |
Hardware Monitoring
Examples
Infiniband Network
BDA CPU Utilization
Host Level Metrics
 ハードウェアコンポーネント
を監視:
– Hosts
– ILOM Servers
– PDUs
– Switches
– Disks
 サマリーもしくは詳細なメト
リックを参照
67
Copyright © 2015, Oracle and/or its affiliates. All rights reserved. |
Enterprise ManagerとCloudera Managerの連携方式
Big Data ApplianceEnterprise Manager
(Oracle Management Service)
Enterprise
Manager
for
Big Data
Appliance
Plugin
Cloudera Manager
サービス監視
ヘルスチェッ
ク
リソース監視
サービス設定
サービス
起動・停止
サービス追加
リソース・死活監視
インシデント管理
Cloudera Managerからの管理が必要な項目
サーバー・スイッチ・PDU
68
Copyright © 2015, Oracle and/or its affiliates. All rights reserved. |
Agenda
Cloudへの取り組み
69
Copyright © 2015, Oracle and/or its affiliates. All rights reserved. |
Integrated Cloud: エンタープライズ向けの統一化されたプラットフォーム
70
CloudOn-Premises
DEVELOP AND DEPLOY ANYWHERE
同じ「アーキテクチャ」
同じ「オラクル製品」
同じ「知識・ノウハウ」
オンプレミスで培った高度な技術を
セキュアなクラウド環境へ
Complete
Open
Integrated
Engineered
Complete
Open
Integrated
Engineered
オラクルのクラウド戦略
Copyright © 2015, Oracle and/or its affiliates. All rights reserved. |
Oracle Big Data Cloud Service
エンタープライズ向けビッグデータ活用環境をクラウドで
71
Big Data
Cloud Service
高パフォーマンスかつセキュアな
最新の Hadoop の専用環境をご提供
必要に応じて柔軟なスケールアップ/ダウンも可能
高パフォーマンス
な専用環境
オラクルの最新ビッグデータ活用製品も含有
単なるインフラ層のコストや管理コスト削減
だけでなく、ソフトウェアも含めたTCO削減が可能
ビッグデータ活用
のための製品も
含有
Oracle Big Data SQL Cloud Service により
RDBMS, Hadoop, NoSQL にSQLでアクセス可能
クラウド上で総合的な
ビッグデータ管理システムを実現
SQL一つで
全てのデータを
活用可能
Copyright © 2015, Oracle and/or its affiliates. All rights reserved. |
Big Data + IoT環境をセキュアなクラウドでも活用可能
Big Data Cloud + IoT Cloud
Gateway
software 2G/3G/LTE
ネットワーク
WWAN
Database
Hadoop
NoSQL
Big Data
SQL
Big Data
Discovery
SCM
ERP
Sales Marketing
HCMPLM
ファイアウォー
ル
IoT Cloud Service
Big Data
Cloud Service
SaaS
Docs
Data
Prep.
Java BI
Dev
DB
Integ
ration
Process Mobile
PaaS
IoT Cloud Service
Gateway & SDKs
Device
Virtualization
High Speed
Messaging
Endpoint
Management
Stream Processing
Event Store
Enterprise
Connectivity
72
Copyright © 2015, Oracle and/or its affiliates. All rights reserved. |
Agenda
Oracle DBとHadoop
連携の勘所
73
Copyright © 2015, Oracle and/or its affiliates. All rights reserved. |
Oracle DBとHadoop連携の勘所
 移動対象の種類と量
データの移動に時間がかか
り過ぎないか
 バッチ対象データの断面の
取得方法
特定時刻のデータを取得す
る必要があるか
 並列処理が有効な処理か?
→ 「顧客ごと」など処理の分割
単位が明確であれば、並列化
の効果が大きい
 移行工数: 処理の複雑さ
 移行工数: 現行のロジックを再
利用できるか?
 独立性: 該当処理を利用して
いるジョブネットの数
 独立性: 後続処理の有無
 書戻しの種類と量
データの書戻しに時間がか
かり過ぎないか
 書き戻しの際のトランザク
ションの一貫性
TO hadoop IN hadoop FROM hadoop
•Hadoopに切り出す、業務・データを適切に見極める事が重要
•データの移動はコスト
•Hadoopが苦手な処理を無理やり実装しない
74
Copyright © 2015, Oracle and/or its affiliates. All rights reserved. |
0151209 Oracle DDD OracleとHadoop連携の勘所

Más contenido relacionado

La actualidad más candente

Oracle GoldenGateでの資料採取(トラブル時に採取すべき資料)
Oracle GoldenGateでの資料採取(トラブル時に採取すべき資料)Oracle GoldenGateでの資料採取(トラブル時に採取すべき資料)
Oracle GoldenGateでの資料採取(トラブル時に採取すべき資料)オラクルエンジニア通信
 
BIがクラウドで更なる進化!  データとの連携を強化したデータビジュアライゼーション
BIがクラウドで更なる進化!  データとの連携を強化したデータビジュアライゼーションBIがクラウドで更なる進化!  データとの連携を強化したデータビジュアライゼーション
BIがクラウドで更なる進化!  データとの連携を強化したデータビジュアライゼーションHisashi Igarashi
 
オラクル・インフラストラクチャー・サービス(IaaS)最新情報(Oracle Cloud Days Tokyo 2015)
オラクル・インフラストラクチャー・サービス(IaaS)最新情報(Oracle Cloud Days Tokyo 2015)オラクル・インフラストラクチャー・サービス(IaaS)最新情報(Oracle Cloud Days Tokyo 2015)
オラクル・インフラストラクチャー・サービス(IaaS)最新情報(Oracle Cloud Days Tokyo 2015)オラクルエンジニア通信
 
GoldenGateテクニカルセミナー1「市場のトレンドと最新事例のご紹介」(2016/5/11)
GoldenGateテクニカルセミナー1「市場のトレンドと最新事例のご紹介」(2016/5/11)GoldenGateテクニカルセミナー1「市場のトレンドと最新事例のご紹介」(2016/5/11)
GoldenGateテクニカルセミナー1「市場のトレンドと最新事例のご紹介」(2016/5/11)オラクルエンジニア通信
 
【2016年3月時点】クラウド型 BI だからできる新たな情報活用方法
【2016年3月時点】クラウド型 BI だからできる新たな情報活用方法【2016年3月時点】クラウド型 BI だからできる新たな情報活用方法
【2016年3月時点】クラウド型 BI だからできる新たな情報活用方法オラクルエンジニア通信
 
しばちょう先生が語る!オラクルデータベースの進化の歴史と最新技術動向#1
しばちょう先生が語る!オラクルデータベースの進化の歴史と最新技術動向#1しばちょう先生が語る!オラクルデータベースの進化の歴史と最新技術動向#1
しばちょう先生が語る!オラクルデータベースの進化の歴史と最新技術動向#1オラクルエンジニア通信
 
Zero Data Loss Recovery Applianceによるデータベース保護のアーキテクチャ
Zero Data Loss Recovery Applianceによるデータベース保護のアーキテクチャZero Data Loss Recovery Applianceによるデータベース保護のアーキテクチャ
Zero Data Loss Recovery Applianceによるデータベース保護のアーキテクチャオラクルエンジニア通信
 
進化を続けるデータベース・クラウド:Oracle Database, Exadata, MySQL, Cloud Machine [Oracle Clou...
進化を続けるデータベース・クラウド:Oracle Database, Exadata, MySQL, Cloud Machine [Oracle Clou...進化を続けるデータベース・クラウド:Oracle Database, Exadata, MySQL, Cloud Machine [Oracle Clou...
進化を続けるデータベース・クラウド:Oracle Database, Exadata, MySQL, Cloud Machine [Oracle Clou...オラクルエンジニア通信
 
クラウドを使って競争優位なビッグデータ活用の実現へ [Oracle Cloud Days Tokyo 2016]
クラウドを使って競争優位なビッグデータ活用の実現へ [Oracle Cloud Days Tokyo 2016]クラウドを使って競争優位なビッグデータ活用の実現へ [Oracle Cloud Days Tokyo 2016]
クラウドを使って競争優位なビッグデータ活用の実現へ [Oracle Cloud Days Tokyo 2016]オラクルエンジニア通信
 
オラクル・データベース・クラウド~さらなる進化のご紹介(Oracle Cloud Days Tokyo 2015)
オラクル・データベース・クラウド~さらなる進化のご紹介(Oracle Cloud Days Tokyo 2015)オラクル・データベース・クラウド~さらなる進化のご紹介(Oracle Cloud Days Tokyo 2015)
オラクル・データベース・クラウド~さらなる進化のご紹介(Oracle Cloud Days Tokyo 2015)オラクルエンジニア通信
 
Oracle Cloud IaaS活用:VMwareをそのままパブリック・クラウドへ&Windowsならオラクル [Oracle Cloud Days T...
Oracle Cloud IaaS活用:VMwareをそのままパブリック・クラウドへ&Windowsならオラクル [Oracle Cloud Days T...Oracle Cloud IaaS活用:VMwareをそのままパブリック・クラウドへ&Windowsならオラクル [Oracle Cloud Days T...
Oracle Cloud IaaS活用:VMwareをそのままパブリック・クラウドへ&Windowsならオラクル [Oracle Cloud Days T...オラクルエンジニア通信
 

La actualidad más candente (20)

Oracle GoldenGate Monitor 12cR2 セットアップガイド
Oracle GoldenGate Monitor 12cR2 セットアップガイドOracle GoldenGate Monitor 12cR2 セットアップガイド
Oracle GoldenGate Monitor 12cR2 セットアップガイド
 
Oracle GoldenGate Studio概要
Oracle GoldenGate Studio概要Oracle GoldenGate Studio概要
Oracle GoldenGate Studio概要
 
Oracle R Advanced Analytics for Hadoop利用方法
Oracle R Advanced Analytics for Hadoop利用方法Oracle R Advanced Analytics for Hadoop利用方法
Oracle R Advanced Analytics for Hadoop利用方法
 
Oracle GoldenGateでの資料採取(トラブル時に採取すべき資料)
Oracle GoldenGateでの資料採取(トラブル時に採取すべき資料)Oracle GoldenGateでの資料採取(トラブル時に採取すべき資料)
Oracle GoldenGateでの資料採取(トラブル時に採取すべき資料)
 
BIがクラウドで更なる進化!  データとの連携を強化したデータビジュアライゼーション
BIがクラウドで更なる進化!  データとの連携を強化したデータビジュアライゼーションBIがクラウドで更なる進化!  データとの連携を強化したデータビジュアライゼーション
BIがクラウドで更なる進化!  データとの連携を強化したデータビジュアライゼーション
 
Oracle GoldenGate入門
Oracle GoldenGate入門Oracle GoldenGate入門
Oracle GoldenGate入門
 
オラクル・インフラストラクチャー・サービス(IaaS)最新情報(Oracle Cloud Days Tokyo 2015)
オラクル・インフラストラクチャー・サービス(IaaS)最新情報(Oracle Cloud Days Tokyo 2015)オラクル・インフラストラクチャー・サービス(IaaS)最新情報(Oracle Cloud Days Tokyo 2015)
オラクル・インフラストラクチャー・サービス(IaaS)最新情報(Oracle Cloud Days Tokyo 2015)
 
GoldenGateテクニカルセミナー1「市場のトレンドと最新事例のご紹介」(2016/5/11)
GoldenGateテクニカルセミナー1「市場のトレンドと最新事例のご紹介」(2016/5/11)GoldenGateテクニカルセミナー1「市場のトレンドと最新事例のご紹介」(2016/5/11)
GoldenGateテクニカルセミナー1「市場のトレンドと最新事例のご紹介」(2016/5/11)
 
Oracle GoldenGate Veridata概要
Oracle GoldenGate Veridata概要Oracle GoldenGate Veridata概要
Oracle GoldenGate Veridata概要
 
【2016年3月時点】クラウド型 BI だからできる新たな情報活用方法
【2016年3月時点】クラウド型 BI だからできる新たな情報活用方法【2016年3月時点】クラウド型 BI だからできる新たな情報活用方法
【2016年3月時点】クラウド型 BI だからできる新たな情報活用方法
 
しばちょう先生が語る!オラクルデータベースの進化の歴史と最新技術動向#1
しばちょう先生が語る!オラクルデータベースの進化の歴史と最新技術動向#1しばちょう先生が語る!オラクルデータベースの進化の歴史と最新技術動向#1
しばちょう先生が語る!オラクルデータベースの進化の歴史と最新技術動向#1
 
RDF Semantic Graph「RDF 超入門」
RDF Semantic Graph「RDF 超入門」RDF Semantic Graph「RDF 超入門」
RDF Semantic Graph「RDF 超入門」
 
Oracle GoldenGate EM Plugin 13c セットアップガイド
Oracle GoldenGate EM Plugin 13c セットアップガイドOracle GoldenGate EM Plugin 13c セットアップガイド
Oracle GoldenGate EM Plugin 13c セットアップガイド
 
Zero Data Loss Recovery Applianceによるデータベース保護のアーキテクチャ
Zero Data Loss Recovery Applianceによるデータベース保護のアーキテクチャZero Data Loss Recovery Applianceによるデータベース保護のアーキテクチャ
Zero Data Loss Recovery Applianceによるデータベース保護のアーキテクチャ
 
進化を続けるデータベース・クラウド:Oracle Database, Exadata, MySQL, Cloud Machine [Oracle Clou...
進化を続けるデータベース・クラウド:Oracle Database, Exadata, MySQL, Cloud Machine [Oracle Clou...進化を続けるデータベース・クラウド:Oracle Database, Exadata, MySQL, Cloud Machine [Oracle Clou...
進化を続けるデータベース・クラウド:Oracle Database, Exadata, MySQL, Cloud Machine [Oracle Clou...
 
クラウドを使って競争優位なビッグデータ活用の実現へ [Oracle Cloud Days Tokyo 2016]
クラウドを使って競争優位なビッグデータ活用の実現へ [Oracle Cloud Days Tokyo 2016]クラウドを使って競争優位なビッグデータ活用の実現へ [Oracle Cloud Days Tokyo 2016]
クラウドを使って競争優位なビッグデータ活用の実現へ [Oracle Cloud Days Tokyo 2016]
 
20161125 Asakusa Framework Day オラクル講演資料
20161125 Asakusa Framework Day オラクル講演資料20161125 Asakusa Framework Day オラクル講演資料
20161125 Asakusa Framework Day オラクル講演資料
 
オラクル・データベース・クラウド~さらなる進化のご紹介(Oracle Cloud Days Tokyo 2015)
オラクル・データベース・クラウド~さらなる進化のご紹介(Oracle Cloud Days Tokyo 2015)オラクル・データベース・クラウド~さらなる進化のご紹介(Oracle Cloud Days Tokyo 2015)
オラクル・データベース・クラウド~さらなる進化のご紹介(Oracle Cloud Days Tokyo 2015)
 
Oracle GoldenGate アーキテクチャと基本機能
Oracle GoldenGate アーキテクチャと基本機能Oracle GoldenGate アーキテクチャと基本機能
Oracle GoldenGate アーキテクチャと基本機能
 
Oracle Cloud IaaS活用:VMwareをそのままパブリック・クラウドへ&Windowsならオラクル [Oracle Cloud Days T...
Oracle Cloud IaaS活用:VMwareをそのままパブリック・クラウドへ&Windowsならオラクル [Oracle Cloud Days T...Oracle Cloud IaaS活用:VMwareをそのままパブリック・クラウドへ&Windowsならオラクル [Oracle Cloud Days T...
Oracle Cloud IaaS活用:VMwareをそのままパブリック・クラウドへ&Windowsならオラクル [Oracle Cloud Days T...
 

Destacado

Hadoop HDFS NameNode HA
Hadoop HDFS NameNode HAHadoop HDFS NameNode HA
Hadoop HDFS NameNode HAHanborq Inc.
 
ビッグデータ&データマネジメント展
ビッグデータ&データマネジメント展ビッグデータ&データマネジメント展
ビッグデータ&データマネジメント展Recruit Technologies
 
SQL Serverの関数を一覧でマスターしよう
SQL Serverの関数を一覧でマスターしようSQL Serverの関数を一覧でマスターしよう
SQL Serverの関数を一覧でマスターしようA AOKI
 
第12回rest勉強会 これまでの補足・展望編
第12回rest勉強会 これまでの補足・展望編第12回rest勉強会 これまでの補足・展望編
第12回rest勉強会 これまでの補足・展望編ksimoji
 
DDDのすすめ
DDDのすすめDDDのすすめ
DDDのすすめRyo Amano
 
DDDモデリング勉強会 #6
DDDモデリング勉強会 #6DDDモデリング勉強会 #6
DDDモデリング勉強会 #6株式会社Jurabi
 
Scala × DDD × 弊社実践例
Scala × DDD × 弊社実践例Scala × DDD × 弊社実践例
Scala × DDD × 弊社実践例侑亮 原田
 
DevLOVE20150618 ddd x ビッグローブ
DevLOVE20150618 ddd x ビッグローブDevLOVE20150618 ddd x ビッグローブ
DevLOVE20150618 ddd x ビッグローブKoutarou Ishizaki
 
Azure MLやってみよう
Azure MLやってみようAzure MLやってみよう
Azure MLやってみようA AOKI
 
ドメイン駆動設計(DDD)導入判定チェックシート
ドメイン駆動設計(DDD)導入判定チェックシートドメイン駆動設計(DDD)導入判定チェックシート
ドメイン駆動設計(DDD)導入判定チェックシートTakuya Kawabe
 
Microsoft機械学習の簡単な紹介
Microsoft機械学習の簡単な紹介Microsoft機械学習の簡単な紹介
Microsoft機械学習の簡単な紹介A AOKI
 
Base DDD(ドメイン駆動設計) 参考文献を巡る旅
Base DDD(ドメイン駆動設計) 参考文献を巡る旅Base DDD(ドメイン駆動設計) 参考文献を巡る旅
Base DDD(ドメイン駆動設計) 参考文献を巡る旅Takuya Kawabe
 
ざっくり DDD 入門!!
ざっくり DDD 入門!!ざっくり DDD 入門!!
ざっくり DDD 入門!!Yukei Wachi
 
Biglobe×ddd 実践編(dev love 20150618)
Biglobe×ddd 実践編(dev love 20150618)Biglobe×ddd 実践編(dev love 20150618)
Biglobe×ddd 実践編(dev love 20150618)Hidekazu Nishi
 
ぐるぐるDDD/Scrum - モデリングと実装のうずまきをまわそう
ぐるぐるDDD/Scrum - モデリングと実装のうずまきをまわそうぐるぐるDDD/Scrum - モデリングと実装のうずまきをまわそう
ぐるぐるDDD/Scrum - モデリングと実装のうずまきをまわそうKiro Harada
 
DDD読書会@大阪(最終回)のLT資料「ドメイン駆動設計で気づいたこと~権利の概念とERP分析への適用」 #dddosaka
DDD読書会@大阪(最終回)のLT資料「ドメイン駆動設計で気づいたこと~権利の概念とERP分析への適用」 #dddosakaDDD読書会@大阪(最終回)のLT資料「ドメイン駆動設計で気づいたこと~権利の概念とERP分析への適用」 #dddosaka
DDD読書会@大阪(最終回)のLT資料「ドメイン駆動設計で気づいたこと~権利の概念とERP分析への適用」 #dddosakaakipii Oga
 
某S社のddd(メイリオ)
某S社のddd(メイリオ)某S社のddd(メイリオ)
某S社のddd(メイリオ)kumake
 
マイクロWebアプリケーション - Developers.IO 2016
マイクロWebアプリケーション - Developers.IO 2016マイクロWebアプリケーション - Developers.IO 2016
マイクロWebアプリケーション - Developers.IO 2016都元ダイスケ Miyamoto
 

Destacado (20)

Hadoop HDFS NameNode HA
Hadoop HDFS NameNode HAHadoop HDFS NameNode HA
Hadoop HDFS NameNode HA
 
ビッグデータ&データマネジメント展
ビッグデータ&データマネジメント展ビッグデータ&データマネジメント展
ビッグデータ&データマネジメント展
 
Hadoop HDFS Concepts
Hadoop HDFS ConceptsHadoop HDFS Concepts
Hadoop HDFS Concepts
 
SQL Serverの関数を一覧でマスターしよう
SQL Serverの関数を一覧でマスターしようSQL Serverの関数を一覧でマスターしよう
SQL Serverの関数を一覧でマスターしよう
 
第12回rest勉強会 これまでの補足・展望編
第12回rest勉強会 これまでの補足・展望編第12回rest勉強会 これまでの補足・展望編
第12回rest勉強会 これまでの補足・展望編
 
DDDのすすめ
DDDのすすめDDDのすすめ
DDDのすすめ
 
DDDモデリング勉強会 #6
DDDモデリング勉強会 #6DDDモデリング勉強会 #6
DDDモデリング勉強会 #6
 
Scala × DDD × 弊社実践例
Scala × DDD × 弊社実践例Scala × DDD × 弊社実践例
Scala × DDD × 弊社実践例
 
DevLOVE20150618 ddd x ビッグローブ
DevLOVE20150618 ddd x ビッグローブDevLOVE20150618 ddd x ビッグローブ
DevLOVE20150618 ddd x ビッグローブ
 
保守とDDDと私
保守とDDDと私保守とDDDと私
保守とDDDと私
 
Azure MLやってみよう
Azure MLやってみようAzure MLやってみよう
Azure MLやってみよう
 
ドメイン駆動設計(DDD)導入判定チェックシート
ドメイン駆動設計(DDD)導入判定チェックシートドメイン駆動設計(DDD)導入判定チェックシート
ドメイン駆動設計(DDD)導入判定チェックシート
 
Microsoft機械学習の簡単な紹介
Microsoft機械学習の簡単な紹介Microsoft機械学習の簡単な紹介
Microsoft機械学習の簡単な紹介
 
Base DDD(ドメイン駆動設計) 参考文献を巡る旅
Base DDD(ドメイン駆動設計) 参考文献を巡る旅Base DDD(ドメイン駆動設計) 参考文献を巡る旅
Base DDD(ドメイン駆動設計) 参考文献を巡る旅
 
ざっくり DDD 入門!!
ざっくり DDD 入門!!ざっくり DDD 入門!!
ざっくり DDD 入門!!
 
Biglobe×ddd 実践編(dev love 20150618)
Biglobe×ddd 実践編(dev love 20150618)Biglobe×ddd 実践編(dev love 20150618)
Biglobe×ddd 実践編(dev love 20150618)
 
ぐるぐるDDD/Scrum - モデリングと実装のうずまきをまわそう
ぐるぐるDDD/Scrum - モデリングと実装のうずまきをまわそうぐるぐるDDD/Scrum - モデリングと実装のうずまきをまわそう
ぐるぐるDDD/Scrum - モデリングと実装のうずまきをまわそう
 
DDD読書会@大阪(最終回)のLT資料「ドメイン駆動設計で気づいたこと~権利の概念とERP分析への適用」 #dddosaka
DDD読書会@大阪(最終回)のLT資料「ドメイン駆動設計で気づいたこと~権利の概念とERP分析への適用」 #dddosakaDDD読書会@大阪(最終回)のLT資料「ドメイン駆動設計で気づいたこと~権利の概念とERP分析への適用」 #dddosaka
DDD読書会@大阪(最終回)のLT資料「ドメイン駆動設計で気づいたこと~権利の概念とERP分析への適用」 #dddosaka
 
某S社のddd(メイリオ)
某S社のddd(メイリオ)某S社のddd(メイリオ)
某S社のddd(メイリオ)
 
マイクロWebアプリケーション - Developers.IO 2016
マイクロWebアプリケーション - Developers.IO 2016マイクロWebアプリケーション - Developers.IO 2016
マイクロWebアプリケーション - Developers.IO 2016
 

Similar a 0151209 Oracle DDD OracleとHadoop連携の勘所

最強のデータベース基盤“Exadata”をパブリック・クラウドで活用!(Oracle Cloud Days Tokyo 2015)
最強のデータベース基盤“Exadata”をパブリック・クラウドで活用!(Oracle Cloud Days Tokyo 2015)最強のデータベース基盤“Exadata”をパブリック・クラウドで活用!(Oracle Cloud Days Tokyo 2015)
最強のデータベース基盤“Exadata”をパブリック・クラウドで活用!(Oracle Cloud Days Tokyo 2015)オラクルエンジニア通信
 
Oracle Database Appliance X5-2 アップデート内容のご紹介
Oracle Database Appliance X5-2 アップデート内容のご紹介Oracle Database Appliance X5-2 アップデート内容のご紹介
Oracle Database Appliance X5-2 アップデート内容のご紹介オラクルエンジニア通信
 
[db tech showcase Tokyo 2017] A32: Attunity Replicate + Kafka + Hadoop マルチデータ...
[db tech showcase Tokyo 2017] A32: Attunity Replicate + Kafka + Hadoop マルチデータ...[db tech showcase Tokyo 2017] A32: Attunity Replicate + Kafka + Hadoop マルチデータ...
[db tech showcase Tokyo 2017] A32: Attunity Replicate + Kafka + Hadoop マルチデータ...Insight Technology, Inc.
 
Cloudera World Tokyo 2015 Oracleセッション資料 「ビッグデータ/IoTの最新事例とHadoop活用の勘所」
Cloudera World Tokyo 2015 Oracleセッション資料 「ビッグデータ/IoTの最新事例とHadoop活用の勘所」Cloudera World Tokyo 2015 Oracleセッション資料 「ビッグデータ/IoTの最新事例とHadoop活用の勘所」
Cloudera World Tokyo 2015 Oracleセッション資料 「ビッグデータ/IoTの最新事例とHadoop活用の勘所」オラクルエンジニア通信
 
成功事例に学べ! これからの時代のビッグデータ活用最新ベストプラクティス [Oracle Cloud Days Tokyo 2016]
成功事例に学べ! これからの時代のビッグデータ活用最新ベストプラクティス [Oracle Cloud Days Tokyo 2016]成功事例に学べ! これからの時代のビッグデータ活用最新ベストプラクティス [Oracle Cloud Days Tokyo 2016]
成功事例に学べ! これからの時代のビッグデータ活用最新ベストプラクティス [Oracle Cloud Days Tokyo 2016]オラクルエンジニア通信
 
Impala + Kudu を用いたデータウェアハウス構築の勘所 (仮)
Impala + Kudu を用いたデータウェアハウス構築の勘所 (仮)Impala + Kudu を用いたデータウェアハウス構築の勘所 (仮)
Impala + Kudu を用いたデータウェアハウス構築の勘所 (仮)Cloudera Japan
 
脱Excelで部門のデータ管理業務を 効率化するデータ活用クラウド
脱Excelで部門のデータ管理業務を効率化するデータ活用クラウド脱Excelで部門のデータ管理業務を効率化するデータ活用クラウド
脱Excelで部門のデータ管理業務を 効率化するデータ活用クラウドオラクルエンジニア通信
 
[db tech showcase Tokyo 2018] #dbts2018 #E28 『Hadoop DataLakeにリアルタイムでデータをレプリケ...
[db tech showcase Tokyo 2018] #dbts2018 #E28 『Hadoop DataLakeにリアルタイムでデータをレプリケ...[db tech showcase Tokyo 2018] #dbts2018 #E28 『Hadoop DataLakeにリアルタイムでデータをレプリケ...
[db tech showcase Tokyo 2018] #dbts2018 #E28 『Hadoop DataLakeにリアルタイムでデータをレプリケ...Insight Technology, Inc.
 
Oracle Database / Exadata Cloud 技術情報(Oracle Cloudウェビナーシリーズ: 2020年7月9日)
Oracle Database / Exadata Cloud 技術情報(Oracle Cloudウェビナーシリーズ: 2020年7月9日)Oracle Database / Exadata Cloud 技術情報(Oracle Cloudウェビナーシリーズ: 2020年7月9日)
Oracle Database / Exadata Cloud 技術情報(Oracle Cloudウェビナーシリーズ: 2020年7月9日)オラクルエンジニア通信
 
[Modern Cloud Day Tokyo 2019] 次世代型データベース・クラウドの魅力に迫る ~ Autonomous Database Dee...
[Modern Cloud Day Tokyo 2019] 次世代型データベース・クラウドの魅力に迫る ~ Autonomous Database Dee...[Modern Cloud Day Tokyo 2019] 次世代型データベース・クラウドの魅力に迫る ~ Autonomous Database Dee...
[Modern Cloud Day Tokyo 2019] 次世代型データベース・クラウドの魅力に迫る ~ Autonomous Database Dee...オラクルエンジニア通信
 
NTTデータ流 Hadoop活用のすすめ ~インフラ構築・運用の勘所~
NTTデータ流 Hadoop活用のすすめ ~インフラ構築・運用の勘所~NTTデータ流 Hadoop活用のすすめ ~インフラ構築・運用の勘所~
NTTデータ流 Hadoop活用のすすめ ~インフラ構築・運用の勘所~NTT DATA OSS Professional Services
 
オラクルクラウドで開発を~サーバからDB/アプリケーションサーバ準備が、2時間で~
オラクルクラウドで開発を~サーバからDB/アプリケーションサーバ準備が、2時間で~オラクルクラウドで開発を~サーバからDB/アプリケーションサーバ準備が、2時間で~
オラクルクラウドで開発を~サーバからDB/アプリケーションサーバ準備が、2時間で~オラクルエンジニア通信
 
[db tech showcase Tokyo 2017] A15: レプリケーションを使用したデータ分析基盤構築のキモ(事例)by 株式会社インサイトテ...
[db tech showcase Tokyo 2017] A15: レプリケーションを使用したデータ分析基盤構築のキモ(事例)by 株式会社インサイトテ...[db tech showcase Tokyo 2017] A15: レプリケーションを使用したデータ分析基盤構築のキモ(事例)by 株式会社インサイトテ...
[db tech showcase Tokyo 2017] A15: レプリケーションを使用したデータ分析基盤構築のキモ(事例)by 株式会社インサイトテ...Insight Technology, Inc.
 
[D35] インメモリーデータベース徹底比較 by Komori
[D35] インメモリーデータベース徹底比較 by Komori[D35] インメモリーデータベース徹底比較 by Komori
[D35] インメモリーデータベース徹底比較 by KomoriInsight Technology, Inc.
 
[INSIGHT OUT 2011] C27 今こそBCPを考える ~コスト・要件に応じたデータベースのディザスタ・リカバリを提案しよう!~(kishida)
[INSIGHT OUT 2011] C27 今こそBCPを考える ~コスト・要件に応じたデータベースのディザスタ・リカバリを提案しよう!~(kishida)[INSIGHT OUT 2011] C27 今こそBCPを考える ~コスト・要件に応じたデータベースのディザスタ・リカバリを提案しよう!~(kishida)
[INSIGHT OUT 2011] C27 今こそBCPを考える ~コスト・要件に応じたデータベースのディザスタ・リカバリを提案しよう!~(kishida)Insight Technology, Inc.
 
【旧版】Oracle Database Cloud Service:サービス概要のご紹介 [2020年3月版]
【旧版】Oracle Database Cloud Service:サービス概要のご紹介 [2020年3月版]【旧版】Oracle Database Cloud Service:サービス概要のご紹介 [2020年3月版]
【旧版】Oracle Database Cloud Service:サービス概要のご紹介 [2020年3月版]オラクルエンジニア通信
 
MySQL 5.7 & 最新開発状況 @ オープンソースカンファレンス20
MySQL 5.7 & 最新開発状況 @ オープンソースカンファレンス20MySQL 5.7 & 最新開発状況 @ オープンソースカンファレンス20
MySQL 5.7 & 最新開発状況 @ オープンソースカンファレンス20Ryusuke Kajiyama
 
MySQLのNoSQL機能 - MySQL JSON & HTTP Plugin for MySQL
MySQLのNoSQL機能 - MySQL JSON & HTTP Plugin for MySQLMySQLのNoSQL機能 - MySQL JSON & HTTP Plugin for MySQL
MySQLのNoSQL機能 - MySQL JSON & HTTP Plugin for MySQLRyusuke Kajiyama
 

Similar a 0151209 Oracle DDD OracleとHadoop連携の勘所 (20)

最強のデータベース基盤“Exadata”をパブリック・クラウドで活用!(Oracle Cloud Days Tokyo 2015)
最強のデータベース基盤“Exadata”をパブリック・クラウドで活用!(Oracle Cloud Days Tokyo 2015)最強のデータベース基盤“Exadata”をパブリック・クラウドで活用!(Oracle Cloud Days Tokyo 2015)
最強のデータベース基盤“Exadata”をパブリック・クラウドで活用!(Oracle Cloud Days Tokyo 2015)
 
Oracle Database Appliance X5-2 アップデート内容のご紹介
Oracle Database Appliance X5-2 アップデート内容のご紹介Oracle Database Appliance X5-2 アップデート内容のご紹介
Oracle Database Appliance X5-2 アップデート内容のご紹介
 
Oracle Big Data SQL3.1のご紹介
Oracle Big Data SQL3.1のご紹介Oracle Big Data SQL3.1のご紹介
Oracle Big Data SQL3.1のご紹介
 
[db tech showcase Tokyo 2017] A32: Attunity Replicate + Kafka + Hadoop マルチデータ...
[db tech showcase Tokyo 2017] A32: Attunity Replicate + Kafka + Hadoop マルチデータ...[db tech showcase Tokyo 2017] A32: Attunity Replicate + Kafka + Hadoop マルチデータ...
[db tech showcase Tokyo 2017] A32: Attunity Replicate + Kafka + Hadoop マルチデータ...
 
Cloudera World Tokyo 2015 Oracleセッション資料 「ビッグデータ/IoTの最新事例とHadoop活用の勘所」
Cloudera World Tokyo 2015 Oracleセッション資料 「ビッグデータ/IoTの最新事例とHadoop活用の勘所」Cloudera World Tokyo 2015 Oracleセッション資料 「ビッグデータ/IoTの最新事例とHadoop活用の勘所」
Cloudera World Tokyo 2015 Oracleセッション資料 「ビッグデータ/IoTの最新事例とHadoop活用の勘所」
 
成功事例に学べ! これからの時代のビッグデータ活用最新ベストプラクティス [Oracle Cloud Days Tokyo 2016]
成功事例に学べ! これからの時代のビッグデータ活用最新ベストプラクティス [Oracle Cloud Days Tokyo 2016]成功事例に学べ! これからの時代のビッグデータ活用最新ベストプラクティス [Oracle Cloud Days Tokyo 2016]
成功事例に学べ! これからの時代のビッグデータ活用最新ベストプラクティス [Oracle Cloud Days Tokyo 2016]
 
Impala + Kudu を用いたデータウェアハウス構築の勘所 (仮)
Impala + Kudu を用いたデータウェアハウス構築の勘所 (仮)Impala + Kudu を用いたデータウェアハウス構築の勘所 (仮)
Impala + Kudu を用いたデータウェアハウス構築の勘所 (仮)
 
脱Excelで部門のデータ管理業務を 効率化するデータ活用クラウド
脱Excelで部門のデータ管理業務を効率化するデータ活用クラウド脱Excelで部門のデータ管理業務を効率化するデータ活用クラウド
脱Excelで部門のデータ管理業務を 効率化するデータ活用クラウド
 
[db tech showcase Tokyo 2018] #dbts2018 #E28 『Hadoop DataLakeにリアルタイムでデータをレプリケ...
[db tech showcase Tokyo 2018] #dbts2018 #E28 『Hadoop DataLakeにリアルタイムでデータをレプリケ...[db tech showcase Tokyo 2018] #dbts2018 #E28 『Hadoop DataLakeにリアルタイムでデータをレプリケ...
[db tech showcase Tokyo 2018] #dbts2018 #E28 『Hadoop DataLakeにリアルタイムでデータをレプリケ...
 
Oracle Database / Exadata Cloud 技術情報(Oracle Cloudウェビナーシリーズ: 2020年7月9日)
Oracle Database / Exadata Cloud 技術情報(Oracle Cloudウェビナーシリーズ: 2020年7月9日)Oracle Database / Exadata Cloud 技術情報(Oracle Cloudウェビナーシリーズ: 2020年7月9日)
Oracle Database / Exadata Cloud 技術情報(Oracle Cloudウェビナーシリーズ: 2020年7月9日)
 
[Modern Cloud Day Tokyo 2019] 次世代型データベース・クラウドの魅力に迫る ~ Autonomous Database Dee...
[Modern Cloud Day Tokyo 2019] 次世代型データベース・クラウドの魅力に迫る ~ Autonomous Database Dee...[Modern Cloud Day Tokyo 2019] 次世代型データベース・クラウドの魅力に迫る ~ Autonomous Database Dee...
[Modern Cloud Day Tokyo 2019] 次世代型データベース・クラウドの魅力に迫る ~ Autonomous Database Dee...
 
NTTデータ流 Hadoop活用のすすめ ~インフラ構築・運用の勘所~
NTTデータ流 Hadoop活用のすすめ ~インフラ構築・運用の勘所~NTTデータ流 Hadoop活用のすすめ ~インフラ構築・運用の勘所~
NTTデータ流 Hadoop活用のすすめ ~インフラ構築・運用の勘所~
 
オラクルクラウドで開発を~サーバからDB/アプリケーションサーバ準備が、2時間で~
オラクルクラウドで開発を~サーバからDB/アプリケーションサーバ準備が、2時間で~オラクルクラウドで開発を~サーバからDB/アプリケーションサーバ準備が、2時間で~
オラクルクラウドで開発を~サーバからDB/アプリケーションサーバ準備が、2時間で~
 
[db tech showcase Tokyo 2017] A15: レプリケーションを使用したデータ分析基盤構築のキモ(事例)by 株式会社インサイトテ...
[db tech showcase Tokyo 2017] A15: レプリケーションを使用したデータ分析基盤構築のキモ(事例)by 株式会社インサイトテ...[db tech showcase Tokyo 2017] A15: レプリケーションを使用したデータ分析基盤構築のキモ(事例)by 株式会社インサイトテ...
[db tech showcase Tokyo 2017] A15: レプリケーションを使用したデータ分析基盤構築のキモ(事例)by 株式会社インサイトテ...
 
[D35] インメモリーデータベース徹底比較 by Komori
[D35] インメモリーデータベース徹底比較 by Komori[D35] インメモリーデータベース徹底比較 by Komori
[D35] インメモリーデータベース徹底比較 by Komori
 
[INSIGHT OUT 2011] C27 今こそBCPを考える ~コスト・要件に応じたデータベースのディザスタ・リカバリを提案しよう!~(kishida)
[INSIGHT OUT 2011] C27 今こそBCPを考える ~コスト・要件に応じたデータベースのディザスタ・リカバリを提案しよう!~(kishida)[INSIGHT OUT 2011] C27 今こそBCPを考える ~コスト・要件に応じたデータベースのディザスタ・リカバリを提案しよう!~(kishida)
[INSIGHT OUT 2011] C27 今こそBCPを考える ~コスト・要件に応じたデータベースのディザスタ・リカバリを提案しよう!~(kishida)
 
【旧版】Oracle Database Cloud Service:サービス概要のご紹介 [2020年3月版]
【旧版】Oracle Database Cloud Service:サービス概要のご紹介 [2020年3月版]【旧版】Oracle Database Cloud Service:サービス概要のご紹介 [2020年3月版]
【旧版】Oracle Database Cloud Service:サービス概要のご紹介 [2020年3月版]
 
Oracle Database 12c Release 1 PSR 12.1.0.2 のご紹介
Oracle Database 12c Release 1 PSR 12.1.0.2 のご紹介Oracle Database 12c Release 1 PSR 12.1.0.2 のご紹介
Oracle Database 12c Release 1 PSR 12.1.0.2 のご紹介
 
MySQL 5.7 & 最新開発状況 @ オープンソースカンファレンス20
MySQL 5.7 & 最新開発状況 @ オープンソースカンファレンス20MySQL 5.7 & 最新開発状況 @ オープンソースカンファレンス20
MySQL 5.7 & 最新開発状況 @ オープンソースカンファレンス20
 
MySQLのNoSQL機能 - MySQL JSON & HTTP Plugin for MySQL
MySQLのNoSQL機能 - MySQL JSON & HTTP Plugin for MySQLMySQLのNoSQL機能 - MySQL JSON & HTTP Plugin for MySQL
MySQLのNoSQL機能 - MySQL JSON & HTTP Plugin for MySQL
 

Más de オラクルエンジニア通信

Oracle Cloud Infrastructure:2023年5月度サービス・アップデート
Oracle Cloud Infrastructure:2023年5月度サービス・アップデートOracle Cloud Infrastructure:2023年5月度サービス・アップデート
Oracle Cloud Infrastructure:2023年5月度サービス・アップデートオラクルエンジニア通信
 
Oracle Cloud Infrastructure:2023年4月度サービス・アップデート
Oracle Cloud Infrastructure:2023年4月度サービス・アップデートOracle Cloud Infrastructure:2023年4月度サービス・アップデート
Oracle Cloud Infrastructure:2023年4月度サービス・アップデートオラクルエンジニア通信
 
Oracle Cloud Infrastructure:2023年3月度サービス・アップデート
Oracle Cloud Infrastructure:2023年3月度サービス・アップデートOracle Cloud Infrastructure:2023年3月度サービス・アップデート
Oracle Cloud Infrastructure:2023年3月度サービス・アップデートオラクルエンジニア通信
 
Oracle Cloud Infrastructure:2023年2月度サービス・アップデート
Oracle Cloud Infrastructure:2023年2月度サービス・アップデートOracle Cloud Infrastructure:2023年2月度サービス・アップデート
Oracle Cloud Infrastructure:2023年2月度サービス・アップデートオラクルエンジニア通信
 
Oracle Cloud Infrastructure:2023年1月度サービス・アップデート
Oracle Cloud Infrastructure:2023年1月度サービス・アップデートOracle Cloud Infrastructure:2023年1月度サービス・アップデート
Oracle Cloud Infrastructure:2023年1月度サービス・アップデートオラクルエンジニア通信
 
Oracle Cloud Infrastructure:2022年12月度サービス・アップデート
Oracle Cloud Infrastructure:2022年12月度サービス・アップデートOracle Cloud Infrastructure:2022年12月度サービス・アップデート
Oracle Cloud Infrastructure:2022年12月度サービス・アップデートオラクルエンジニア通信
 
Oracle Cloud Infrastructure:2022年11月度サービス・アップデート
Oracle Cloud Infrastructure:2022年11月度サービス・アップデートOracle Cloud Infrastructure:2022年11月度サービス・アップデート
Oracle Cloud Infrastructure:2022年11月度サービス・アップデートオラクルエンジニア通信
 
Oracle Cloud Infrastructure:2022年10月度サービス・アップデート
Oracle Cloud Infrastructure:2022年10月度サービス・アップデートOracle Cloud Infrastructure:2022年10月度サービス・アップデート
Oracle Cloud Infrastructure:2022年10月度サービス・アップデートオラクルエンジニア通信
 
Oracle Cloud Infrastructure:2022年9月度サービス・アップデート
Oracle Cloud Infrastructure:2022年9月度サービス・アップデートOracle Cloud Infrastructure:2022年9月度サービス・アップデート
Oracle Cloud Infrastructure:2022年9月度サービス・アップデートオラクルエンジニア通信
 
Oracle Cloud Infrastructure:2022年8月度サービス・アップデート
Oracle Cloud Infrastructure:2022年8月度サービス・アップデートOracle Cloud Infrastructure:2022年8月度サービス・アップデート
Oracle Cloud Infrastructure:2022年8月度サービス・アップデートオラクルエンジニア通信
 
Oracle Cloud Infrastructure:2022年7月度サービス・アップデート
Oracle Cloud Infrastructure:2022年7月度サービス・アップデートOracle Cloud Infrastructure:2022年7月度サービス・アップデート
Oracle Cloud Infrastructure:2022年7月度サービス・アップデートオラクルエンジニア通信
 
Oracle Cloud Infrastructure:2022年6月度サービス・アップデート
Oracle Cloud Infrastructure:2022年6月度サービス・アップデートOracle Cloud Infrastructure:2022年6月度サービス・アップデート
Oracle Cloud Infrastructure:2022年6月度サービス・アップデートオラクルエンジニア通信
 
Oracle Cloud Infrastructure:2022年5月度サービス・アップデート
Oracle Cloud Infrastructure:2022年5月度サービス・アップデートOracle Cloud Infrastructure:2022年5月度サービス・アップデート
Oracle Cloud Infrastructure:2022年5月度サービス・アップデートオラクルエンジニア通信
 
Oracle Cloud Infrastructure:2022年4月度サービス・アップデート
Oracle Cloud Infrastructure:2022年4月度サービス・アップデートOracle Cloud Infrastructure:2022年4月度サービス・アップデート
Oracle Cloud Infrastructure:2022年4月度サービス・アップデートオラクルエンジニア通信
 
Oracle Cloud Infrastructure データベース・クラウド:各バージョンのサポート期間 (2022年4月版)
Oracle Cloud Infrastructureデータベース・クラウド:各バージョンのサポート期間 (2022年4月版)Oracle Cloud Infrastructureデータベース・クラウド:各バージョンのサポート期間 (2022年4月版)
Oracle Cloud Infrastructure データベース・クラウド:各バージョンのサポート期間 (2022年4月版)オラクルエンジニア通信
 
MySQL Technology Cafe #14 MySQL Shellを使ってもっと楽をしようの会
MySQL Technology Cafe #14 MySQL Shellを使ってもっと楽をしようの会MySQL Technology Cafe #14 MySQL Shellを使ってもっと楽をしようの会
MySQL Technology Cafe #14 MySQL Shellを使ってもっと楽をしようの会オラクルエンジニア通信
 
Oracle Cloud Infrastructure:2022年3月度サービス・アップデート
Oracle Cloud Infrastructure:2022年3月度サービス・アップデートOracle Cloud Infrastructure:2022年3月度サービス・アップデート
Oracle Cloud Infrastructure:2022年3月度サービス・アップデートオラクルエンジニア通信
 
Oracle Cloud Infrastructure:2022年2月度サービス・アップデート
Oracle Cloud Infrastructure:2022年2月度サービス・アップデートOracle Cloud Infrastructure:2022年2月度サービス・アップデート
Oracle Cloud Infrastructure:2022年2月度サービス・アップデートオラクルエンジニア通信
 
Oracle Cloud Infrastructure:2022年1月度サービス・アップデート
Oracle Cloud Infrastructure:2022年1月度サービス・アップデートOracle Cloud Infrastructure:2022年1月度サービス・アップデート
Oracle Cloud Infrastructure:2022年1月度サービス・アップデートオラクルエンジニア通信
 
Oracle Databaseはクラウドに移行するべきか否か 全10ケースをご紹介 (Oracle Cloudウェビナーシリーズ: 2021年11月30日)
Oracle Databaseはクラウドに移行するべきか否か 全10ケースをご紹介 (Oracle Cloudウェビナーシリーズ: 2021年11月30日)Oracle Databaseはクラウドに移行するべきか否か 全10ケースをご紹介 (Oracle Cloudウェビナーシリーズ: 2021年11月30日)
Oracle Databaseはクラウドに移行するべきか否か 全10ケースをご紹介 (Oracle Cloudウェビナーシリーズ: 2021年11月30日)オラクルエンジニア通信
 

Más de オラクルエンジニア通信 (20)

Oracle Cloud Infrastructure:2023年5月度サービス・アップデート
Oracle Cloud Infrastructure:2023年5月度サービス・アップデートOracle Cloud Infrastructure:2023年5月度サービス・アップデート
Oracle Cloud Infrastructure:2023年5月度サービス・アップデート
 
Oracle Cloud Infrastructure:2023年4月度サービス・アップデート
Oracle Cloud Infrastructure:2023年4月度サービス・アップデートOracle Cloud Infrastructure:2023年4月度サービス・アップデート
Oracle Cloud Infrastructure:2023年4月度サービス・アップデート
 
Oracle Cloud Infrastructure:2023年3月度サービス・アップデート
Oracle Cloud Infrastructure:2023年3月度サービス・アップデートOracle Cloud Infrastructure:2023年3月度サービス・アップデート
Oracle Cloud Infrastructure:2023年3月度サービス・アップデート
 
Oracle Cloud Infrastructure:2023年2月度サービス・アップデート
Oracle Cloud Infrastructure:2023年2月度サービス・アップデートOracle Cloud Infrastructure:2023年2月度サービス・アップデート
Oracle Cloud Infrastructure:2023年2月度サービス・アップデート
 
Oracle Cloud Infrastructure:2023年1月度サービス・アップデート
Oracle Cloud Infrastructure:2023年1月度サービス・アップデートOracle Cloud Infrastructure:2023年1月度サービス・アップデート
Oracle Cloud Infrastructure:2023年1月度サービス・アップデート
 
Oracle Cloud Infrastructure:2022年12月度サービス・アップデート
Oracle Cloud Infrastructure:2022年12月度サービス・アップデートOracle Cloud Infrastructure:2022年12月度サービス・アップデート
Oracle Cloud Infrastructure:2022年12月度サービス・アップデート
 
Oracle Cloud Infrastructure:2022年11月度サービス・アップデート
Oracle Cloud Infrastructure:2022年11月度サービス・アップデートOracle Cloud Infrastructure:2022年11月度サービス・アップデート
Oracle Cloud Infrastructure:2022年11月度サービス・アップデート
 
Oracle Cloud Infrastructure:2022年10月度サービス・アップデート
Oracle Cloud Infrastructure:2022年10月度サービス・アップデートOracle Cloud Infrastructure:2022年10月度サービス・アップデート
Oracle Cloud Infrastructure:2022年10月度サービス・アップデート
 
Oracle Cloud Infrastructure:2022年9月度サービス・アップデート
Oracle Cloud Infrastructure:2022年9月度サービス・アップデートOracle Cloud Infrastructure:2022年9月度サービス・アップデート
Oracle Cloud Infrastructure:2022年9月度サービス・アップデート
 
Oracle Cloud Infrastructure:2022年8月度サービス・アップデート
Oracle Cloud Infrastructure:2022年8月度サービス・アップデートOracle Cloud Infrastructure:2022年8月度サービス・アップデート
Oracle Cloud Infrastructure:2022年8月度サービス・アップデート
 
Oracle Cloud Infrastructure:2022年7月度サービス・アップデート
Oracle Cloud Infrastructure:2022年7月度サービス・アップデートOracle Cloud Infrastructure:2022年7月度サービス・アップデート
Oracle Cloud Infrastructure:2022年7月度サービス・アップデート
 
Oracle Cloud Infrastructure:2022年6月度サービス・アップデート
Oracle Cloud Infrastructure:2022年6月度サービス・アップデートOracle Cloud Infrastructure:2022年6月度サービス・アップデート
Oracle Cloud Infrastructure:2022年6月度サービス・アップデート
 
Oracle Cloud Infrastructure:2022年5月度サービス・アップデート
Oracle Cloud Infrastructure:2022年5月度サービス・アップデートOracle Cloud Infrastructure:2022年5月度サービス・アップデート
Oracle Cloud Infrastructure:2022年5月度サービス・アップデート
 
Oracle Cloud Infrastructure:2022年4月度サービス・アップデート
Oracle Cloud Infrastructure:2022年4月度サービス・アップデートOracle Cloud Infrastructure:2022年4月度サービス・アップデート
Oracle Cloud Infrastructure:2022年4月度サービス・アップデート
 
Oracle Cloud Infrastructure データベース・クラウド:各バージョンのサポート期間 (2022年4月版)
Oracle Cloud Infrastructureデータベース・クラウド:各バージョンのサポート期間 (2022年4月版)Oracle Cloud Infrastructureデータベース・クラウド:各バージョンのサポート期間 (2022年4月版)
Oracle Cloud Infrastructure データベース・クラウド:各バージョンのサポート期間 (2022年4月版)
 
MySQL Technology Cafe #14 MySQL Shellを使ってもっと楽をしようの会
MySQL Technology Cafe #14 MySQL Shellを使ってもっと楽をしようの会MySQL Technology Cafe #14 MySQL Shellを使ってもっと楽をしようの会
MySQL Technology Cafe #14 MySQL Shellを使ってもっと楽をしようの会
 
Oracle Cloud Infrastructure:2022年3月度サービス・アップデート
Oracle Cloud Infrastructure:2022年3月度サービス・アップデートOracle Cloud Infrastructure:2022年3月度サービス・アップデート
Oracle Cloud Infrastructure:2022年3月度サービス・アップデート
 
Oracle Cloud Infrastructure:2022年2月度サービス・アップデート
Oracle Cloud Infrastructure:2022年2月度サービス・アップデートOracle Cloud Infrastructure:2022年2月度サービス・アップデート
Oracle Cloud Infrastructure:2022年2月度サービス・アップデート
 
Oracle Cloud Infrastructure:2022年1月度サービス・アップデート
Oracle Cloud Infrastructure:2022年1月度サービス・アップデートOracle Cloud Infrastructure:2022年1月度サービス・アップデート
Oracle Cloud Infrastructure:2022年1月度サービス・アップデート
 
Oracle Databaseはクラウドに移行するべきか否か 全10ケースをご紹介 (Oracle Cloudウェビナーシリーズ: 2021年11月30日)
Oracle Databaseはクラウドに移行するべきか否か 全10ケースをご紹介 (Oracle Cloudウェビナーシリーズ: 2021年11月30日)Oracle Databaseはクラウドに移行するべきか否か 全10ケースをご紹介 (Oracle Cloudウェビナーシリーズ: 2021年11月30日)
Oracle Databaseはクラウドに移行するべきか否か 全10ケースをご紹介 (Oracle Cloudウェビナーシリーズ: 2021年11月30日)
 

Último

Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。iPride Co., Ltd.
 
論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding
論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding
論文紹介:Selective Structured State-Spaces for Long-Form Video UnderstandingToru Tamaki
 
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。iPride Co., Ltd.
 
Observabilityは従来型の監視と何が違うのか(キンドリルジャパン社内勉強会:2022年10月27日発表)
Observabilityは従来型の監視と何が違うのか(キンドリルジャパン社内勉強会:2022年10月27日発表)Observabilityは従来型の監視と何が違うのか(キンドリルジャパン社内勉強会:2022年10月27日発表)
Observabilityは従来型の監視と何が違うのか(キンドリルジャパン社内勉強会:2022年10月27日発表)Hiroshi Tomioka
 
新人研修 後半 2024/04/26の勉強会で発表されたものです。
新人研修 後半        2024/04/26の勉強会で発表されたものです。新人研修 後半        2024/04/26の勉強会で発表されたものです。
新人研修 後半 2024/04/26の勉強会で発表されたものです。iPride Co., Ltd.
 
論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games
論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games
論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Gamesatsushi061452
 
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアルLoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアルCRI Japan, Inc.
 
知識ゼロの営業マンでもできた!超速で初心者を脱する、悪魔的学習ステップ3選.pptx
知識ゼロの営業マンでもできた!超速で初心者を脱する、悪魔的学習ステップ3選.pptx知識ゼロの営業マンでもできた!超速で初心者を脱する、悪魔的学習ステップ3選.pptx
知識ゼロの営業マンでもできた!超速で初心者を脱する、悪魔的学習ステップ3選.pptxsn679259
 
論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...
論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...
論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...Toru Tamaki
 
LoRaWANスマート距離検出センサー DS20L カタログ LiDARデバイス
LoRaWANスマート距離検出センサー  DS20L  カタログ  LiDARデバイスLoRaWANスマート距離検出センサー  DS20L  カタログ  LiDARデバイス
LoRaWANスマート距離検出センサー DS20L カタログ LiDARデバイスCRI Japan, Inc.
 
Utilizing Ballerina for Cloud Native Integrations
Utilizing Ballerina for Cloud Native IntegrationsUtilizing Ballerina for Cloud Native Integrations
Utilizing Ballerina for Cloud Native IntegrationsWSO2
 

Último (11)

Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
 
論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding
論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding
論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding
 
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
 
Observabilityは従来型の監視と何が違うのか(キンドリルジャパン社内勉強会:2022年10月27日発表)
Observabilityは従来型の監視と何が違うのか(キンドリルジャパン社内勉強会:2022年10月27日発表)Observabilityは従来型の監視と何が違うのか(キンドリルジャパン社内勉強会:2022年10月27日発表)
Observabilityは従来型の監視と何が違うのか(キンドリルジャパン社内勉強会:2022年10月27日発表)
 
新人研修 後半 2024/04/26の勉強会で発表されたものです。
新人研修 後半        2024/04/26の勉強会で発表されたものです。新人研修 後半        2024/04/26の勉強会で発表されたものです。
新人研修 後半 2024/04/26の勉強会で発表されたものです。
 
論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games
論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games
論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games
 
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアルLoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
 
知識ゼロの営業マンでもできた!超速で初心者を脱する、悪魔的学習ステップ3選.pptx
知識ゼロの営業マンでもできた!超速で初心者を脱する、悪魔的学習ステップ3選.pptx知識ゼロの営業マンでもできた!超速で初心者を脱する、悪魔的学習ステップ3選.pptx
知識ゼロの営業マンでもできた!超速で初心者を脱する、悪魔的学習ステップ3選.pptx
 
論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...
論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...
論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...
 
LoRaWANスマート距離検出センサー DS20L カタログ LiDARデバイス
LoRaWANスマート距離検出センサー  DS20L  カタログ  LiDARデバイスLoRaWANスマート距離検出センサー  DS20L  カタログ  LiDARデバイス
LoRaWANスマート距離検出センサー DS20L カタログ LiDARデバイス
 
Utilizing Ballerina for Cloud Native Integrations
Utilizing Ballerina for Cloud Native IntegrationsUtilizing Ballerina for Cloud Native Integrations
Utilizing Ballerina for Cloud Native Integrations
 

0151209 Oracle DDD OracleとHadoop連携の勘所

  • 1. Copyright © 2015, Oracle and/or its affiliates. All rights reserved. | Oracle DBとHadoop連携の勘所 日本オラクル株式会社 クラウド・テクノロジー事業統括 クラウド・テクノロジー製品戦略統括本部 ビッグデータ&セキュリティ技術部 立山 重幸(Shigeyuki.Tateyama@oracle.com)
  • 2. Copyright © 2015, Oracle and/or its affiliates. All rights reserved. | • 以下の事項は、弊社の一般的な製品の方向性に関する概要を説明す るものです。また、情報提供を唯一の目的とするものであり、いか なる契約にも組み込むことはできません。以下の事項は、マテリア ルやコード、機能を提供することをコミットメント(確約)するも のではないため、購買決定を行う際の判断材料になさらないで下さ い。オラクル製品に関して記載されている機能の開発、リリースお よび時期については、弊社の裁量により決定されます。 2 OracleとJavaは、Oracle Corporation 及びその子会社、関連会社の米国及びその他の国における登録商標です。 文中の社名、商品名等は各社の商標または登録商標である場合があります。
  • 3. Copyright © 2015, Oracle and/or its affiliates. All rights reserved. | 本資料と、セッション動画公開について • 本資料は、2015年12月9日に開催された、『Oracle DBA & Developer Day 2015』のセッション公開資料です • セッション内容の動画については、他セッションとあわせて下記に 公開されておりますので、あわせてご参照いただければと存じます 3 リンクはこちら
  • 4. Copyright © 2015, Oracle and/or its affiliates. All rights reserved. | 4 ビッグデータ& IoT お客様事例 抜粋 投影のみ
  • 5. Copyright © 2015, Oracle and/or its affiliates. All rights reserved. | Agenda どうして、こんなにHadoop やNOSQLの事例が増えて 来たのだろう? 5
  • 6. Copyright © 2015, Oracle and/or its affiliates. All rights reserved. | Oracle DB & Hadoop & NOSQL 共存共栄 6 スループット 高 バッチ処理 レイテンシ 低 オンライン処理 流行らな かったRDB Oracle DBは、堅牢性、安定性、パフォーマンスが 優れている ⇒これからも企業システムの主役であり続ける しかしながら、ビッグデータやIoTなど、試験的な試 みに対するROIを得るために、目的別に機能特化 した低コストな環境を利用する事が定着してきた
  • 7. Copyright © 2015, Oracle and/or its affiliates. All rights reserved. | 7 Facebook – HadoopとRDBMSの連携例 主な利用用途 • 定期的なレポート生成 • 広告キャンペーンの効果測定 • ページビュー、滞在時間等の集計 • リコメンド情報の生成 • ログデータの長期保持 • ログデータを利用したスパムボットからのユーザの保護 RDBMSとの併用 Hadoop単体では、リアルタイム処理に弱いため、高速なレ スポンスが求められるデータに関しては、RDBMS(Oracle / MySQL)に最終的に格納 FacebookのようなHadoopを多用している企業でも、最終的にRDBMSにデータを格納して活用  HadoopとRDBMSの連携の需要は大きい 出典 Apache Hadoop FileSystem and its Usage in Facebook Dhruba Borthakur http://cloud.berkeley.edu/data/hdfs.pdf
  • 8. Copyright © 2015, Oracle and/or its affiliates. All rights reserved. | 業務 アプリケーション オペレーショナル レポーティング DWH (RDBMS) Oracle社としても HadoopとRDBMSの強みを組みあわせる事を推奨 ソーシャルメディア Internet of Things 73° ビッグデータ マネジメント基盤 Data Reservoir (Hadoop) 8 アナリティクス
  • 9. Copyright © 2015, Oracle and/or its affiliates. All rights reserved. | Oracle社が提供するHadoopマシン Big Data Appliance X5-2 Sun Oracle X5-2L Servers × 18node: • 2 * 18 Core Intel Xeon E5 Processors • 128 GB Memory • 96TB Disk space Integrated Software (4.3): • Oracle Linux6.7, Oracle JDK 8 • Oracle Big Data SQL 2.0* • Cloudera Distribution of Apache Hadoop 5.4 – EDH Edition • Cloudera Manager 5.4 • Oracle R Distribution 3.1.1-2 • Oracle NoSQL Database CE 3.2.4 9 •Oracle Big Data SQL はオプションライセンス
  • 10. Copyright © 2015, Oracle and/or its affiliates. All rights reserved. | Agenda HadoopとRDBMSは、 どう住み分けるべきか? 10
  • 11. Copyright © 2015, Oracle and/or its affiliates. All rights reserved. | Oracle Big Data Management System データの特性による典型パターン 適材適所のデータ配置例 パターン・データ特性 Data Reservoir (Big Data Appliance) Data WareHouse (Exadata) データ 容量 データ密度・ データ価値 低い 高い フォーマット 変更頻度 多い 少ない 粒度 細かい 粗い 参照頻度 少ない 多い ETL処理 ETL処理と生データ保持 ETL処理、生データ 処理後データ センサーデータ、 ログデータ、GPSデータ、SNS 等 既存のRDBMS内のデータ(マ スターデータ/ トランザクションデータ) 明細データ サマリデータ 経年データ アクティブデータ ETL処理前の生データ ETL処理後データ 11
  • 12. Copyright © 2015, Oracle and/or its affiliates. All rights reserved. | ユースケース:大量データ保持基盤(CDWH) データレザボアとして必要な情報を一元化 12 社内システム群 センサーデータなど Web Log セントラル データウェアハウス としてのHadoop RDBMSを 利用したデータマート BIツールを 利用した分析 目的:集約した大量のデータを 相対的に安価に保持、加工、集 約する 目的:ユーザに利用しやすい形 でセキュアにデータを提供
  • 13. Copyright © 2015, Oracle and/or its affiliates. All rights reserved. | Why Hadoop? • 相対的に安価に大量のデータを保持 – 複数事業部のデータを集約 – Web logやセンサーデータ、デバイス生成のデータなどストレージ容量の制約 で、これまで廃棄していたデータの保持 • 計算処理をオフロード – データの正規化、加工、集計の負荷をRDBMSからオフロード – 並列分散処理はHadoopがもっとも得意とするところ 13
  • 14. Copyright © 2015, Oracle and/or its affiliates. All rights reserved. | Hadoop + RDB組み合わせの実装上の課題 14 社内システム群 センサーデータなど Web Log セントラル データウェアハウス としてのHadoop RDBMSを 利用したデータマート BIツールを 利用した分析 HadoopとRDBMSという異なる技術要素の連携が課題になる TO hadoop IN hadoop FROM hadoop
  • 15. Copyright © 2015, Oracle and/or its affiliates. All rights reserved. | Agenda どんな方法で 連携出来るのか? 15
  • 16. Copyright © 2015, Oracle and/or its affiliates. All rights reserved. | Hadoop+RDBの連携技術 サマリ 16 Sqoop Copy to BDA 一般的なHadoop機能 Oracle独自機能 SPARK Oracle Table Access for Hadoop & Spark File HDFS API Flume TO hadoop IN hadoop FROM hadoop Hive MapReduce Sqoop Oracle Loader for Hadoop Oracle Big Data SQL Oracle Data Integrator
  • 17. Copyright © 2015, Oracle and/or its affiliates. All rights reserved. | Agenda TO hadoop 17
  • 18. Copyright © 2015, Oracle and/or its affiliates. All rights reserved. | Apache Sqoop 連携元 各種RDBMS 連携タイミング バッチ データ・ロスの 可能性 連係中に障害等で処理が 停止した場合は、連係中の HDFSデータの消去と再実 行で対応 HDFS以外の連 携先 HBase, Hive 特徴 Cloudera Enterpriseにサ ポートが含まれる • RDBMSとのバッチ連係のための ソフトウェア – RDBMSからHadoopへの連係(import)、Hadoooから RDBMSへの連係(export)の双方向の連係に対応 – JDBCが利用可能な各種RDBMSに対応 – Client SoftwareであるSqoop1とサーバー型のSqoop2が 存在 Sqoop 18
  • 19. Copyright © 2015, Oracle and/or its affiliates. All rights reserved. | Sqoopの動作 19 HDFS MapReduce DB M1 M2 File node1 node2 nodex File 並列Select 並列Select データ転送 データ転送 変換 変換 書込 書込 コマンド例: sqoop import --connect jdbc:oracle:thin:@hostname:port:instance --username ユーザ名 --password パスワード --table 表名 –target-dir HDFSディレクトリ - m 4 4つのMapperが、JDBC経由で--tableで指定されたテーブルにSQLを実行し、取得したデータをコード変換やCSV へのフォーマット変換を行った後に、--target-dirで指定したHDFSディレクトリに書き込みを行う M3 M4 File File 並列Select 並列Select データ転送 データ転送 変換 変換 書込 書込 Sqoop
  • 20. Copyright © 2015, Oracle and/or its affiliates. All rights reserved. | Copy to BDA (Oracle Big Data SQL機能) 連携元 Exadata Oracle Database 11.2以上 連携タイミング バッチ データ・ロスの 可能性 連係中に障害等で処理が 停止した場合は、連係中の HDFSデータの消去とコピー で対応 HDFS以外の連 携先 Hive 特徴 DataPump形式の論理バッ クアップを取得している場 合は、バックアップをそのま まBDA側で利用可能 • DataPump形式のファイルをHiveやBig Data SQLから利用可能に – DataPump形式のファイルをHDFSにコピーしておけば、そ のファイルをHive StorageHandler経由で利用可能 – DataPumpの取得元は、ライセンス上の制約から、現時 点では、Exadataのみ – Impalaなどのように、Hive StorageHandlerを利用できな いソフトウェアからはアクセスできない Big Data Appliance + Cloudera Hadoop Exadata + Oracle Database Copy files to BDA Big Data SQL Copy to BDA 20
  • 21. Copyright © 2015, Oracle and/or its affiliates. All rights reserved. | Copy to BDAのイメージ 21 Copy to BDA ①表データおよびメタデータを含む pump形式ファイルを生成 CREATE TABLE table_name ORGANIZATION EXTERNAL ( TYPE oracle_datapump DEFAULT DIRECTORY database_directory LOCATION ('filename1.dmp','filename2.dmp'...) ) PARALLEL n AS SELECT * FROM tablename; ②HDFSにファイルをコピー hadoop fs -put filename*.dmp hdfs_directory ③Hive表の作成 CREATE EXTERNAL TABLE tablename ROW FORMAT SERDE 'oracle.hadoop.hive.datapump.DPSerDe' STORED AS INPUTFORMAT 'oracle.hadoop.hive.datapump.DPInputFormat' OUTPUTFORMAT 'org.apache.hadoop.hive.ql.io.HiveIgnoreKeyTextOutput Format' LOCATION 'hdfs_directory’ 列定義は不要
  • 22. Copyright © 2015, Oracle and/or its affiliates. All rights reserved. | Sqoop vs Copy To BDA Apache Sqoop CopyTo BDA 連携元 〇 JDBC提供されているRDBMS HSQLDB,MySQL,Oracle,PostgreSQLは個別DB対応機 能あり △ Exadata (Oracle Database 11.2) HDFSへの出力形式 〇 SequenceFile, Avro, Text, Hive表 △ Hive表(DataPump形式) 連携時の実行速度 ○ 特定列のレンジで分散されて処理されるため、一様分 布している列が存在しないと速度が出にくい △ DataPumpを出力するファイルシステムのIO性能および HDFSへの転送速度に大きく依存 設定の容易性 〇 パラメータによる設定 ODIを利用してGUIから設定可能 実行はMapReduceの起動 〇 (利点) DataPumpファイルにメタデータを内包しているので、 Hive側で列定義等が不要 (欠点) DataPumpの出力、HDFSへのコピー、Hive表の作成 いう3ステップが必要 その他制約事項 Big Data SQL必須 Impalaなどのように、Hive StorageHandlerを利用できない ソフトウェアからはアクセスできない 総評 汎用性に強みあり。 ソースがExadataかつ、活用パターンがBig Data SQL経由 のみの場合は有効 22 Copy to BDA Sqoop
  • 23. Copyright © 2015, Oracle and/or its affiliates. All rights reserved. | Oracle Table Access for Hadoop(Oracle Big Data Appliance機能) HiveやSpark SQLからOracle Databaseのデータにアクセス Big Data Appliance Cloudera Hadoop Oracle Database HCatalog StorageHandler JDBC • Oracle DBからのデータの移動 の必要なく、Hive SQL, Spark SQLからOracle DBのデータに アクセス可能 • バッチ処理時のマスタ参照など に有効 23 Oracle Table Access for Hadoop & Spark
  • 24. Copyright © 2015, Oracle and/or its affiliates. All rights reserved. | Hive表のDDL 24 CREATE EXTERNAL TABLE orders_ora( trx_nbr STRING, ・・・ curr_ind STRING ) STORED BY 'oracle.hcat.osh.OracleStorageHandler' WITH SERDEPROPERTIES ( ‘oracle.hcat.osh.columns.mapping’ = ‘trx_nbr,・・・,curr_ind') TBLPROPERTIES ( 'mapreduce.jdbc.url' = 'jdbc:oracle:thin:@DBServer:1521/dbname', 'mapreduce.jdbc.username' = ‘username', 'mapreduce.jdbc.password' = ‘password', 'mapreduce.jdbc.input.table.name' = ‘tablename', 'oracle.hcat.osh.splitterKind' = 'ROW_SPLITTER', 'oracle.hcat.osh.rowsPerSplit' = '1500' ); Oracle Table Access for Hadoop and Spark用の Storage Handler Hive表の各列に対応するOracle Database側の 列名をカンマ区切りでHiveの列順に記述 Oracle Databaseへの接続情報 データの分割・並列度をどのように決定するか(Splitter) Oracle Table Access for Hadoop & Spark
  • 25. Copyright © 2015, Oracle and/or its affiliates. All rights reserved. | 並列度およびデータ分割(Splitter) • 以下のSplitterを設定可能 (oracle.hcat.osh.splitterKind に設定) – SINGLE_SPLITTER • Mapperの起動数は常に1つ – ROW_SPLITTER • 一定行数で分割して並列処理 • Mapperの起動数は、以下のうち小さい方 – oracle.hcat.osh.rowsPerSplit – oracle.hcat.osh.maxSplits (ROW_SPLITTERを利用した時のmaxSplitsのデフォルト値は1のためmaxSplitsを明示的に指定しないと並列 処理されない) – BLOCK_SPLITTER • データ・ブロックをもとに分割。並列度は oracle.hcat.osh.maxSplits (デフォルト値は1)を超えない。 • 利用するOracle DatabaseユーザーにはSYS.DBA_EXTENTS表の参照権限が必要。権限が無い場合はSINGLE_SPLITTERを使って実行される • パーティション表および索引構成表に対しては設定不可 – PARTITION_SPLITTER • パーティション単位で分割。並列度は oracle.hcat.osh.maxSplits を超えない。 25 Oracle Table Access for Hadoop & Spark
  • 26. Copyright © 2015, Oracle and/or its affiliates. All rights reserved. | Agenda TO hadoop File 26
  • 27. Copyright © 2015, Oracle and/or its affiliates. All rights reserved. | • HDFS NFS Gateway – NFS Mountにより、通常の ファイルシステムと同様 の操作感。ただしrandom writeはサポートされない ので要注意 • HttpFS – HTTPでHDFSへファイルを 送受信 – HTTPアクセスできればよ いので、クライアント側 に特別な設定・ソフト ウェアは不要。クライア ントはGatewayサーバーに HTTPでアクセスできれば よい 27 • HDFS API – JavaやCなどのAPI経由での アクセス – プロキシなどを経由しな いので、もっとも高速 HDFSへのファイル転送 典型的な利用シーン: 管理用シェルスクリプトなど 通常のOSコマンドで、HDFSを 操作したい場合 典型的な利用シーン: - クライアント側にライブラリ等 を配置できない場合 - APIが提供されていない言語 からの利用 典型的な利用シーン: - Java, Cプログラムからの利用 HDFS API
  • 28. Copyright © 2015, Oracle and/or its affiliates. All rights reserved. | 28 Hadoopコマンド(File system shell)例 https://hadoop.apache.org/docs/current/hadoop-project-dist/hadoop-common/FileSystemShell.html コマンド 説明 hadoop fs –ls hdfsディレクトリ HDFSディレクトリの一覧を表示 hadoop fs –put file.txt hdfsディレクトリ ローカルにあるfile.txtをHDFSディレクトリにコピー Hadoop fs –cat hdfsディレクトリ/file.txt HDFS上にあるfile.txtを表示 Hadoop fs –rm hdfsディレクトリ/file.txt HDFS上にあるfile.txtを削除 HDFS API
  • 29. Copyright © 2015, Oracle and/or its affiliates. All rights reserved. | Apache Flume • 準リアルタイム データ収集のための効率的な基盤 – Big Data Applianceに含まれる – 特にログファイルの準リアルタイムの収集に強みをもつ • ファイル単位ではなくログに出力されたものを順次収集 (TailSuorce) – Agentを複数配置することでスケールアウト可能 29 HDFS Agent1 Agent ログの転送 Agent Agent2 Agent3 Agent4 Thirft, JMS, HTTP等 多様なソースに対応 収集したデータの格納先は Apache HBaseやApache Solr 等にも対応 連携元 ファイル(tail –F 方式で順次 読み取り), Thrift, JMS, Avro, HTTP, Syslog等 連携タイミン グ 準リアルタイム データ・ロスの 可能性 連携中にAgentが受信した データを送信前にファイル or DBに永続化することでき、 データロスを防ぐことが可能 HDFS以外の 連携先 Avro, Thrift, IRC, HBase, Solr, Elastic Search, Kafka 特徴 Big Data Applianceではサ ポートこみで利用可能 公式サイト https://flume.apache.org/ Flume
  • 30. Copyright © 2015, Oracle and/or its affiliates. All rights reserved. | Agenda IN hadoop 30
  • 31. Copyright © 2015, Oracle and/or its affiliates. All rights reserved. | Hadoop仲間のエコシステム 31 HDFS 分散ファイルシステム Spark インメモリの分散処理フレームワーク MapReduce 分散処理フレームワーク Hive SQLエ ンジン YARN 分散処理のリソース管理 Mahout 機械 学習 Pig 手続型 データ処理 MLLib 機械学習 GraphX グラフ分析 SparkSQL SQLエンジン Impala SQLエ ンジン その他 アプリ ケーショ ン
  • 32. Copyright © 2015, Oracle and/or its affiliates. All rights reserved. | バッチ処理用言語 MapReduce , Pig , Hive •MapReduceはパワフルな半面、習得が難しい •HiveやPigであればスクリプトやSQLなどで比較的容易な操作が可能になる •内部的にはMapReduceを実行している •HiveはFacebook , PigはYahoo!によって開発された •Hive •Pig Select * FROM purchases Where price > 10000 ORDER BY storeid Purchases = LOAD “/user/data/purchases” AS (itemID , price ,puchaseID); Bigticket = FILTER purchases BY price > 10000 ; ・・・ 32
  • 33. Copyright © 2015, Oracle and/or its affiliates. All rights reserved. | バッチ処理用言語 MapReduce , Pig , Hive •Hive vs Pig Hive Pig Language HiveQL (SQLライク) Pig Latin (データフロー型言語) スキーマ テーブル定義はメタデータとして 管理される StorageHandlerにより、様々な フォーマットをパース可能 スキーマは、あってもなくても良い 実行時に定義可能 クライアント からのアクセス コマンドラインツール JDBC, ODBC, Thrift コマンドラインツール PigServer ( Java API) 33
  • 34. Copyright © 2015, Oracle and/or its affiliates. All rights reserved. | Hive SQLライクな言語で分散処理を実現 HDFS上では、データは種々 のフォーマットの ファイルとして存在 HiveQLによる 処理の記述 HDFS Hive Engine MapReduce Hive Metastore Hive MapReduce HiveQLを解釈して、 MapReduceとして実行 = SQLとMapReduceの 橋渡し 表定義や、ファイルの フォーマットなどを管理。 CREATE TABLE文で情報 が格納される Hive Metastoreの情報に 従って、ファイル取得、 フォーマット解釈 34
  • 35. Copyright © 2015, Oracle and/or its affiliates. All rights reserved. | CREATE TABLE 文の例 CREATE TABLE TEST_TABLE ( ORG_BSNS_UNIT_KEY decimal(30), BSNS_UNIT_CD string, DAY_ACT_CONDITION_KEY decimal(30), BSNS_ENT_KEY decimal(30), BSNS_ENT_CD string, EMP_KEY decimal(30)) ROW FORMAT DELIMITED FIELDS TERMINATED BY ',' STORED AS TEXTFILE; 区切り文字が”,”のテキストファイル = CSVファイルとして定義 35
  • 36. Copyright © 2015, Oracle and/or its affiliates. All rights reserved. | INSERT SELECT句や、CREATE TABLE AS SELECTによる処理 Hiveによるデータ処理の例 36 INSERT OVERWRITE TABLE table_a SELECT …. CREATE TABLE result_table AS SELECT …. SELECTの結果をテーブルに挿入。 OVERWRITE句を使用した場合は、既存 データは消去。使用しない場合は追記 新規に結果格納用のテーブルを作成
  • 37. Copyright © 2015, Oracle and/or its affiliates. All rights reserved. | Oracle Data Integrator Oracle Data Integrator Application Adapters for Hadoop Oracle Data Integrator for Big Data • ファイル/RDBMSからHiveへのロード • Hive を利用したデータの検証と変換 • FileもしくはHiveからOracleへのロード 37 Map Reduceによるデータ加工やETL処理、DBへのデータロードをGUIで定義可能 Hadoop Cluster f(x) MapReduce Data Load Oracle Database Oracle Data Integrator Application Adapters for Hadoop • 追加オプションでSparkやPigのコードを 生成する事が可能 • Hadoopの最新技術を活用した、 高速なインメモリ処理がGUIで定義可能に Oracle Data Integrator
  • 38. Copyright © 2015, Oracle and/or its affiliates. All rights reserved. | 論理的にデータフローをデザインするだけで、 ナレッジモジュールによりSqoopやHiveなどの物理デザインを作成できる 38 Logical and Physical Design with ODI 論理デザイン 物理デザイン Oracle MySQL Hive Sqoop Sqoop IKM LKM LKM Oracle Hive MySQL Hive Oracle Data Integrator
  • 39. Copyright © 2015, Oracle and/or its affiliates. All rights reserved. | Hive: Execute Transformation Hive SQL Oracle Data Integrator 39
  • 40. Copyright © 2015, Oracle and/or its affiliates. All rights reserved. | Pig: Execute Transformation Oracle Data Integrator 40
  • 41. Copyright © 2015, Oracle and/or its affiliates. All rights reserved. | Spark: Execute Transformation Oracle Data Integrator 41
  • 42. Copyright © 2015, Oracle and/or its affiliates. All rights reserved. | Agenda FROM hadoop 42
  • 43. Copyright © 2015, Oracle and/or its affiliates. All rights reserved. | HadoopとRDBMSの連携の問題点 • NTTデータ殿による金融機関の市場リスク管理のバッチ処理をHadoopで行った検証結果 金融システムへの最新技術の適用 「大量データ分析処理技術『Hadoop』」(後篇) http://e-public.nttdata.co.jp/topics_detail4/id=176 バッチ処理自体は速くなった RDBMSへのロードに時間がかかり トータルではあまり速くなっていないしかし Open SourceのHadoopとOracle DBとの連携製品(Sqoop もしくはそれを拡張したOraOop)もあるが十 分な速度がでず、処理全体の中でボトルネックになっている 43
  • 44. Copyright © 2015, Oracle and/or its affiliates. All rights reserved. | Oracle Loader for Hadoop 44 • Hadoop上のデータを並列処理 でOracle DBに高速データロード (15TB/時間) • データロード時のOracle DBへの 負荷を最小化 • 自動ロードバランスによるデータ ロード処理時間の短縮 • ケルベロス認証のサポートJSON Log files Hive Text ParquetAvro Sequence files Compressed files And more … Oracle Loader for Hadoop (Oracle Big Data Connectors機能)
  • 45. Copyright © 2015, Oracle and/or its affiliates. All rights reserved. | Oracle Loader for Hadoop 45 HDFS上の対応フォーマット 形式 摘要 Hive Hiveテーブルからの読み取り テキスト(可変長、正規表現) HDFS上のデリミタ区切りのファイルもしくは、フォーマット を正規表現で記述可能なファイルからの読み取り 任意のフォーマット InputFormatを独自に実装可能 データベースへのロード方式 方式 摘要 OCI Direct Path ロードに最適化されたDirect Path Loadモードを利用する ため高速 データベースバッファを経由せず、直接データブロックを 生成するため高速 JDBC JDBCによる接続、ロード。 Offline ロードに最適化されたファイル(Data PumpもしくはCSV)を HDFS上に生成 高速化を支える仕組み •通常のJDBCインタフェースの他に、ロード に最適化されたDirect Path Loadを利用する ことが可能 • Oracle DatabaseのPartitionごとに並列に ロード処理を行うことが可能なため高速 •データのサンプリングを行うことにより、ロー ド処理を行うReducerの数を適切に割り当て ることで、処理完了までの時間を短縮(後述) パーティション対応したData PumpをMapReduceで作成し、Direct Pathでロードする仕組み Oracle Loader for Hadoop
  • 46. Copyright © 2015, Oracle and/or its affiliates. All rights reserved. | Oracle Loader for Hadoop 46 時間 Reduce1 Reduce2 Reduce3 Reduce4 ※ maxSamplesPctとmaxLoadFactorと loadCIの組み合わせによっては、統計的に条件を満たせないこともある。 その場合には、サンプリングに基づいたロードバランスを実施しない。一般的にはデフォルト値が効果的。 以下のパラメータを使い、サンプリングの精度を設定可能 パーティションごとのデータに偏りがある場合でも、 パーティションに割り当てるReducerの数を調整して 最適なロードバランスを実現 Partitionごとにロードを行う場合でも、Partition間 のデータの偏りをサンプリングで検知して、割り当 てるReducerの数を調整する。 結果、各Reducerの処理量が平準化され、トータル の処理時間の短縮が実現される。 パラメータ パラメータの意味 enableSampling サンプリングを行うかどうか maxSamplesPct 元データのうち最大どれだけの割合のデータをサンプリングするかを指定 (default:0.01) maxLoadFactor どのreducerも、ここで設定した割合以上のオーバーロードが起きない (default:0.05) loadCI 統計的に、ここで指定した確率でmaxLoadFactor以内のオーバーロードに収まる (1から有意水準を引いた値)(default:0.95) Oracle Loader for Hadoop
  • 47. Copyright © 2015, Oracle and/or its affiliates. All rights reserved. | Oracle Big Data SQL 47 Smart Scan クエリをExadataの ストレージサーバーにオフロード Storage Index クエリに必要な データブロックのみをスキャン SQL一つで、 必要なデータが 高速にセキュアに返される Smart Scan クエリをBig Data Applianceの データノードにオフロード Storage Index クエリに必要な データブロックのみをスキャン SQL 必要データ のみ移動 SQL Big Data Appliance + Hadoop/NoSQL Exadata + Oracle Database 12c Hive metadata Oracle DBの外部表からHDFSのデータを参照する仕組み 既存のアプリ、ツール、スキル そのままで全てのデータがクエリ可能 Oracle Big Data SQL
  • 48. Copyright © 2015, Oracle and/or its affiliates. All rights reserved. | Oracle Big Data SQL selectlast_name, state, movie,genre frommovielogm,customer c wheregenre=‘comedy’ andc.custid=m.custid Smart Scan:ローカルでの絞り込み・データ転送の極小化 1 NameNode/Hive Metastoreから 以下の情報取得: • データの保持場所 • データの構造 • 対象のブロック数 1 2 Big Data SQL Serverが並列読込み: • DataNodeが並列にデータアクセス • 行と列の絞り込み 2 HiveMetastore HDFS NameNode 3 データベースサーバーでの処理 • 関連するデータのみ転送されてくる • データベースのテーブルとジョイン • データベースセキュリティポリシーの適用 3 HDFSDataNode BDS Server HDFSDataNode BDS Server customer DB Hadoop 48 Oracle Big Data SQL
  • 49. Copyright © 2015, Oracle and/or its affiliates. All rights reserved. | Big Data SQL 1.0 & 1.1 • Hadoop側の並列度はDB側に依存 – DB側に不要なPQプロセスが乱立 – 明示的な並列度指定が必要 Big Data SQL 2.0 • HadoopとDBの並列度を個別割り当て • Auto DoPで常に最適な並列度 – 平均40%パフォーマンス向上 • StorageHandler サポート – And more… Big Data SQL 2.0: 並列化の仕組みとStorageHandler対応が拡張 Oracle Big Data SQL 49
  • 50. Copyright © 2015, Oracle and/or its affiliates. All rights reserved. | 50 BDS1.1 vs BDS2.0 並列度 社内検証結果 投影のみ
  • 51. Copyright © 2015, Oracle and/or its affiliates. All rights reserved. | StorageHandlers: HDFS以外の仕組みにも拡張できる Hive Metastore Oracle Big Data SQL Hive StorageHandlers Oracle Big Data SQL 51
  • 52. Copyright © 2015, Oracle and/or its affiliates. All rights reserved. | 52 DEMO
  • 53. Copyright © 2015, Oracle and/or its affiliates. All rights reserved. | Big Data SQL 1.0 & 1.1 • クエリの度に全てのブロックを 読み取り – ブロックあたり256MBのI/Oが発生 Big Data SQL 2.0 • 初回アクセス時に自動的にStorage Indexを作成 • 2回目からは不要なI/Oをスキップ • 平均65% 高速化 – 絞り込み条件が強いクエリの場合、 100倍以上高速化するものも Big Data SQL 2.0: Storage Indexing Oracle Big Data SQL 53
  • 54. Copyright © 2015, Oracle and/or its affiliates. All rights reserved. | Oracle Big Data SQL Storage Index:スキャン対象を絞込み、クエリ時間とデータIOを削減 54 HDFS Field1, Field2, 1001 1010 1045 1109 1043 1001 1045 1609 1043 11455 1909 12430 13010 10450 1909 2043 Field3, … , Fieldn HDFS Block1 (256MB) HDFS Block2 (256MB) Index B1 – Movie_ID Min: 1001 Max: 1609 B2 – Movie_ID Min: 1909 Max: 13010 Example: Find all ratings from movies with a MOVIE_ID of 1109 ✓ ✗ • 自動的にHDFS上のデータブロッ ク毎のIndexの最大値と最小値を 作成 • スキャン前に目的のデータが最 大値-最小値の間にあるかを確認 • 最大値-最小値の間になければ、 スキャンを行わず、クエリにか かる時間と、HDFSからのI/Oを削 減 平均65%、最大100倍高速化 Oracle Big Data SQL
  • 55. Copyright © 2015, Oracle and/or its affiliates. All rights reserved. | 55 Big Data SQL 2.0: Selected TPC-DS Speed Ups Query Elapsed Time Times Faster without SI with SI 42 141.7s 12.3s 11.5 52 148.6s 26.3s 5.7 53 151.6s 44.3s 3.4 55 124.6s 11.0s 11.3 59 238.1s 63.5s 3.7 65 294.3s 76.1s 3.9 68 125.8s 8.9s 14.1 73 120.9s 10.2s 11.9 79 132.6s 11.9s 11.1 89 362.0s 67.1s 5.4 98 252.2s 13.1s 19.3 Oracle Big Data SQL
  • 56. Copyright © 2015, Oracle and/or its affiliates. All rights reserved. | 56 BDS1.1 vs BDS2.0 並列度 社内検証結果 投影のみ
  • 57. Copyright © 2015, Oracle and/or its affiliates. All rights reserved. | 今後さらに高速化機能を追加予定 57 投影のみ
  • 58. Copyright © 2015, Oracle and/or its affiliates. All rights reserved. | Big Data SQL: 制約もなくしていく予定 58 投影のみ
  • 59. Copyright © 2015, Oracle and/or its affiliates. All rights reserved. | Big Data SQLのビジョン 全ての仕組みに共通のインターフェースを提供する 59
  • 60. Copyright © 2015, Oracle and/or its affiliates. All rights reserved. | Hadoop+RDBの連携技術 サマリ 60 Sqoop Copy to BDA 一般的なHadoop機能 Oracle独自機能 SPARK Oracle Table Access for Hadoop & Spark File HDFS API Flume TO hadoop IN hadoop FROM hadoop Hive MapReduce Sqoop Oracle Loader for Hadoop Oracle Big Data SQL Oracle Data Integrator
  • 61. Copyright © 2015, Oracle and/or its affiliates. All rights reserved. | Agenda バッチではなくリアルタイム 連携が求められた時は? 61
  • 62. Copyright © 2015, Oracle and/or its affiliates. All rights reserved. | (準)リアルタイム処理 62 リアルタイム処理: Spark Streaming (BDAに含まれる) Custom Applications Events メッセージング・システム Apache Kafka N対Mの連係の際には 特に有用 Oracle GoldenGate for Big Data
  • 63. Copyright © 2015, Oracle and/or its affiliates. All rights reserved. | Agenda 運用面ではどうなんだろう? 63
  • 64. Copyright © 2015, Oracle and/or its affiliates. All rights reserved. | Enterprise Manager連携 • Big Data ApplianceはEnterprise Managerによる管理機能を提供 • ハードウェアの管理機能は、Exadata用のプラグインを流用 • ソフトウェアの管理機能は、Cloudera Managerと連携 64 基本的にはExadataと同じ監視が可能
  • 65. Copyright © 2015, Oracle and/or its affiliates. All rights reserved. | 統合システム管理 BDA を Oracle Enterprise Manager • ハードウェアとHadoopサービスのヘルス チェック、死活監視、パフォーマンスの 監視 – 詳細な解析が必要な場合はCloudera Manager にドリルダウン • 統合されたインシデント管理 65
  • 66. Copyright © 2015, Oracle and/or its affiliates. All rights reserved. | Hadoop Cluster • 全体のシステムパフォーマ ンスを監視 • HDFSの格納量、MapReduce アクティビティ、ホスト利 用率などのトレンドを確認 – 詳細な分析が必要な場合は Cloudera Managerにドリルダウ ン Performance Summary 66
  • 67. Copyright © 2015, Oracle and/or its affiliates. All rights reserved. | Hardware Monitoring Examples Infiniband Network BDA CPU Utilization Host Level Metrics  ハードウェアコンポーネント を監視: – Hosts – ILOM Servers – PDUs – Switches – Disks  サマリーもしくは詳細なメト リックを参照 67
  • 68. Copyright © 2015, Oracle and/or its affiliates. All rights reserved. | Enterprise ManagerとCloudera Managerの連携方式 Big Data ApplianceEnterprise Manager (Oracle Management Service) Enterprise Manager for Big Data Appliance Plugin Cloudera Manager サービス監視 ヘルスチェッ ク リソース監視 サービス設定 サービス 起動・停止 サービス追加 リソース・死活監視 インシデント管理 Cloudera Managerからの管理が必要な項目 サーバー・スイッチ・PDU 68
  • 69. Copyright © 2015, Oracle and/or its affiliates. All rights reserved. | Agenda Cloudへの取り組み 69
  • 70. Copyright © 2015, Oracle and/or its affiliates. All rights reserved. | Integrated Cloud: エンタープライズ向けの統一化されたプラットフォーム 70 CloudOn-Premises DEVELOP AND DEPLOY ANYWHERE 同じ「アーキテクチャ」 同じ「オラクル製品」 同じ「知識・ノウハウ」 オンプレミスで培った高度な技術を セキュアなクラウド環境へ Complete Open Integrated Engineered Complete Open Integrated Engineered オラクルのクラウド戦略
  • 71. Copyright © 2015, Oracle and/or its affiliates. All rights reserved. | Oracle Big Data Cloud Service エンタープライズ向けビッグデータ活用環境をクラウドで 71 Big Data Cloud Service 高パフォーマンスかつセキュアな 最新の Hadoop の専用環境をご提供 必要に応じて柔軟なスケールアップ/ダウンも可能 高パフォーマンス な専用環境 オラクルの最新ビッグデータ活用製品も含有 単なるインフラ層のコストや管理コスト削減 だけでなく、ソフトウェアも含めたTCO削減が可能 ビッグデータ活用 のための製品も 含有 Oracle Big Data SQL Cloud Service により RDBMS, Hadoop, NoSQL にSQLでアクセス可能 クラウド上で総合的な ビッグデータ管理システムを実現 SQL一つで 全てのデータを 活用可能
  • 72. Copyright © 2015, Oracle and/or its affiliates. All rights reserved. | Big Data + IoT環境をセキュアなクラウドでも活用可能 Big Data Cloud + IoT Cloud Gateway software 2G/3G/LTE ネットワーク WWAN Database Hadoop NoSQL Big Data SQL Big Data Discovery SCM ERP Sales Marketing HCMPLM ファイアウォー ル IoT Cloud Service Big Data Cloud Service SaaS Docs Data Prep. Java BI Dev DB Integ ration Process Mobile PaaS IoT Cloud Service Gateway & SDKs Device Virtualization High Speed Messaging Endpoint Management Stream Processing Event Store Enterprise Connectivity 72
  • 73. Copyright © 2015, Oracle and/or its affiliates. All rights reserved. | Agenda Oracle DBとHadoop 連携の勘所 73
  • 74. Copyright © 2015, Oracle and/or its affiliates. All rights reserved. | Oracle DBとHadoop連携の勘所  移動対象の種類と量 データの移動に時間がかか り過ぎないか  バッチ対象データの断面の 取得方法 特定時刻のデータを取得す る必要があるか  並列処理が有効な処理か? → 「顧客ごと」など処理の分割 単位が明確であれば、並列化 の効果が大きい  移行工数: 処理の複雑さ  移行工数: 現行のロジックを再 利用できるか?  独立性: 該当処理を利用して いるジョブネットの数  独立性: 後続処理の有無  書戻しの種類と量 データの書戻しに時間がか かり過ぎないか  書き戻しの際のトランザク ションの一貫性 TO hadoop IN hadoop FROM hadoop •Hadoopに切り出す、業務・データを適切に見極める事が重要 •データの移動はコスト •Hadoopが苦手な処理を無理やり実装しない 74
  • 75. Copyright © 2015, Oracle and/or its affiliates. All rights reserved. |