SlideShare una empresa de Scribd logo
1 de 35
Descargar para leer sin conexión
CAジャーナルクラブ
Dremel: Interactive Analysis
of Web-Scale Datasets
2014/07/25
山田 直行
今回とりあげる論文・資料
Dremel: Interactive Analysis of Web-Scale Datasets
http://research.google.com/pubs/pub36632.html
2010年発表。それまでGoogle社内で使われてきた理論と実装を論文
にまとめて公開したもの。オープンソースの世界にデータ分析フレーム
ワークの新しいコンセプトを提示した
参考:

An Inside Look at Google BigQuery

https://cloud.google.com/files/BigQueryTechnicalWP.pdf
目次
- 要約(+自分なりの要点)
- 1. Introduction
- 2. Background
- 3. Data Model
- 4. Nested Columnar Storage
- 5. Query Language
- 6. Query Executio
- 7. Experiments
- 8. Observations
- 9. Related Work
- 10. Conclusions
- MapReduceとの違い:

An Inside Look at Google BigQuery より
要約(+自分なりの要点)
Dremelとは
ネストされたデータ構造(ただし各データの構造と型は固定)に最
適化された列指向のデータストレージにより、最も少量でのディス
クのフルスキャンを行う(つまりインメモリを前提としていない)
多重の木構造からなる処理エンジン。中間にあるディスパッチャが
バランシングと再実行を行うことにより、並列数を増やすことによ
り線形にスケールする
SQLでの処理ができ、シンプルなクエリをアドホックに短時間に何
度も実行することに向く。非構造なデータや複雑なデータ処理には
向いていないという点で、MapReduceなどと補完関係にある
Dremelがカバーする範囲
100ミリ秒台から数分までのイ
ンタラクティブなクエリ実行に
適する
Read-Onlyが前提
100ミリ秒以下のものは全てを
インメモリで処理可能なものが
適する(MySQLやRedis)
20分以上の大規模な集計は
MapReduceやHiveなど
出典:
http://incubator.apache.org/drill/
Dremelと周辺技術
Dremelの実装
Apache Drill - オープンソース実装
Google BigQuery - by Google社
一部実装しているもの、参考にしているもの
Impala, Parquet, Prestoなど
MapReduce(2004年)

http://research.google.com/archive/mapreduce.html
列指向データベース(Columnar Database) 10年以上前から商用化はされている

http://en.wikipedia.org/wiki/Column-oriented_DBMS
BigTable(2006年)

BigTableはGoogleの開発したデータストレージの名前。HBaseなどと同等のレイヤー
(HBaseはBigTableをモデルとする)。

DremelはMapReduce等と同列の、データ処理フレームワークを指す
1. Introduction
ネスト化されたデータ構造に列指向データストレージを適用することに
ついて(第4セクション)
Dremelのクエリ言語と実行方法について述べる。どちらも列指向の
ネスト化されたデータの処理に向いている(第5セクション)
ウェブの検索システムで使われている木構造の処理がデータベースにど
う適用できるかを述べ、データの集約における利点と効率性について述
べる(第6セクション)
数兆のレコード、数テラバイトのデータセットに対して1000 4000
のノードを使ってDremelのクエリを実行した結果について示す

(第7セクション)
2. Background
具体的なユースケースを仮定してみる:

Google社のエンジニアのAliceはウェブページの新しい徴候(new
signals)を抽出するアイデアをデータを使って検証しようとしている
MapReduceジョブ→DremelでSELECTクエリ→FlumeJavaで
深堀りして分析、といった一連のフロー
これらをパイプライン処理化してダッシュボードに表示

データセットカタログに登録して他のエンジニアが閲覧する
以上のようなシナリオでは、処理システム自体とデータ管理ツールとの
相互運用をうまく回すことが求められる
まず第一の要素として重要なのは、汎用のストレージ層( common
storage layer )
例えばGoogle File System(他にHDFSなど)
分散処理が可能で、読み出しが高速であり、ツールを使ってデータの操
作が簡単にできること
第二の要素として重要なのは、共通のストレージ形式( shared
storage format )。いわゆるカラム型ストレージは、フラットなリ
レーショナルデータについてはすでに利用されているが、Googleはこ
れをネストされたデータ形式にも適用したいという要件があった
doc{:a=>{:b =>{:c =>x, :d=>y}, :e=>z}みたいなデータについても
カラム型データとして表現できるようにする
3. Data Model
ここで説明するデータモデルはProtocol Buffersで、Google社内
だけでなくオープンソースで公開されている
強く定型化されたネスト型データとして表現される
τ(タウ): データ型またはレコード型

dom: document object model

*: 繰り返し出現するフィールドであることを示す

?: オプショナルなフィールドであることを示す
具体的には例えばこういうデータ:
4. Nested Columnar Storage
私たちにとっての目的は、検索効率を改善するため、あるフィールドの
全てのデータをできるだけ隣接して保存すること
その取り組みは下記3点に集約される:
カラム型形式における無劣化の(可逆な)レコード形式

(4.1 Repetition and Definition Level)
高速なエンコーディング

(4.2 Splitting Records into Columns)
効率的なレコードの組み立て

(4.3 Record Assembly)
4.1 Repetition and Definition Level
単一の値は、それ自体ではデータ構造を表現できない。レコード間の境
界や、繰り返しフィールドやオプショナルフィールドを表現する要素が
必要
Repetition Levels(繰り返しレベル)
どのフィールドパスにある繰り返しフィールドの値が繰り返しされて
いるのか、をnull値の付与および0以上の整数のレベルで表す
Definition Levels(定義レベル)
あるパスにあるどれだけの(未定義になりうる)フィールドが実際
に存在するのか、をnull値の付与および0以上の整数のレベルで表す
Encoding
できるだけ少ないビット列でこれらを表現する。省略できるものは
入れない
言葉で表現しづらいので下記のようなイメージ
4.2 Splitting Records into Columns
あるレコードのデータを、どう効率的に各カラムに格納していくかにつ
いて
Googleで扱うデータの多くは非常に疎(sparse)であるため、出現す
る頻度が未定なフィールドを全て走査するのは効率が悪い
field writer を木構造で持ち、親子間でレベルを同期して必要なと
きにだけ更新をかけるようにする
4.3 Record Assembly
カラム型データ構造から、いかに効率的にレコード型のデータ処理
(MapReduceなど)を行えるようにデータを取り出すかについて
FSM(finite state machine)
必要なカラムを順に渡り歩きながら各フィールドの値とレベルを読
み出してレコードとして出力する
FSMの状態=各フィールドリーダー
Repetition Levelに沿ってFSMが順々に処理していき、次の
フィールドの読み取り、と進んでいく
Figure4(上図)はレコード
全体を処理する例
Figure5(下図)は2つの
フィールドだけを読み取る例
5. Query Language
Dremelのクエリ言語はSQLを基礎として、ネスト化されたカラム型
ストレージのデータに適した実装になっている
正確な言語仕様は割愛
ネスト化されたカラム型データのレコードをラベルの付いた木構造とし
て表現している
6. Query Execution
Tree architecture
多重階層の木構造でクエリを実行している
上記のようなクエリは、下記のようなクエリに変換され、
それぞれのRは下記のようなクエリに分割されて実行されて集約される
Query dispatcher
Dremelはマルチユーザーで実行することができ、複数のクエリを
同時に実行可能
Slot = 末端のサーバーの数 スレッド数、として、各Slotに均等
に処理がいくように配分される。レスポンスが遅い処理があれば別
の処理へと再配分される
結果を返すのに必要なデータの割合(%)を指定することで、全ての
データを集約する前に結果を返すことで、実行時間を短縮できる
7. Experiments
Local diskでの検証
レコード型とカラム型のデータの読み取りパフォーマンスの比較
MR(MapReduce) and Dremel
あるフィールドにある語句の数の平均を求める処理をMRと
Dremelで比較
Dremel
MapReduce(Sawzall)
numWords numRecs = 結果
MR-record → MR-Columnsと、MR-Columns→Dremelでそ
れぞれ一桁ずつ実行時間が短縮している
Serving tree topology
2段階(root-leaf)から4段階(root-mid-mid-leaf)と階層化を
深めていくことでパフォーマンスが上がっている
Per-tablet histograms
各tablet(1つの処理単位)は99%以上が1 2秒以内に完了している
Within-record aggregation
下記では、a.b.c.d(ネスト数4)およびa.b.p.q.r(ネスト数5)とい
うようにネスト階層の違ったフィールドの集計をしているが、ネス
ト型をサポートしているDremelの特性により、読み出すデータは
最小(13GB/70GB)で済むため、効率よく処理ができる
Scalability
leaf server数を増やすことで線形にスケールする
Stragglers(はぐれ者)
1%に満たないごく一部のtabletsは処理に長時間を要する
8. Observations
GoogleにおいてDremelは1000兆レコードを毎月処理している
共有サーバーでも秒間1000億レコードを処理、専有サーバーならもっ
とパフォーマンスがでる
Scan-based(read-only)なクエリであれば1兆レコードまでは
インタラクティブといえる速度で処理できる
数千ノードのサーバーで処理すれば、線形にスケールする
DBMSと同様に、MapReduceもカラム型ストレージの効果がある
レコードの組み立てとパースは重い処理であるため、ソフトウェアレイ
ヤ(クエリの実行前)に最適化しておく必要がある
MRとクエリ処理は補完関係にできる。あるレイヤーの出力を次のレイ
ヤーの入力に渡す、ということが可能
複数ユーザーの環境下では、大規模なシステムのほうが規模の経済の恩
恵を受けやすい
スピードのために正確性を少し犠牲にできるのならば、クエリは途中で
停止させることができ、短い実行時間で結果を返すことができる
Web-scaleのデータはほとんどは高速にスキャンできるが、残りのご
く一部の割合の処理時間を短縮するのが難しい
9. Related Work
MapReduce, Hadoop関係
並列処理について
カラムナーデータベースについて(XMLを使ったもの含む)
データモデルについて
SQLやその関連技術について
10. Conclusions
Dremelという、大規模データをインタラクティブに分析できる分散
システムについて述べた
Dremelはシンプルな部品から構成されるデータ管理ソリューション
MapReduce的パラダイムを補完する
兆単位のレコード、数TBのデータにおけるパフォーマンスを検証した
Dremelのストレージ形式、クエリ言語、実行モデルについて述べた
今後、正式な代数的な仕様やJOINクエリ、拡張の仕組みなどについて
取り上げる予定
MapReduceとの違い:
An Inside Look at Google BigQuery より
!
BigQueryはインタラクティブな、数秒で終わる処理

アドホックでTry-and-errorを繰り返すような処理
MapReduceはバッチ処理、時間のかかる処理

大規模データの変換や集計で多くの時間がかかるもの

複雑なデータ処理やロジックの適用が可能

非構造化されたデータの処理が可能

多量の結果を返すケース

大きいテーブル同士JOINする場合

既存のデータの更新




Más contenido relacionado

La actualidad más candente

MongoDBを用いたソーシャルアプリのログ解析 〜解析基盤構築からフロントUIまで、MongoDBを最大限に活用する〜
MongoDBを用いたソーシャルアプリのログ解析 〜解析基盤構築からフロントUIまで、MongoDBを最大限に活用する〜MongoDBを用いたソーシャルアプリのログ解析 〜解析基盤構築からフロントUIまで、MongoDBを最大限に活用する〜
MongoDBを用いたソーシャルアプリのログ解析 〜解析基盤構築からフロントUIまで、MongoDBを最大限に活用する〜
Takahiro Inoue
 
MongoDBとAjaxで作る解析フロントエンド&GraphDBを用いたソーシャルデータ解析
MongoDBとAjaxで作る解析フロントエンド&GraphDBを用いたソーシャルデータ解析MongoDBとAjaxで作る解析フロントエンド&GraphDBを用いたソーシャルデータ解析
MongoDBとAjaxで作る解析フロントエンド&GraphDBを用いたソーシャルデータ解析
Takahiro Inoue
 

La actualidad más candente (20)

【ウェブ セミナー】AI / アナリティクスを支えるビッグデータ基盤 Azure Data Lake [概要編]
【ウェブ セミナー】AI / アナリティクスを支えるビッグデータ基盤 Azure Data Lake [概要編]【ウェブ セミナー】AI / アナリティクスを支えるビッグデータ基盤 Azure Data Lake [概要編]
【ウェブ セミナー】AI / アナリティクスを支えるビッグデータ基盤 Azure Data Lake [概要編]
 
MySQLと組み合わせて始める全文検索プロダクト"elasticsearch"
MySQLと組み合わせて始める全文検索プロダクト"elasticsearch"MySQLと組み合わせて始める全文検索プロダクト"elasticsearch"
MySQLと組み合わせて始める全文検索プロダクト"elasticsearch"
 
【ウェブ セミナー】AI / アナリティクスを支えるビッグデータ基盤 Azure Data Lake [実践編]
【ウェブ セミナー】AI / アナリティクスを支えるビッグデータ基盤 Azure Data Lake [実践編]【ウェブ セミナー】AI / アナリティクスを支えるビッグデータ基盤 Azure Data Lake [実践編]
【ウェブ セミナー】AI / アナリティクスを支えるビッグデータ基盤 Azure Data Lake [実践編]
 
MongoDBを用いたソーシャルアプリのログ解析 〜解析基盤構築からフロントUIまで、MongoDBを最大限に活用する〜
MongoDBを用いたソーシャルアプリのログ解析 〜解析基盤構築からフロントUIまで、MongoDBを最大限に活用する〜MongoDBを用いたソーシャルアプリのログ解析 〜解析基盤構築からフロントUIまで、MongoDBを最大限に活用する〜
MongoDBを用いたソーシャルアプリのログ解析 〜解析基盤構築からフロントUIまで、MongoDBを最大限に活用する〜
 
Elasticsearch勉強会#39 LT 20201217
Elasticsearch勉強会#39 LT 20201217Elasticsearch勉強会#39 LT 20201217
Elasticsearch勉強会#39 LT 20201217
 
Microsoft Azureのビッグデータ基盤とAIテクノロジーを活用しよう
Microsoft Azureのビッグデータ基盤とAIテクノロジーを活用しようMicrosoft Azureのビッグデータ基盤とAIテクノロジーを活用しよう
Microsoft Azureのビッグデータ基盤とAIテクノロジーを活用しよう
 
MongoDBとAjaxで作る解析フロントエンド&GraphDBを用いたソーシャルデータ解析
MongoDBとAjaxで作る解析フロントエンド&GraphDBを用いたソーシャルデータ解析MongoDBとAjaxで作る解析フロントエンド&GraphDBを用いたソーシャルデータ解析
MongoDBとAjaxで作る解析フロントエンド&GraphDBを用いたソーシャルデータ解析
 
ElasticSearch+Kibanaでログデータの検索と視覚化を実現するテクニックと運用ノウハウ
ElasticSearch+Kibanaでログデータの検索と視覚化を実現するテクニックと運用ノウハウElasticSearch+Kibanaでログデータの検索と視覚化を実現するテクニックと運用ノウハウ
ElasticSearch+Kibanaでログデータの検索と視覚化を実現するテクニックと運用ノウハウ
 
MySQLユーザ視点での小さく始めるElasticsearch
MySQLユーザ視点での小さく始めるElasticsearchMySQLユーザ視点での小さく始めるElasticsearch
MySQLユーザ視点での小さく始めるElasticsearch
 
ESFluteによるElasticsearchでのO/Rマッパーを用いた開発
ESFluteによるElasticsearchでのO/Rマッパーを用いた開発ESFluteによるElasticsearchでのO/Rマッパーを用いた開発
ESFluteによるElasticsearchでのO/Rマッパーを用いた開発
 
Mongodb
MongodbMongodb
Mongodb
 
Elastic Stackの紹介とOpenStackでの活用事例(Searchlightなど) - OpenStack最新情報セミナー 2016年5月
Elastic Stackの紹介とOpenStackでの活用事例(Searchlightなど) - OpenStack最新情報セミナー 2016年5月Elastic Stackの紹介とOpenStackでの活用事例(Searchlightなど) - OpenStack最新情報セミナー 2016年5月
Elastic Stackの紹介とOpenStackでの活用事例(Searchlightなど) - OpenStack最新情報セミナー 2016年5月
 
Elasticsearchで作る形態素解析サーバ
Elasticsearchで作る形態素解析サーバElasticsearchで作る形態素解析サーバ
Elasticsearchで作る形態素解析サーバ
 
Azure Antenna はじめての Azure Data Lake
Azure Antenna はじめての Azure Data LakeAzure Antenna はじめての Azure Data Lake
Azure Antenna はじめての Azure Data Lake
 
Data x AI x API で考えるビジネスインフラ
Data x AI x API で考えるビジネスインフラData x AI x API で考えるビジネスインフラ
Data x AI x API で考えるビジネスインフラ
 
SmartNews の Webmining を支えるプラットフォーム
SmartNews の Webmining を支えるプラットフォームSmartNews の Webmining を支えるプラットフォーム
SmartNews の Webmining を支えるプラットフォーム
 
実動するIot&hadoopから学ぶ会_資料
実動するIot&hadoopから学ぶ会_資料実動するIot&hadoopから学ぶ会_資料
実動するIot&hadoopから学ぶ会_資料
 
SolrとElasticsearchの比較
SolrとElasticsearchの比較SolrとElasticsearchの比較
SolrとElasticsearchの比較
 
GDG Tokyo Firebaseを使った Androidアプリ開発
GDG Tokyo Firebaseを使った Androidアプリ開発GDG Tokyo Firebaseを使った Androidアプリ開発
GDG Tokyo Firebaseを使った Androidアプリ開発
 
[東京] JapanSharePointGroup 勉強会 #2
[東京] JapanSharePointGroup 勉強会 #2[東京] JapanSharePointGroup 勉強会 #2
[東京] JapanSharePointGroup 勉強会 #2
 

Destacado

Adtech College#7 GitHubを中心とした開発フロー
Adtech College#7 GitHubを中心とした開発フローAdtech College#7 GitHubを中心とした開発フロー
Adtech College#7 GitHubを中心とした開発フロー
Naoyuki Yamada
 
Social Web Japan Vol.3 "Social Application and their support services"
Social Web Japan Vol.3 "Social Application and their support services"Social Web Japan Vol.3 "Social Application and their support services"
Social Web Japan Vol.3 "Social Application and their support services"
Naoyuki Yamada
 
ADTECH COLLEGE #2 近い将来、開発責任者になるあなたへ
ADTECH COLLEGE #2 近い将来、開発責任者になるあなたへADTECH COLLEGE #2 近い将来、開発責任者になるあなたへ
ADTECH COLLEGE #2 近い将来、開発責任者になるあなたへ
Naoyuki Yamada
 
JAWS-2013-LT 10000req/secを50msecで返すサーバーインフラをAWSで作る
JAWS-2013-LT 10000req/secを50msecで返すサーバーインフラをAWSで作るJAWS-2013-LT 10000req/secを50msecで返すサーバーインフラをAWSで作る
JAWS-2013-LT 10000req/secを50msecで返すサーバーインフラをAWSで作る
Naoyuki Yamada
 
社内勉強会:ソーシャルゲームのデータベース設計入門
社内勉強会:ソーシャルゲームのデータベース設計入門社内勉強会:ソーシャルゲームのデータベース設計入門
社内勉強会:ソーシャルゲームのデータベース設計入門
Naoyuki Yamada
 
JP_Chaosmap 2013 Autumn
JP_Chaosmap 2013 AutumnJP_Chaosmap 2013 Autumn
JP_Chaosmap 2013 Autumn
Hiroshi Kondo
 
Elasticsearch勉強会第8回 ElasticsearchとKibanaで実現する 30億req/dayのリアルタイム分析
Elasticsearch勉強会第8回 ElasticsearchとKibanaで実現する 30億req/dayのリアルタイム分析Elasticsearch勉強会第8回 ElasticsearchとKibanaで実現する 30億req/dayのリアルタイム分析
Elasticsearch勉強会第8回 ElasticsearchとKibanaで実現する 30億req/dayのリアルタイム分析
Naoyuki Yamada
 
Jp chaosmap 2014-2015
Jp chaosmap 2014-2015Jp chaosmap 2014-2015
Jp chaosmap 2014-2015
Hiroshi Kondo
 

Destacado (17)

Google Dremel
Google DremelGoogle Dremel
Google Dremel
 
ソーシャルアプリ業界を構成する中間サービスたち
ソーシャルアプリ業界を構成する中間サービスたちソーシャルアプリ業界を構成する中間サービスたち
ソーシャルアプリ業界を構成する中間サービスたち
 
Adtech College#7 GitHubを中心とした開発フロー
Adtech College#7 GitHubを中心とした開発フローAdtech College#7 GitHubを中心とした開発フロー
Adtech College#7 GitHubを中心とした開発フロー
 
Social Web Japan Vol.3 "Social Application and their support services"
Social Web Japan Vol.3 "Social Application and their support services"Social Web Japan Vol.3 "Social Application and their support services"
Social Web Japan Vol.3 "Social Application and their support services"
 
ADTECH COLLEGE #2 近い将来、開発責任者になるあなたへ
ADTECH COLLEGE #2 近い将来、開発責任者になるあなたへADTECH COLLEGE #2 近い将来、開発責任者になるあなたへ
ADTECH COLLEGE #2 近い将来、開発責任者になるあなたへ
 
東北Tech道場郡山20151031
東北Tech道場郡山20151031東北Tech道場郡山20151031
東北Tech道場郡山20151031
 
JAWS-2013-LT 10000req/secを50msecで返すサーバーインフラをAWSで作る
JAWS-2013-LT 10000req/secを50msecで返すサーバーインフラをAWSで作るJAWS-2013-LT 10000req/secを50msecで返すサーバーインフラをAWSで作る
JAWS-2013-LT 10000req/secを50msecで返すサーバーインフラをAWSで作る
 
浪江町タブレットで採用した、 Cordovaで作るHTML5のAndroidアプリのしくみ
浪江町タブレットで採用した、 Cordovaで作るHTML5のAndroidアプリのしくみ浪江町タブレットで採用した、 Cordovaで作るHTML5のAndroidアプリのしくみ
浪江町タブレットで採用した、 Cordovaで作るHTML5のAndroidアプリのしくみ
 
AWSからOpenStack, Chef SoloからChef Serverに インフラを置き換えた事例の紹介
AWSからOpenStack, Chef SoloからChef Serverに インフラを置き換えた事例の紹介AWSからOpenStack, Chef SoloからChef Serverに インフラを置き換えた事例の紹介
AWSからOpenStack, Chef SoloからChef Serverに インフラを置き換えた事例の紹介
 
社内勉強会:ソーシャルゲームのデータベース設計入門
社内勉強会:ソーシャルゲームのデータベース設計入門社内勉強会:ソーシャルゲームのデータベース設計入門
社内勉強会:ソーシャルゲームのデータベース設計入門
 
Google's Dremel
Google's DremelGoogle's Dremel
Google's Dremel
 
elasticsearchソースコードを読みはじめてみた
elasticsearchソースコードを読みはじめてみたelasticsearchソースコードを読みはじめてみた
elasticsearchソースコードを読みはじめてみた
 
JP_Chaosmap 2013 Autumn
JP_Chaosmap 2013 AutumnJP_Chaosmap 2013 Autumn
JP_Chaosmap 2013 Autumn
 
Elasticsearch勉強会第8回 ElasticsearchとKibanaで実現する 30億req/dayのリアルタイム分析
Elasticsearch勉強会第8回 ElasticsearchとKibanaで実現する 30億req/dayのリアルタイム分析Elasticsearch勉強会第8回 ElasticsearchとKibanaで実現する 30億req/dayのリアルタイム分析
Elasticsearch勉強会第8回 ElasticsearchとKibanaで実現する 30億req/dayのリアルタイム分析
 
ElasticSearch勉強会 第6回
ElasticSearch勉強会 第6回ElasticSearch勉強会 第6回
ElasticSearch勉強会 第6回
 
Jp chaosmap 2014-2015
Jp chaosmap 2014-2015Jp chaosmap 2014-2015
Jp chaosmap 2014-2015
 
JP Chaosmap 2015-2016
JP Chaosmap 2015-2016JP Chaosmap 2015-2016
JP Chaosmap 2015-2016
 

Similar a CAジャーナルクラブ Dremel: Interactive Analysis of Web-Scale Datasets

Groovy base gradle_20130309
Groovy base gradle_20130309Groovy base gradle_20130309
Groovy base gradle_20130309
Nobuhiro Sue
 
Intalio japan special cloud workshop
Intalio japan special cloud workshopIntalio japan special cloud workshop
Intalio japan special cloud workshop
Daisuke Sugai
 
ビッグデータ活用支援フォーラム
ビッグデータ活用支援フォーラムビッグデータ活用支援フォーラム
ビッグデータ活用支援フォーラム
Recruit Technologies
 
Gws 20120521 gradle
Gws 20120521 gradleGws 20120521 gradle
Gws 20120521 gradle
Nobuhiro Sue
 
WebDB Forum 2012 基調講演資料
WebDB Forum 2012 基調講演資料WebDB Forum 2012 基調講演資料
WebDB Forum 2012 基調講演資料
Recruit Technologies
 

Similar a CAジャーナルクラブ Dremel: Interactive Analysis of Web-Scale Datasets (20)

基本から学ぶ ビッグデータ / データ分析 / 機械学習 サービス群
基本から学ぶ ビッグデータ / データ分析 / 機械学習 サービス群基本から学ぶ ビッグデータ / データ分析 / 機械学習 サービス群
基本から学ぶ ビッグデータ / データ分析 / 機械学習 サービス群
 
Drupal ISV 20160630
Drupal ISV 20160630Drupal ISV 20160630
Drupal ISV 20160630
 
Groovy base gradle_20130309
Groovy base gradle_20130309Groovy base gradle_20130309
Groovy base gradle_20130309
 
MLOps Course Slides_JP(配布用).pdf
MLOps Course Slides_JP(配布用).pdfMLOps Course Slides_JP(配布用).pdf
MLOps Course Slides_JP(配布用).pdf
 
Oracle Data Minerハンズオンセミナー170927:②Oracle data minerハンズオン資料
Oracle Data Minerハンズオンセミナー170927:②Oracle data minerハンズオン資料Oracle Data Minerハンズオンセミナー170927:②Oracle data minerハンズオン資料
Oracle Data Minerハンズオンセミナー170927:②Oracle data minerハンズオン資料
 
Intalio japan special cloud workshop
Intalio japan special cloud workshopIntalio japan special cloud workshop
Intalio japan special cloud workshop
 
ビッグデータ活用支援フォーラム
ビッグデータ活用支援フォーラムビッグデータ活用支援フォーラム
ビッグデータ活用支援フォーラム
 
20180723 PFNの研究基盤 / PFN research system infrastructure
20180723 PFNの研究基盤 / PFN research system infrastructure20180723 PFNの研究基盤 / PFN research system infrastructure
20180723 PFNの研究基盤 / PFN research system infrastructure
 
rePiT2015_アジャイルソフトウェア開発教育のためのチケットシステムを用いたプロジェクト定量評価手法
rePiT2015_アジャイルソフトウェア開発教育のためのチケットシステムを用いたプロジェクト定量評価手法rePiT2015_アジャイルソフトウェア開発教育のためのチケットシステムを用いたプロジェクト定量評価手法
rePiT2015_アジャイルソフトウェア開発教育のためのチケットシステムを用いたプロジェクト定量評価手法
 
[Cloud OnAir] ハイブリッドクラウドと Google Cloud 〜戦略的なクラウド活用を考える〜 2019年2月7日 放送
[Cloud OnAir] ハイブリッドクラウドと Google Cloud 〜戦略的なクラウド活用を考える〜 2019年2月7日 放送[Cloud OnAir] ハイブリッドクラウドと Google Cloud 〜戦略的なクラウド活用を考える〜 2019年2月7日 放送
[Cloud OnAir] ハイブリッドクラウドと Google Cloud 〜戦略的なクラウド活用を考える〜 2019年2月7日 放送
 
ディープラーニング最近の発展とビジネス応用への課題
ディープラーニング最近の発展とビジネス応用への課題ディープラーニング最近の発展とビジネス応用への課題
ディープラーニング最近の発展とビジネス応用への課題
 
Gws 20120521 gradle
Gws 20120521 gradleGws 20120521 gradle
Gws 20120521 gradle
 
Google Product
Google ProductGoogle Product
Google Product
 
React ContextとPropの違いについて
React ContextとPropの違いについてReact ContextとPropの違いについて
React ContextとPropの違いについて
 
Snowflake Architecture and Performance(db tech showcase Tokyo 2018)
Snowflake Architecture and Performance(db tech showcase Tokyo 2018)Snowflake Architecture and Performance(db tech showcase Tokyo 2018)
Snowflake Architecture and Performance(db tech showcase Tokyo 2018)
 
データプロダクトを支えるビッグデータ基盤
データプロダクトを支えるビッグデータ基盤データプロダクトを支えるビッグデータ基盤
データプロダクトを支えるビッグデータ基盤
 
チームトポロジーから学び、 データプラットフォーム組織を考え直した話.pptx
チームトポロジーから学び、 データプラットフォーム組織を考え直した話.pptxチームトポロジーから学び、 データプラットフォーム組織を考え直した話.pptx
チームトポロジーから学び、 データプラットフォーム組織を考え直した話.pptx
 
Panel Discussion@WebDB forum 2014
Panel Discussion@WebDB forum 2014Panel Discussion@WebDB forum 2014
Panel Discussion@WebDB forum 2014
 
WebDB Forum 2012 基調講演資料
WebDB Forum 2012 基調講演資料WebDB Forum 2012 基調講演資料
WebDB Forum 2012 基調講演資料
 
JAWS DAYS 2022
JAWS DAYS 2022JAWS DAYS 2022
JAWS DAYS 2022
 

Más de Naoyuki Yamada (6)

KubernetesでRedisを使うときの選択肢
KubernetesでRedisを使うときの選択肢KubernetesでRedisを使うときの選択肢
KubernetesでRedisを使うときの選択肢
 
いわき情報技術研究会20170513
いわき情報技術研究会20170513いわき情報技術研究会20170513
いわき情報技術研究会20170513
 
CAジャーナルクラブ TAO: Facebook’s Distributed Data Store for the Social Graph
CAジャーナルクラブ TAO: Facebook’s Distributed Data Store for the Social GraphCAジャーナルクラブ TAO: Facebook’s Distributed Data Store for the Social Graph
CAジャーナルクラブ TAO: Facebook’s Distributed Data Store for the Social Graph
 
株式会社サイバーエージェント アドテクスタジオの技術と開発
株式会社サイバーエージェント アドテクスタジオの技術と開発株式会社サイバーエージェント アドテクスタジオの技術と開発
株式会社サイバーエージェント アドテクスタジオの技術と開発
 
Functional Programming in Scala Reading #2
Functional Programming in Scala Reading #2Functional Programming in Scala Reading #2
Functional Programming in Scala Reading #2
 
Code for Japan 勉強会 Vol.1 CKAN入門 プロジェクトのFork、デプロイ、CIまで
Code for Japan 勉強会 Vol.1 CKAN入門 プロジェクトのFork、デプロイ、CIまでCode for Japan 勉強会 Vol.1 CKAN入門 プロジェクトのFork、デプロイ、CIまで
Code for Japan 勉強会 Vol.1 CKAN入門 プロジェクトのFork、デプロイ、CIまで
 

Último

Último (10)

LoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアルLoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
 
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
 
新人研修 後半 2024/04/26の勉強会で発表されたものです。
新人研修 後半        2024/04/26の勉強会で発表されたものです。新人研修 後半        2024/04/26の勉強会で発表されたものです。
新人研修 後半 2024/04/26の勉強会で発表されたものです。
 
論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games
論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games
論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games
 
知識ゼロの営業マンでもできた!超速で初心者を脱する、悪魔的学習ステップ3選.pptx
知識ゼロの営業マンでもできた!超速で初心者を脱する、悪魔的学習ステップ3選.pptx知識ゼロの営業マンでもできた!超速で初心者を脱する、悪魔的学習ステップ3選.pptx
知識ゼロの営業マンでもできた!超速で初心者を脱する、悪魔的学習ステップ3選.pptx
 
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
 
論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...
論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...
論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...
 
論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding
論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding
論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding
 
LoRaWANスマート距離検出センサー DS20L カタログ LiDARデバイス
LoRaWANスマート距離検出センサー  DS20L  カタログ  LiDARデバイスLoRaWANスマート距離検出センサー  DS20L  カタログ  LiDARデバイス
LoRaWANスマート距離検出センサー DS20L カタログ LiDARデバイス
 
Utilizing Ballerina for Cloud Native Integrations
Utilizing Ballerina for Cloud Native IntegrationsUtilizing Ballerina for Cloud Native Integrations
Utilizing Ballerina for Cloud Native Integrations
 

CAジャーナルクラブ Dremel: Interactive Analysis of Web-Scale Datasets