Submit Search
Upload
Analytics CloudとEmbulkを使った社会的データの分析
•
Download as PPTX, PDF
•
3 likes
•
860 views
T
tzm_freedom
Follow
Analytics CloudとEmbulkを使ったツイッターのデータを分析してみた話
Read less
Read more
Technology
Report
Share
Report
Share
1 of 14
Download now
Recommended
今更聞けないストリーム処理のあれとかこれ
今更聞けないストリーム処理のあれとかこれ
Tatsuro Hisamori
Game Architecture Trends in Tokyo Kansai Social Game Study#5
Game Architecture Trends in Tokyo Kansai Social Game Study#5
Yasuhiro Matsuo
Hybrid serverless architecture using open whisk ibm cloud functions and istio...
Hybrid serverless architecture using open whisk ibm cloud functions and istio...
Tsuyoshi Hirayama
AI & Deep Learning on AWS at CTO Night&Day 2016 Winter
AI & Deep Learning on AWS at CTO Night&Day 2016 Winter
Yasuhiro Matsuo
Docker Actionを利用してOpenWhiskをあれこれする
Docker Actionを利用してOpenWhiskをあれこれする
Hideaki Tokida
Scaling MongoDB on AWS
Scaling MongoDB on AWS
Yasuhiro Matsuo
AWSでGPUも安く大量に使い倒せ
AWSでGPUも安く大量に使い倒せ
Yasuhiro Matsuo
[F.O.XMeetup#2]インフラ業務を開発エンジニアへ移譲して_2年間の軌跡_
[F.O.XMeetup#2]インフラ業務を開発エンジニアへ移譲して_2年間の軌跡_
Takahiro Moteki
Recommended
今更聞けないストリーム処理のあれとかこれ
今更聞けないストリーム処理のあれとかこれ
Tatsuro Hisamori
Game Architecture Trends in Tokyo Kansai Social Game Study#5
Game Architecture Trends in Tokyo Kansai Social Game Study#5
Yasuhiro Matsuo
Hybrid serverless architecture using open whisk ibm cloud functions and istio...
Hybrid serverless architecture using open whisk ibm cloud functions and istio...
Tsuyoshi Hirayama
AI & Deep Learning on AWS at CTO Night&Day 2016 Winter
AI & Deep Learning on AWS at CTO Night&Day 2016 Winter
Yasuhiro Matsuo
Docker Actionを利用してOpenWhiskをあれこれする
Docker Actionを利用してOpenWhiskをあれこれする
Hideaki Tokida
Scaling MongoDB on AWS
Scaling MongoDB on AWS
Yasuhiro Matsuo
AWSでGPUも安く大量に使い倒せ
AWSでGPUも安く大量に使い倒せ
Yasuhiro Matsuo
[F.O.XMeetup#2]インフラ業務を開発エンジニアへ移譲して_2年間の軌跡_
[F.O.XMeetup#2]インフラ業務を開発エンジニアへ移譲して_2年間の軌跡_
Takahiro Moteki
トレジャーデータ 導入体験記 リブセンス編
トレジャーデータ 導入体験記 リブセンス編
Kentaro Yoshida
Smart Tennis Lesson Serverless Design
Smart Tennis Lesson Serverless Design
Ryuji TAKEHARA
[excite open beerbash 特別篇]レガシーシステムをAWS移行で幸せになった話
[excite open beerbash 特別篇]レガシーシステムをAWS移行で幸せになった話
Takahiro Moteki
Azure Hybrid/Infra Updates! Azureからオンプレ仮想基盤の管理もできるようになってます!
Azure Hybrid/Infra Updates! Azureからオンプレ仮想基盤の管理もできるようになってます!
Masahiko Ebisuda
20190515 hccjp hybrid_strategy
20190515 hccjp hybrid_strategy
Osamu Takazoe
BigQueryで集計するシステムを作って分かったKPI集計ツール作成
BigQueryで集計するシステムを作って分かったKPI集計ツール作成
(shibao)芝尾 (kouichiro)幸一郎
TB / Day規模のゲーム向けデータパイプラインを開発運用する日々
TB / Day規模のゲーム向けデータパイプラインを開発運用する日々
gree_tech
New Features of DotNet 6 Blazor WASM
New Features of DotNet 6 Blazor WASM
Shotaro Suzuki
[JAWS-UG AI支部] AWS AIアップデート
[JAWS-UG AI支部] AWS AIアップデート
Yasuhiro Matsuo
[data analytics showcase] B11: ビッグデータを高速に検索・分析する「Elasticsearch」~新プラグイン「Graph」...
[data analytics showcase] B11: ビッグデータを高速に検索・分析する「Elasticsearch」~新プラグイン「Graph」...
Insight Technology, Inc.
Amazon kinesisで広がるリアルタイムデータプロセッシングとその未来
Amazon kinesisで広がるリアルタイムデータプロセッシングとその未来
Shinpei Ohtani
Awsでつくるapache kafkaといろんな悩み
Awsでつくるapache kafkaといろんな悩み
Keigo Suda
[2018bcu30]1年半もかけてしまったビッグデータ環境のリプレイス
[2018bcu30]1年半もかけてしまったビッグデータ環境のリプレイス
Takahiro Moteki
Hivemall meetup vol2 oisix
Hivemall meetup vol2 oisix
Taisuke Fukawa
Asp.netとbluemixで遊んでみたお話
Asp.netとbluemixで遊んでみたお話
Kazunori Hamamoto
Elasticsearch+nodejs+dynamodbで作る全社システム基盤
Elasticsearch+nodejs+dynamodbで作る全社システム基盤
Recruit Technologies
DynamoDBを利用したKPI保存システム
DynamoDBを利用したKPI保存システム
gree_tech
2016 sep13 gdlc01 pfn
2016 sep13 gdlc01 pfn
Tomokazu Kanazawa
AWSとGPUインスタンスのご紹介
AWSとGPUインスタンスのご紹介
Yasuhiro Matsuo
Build 2014 Azure インフラエンジニア向けアップデート
Build 2014 Azure インフラエンジニア向けアップデート
kekekekenta
セキュリティ勉強会 暗号技術入門 1章
セキュリティ勉強会 暗号技術入門 1章
Naoko Suzuki
いろいろなSSL/TLS設定ガイドライン (JNSA電子署名WG 実世界の暗号・認証技術勉強会資料)
いろいろなSSL/TLS設定ガイドライン (JNSA電子署名WG 実世界の暗号・認証技術勉強会資料)
Kenji Urushima
More Related Content
What's hot
トレジャーデータ 導入体験記 リブセンス編
トレジャーデータ 導入体験記 リブセンス編
Kentaro Yoshida
Smart Tennis Lesson Serverless Design
Smart Tennis Lesson Serverless Design
Ryuji TAKEHARA
[excite open beerbash 特別篇]レガシーシステムをAWS移行で幸せになった話
[excite open beerbash 特別篇]レガシーシステムをAWS移行で幸せになった話
Takahiro Moteki
Azure Hybrid/Infra Updates! Azureからオンプレ仮想基盤の管理もできるようになってます!
Azure Hybrid/Infra Updates! Azureからオンプレ仮想基盤の管理もできるようになってます!
Masahiko Ebisuda
20190515 hccjp hybrid_strategy
20190515 hccjp hybrid_strategy
Osamu Takazoe
BigQueryで集計するシステムを作って分かったKPI集計ツール作成
BigQueryで集計するシステムを作って分かったKPI集計ツール作成
(shibao)芝尾 (kouichiro)幸一郎
TB / Day規模のゲーム向けデータパイプラインを開発運用する日々
TB / Day規模のゲーム向けデータパイプラインを開発運用する日々
gree_tech
New Features of DotNet 6 Blazor WASM
New Features of DotNet 6 Blazor WASM
Shotaro Suzuki
[JAWS-UG AI支部] AWS AIアップデート
[JAWS-UG AI支部] AWS AIアップデート
Yasuhiro Matsuo
[data analytics showcase] B11: ビッグデータを高速に検索・分析する「Elasticsearch」~新プラグイン「Graph」...
[data analytics showcase] B11: ビッグデータを高速に検索・分析する「Elasticsearch」~新プラグイン「Graph」...
Insight Technology, Inc.
Amazon kinesisで広がるリアルタイムデータプロセッシングとその未来
Amazon kinesisで広がるリアルタイムデータプロセッシングとその未来
Shinpei Ohtani
Awsでつくるapache kafkaといろんな悩み
Awsでつくるapache kafkaといろんな悩み
Keigo Suda
[2018bcu30]1年半もかけてしまったビッグデータ環境のリプレイス
[2018bcu30]1年半もかけてしまったビッグデータ環境のリプレイス
Takahiro Moteki
Hivemall meetup vol2 oisix
Hivemall meetup vol2 oisix
Taisuke Fukawa
Asp.netとbluemixで遊んでみたお話
Asp.netとbluemixで遊んでみたお話
Kazunori Hamamoto
Elasticsearch+nodejs+dynamodbで作る全社システム基盤
Elasticsearch+nodejs+dynamodbで作る全社システム基盤
Recruit Technologies
DynamoDBを利用したKPI保存システム
DynamoDBを利用したKPI保存システム
gree_tech
2016 sep13 gdlc01 pfn
2016 sep13 gdlc01 pfn
Tomokazu Kanazawa
AWSとGPUインスタンスのご紹介
AWSとGPUインスタンスのご紹介
Yasuhiro Matsuo
Build 2014 Azure インフラエンジニア向けアップデート
Build 2014 Azure インフラエンジニア向けアップデート
kekekekenta
What's hot
(20)
トレジャーデータ 導入体験記 リブセンス編
トレジャーデータ 導入体験記 リブセンス編
Smart Tennis Lesson Serverless Design
Smart Tennis Lesson Serverless Design
[excite open beerbash 特別篇]レガシーシステムをAWS移行で幸せになった話
[excite open beerbash 特別篇]レガシーシステムをAWS移行で幸せになった話
Azure Hybrid/Infra Updates! Azureからオンプレ仮想基盤の管理もできるようになってます!
Azure Hybrid/Infra Updates! Azureからオンプレ仮想基盤の管理もできるようになってます!
20190515 hccjp hybrid_strategy
20190515 hccjp hybrid_strategy
BigQueryで集計するシステムを作って分かったKPI集計ツール作成
BigQueryで集計するシステムを作って分かったKPI集計ツール作成
TB / Day規模のゲーム向けデータパイプラインを開発運用する日々
TB / Day規模のゲーム向けデータパイプラインを開発運用する日々
New Features of DotNet 6 Blazor WASM
New Features of DotNet 6 Blazor WASM
[JAWS-UG AI支部] AWS AIアップデート
[JAWS-UG AI支部] AWS AIアップデート
[data analytics showcase] B11: ビッグデータを高速に検索・分析する「Elasticsearch」~新プラグイン「Graph」...
[data analytics showcase] B11: ビッグデータを高速に検索・分析する「Elasticsearch」~新プラグイン「Graph」...
Amazon kinesisで広がるリアルタイムデータプロセッシングとその未来
Amazon kinesisで広がるリアルタイムデータプロセッシングとその未来
Awsでつくるapache kafkaといろんな悩み
Awsでつくるapache kafkaといろんな悩み
[2018bcu30]1年半もかけてしまったビッグデータ環境のリプレイス
[2018bcu30]1年半もかけてしまったビッグデータ環境のリプレイス
Hivemall meetup vol2 oisix
Hivemall meetup vol2 oisix
Asp.netとbluemixで遊んでみたお話
Asp.netとbluemixで遊んでみたお話
Elasticsearch+nodejs+dynamodbで作る全社システム基盤
Elasticsearch+nodejs+dynamodbで作る全社システム基盤
DynamoDBを利用したKPI保存システム
DynamoDBを利用したKPI保存システム
2016 sep13 gdlc01 pfn
2016 sep13 gdlc01 pfn
AWSとGPUインスタンスのご紹介
AWSとGPUインスタンスのご紹介
Build 2014 Azure インフラエンジニア向けアップデート
Build 2014 Azure インフラエンジニア向けアップデート
Viewers also liked
セキュリティ勉強会 暗号技術入門 1章
セキュリティ勉強会 暗号技術入門 1章
Naoko Suzuki
いろいろなSSL/TLS設定ガイドライン (JNSA電子署名WG 実世界の暗号・認証技術勉強会資料)
いろいろなSSL/TLS設定ガイドライン (JNSA電子署名WG 実世界の暗号・認証技術勉強会資料)
Kenji Urushima
qpstudy 2015.11.14 一歩先を行くインフラエンジニアに知ってほしいSSL/TLS
qpstudy 2015.11.14 一歩先を行くインフラエンジニアに知ってほしいSSL/TLS
Kenji Urushima
私はここでつまづいた! Oracle database 11g から 12cへのアップグレードと Oracle Database 12c の新機能@201...
私はここでつまづいた! Oracle database 11g から 12cへのアップグレードと Oracle Database 12c の新機能@201...
yoshimotot
第2回Web技術勉強会 webパフォーマンス改善編
第2回Web技術勉強会 webパフォーマンス改善編
tzm_freedom
第3回web技術勉強会 暗号技術編その1
第3回web技術勉強会 暗号技術編その1
tzm_freedom
第5回web技術勉強会 暗号技術編その3
第5回web技術勉強会 暗号技術編その3
tzm_freedom
第4回web技術勉強会 暗号技術編その2
第4回web技術勉強会 暗号技術編その2
tzm_freedom
Certificate TransparencyによるSSLサーバー証明書公開監査情報とその課題の議論
Certificate TransparencyによるSSLサーバー証明書公開監査情報とその課題の議論
Kenji Urushima
introduction to jsrsasign
introduction to jsrsasign
Kenji Urushima
Viewers also liked
(10)
セキュリティ勉強会 暗号技術入門 1章
セキュリティ勉強会 暗号技術入門 1章
いろいろなSSL/TLS設定ガイドライン (JNSA電子署名WG 実世界の暗号・認証技術勉強会資料)
いろいろなSSL/TLS設定ガイドライン (JNSA電子署名WG 実世界の暗号・認証技術勉強会資料)
qpstudy 2015.11.14 一歩先を行くインフラエンジニアに知ってほしいSSL/TLS
qpstudy 2015.11.14 一歩先を行くインフラエンジニアに知ってほしいSSL/TLS
私はここでつまづいた! Oracle database 11g から 12cへのアップグレードと Oracle Database 12c の新機能@201...
私はここでつまづいた! Oracle database 11g から 12cへのアップグレードと Oracle Database 12c の新機能@201...
第2回Web技術勉強会 webパフォーマンス改善編
第2回Web技術勉強会 webパフォーマンス改善編
第3回web技術勉強会 暗号技術編その1
第3回web技術勉強会 暗号技術編その1
第5回web技術勉強会 暗号技術編その3
第5回web技術勉強会 暗号技術編その3
第4回web技術勉強会 暗号技術編その2
第4回web技術勉強会 暗号技術編その2
Certificate TransparencyによるSSLサーバー証明書公開監査情報とその課題の議論
Certificate TransparencyによるSSLサーバー証明書公開監査情報とその課題の議論
introduction to jsrsasign
introduction to jsrsasign
Similar to Analytics CloudとEmbulkを使った社会的データの分析
Twilio の API を SQL で操作!? 〜 CData Drivers for Twilio 製品のご紹介 〜
Twilio の API を SQL で操作!? 〜 CData Drivers for Twilio 製品のご紹介 〜
CData Software Japan
AWSによるサーバーレスアーキテクチャ
AWSによるサーバーレスアーキテクチャ
真吾 吉田
ApexからAWS IoT叩いてみた話
ApexからAWS IoT叩いてみた話
tzm_freedom
Azure Antenna はじめての Azure Data Lake
Azure Antenna はじめての Azure Data Lake
Hideo Takagi
Tech circle#2 Vagrant+Docker handson
Tech circle#2 Vagrant+Docker handson
Daisuke Ikeda
Azureのサーバーレスで限界を超えよう~スマートスピーカースキル開発を題材に~
Azureのサーバーレスで限界を超えよう~スマートスピーカースキル開発を題材に~
拓将 平林
スマートニュースの世界展開を支えるログ解析基盤
スマートニュースの世界展開を支えるログ解析基盤
Takumi Sakamoto
鹿駆動勉強会 青江発表資料
鹿駆動勉強会 青江発表資料
Takashi Aoe
Small Language Model Local Launch on AI Tour Tokyo
Small Language Model Local Launch on AI Tour Tokyo
Takao Tetsuro
RPA勉強会 Power BI を学ぶ特別編!
RPA勉強会 Power BI を学ぶ特別編!
Yugo Shimizu
Microsoft Azureのビッグデータ基盤とAIテクノロジーを活用しよう
Microsoft Azureのビッグデータ基盤とAIテクノロジーを活用しよう
Hideo Takagi
Salesforce DUG #10 Winter'16 Wave Analytics
Salesforce DUG #10 Winter'16 Wave Analytics
Masaki Kubomura
Big query and elasticsearch insight at scale
Big query and elasticsearch insight at scale
Shotaro Suzuki
Implementation Approach of Artifical Intelligence
Implementation Approach of Artifical Intelligence
Takao Tetsuro
Watson summit 2016_j2_5
Watson summit 2016_j2_5
Tanaka Yuichi
ADO.NETでつながるクラウドデータ連携
ADO.NETでつながるクラウドデータ連携
CData Software Japan
Azure Serverless or Power Platform 〜 あなたならどっち?! - Azure Serverless 編
Azure Serverless or Power Platform 〜 あなたならどっち?! - Azure Serverless 編
Kazumi IWANAGA
Strata + Hadoop World 2014 レポート #cwt2014
Strata + Hadoop World 2014 レポート #cwt2014
Cloudera Japan
Visual Studio App Centerで始めるCI/CD(iOS)
Visual Studio App Centerで始めるCI/CD(iOS)
Shinya Nakajima
Swtt2018 sfdgr2 Developer Group ルーキー会が教える!次の一歩のための開発ノウハウ
Swtt2018 sfdgr2 Developer Group ルーキー会が教える!次の一歩のための開発ノウハウ
SFDG ROOKIES
Similar to Analytics CloudとEmbulkを使った社会的データの分析
(20)
Twilio の API を SQL で操作!? 〜 CData Drivers for Twilio 製品のご紹介 〜
Twilio の API を SQL で操作!? 〜 CData Drivers for Twilio 製品のご紹介 〜
AWSによるサーバーレスアーキテクチャ
AWSによるサーバーレスアーキテクチャ
ApexからAWS IoT叩いてみた話
ApexからAWS IoT叩いてみた話
Azure Antenna はじめての Azure Data Lake
Azure Antenna はじめての Azure Data Lake
Tech circle#2 Vagrant+Docker handson
Tech circle#2 Vagrant+Docker handson
Azureのサーバーレスで限界を超えよう~スマートスピーカースキル開発を題材に~
Azureのサーバーレスで限界を超えよう~スマートスピーカースキル開発を題材に~
スマートニュースの世界展開を支えるログ解析基盤
スマートニュースの世界展開を支えるログ解析基盤
鹿駆動勉強会 青江発表資料
鹿駆動勉強会 青江発表資料
Small Language Model Local Launch on AI Tour Tokyo
Small Language Model Local Launch on AI Tour Tokyo
RPA勉強会 Power BI を学ぶ特別編!
RPA勉強会 Power BI を学ぶ特別編!
Microsoft Azureのビッグデータ基盤とAIテクノロジーを活用しよう
Microsoft Azureのビッグデータ基盤とAIテクノロジーを活用しよう
Salesforce DUG #10 Winter'16 Wave Analytics
Salesforce DUG #10 Winter'16 Wave Analytics
Big query and elasticsearch insight at scale
Big query and elasticsearch insight at scale
Implementation Approach of Artifical Intelligence
Implementation Approach of Artifical Intelligence
Watson summit 2016_j2_5
Watson summit 2016_j2_5
ADO.NETでつながるクラウドデータ連携
ADO.NETでつながるクラウドデータ連携
Azure Serverless or Power Platform 〜 あなたならどっち?! - Azure Serverless 編
Azure Serverless or Power Platform 〜 あなたならどっち?! - Azure Serverless 編
Strata + Hadoop World 2014 レポート #cwt2014
Strata + Hadoop World 2014 レポート #cwt2014
Visual Studio App Centerで始めるCI/CD(iOS)
Visual Studio App Centerで始めるCI/CD(iOS)
Swtt2018 sfdgr2 Developer Group ルーキー会が教える!次の一歩のための開発ノウハウ
Swtt2018 sfdgr2 Developer Group ルーキー会が教える!次の一歩のための開発ノウハウ
More from tzm_freedom
Apex on Local - Better Alternative to Salesforce DX
Apex on Local - Better Alternative to Salesforce DX
tzm_freedom
Land
Land
tzm_freedom
C初心者がbyebugにPR出した話
C初心者がbyebugにPR出した話
tzm_freedom
APIテストあれこれ
APIテストあれこれ
tzm_freedom
第一回Web技術勉強会 efkスタック編
第一回Web技術勉強会 efkスタック編
tzm_freedom
第三回IoT関連技術勉強会 データ通信編
第三回IoT関連技術勉強会 データ通信編
tzm_freedom
第二回IoT関連技術勉強会 ログ収集編
第二回IoT関連技術勉強会 ログ収集編
tzm_freedom
第一回IoT関連技術勉強会 分散処理編
第一回IoT関連技術勉強会 分散処理編
tzm_freedom
ElectronでExactTargetのGUIツールを作ってみた話
ElectronでExactTargetのGUIツールを作ってみた話
tzm_freedom
Dreamforce '15のお話
Dreamforce '15のお話
tzm_freedom
More from tzm_freedom
(10)
Apex on Local - Better Alternative to Salesforce DX
Apex on Local - Better Alternative to Salesforce DX
Land
Land
C初心者がbyebugにPR出した話
C初心者がbyebugにPR出した話
APIテストあれこれ
APIテストあれこれ
第一回Web技術勉強会 efkスタック編
第一回Web技術勉強会 efkスタック編
第三回IoT関連技術勉強会 データ通信編
第三回IoT関連技術勉強会 データ通信編
第二回IoT関連技術勉強会 ログ収集編
第二回IoT関連技術勉強会 ログ収集編
第一回IoT関連技術勉強会 分散処理編
第一回IoT関連技術勉強会 分散処理編
ElectronでExactTargetのGUIツールを作ってみた話
ElectronでExactTargetのGUIツールを作ってみた話
Dreamforce '15のお話
Dreamforce '15のお話
Recently uploaded
PHP-Conference-Odawara-2024-04-000000000
PHP-Conference-Odawara-2024-04-000000000
Shota Ito
20240412_HCCJP での Windows Server 2025 Active Directory
20240412_HCCJP での Windows Server 2025 Active Directory
osamut
プレイマットのパターン生成支援ツール
プレイマットのパターン生成支援ツール
sugiuralab
IoT in the era of generative AI, Thanks IoT ALGYAN.pptx
IoT in the era of generative AI, Thanks IoT ALGYAN.pptx
Atomu Hidaka
Amazon SES を勉強してみる その12024/04/12の勉強会で発表されたものです。
Amazon SES を勉強してみる その12024/04/12の勉強会で発表されたものです。
iPride Co., Ltd.
新人研修のまとめ 2024/04/12の勉強会で発表されたものです。
新人研修のまとめ 2024/04/12の勉強会で発表されたものです。
iPride Co., Ltd.
プレイマットのパターン生成支援ツールの評価
プレイマットのパターン生成支援ツールの評価
sugiuralab
Postman LT Fukuoka_Quick Prototype_By Daniel
Postman LT Fukuoka_Quick Prototype_By Daniel
danielhu54
Recently uploaded
(8)
PHP-Conference-Odawara-2024-04-000000000
PHP-Conference-Odawara-2024-04-000000000
20240412_HCCJP での Windows Server 2025 Active Directory
20240412_HCCJP での Windows Server 2025 Active Directory
プレイマットのパターン生成支援ツール
プレイマットのパターン生成支援ツール
IoT in the era of generative AI, Thanks IoT ALGYAN.pptx
IoT in the era of generative AI, Thanks IoT ALGYAN.pptx
Amazon SES を勉強してみる その12024/04/12の勉強会で発表されたものです。
Amazon SES を勉強してみる その12024/04/12の勉強会で発表されたものです。
新人研修のまとめ 2024/04/12の勉強会で発表されたものです。
新人研修のまとめ 2024/04/12の勉強会で発表されたものです。
プレイマットのパターン生成支援ツールの評価
プレイマットのパターン生成支援ツールの評価
Postman LT Fukuoka_Quick Prototype_By Daniel
Postman LT Fukuoka_Quick Prototype_By Daniel
Analytics CloudとEmbulkを使った社会的データの分析
1.
Analytics CloudとEmbulk を使った社会的データの分析 株式会社ウフル 田実
誠
2.
Who Am I? 名前:田実
誠 所属:ウフルの人 Salesforce Summer Tokyoに申し込まずにコミュニ ティハッピーアワーにだけ飛び入り参加する不心得者は 私の事です。 Blog: http://freedom-man.com/blog/ Github: tzmfreedom Twitter: @tzm_freedom SlideShare: tzm_freedom
3.
Analytics Cloud? • BIツール付きデータストアな、大量データ分析プラットフォーム •
億レベルのレコード数のデータを格納/解析可能 • レンズ、ダッシュボードによるクリックベースの設定 • SAQL(Apache Pig Latinライクなクエリ言語) • フロントエンドはReact/EclairNG • 転置インデックス • カラムナーDB 概要資料 http://www.salesforce.com/jp/analytics-cloud/overview/ アーキテクチャ http://www.slideshare.net/mokamoto/biweb “Analytics Cloud用”のDeveloper環境で試せる! https://developer.salesforce.com/promotions/orgs/wave-de
4.
AnalyticsCloudのUIから取り込めるデータ種別
5.
AnalyticsCloudのUIから取り込めるデータ種別 び、微妙…
6.
AnalyticsCloudのUIから取り込めるデータ種別 S3とかTreasureDataとかBigQueryとかRedShiftとかHDFSとか、そういうところからロードしたいはず。 え、CSVだけ…? それ以外はファイル変換しなきゃダメなの…? 普通のRDBからも入力したいな… んーエンジニアっぽくテキストベースでスマートに バルクロードできるやつないかなー
7.
ということでEmbulkに目を付けた • バルクデータローダなOSS • 並列処理をすることで高速なアップロードを実現 •
Fluentdのバッチ版 • Fluentd同様プラガブルなアーキテクチャ • リトライ/エラーハンドリング →利用するプラグインに依存するけど… • 設定ファイルをある程度自動的に作成してくれる仕組み(guess) • TreasureDataが担っているOSS $ embulk run config.yml
8.
embulk-output-analytics_cloudをリリース
9.
こんな感じで設定すればおk out: type: analytics_cloud username: hoge@example.com password:
xxxxxx edgemart_alias: foobar auto_metadata_settings: {} INPUTから算出したスキーマ情報から、自動 的にメタデータJSONを作ってくれる。 明示的に指定することも可能
10.
全体こんな感じ in: type: s3 bucket: tzmfreedom-tweet-stock path_prefix:
sakamichi/2016/05/01 endpoint: s3-ap-northeast-1.amazonaws.com access_key_id: AKI****** secret_access_key: ******* decoders: - {type: gzip} parser: type: jsonl charset: UTF-8 newline: CRLF columns: - {name: id_str, type: string} - {name: text, type: string} - {name: timestamp_ms, type: string} filters: - type: typecast columns: - {name: created_at, type: timestamp, format: "%a %b %d %H:%M:%S %z %Y"} out: type: analytics_cloud username: hoge@example.com password: ******* edgemart_alias: foobar auto_metadata_settings: {} S3から jsonl形式のデータを gzipで圧縮されたファイルで AnalyticsCloudにロードする
11.
嫌な予感しかしないDEMO 今回は乃木坂46, 欅坂46に関するツイートを集めて Analytics Cloudで分析。 Twitter
Streaming APIで 各メンバーの名前及びグループ名が 入っているツイートをリアルタイムに取得 embulk-output- analytics_cloud jsonlファイルとして格納
12.
Embulkの起動
13.
ジョブはこんな感じ
14.
ツイート分析ダッシュボード
Download now