SlideShare una empresa de Scribd logo
1 de 42
© SIOS Technology, Inc. All rights Reserved.
データの入力、確認、出力
Treasure Dataの利用方法の紹介
サイオステクノロジー株式会社
クラウドソリューション部
2013.05.17
大村 和子
サイオステクノロジー株式会社
© SIOS Technology, Inc. All rights Reserved.
自己紹介
名前:大村和子
所属:サイオステクノロジー株式会社
クラウドソリューション部
ビッグデータ技術ブログ書いてます!!
http://sstd-bigdata.blogspot.jp/
© SIOS Technology, Inc. All rights Reserved.
目次
全体図
Treasure Dataへtd-agentでデータをイ
ンポート
Treasure Dataのデータの監視と確認
Treasure Dataのデータを出力
Treasure DataとREST
Treasure Dataのその他の機能紹介
Treasure DataとBIツールの連携
© SIOS Technology, Inc. All rights Reserved.
全体図
© SIOS Technology, Inc. All rights Reserved.
Google Apps
全体図
Amazon Web Service
株価
Treasure Data
Database
Google
Spreadsheet
SiosWebSite
td-agent
Twitter
データ
Faceboo
kデータ
HRForecast
PG
td-agent
MySQL
監視、確認
© SIOS Technology, Inc. All rights Reserved.
Treasure Dataへtd-agentでデータをインポート
© SIOS Technology, Inc. All rights Reserved.
Treasure Dataへデータをインポート
Treasure Data
Database
SiosWebSite
td-agent
© SIOS Technology, Inc. All rights Reserved.
td-agent.confの設定
#/etc/td-agent/td-agent.conf
<source>
type tail
format apache
path /var/log/httpd/access_log
pos_file /var/log/td-agent/httpd-access.log.pos
tag td.sios_web.www_access
</source>
<match td.sios_web.www_access>
type tdlog
apikey XXXXXXXXXXXXXXXXXXXXXXXXXXXXXX
auto_create_table
buffer_type file
buffer_path /var/log/td-agent/buffer/td
use_ssl true
</match>
設定ファイルを記述し、
td-agentを動作させる
© SIOS Technology, Inc. All rights Reserved.
Treasure Dataのデータの監視と確認
© SIOS Technology, Inc. All rights Reserved.
Treasure Dataの監視と確認
Treasure Data
Database
監視、確認
© SIOS Technology, Inc. All rights Reserved.
Treasure Dataコンソール
ダッシュボード
データベース
クエリ
インポート
ジョブ
出力先
スケジュール
© SIOS Technology, Inc. All rights Reserved.
tdコマンドでも監視できます
© SIOS Technology, Inc. All rights Reserved.
Wikiデータの検索
wikimedia.orgの
オープンデータの
約11億レコードが
Treasure Dataに入ってます!!
検索してみましょう!!
© SIOS Technology, Inc. All rights Reserved.
HiveQL(はいぶきゅーえる)
SQLに似ているHiveの問い合わせ言語
TreasureDataのデータもこれで検索できます。
select
TD_TIME_FORMAT(time, 'yyyy-MM-dd') as tm
,count(1) as cnt
from wiki_tbl
group by TD_TIME_FORMAT(time, 'yyyy-MM-dd')
↑
日付別の件数を取得するHiveQL
© SIOS Technology, Inc. All rights Reserved.
HiveQL(はいぶきゅーえる)の実行1
© SIOS Technology, Inc. All rights Reserved.
HiveQL(はいぶきゅーえる)の実行2
実行中
Job Id:2786765
© SIOS Technology, Inc. All rights Reserved.
HiveQL(はいぶきゅーえる)の実行3
終了
© SIOS Technology, Inc. All rights Reserved.
HiveQL(はいぶきゅーえる)の実行4
結果
© SIOS Technology, Inc. All rights Reserved.
Treasure Dataのデータを出力
© SIOS Technology, Inc. All rights Reserved.
Treasure Dataのデータを出力
Google Apps
Amazon Web Service
Treasure Data
Database
Google
Spreadsheet
HRForecast
PG
MySQL
BIツール
© SIOS Technology, Inc. All rights Reserved.
GoogleスプレッドシートにPush 1
Result(出力先)の登録(現在はtdコマンドからのみ)
$ td result:create my_gspreadsheet
‘gspreadsheet://<user>:<password>@gmail.com/<ブック名>’
© SIOS Technology, Inc. All rights Reserved.
GoogleスプレッドシートにPush 2
先ほどのwikiのクエリを指定し、Resultに
先ほど作った名前とシート名を設定
{Result名}:{シート名}
my_gspreadsheet:wiki_list
© SIOS Technology, Inc. All rights Reserved.
GoogleスプレッドシートにPush 3
結果
© SIOS Technology, Inc. All rights Reserved.
GoogleスプレッドシートにPush 4
定期的に出力することも可能
© SIOS Technology, Inc. All rights Reserved.
MySQLに出力
Googleスプレッドシートとほぼ同じです
$ td result:create my_db
‘mysql://<user>:<password>@<host>/<db>’
© SIOS Technology, Inc. All rights Reserved.
Treasure DataとREST
© SIOS Technology, Inc. All rights Reserved.
現在、標準ライブラリが用意されている言語
•Ruby
•Java
•Node.js
© SIOS Technology, Inc. All rights Reserved.
こんなかんじです(Ruby)
#Treasure Dataクライアント作成
cln = TreasureData::Client.new(ENV['TREASURE_DATA_API_KEY'])
#過去3日分のデータを取得
sql = "select close ,date_time,low,high from stocks where code=3744 and date_time >= '"
+ str_startday + "'"
#query
job = cln.query("rps_db",sql)
#wait
until job.finished?
sleep 2
job.update_progress!
end
#get data
job.result_each{|row|
#send data
res = Net::HTTP.post_form(URI.parse('http://localhost:5127/api/stocks/sios/price'),
{'number'=>row[0].to_i.to_s, 'datetime'=>row[1].to_s})
}
© SIOS Technology, Inc. All rights Reserved.
HRForecastに書き込んでみました。
© SIOS Technology, Inc. All rights Reserved.
Treasure Dataのその他の機能紹介
© SIOS Technology, Inc. All rights Reserved.
Bulk Import
すでに大量の過去ログがある
んだけど。。
大丈夫です!
Bulk Importで確実に
インポートできます!
© SIOS Technology, Inc. All rights Reserved.
手動インポート
ちょっとだけ手動でデータを
インポートしたいんだけど。。
大丈夫です!
ちょっともできます。
コンソールからも可能です。
© SIOS Technology, Inc. All rights Reserved.
データの分析
Treasure Data中のデータを
分析したいんだけど。。
大丈夫です!
各種BIツールと連携できます!!
© SIOS Technology, Inc. All rights Reserved.
Treasure DataとBIツールの連携
© SIOS Technology, Inc. All rights Reserved.
どのようなツールが利用できるの?
Treasure Dataはデータベース内の
データをさまざまなBIツールから
直接利用することができます。
• JDBC接続
• ODBC接続(準備中)
• Treasure Data専用の設定
© SIOS Technology, Inc. All rights Reserved.
Metric InsightsとTreasure Data
© SIOS Technology, Inc. All rights Reserved.
Metric InsightsとTreasure Data
© SIOS Technology, Inc. All rights Reserved.
Metric InsightsとTreasure Data
© SIOS Technology, Inc. All rights Reserved.
最後に宣伝です
© SIOS Technology, Inc. All rights Reserved.
ビッグデータに関する技術支援もしています
• アトリビューション分析支援
• マイニング用リソース構築(RDB,NoSQL)
• 形態素解析支援(MeCab等)
• データ分析支援(R言語)
• BIツール紹介
Treasure Dataの導入支援、サポート以外にも
いろいろやってます!
© SIOS Technology, Inc. All rights Reserved.
ブログもやってます!
SIOSビッグデータ技術ブログ
http://sstd-bigdata.blogspot.jp/
「ビッグデータ ブログ」
で検索!
ご清聴ありがとうございました。

Más contenido relacionado

Similar a Treasure data demo.0517

OSSを活用したダッシュボード の紹介
OSSを活用したダッシュボード の紹介OSSを活用したダッシュボード の紹介
OSSを活用したダッシュボード の紹介BigData Sios
 
zozotown real time linkage infrastructure
zozotown real time linkage infrastructurezozotown real time linkage infrastructure
zozotown real time linkage infrastructureKeisukeTaniguchi2
 
性能問題を起こしにくい信頼されるクラウド RDB のつくりかた
性能問題を起こしにくい信頼されるクラウド RDB のつくりかた性能問題を起こしにくい信頼されるクラウド RDB のつくりかた
性能問題を起こしにくい信頼されるクラウド RDB のつくりかたTomoyuki Oota
 
[db analytics showcase Sapporo 2018] B25 Hadoop上で動く世界最速のAnalytic DBをSparkと一緒に...
[db analytics showcase Sapporo 2018] B25 Hadoop上で動く世界最速のAnalytic DBをSparkと一緒に...[db analytics showcase Sapporo 2018] B25 Hadoop上で動く世界最速のAnalytic DBをSparkと一緒に...
[db analytics showcase Sapporo 2018] B25 Hadoop上で動く世界最速のAnalytic DBをSparkと一緒に...Insight Technology, Inc.
 
エンジニアのための Azure 基礎知識
エンジニアのための Azure 基礎知識エンジニアのための Azure 基礎知識
エンジニアのための Azure 基礎知識Daiyu Hatakeyama
 
MySQLデータ暗号化と暗号鍵のローテーション
MySQLデータ暗号化と暗号鍵のローテーションMySQLデータ暗号化と暗号鍵のローテーション
MySQLデータ暗号化と暗号鍵のローテーションShinya Sugiyama
 
Data analysis platform ver1.1
Data analysis platform ver1.1Data analysis platform ver1.1
Data analysis platform ver1.1TomohiroDoi
 
20151024 Azureデータストア概要
20151024 Azureデータストア概要20151024 Azureデータストア概要
20151024 Azureデータストア概要Keiji Kamebuchi
 
シラサギハンズオン 大阪
シラサギハンズオン 大阪シラサギハンズオン 大阪
シラサギハンズオン 大阪Yu Ito
 
[db tech showcase Tokyo 2014] D33: Prestoで実現するインタラクティブクエリ by トレジャーデータ株式会社 斉藤太郎
[db tech showcase Tokyo 2014] D33: Prestoで実現するインタラクティブクエリ  by トレジャーデータ株式会社 斉藤太郎[db tech showcase Tokyo 2014] D33: Prestoで実現するインタラクティブクエリ  by トレジャーデータ株式会社 斉藤太郎
[db tech showcase Tokyo 2014] D33: Prestoで実現するインタラクティブクエリ by トレジャーデータ株式会社 斉藤太郎Insight Technology, Inc.
 
(2017.6.2) Azure HDInsightで実現するスケーラブル分析環境
(2017.6.2) Azure HDInsightで実現するスケーラブル分析環境(2017.6.2) Azure HDInsightで実現するスケーラブル分析環境
(2017.6.2) Azure HDInsightで実現するスケーラブル分析環境Mitsutoshi Kiuchi
 
[Track1-1] AIの売上予測を発注システムに組み込んだリンガーハットのデータ活用戦略
[Track1-1] AIの売上予測を発注システムに組み込んだリンガーハットのデータ活用戦略[Track1-1] AIの売上予測を発注システムに組み込んだリンガーハットのデータ活用戦略
[Track1-1] AIの売上予測を発注システムに組み込んだリンガーハットのデータ活用戦略Deep Learning Lab(ディープラーニング・ラボ)
 
Data & AI Update 情報 - 2020年4月版
Data & AI Update 情報 - 2020年4月版Data & AI Update 情報 - 2020年4月版
Data & AI Update 情報 - 2020年4月版Takeshi Fukuhara
 
Prestoで実現するインタラクティブクエリ - dbtech showcase 2014 Tokyo
Prestoで実現するインタラクティブクエリ - dbtech showcase 2014 TokyoPrestoで実現するインタラクティブクエリ - dbtech showcase 2014 Tokyo
Prestoで実現するインタラクティブクエリ - dbtech showcase 2014 TokyoTreasure Data, Inc.
 
Data & AI Update 情報 - 2020年8月版
Data & AI Update 情報 - 2020年8月版Data & AI Update 情報 - 2020年8月版
Data & AI Update 情報 - 2020年8月版Takeshi Fukuhara
 
シラサギハンズオン 東京
シラサギハンズオン 東京シラサギハンズオン 東京
シラサギハンズオン 東京Yu Ito
 
2021/09/25 JAZUG11周年記念LT大会 ~FSLogixのお話~
2021/09/25 JAZUG11周年記念LT大会 ~FSLogixのお話~2021/09/25 JAZUG11周年記念LT大会 ~FSLogixのお話~
2021/09/25 JAZUG11周年記念LT大会 ~FSLogixのお話~Dai Iwai
 
導入時に知っておきたいHtml5+css3の基本
導入時に知っておきたいHtml5+css3の基本導入時に知っておきたいHtml5+css3の基本
導入時に知っておきたいHtml5+css3の基本Takeharu Baba
 
As1 company profile[1]
As1 company profile[1]As1 company profile[1]
As1 company profile[1]ssusere2833f
 

Similar a Treasure data demo.0517 (20)

OSSを活用したダッシュボード の紹介
OSSを活用したダッシュボード の紹介OSSを活用したダッシュボード の紹介
OSSを活用したダッシュボード の紹介
 
zozotown real time linkage infrastructure
zozotown real time linkage infrastructurezozotown real time linkage infrastructure
zozotown real time linkage infrastructure
 
性能問題を起こしにくい信頼されるクラウド RDB のつくりかた
性能問題を起こしにくい信頼されるクラウド RDB のつくりかた性能問題を起こしにくい信頼されるクラウド RDB のつくりかた
性能問題を起こしにくい信頼されるクラウド RDB のつくりかた
 
[db analytics showcase Sapporo 2018] B25 Hadoop上で動く世界最速のAnalytic DBをSparkと一緒に...
[db analytics showcase Sapporo 2018] B25 Hadoop上で動く世界最速のAnalytic DBをSparkと一緒に...[db analytics showcase Sapporo 2018] B25 Hadoop上で動く世界最速のAnalytic DBをSparkと一緒に...
[db analytics showcase Sapporo 2018] B25 Hadoop上で動く世界最速のAnalytic DBをSparkと一緒に...
 
エンジニアのための Azure 基礎知識
エンジニアのための Azure 基礎知識エンジニアのための Azure 基礎知識
エンジニアのための Azure 基礎知識
 
MySQLデータ暗号化と暗号鍵のローテーション
MySQLデータ暗号化と暗号鍵のローテーションMySQLデータ暗号化と暗号鍵のローテーション
MySQLデータ暗号化と暗号鍵のローテーション
 
Data analysis platform ver1.1
Data analysis platform ver1.1Data analysis platform ver1.1
Data analysis platform ver1.1
 
20151024 Azureデータストア概要
20151024 Azureデータストア概要20151024 Azureデータストア概要
20151024 Azureデータストア概要
 
シラサギハンズオン 大阪
シラサギハンズオン 大阪シラサギハンズオン 大阪
シラサギハンズオン 大阪
 
[db tech showcase Tokyo 2014] D33: Prestoで実現するインタラクティブクエリ by トレジャーデータ株式会社 斉藤太郎
[db tech showcase Tokyo 2014] D33: Prestoで実現するインタラクティブクエリ  by トレジャーデータ株式会社 斉藤太郎[db tech showcase Tokyo 2014] D33: Prestoで実現するインタラクティブクエリ  by トレジャーデータ株式会社 斉藤太郎
[db tech showcase Tokyo 2014] D33: Prestoで実現するインタラクティブクエリ by トレジャーデータ株式会社 斉藤太郎
 
(2017.6.2) Azure HDInsightで実現するスケーラブル分析環境
(2017.6.2) Azure HDInsightで実現するスケーラブル分析環境(2017.6.2) Azure HDInsightで実現するスケーラブル分析環境
(2017.6.2) Azure HDInsightで実現するスケーラブル分析環境
 
[Track1-1] AIの売上予測を発注システムに組み込んだリンガーハットのデータ活用戦略
[Track1-1] AIの売上予測を発注システムに組み込んだリンガーハットのデータ活用戦略[Track1-1] AIの売上予測を発注システムに組み込んだリンガーハットのデータ活用戦略
[Track1-1] AIの売上予測を発注システムに組み込んだリンガーハットのデータ活用戦略
 
Data & AI Update 情報 - 2020年4月版
Data & AI Update 情報 - 2020年4月版Data & AI Update 情報 - 2020年4月版
Data & AI Update 情報 - 2020年4月版
 
Prestoで実現するインタラクティブクエリ - dbtech showcase 2014 Tokyo
Prestoで実現するインタラクティブクエリ - dbtech showcase 2014 TokyoPrestoで実現するインタラクティブクエリ - dbtech showcase 2014 Tokyo
Prestoで実現するインタラクティブクエリ - dbtech showcase 2014 Tokyo
 
Data & AI Update 情報 - 2020年8月版
Data & AI Update 情報 - 2020年8月版Data & AI Update 情報 - 2020年8月版
Data & AI Update 情報 - 2020年8月版
 
シラサギハンズオン 東京
シラサギハンズオン 東京シラサギハンズオン 東京
シラサギハンズオン 東京
 
2021/09/25 JAZUG11周年記念LT大会 ~FSLogixのお話~
2021/09/25 JAZUG11周年記念LT大会 ~FSLogixのお話~2021/09/25 JAZUG11周年記念LT大会 ~FSLogixのお話~
2021/09/25 JAZUG11周年記念LT大会 ~FSLogixのお話~
 
導入時に知っておきたいHtml5+css3の基本
導入時に知っておきたいHtml5+css3の基本導入時に知っておきたいHtml5+css3の基本
導入時に知っておきたいHtml5+css3の基本
 
As1 company profile[1]
As1 company profile[1]As1 company profile[1]
As1 company profile[1]
 
[Japan Tech summit 2017] MAI 003
[Japan Tech summit 2017] MAI 003[Japan Tech summit 2017] MAI 003
[Japan Tech summit 2017] MAI 003
 

Último

新人研修 後半 2024/04/26の勉強会で発表されたものです。
新人研修 後半        2024/04/26の勉強会で発表されたものです。新人研修 後半        2024/04/26の勉強会で発表されたものです。
新人研修 後半 2024/04/26の勉強会で発表されたものです。iPride Co., Ltd.
 
LoRaWANスマート距離検出センサー DS20L カタログ LiDARデバイス
LoRaWANスマート距離検出センサー  DS20L  カタログ  LiDARデバイスLoRaWANスマート距離検出センサー  DS20L  カタログ  LiDARデバイス
LoRaWANスマート距離検出センサー DS20L カタログ LiDARデバイスCRI Japan, Inc.
 
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。iPride Co., Ltd.
 
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)NTT DATA Technology & Innovation
 
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)Hiroshi Tomioka
 
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。iPride Co., Ltd.
 
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアルLoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアルCRI Japan, Inc.
 

Último (7)

新人研修 後半 2024/04/26の勉強会で発表されたものです。
新人研修 後半        2024/04/26の勉強会で発表されたものです。新人研修 後半        2024/04/26の勉強会で発表されたものです。
新人研修 後半 2024/04/26の勉強会で発表されたものです。
 
LoRaWANスマート距離検出センサー DS20L カタログ LiDARデバイス
LoRaWANスマート距離検出センサー  DS20L  カタログ  LiDARデバイスLoRaWANスマート距離検出センサー  DS20L  カタログ  LiDARデバイス
LoRaWANスマート距離検出センサー DS20L カタログ LiDARデバイス
 
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
 
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)
 
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
 
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
 
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアルLoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
 

Treasure data demo.0517

  • 1. © SIOS Technology, Inc. All rights Reserved. データの入力、確認、出力 Treasure Dataの利用方法の紹介 サイオステクノロジー株式会社 クラウドソリューション部 2013.05.17 大村 和子 サイオステクノロジー株式会社
  • 2. © SIOS Technology, Inc. All rights Reserved. 自己紹介 名前:大村和子 所属:サイオステクノロジー株式会社 クラウドソリューション部 ビッグデータ技術ブログ書いてます!! http://sstd-bigdata.blogspot.jp/
  • 3. © SIOS Technology, Inc. All rights Reserved. 目次 全体図 Treasure Dataへtd-agentでデータをイ ンポート Treasure Dataのデータの監視と確認 Treasure Dataのデータを出力 Treasure DataとREST Treasure Dataのその他の機能紹介 Treasure DataとBIツールの連携
  • 4. © SIOS Technology, Inc. All rights Reserved. 全体図
  • 5. © SIOS Technology, Inc. All rights Reserved. Google Apps 全体図 Amazon Web Service 株価 Treasure Data Database Google Spreadsheet SiosWebSite td-agent Twitter データ Faceboo kデータ HRForecast PG td-agent MySQL 監視、確認
  • 6. © SIOS Technology, Inc. All rights Reserved. Treasure Dataへtd-agentでデータをインポート
  • 7. © SIOS Technology, Inc. All rights Reserved. Treasure Dataへデータをインポート Treasure Data Database SiosWebSite td-agent
  • 8. © SIOS Technology, Inc. All rights Reserved. td-agent.confの設定 #/etc/td-agent/td-agent.conf <source> type tail format apache path /var/log/httpd/access_log pos_file /var/log/td-agent/httpd-access.log.pos tag td.sios_web.www_access </source> <match td.sios_web.www_access> type tdlog apikey XXXXXXXXXXXXXXXXXXXXXXXXXXXXXX auto_create_table buffer_type file buffer_path /var/log/td-agent/buffer/td use_ssl true </match> 設定ファイルを記述し、 td-agentを動作させる
  • 9. © SIOS Technology, Inc. All rights Reserved. Treasure Dataのデータの監視と確認
  • 10. © SIOS Technology, Inc. All rights Reserved. Treasure Dataの監視と確認 Treasure Data Database 監視、確認
  • 11. © SIOS Technology, Inc. All rights Reserved. Treasure Dataコンソール ダッシュボード データベース クエリ インポート ジョブ 出力先 スケジュール
  • 12. © SIOS Technology, Inc. All rights Reserved. tdコマンドでも監視できます
  • 13. © SIOS Technology, Inc. All rights Reserved. Wikiデータの検索 wikimedia.orgの オープンデータの 約11億レコードが Treasure Dataに入ってます!! 検索してみましょう!!
  • 14. © SIOS Technology, Inc. All rights Reserved. HiveQL(はいぶきゅーえる) SQLに似ているHiveの問い合わせ言語 TreasureDataのデータもこれで検索できます。 select TD_TIME_FORMAT(time, 'yyyy-MM-dd') as tm ,count(1) as cnt from wiki_tbl group by TD_TIME_FORMAT(time, 'yyyy-MM-dd') ↑ 日付別の件数を取得するHiveQL
  • 15. © SIOS Technology, Inc. All rights Reserved. HiveQL(はいぶきゅーえる)の実行1
  • 16. © SIOS Technology, Inc. All rights Reserved. HiveQL(はいぶきゅーえる)の実行2 実行中 Job Id:2786765
  • 17. © SIOS Technology, Inc. All rights Reserved. HiveQL(はいぶきゅーえる)の実行3 終了
  • 18. © SIOS Technology, Inc. All rights Reserved. HiveQL(はいぶきゅーえる)の実行4 結果
  • 19. © SIOS Technology, Inc. All rights Reserved. Treasure Dataのデータを出力
  • 20. © SIOS Technology, Inc. All rights Reserved. Treasure Dataのデータを出力 Google Apps Amazon Web Service Treasure Data Database Google Spreadsheet HRForecast PG MySQL BIツール
  • 21. © SIOS Technology, Inc. All rights Reserved. GoogleスプレッドシートにPush 1 Result(出力先)の登録(現在はtdコマンドからのみ) $ td result:create my_gspreadsheet ‘gspreadsheet://<user>:<password>@gmail.com/<ブック名>’
  • 22. © SIOS Technology, Inc. All rights Reserved. GoogleスプレッドシートにPush 2 先ほどのwikiのクエリを指定し、Resultに 先ほど作った名前とシート名を設定 {Result名}:{シート名} my_gspreadsheet:wiki_list
  • 23. © SIOS Technology, Inc. All rights Reserved. GoogleスプレッドシートにPush 3 結果
  • 24. © SIOS Technology, Inc. All rights Reserved. GoogleスプレッドシートにPush 4 定期的に出力することも可能
  • 25. © SIOS Technology, Inc. All rights Reserved. MySQLに出力 Googleスプレッドシートとほぼ同じです $ td result:create my_db ‘mysql://<user>:<password>@<host>/<db>’
  • 26. © SIOS Technology, Inc. All rights Reserved. Treasure DataとREST
  • 27. © SIOS Technology, Inc. All rights Reserved. 現在、標準ライブラリが用意されている言語 •Ruby •Java •Node.js
  • 28. © SIOS Technology, Inc. All rights Reserved. こんなかんじです(Ruby) #Treasure Dataクライアント作成 cln = TreasureData::Client.new(ENV['TREASURE_DATA_API_KEY']) #過去3日分のデータを取得 sql = "select close ,date_time,low,high from stocks where code=3744 and date_time >= '" + str_startday + "'" #query job = cln.query("rps_db",sql) #wait until job.finished? sleep 2 job.update_progress! end #get data job.result_each{|row| #send data res = Net::HTTP.post_form(URI.parse('http://localhost:5127/api/stocks/sios/price'), {'number'=>row[0].to_i.to_s, 'datetime'=>row[1].to_s}) }
  • 29. © SIOS Technology, Inc. All rights Reserved. HRForecastに書き込んでみました。
  • 30. © SIOS Technology, Inc. All rights Reserved. Treasure Dataのその他の機能紹介
  • 31. © SIOS Technology, Inc. All rights Reserved. Bulk Import すでに大量の過去ログがある んだけど。。 大丈夫です! Bulk Importで確実に インポートできます!
  • 32. © SIOS Technology, Inc. All rights Reserved. 手動インポート ちょっとだけ手動でデータを インポートしたいんだけど。。 大丈夫です! ちょっともできます。 コンソールからも可能です。
  • 33. © SIOS Technology, Inc. All rights Reserved. データの分析 Treasure Data中のデータを 分析したいんだけど。。 大丈夫です! 各種BIツールと連携できます!!
  • 34. © SIOS Technology, Inc. All rights Reserved. Treasure DataとBIツールの連携
  • 35. © SIOS Technology, Inc. All rights Reserved. どのようなツールが利用できるの? Treasure Dataはデータベース内の データをさまざまなBIツールから 直接利用することができます。 • JDBC接続 • ODBC接続(準備中) • Treasure Data専用の設定
  • 36. © SIOS Technology, Inc. All rights Reserved. Metric InsightsとTreasure Data
  • 37. © SIOS Technology, Inc. All rights Reserved. Metric InsightsとTreasure Data
  • 38. © SIOS Technology, Inc. All rights Reserved. Metric InsightsとTreasure Data
  • 39. © SIOS Technology, Inc. All rights Reserved. 最後に宣伝です
  • 40. © SIOS Technology, Inc. All rights Reserved. ビッグデータに関する技術支援もしています • アトリビューション分析支援 • マイニング用リソース構築(RDB,NoSQL) • 形態素解析支援(MeCab等) • データ分析支援(R言語) • BIツール紹介 Treasure Dataの導入支援、サポート以外にも いろいろやってます!
  • 41. © SIOS Technology, Inc. All rights Reserved. ブログもやってます! SIOSビッグデータ技術ブログ http://sstd-bigdata.blogspot.jp/ 「ビッグデータ ブログ」 で検索!