SlideShare una empresa de Scribd logo
1 de 69
Descargar para leer sin conexión
継続的データ解析環境の構築

 株式会社adingo エンジニア
      鈴鈴⽊木健太
Meta Information
•  2006.4 – 2012.3
   –  Keio University
      •  Artificial Intelligence, Semantic Web, Ontology Engineering
•  2011.2 – 2012.3
   –  CTO at Trippiece, Inc.
      •  Software Engineering
•  2012.4 –
   –  Engineer at adingo, Inc.
      •  Data Analysis, Operation Engineering


                                                       twitter: @suzu_v
                                            http://blog.kentasuzuki.net
継続的なデータ解析の話をします。
今はこんな業務をしています。




Web広告の技術をCRMに取り⼊入れ、各クライ
アント様のデータを収集・分析した上で効
果や現状を分かりやすく⽰示し、LTVの引き上
げを⾏行行うツールです。
                    http://cosmi.io
基本的な解析のやり⽅方として
•  定点観測
 –  年年、⽉月、週、⽇日、時間、分、秒
 –  毎⽇日⾒見見ているから気がつくことがある
•  アドホック
 –  何か仮説がある場合に、深掘りしていく。
検討


計測        仮説


     実装
解析をする上での
悩みがあります。




      http://www.flickr.com/photos/darwinbell/5827849044/sizes/o/in/photostream/
それは考える時間が減っていく事です。
検討


計測        仮説


     実装
ある⽇日急に、

「ごめん、明⽇日までにAサイトのB商品
 の購買動向について詳細教えてくれ
る?30代男性のあるクラスタに属性し
ているユーザが⼤大量量に購⼊入しているみ
     たいなんだよね。」

    という依頼が来る。
Audience Data
       +
Data of Service



    http://www.flickr.com/photos/chef_ele/3791289276/sizes/l/in/photostream/
枠から
⼈人へ        性別
                       年年齢

                                     居住




                ?
                                                 職業

      興味

                                        趣向



                http://www.flickr.com/photos/catikaoe/232832224/sizes/o/in/photostream/
LOG


    impression
       click
    conversion


ログにはいくつかの種類があります。
  フォーマットが違います。
毎秒                              様々なスパンでログと向き合います。

毎分
毎時
毎⽇日                                                                    months
                                                                        weeks
毎週                                                                       days
毎⽉月                                                                     hours
                                                                      minutes
http://www.flickr.com/photos/gadl/284995199/sizes/o/in/photostream/
                                                                      seconds
Log: X0GB / day

コンスタントにログが増えていきます。
ログの向こう側を⾒見見る




    http://www.flickr.com/photos/eole/1394588888/sizes/o/in/photostream/
環境の変化に対応しよう。
より柔軟に解析できる環境を作ろう。
検討


計測        仮説


     実装
Infrastructure of cosmi
⼤大まかな要件
•  スケールが容易易なログコレクタ
•  どんなスキーマが来ても分析容易易性を確
   保
•  安定したオーディエンスデータの提供
Adnetworks
                                                                media
          Web Sites                                              SSP
                                                                 DSP


                       行動ログ



                        Amazon Elastic
                        Load Balancing


行動ログコレクタ(Web)                                  オーディエンスデータ
                                                  Web API




    EC2
                   …                                                   …
            EC2                EC2                     EC2     EC2                EC2
          Auto scaling Group                                 Auto scaling Group




            Amazon Simple            Amazon Elastic
                                                             オーディエンスデータDB
            Storage Service           MapReduce
                                                                (MongoDB)
                 (S3)                ログ解析バッチ


                                                      http://aws.amazon.com/jp/solutions/case-studies/adingo/
AWSを採⽤用した理理由(解析視点)
ü 安定したストレージ
ü S3 -> Elastic MapReduce連携が便便利利
ü 分析するデータ量量が増えてもスケールが
   容易易
実際のログ解析
ログ解析にはApache Hiveを採
    ⽤用しました。
検討


計測        仮説


     実装
-- EX.) schema of access log
CREATE EXTERNAL TABLE access_log (
    stamp bigint,
    ipaddress string,
    request_status string,
    latency string,
    user_agent string,
    referer string,
    response_out_byte int,
    input_byte int,
    connection string,
    status string
)
PARTITIONED BY (dt string)
STORED AS SEQUENCEFILE
LOCATION 's3n://sample-bucket/access_log/';



 ひと⽬目でスキーマがわかります。
-- defining table for output daily referer count by
pages.
CREATE EXTERNAL TABLE daily_referer_count (
    referer string,
    referer_count int
)
ROW FORMAT DELIMITED FIELDS TERMINATED BY 't'
STORED AS TEXTFILE
LOCATION 's3n://sample-bucket/reports/${EVENTDATE}/
daily_referer_count_ranking’;


例例えばアクセスログからリファラを分析する際には
上のようなテーブルを作り、
集計します。
この場合だと、結果はS3に格納されます。

-- aggregation daily count of each referer.
INSERT OVERWRITE TABLE daily_referer_count
SELECT referer, count(*) AS referer_count FROM
access_log WHERE dt="${EVENTDATE}"
GROUP BY referer
DISTRIBUTE BY referer SORT BY referer_count DESC,
referer ASC
LIMIT 100;
ü 導⼊入の敷居低い

ü 保守が容易

ü  何をしているのか⼀一⽬目で分かる
これで⼿手軽にデータについて調べることが
         できます。
あとはこれを継続して回すことが⼤大事です。
検討


計測        仮説


     実装
解析を継続するために必要なこと



ü 解析までのリードタイムを短くする
ü 気軽に解析バッチを実⾏行行できるようにする
ü 失敗してもすぐに再実⾏行行できる
Deployment & Running Batch
       with Jenkins
解析にもJenkinsを
•  Jenkinsの特徴
 –  インストール、セットアップが簡単
 –  ジョブ設定、通知が容易易
   •  「何が起こった時に何をして何を通知するか」
 –  プラグイン拡張
•  Jenkinsの主な役割
 –  継続的なビルド及びテスト
 –  外部ジョブの監視

                Welcome to Jenkins CI! | Jenkins CI http://jenkins-ci.org/
Jenkinsをフル活⽤用しています


ü ログコレクタとオーディエンスデータAPIの継続
   的デリバリ
ü MapReduce⽤用Javaプログラムのテスト・ビルド・
   s3への配置・実⾏行行
ü Hiveスクリプトのs3への配置・実⾏行行
$ vim apps/hoge/output_log_format
$ git commit –m“#123 ログスキーマを変更更”
$ git push origin master




                push



         Team
push


  Team   mirroring




githubにコードがpushされると、
ローカルのmirrorリポジトリにfetchします。

初期化時
$ git clone --mirror git@github.com:hoge/repos.git
更更新時
$ git remote update
push


 Team   mirroring
                        :release
                    ビ
                    ル
                    ド
                    パ
                    イ
                    プ
                    ラ
                    イ
                    ン

                          :master




Jenkinsにはビルドパイプラインが構築してあり、
これによってジョブフローを制御しています。
また、ブランチごとにデプロイ先を変えています。
push


Team      mirroring
                          :release
                      ビ
                      ル
                      ド
                      パ
                      イ
                      プ
                      ラ
                      イ
                      ン
                                             development
                            :master

                                              EC2




 開発環境にはmasterブランチのコードが
 ⾃自動的にデプロイされます。
 この際テストやマイグレーションなども
 同時に⾏行行われます。
       $ fab –f app_fabfile.py development deploy testing migrate
push                                  production
                                                                                              …
Team      mirroring                                                        EC2       EC2                 EC2
                          :release                                                  Auto scaling Group

                      ビ
                      ル
                                                 preview
                      ド
                      パ
                      イ
                      プ                                                    EC2
                      ラ     AWS CloudFormation
                      イ
                      ン
                                                           development
                            :master

                                                           EC2
                                                             Servers belonged to certain data domain.




pre環境は都度度CloudFormationで⽴立立ち上げます。
本番環境にはreleaseブランチのコードをデプロイします。

       $ fab –f app_fabfile.py preview deploy migrate
       $ fab –f app_fabfile.py production deploy migrate
push                                     production
                                                                                                …
Team     mirroring                                                           EC2       EC2                 EC2
                         :release                                                     Auto scaling Group

                     ビ
                     ル
                                                   preview
                     ド
                     パ
                     イ
                     プ                                                       EC2
                     ラ        AWS CloudFormation
                     イ
                     ン
                                                             development
                              :master

                                                             EC2
                                                               Servers belonged to certain data domain.
       .jarファイルやhiveプログラムの配置




                         S3



もし、MapReduceプログラムやHiveクエリであれば、
ビルド後の成果物をS3に⾃自動的に配置します。
$ s3cmd put --recursive /path/to/workspace/* s3://example/hive/
push                                     production
                                                                                                …
Team     mirroring                                                           EC2       EC2                 EC2
                         :release                                                     Auto scaling Group

                     ビ
                     ル
                                                   preview
                     ド
                     パ
                     イ
                     プ                                                       EC2
                     ラ        AWS CloudFormation
                     イ
                     ン
                                                             development
                              :master

                                                             EC2
                                                               Servers belonged to certain data domain.
       .jarファイルやhiveプログラムの配置


                                              そして実際にジョブを実⾏行行します。
                                              ジョブの実⾏行行は任意のタイミング
                                              で⾏行行うことができます。
                         S3




        ジョブの実⾏行行                             $ TODAY=`date +%Y/%m/%d`
                                             $ elastic-mapreduce --create –name LogAggregation 
                                             --num-instances 10 --instance-type m1.small 
                                             --hive-script --arg s3://example/hive/query/1st_step.q 
                   Amazon Elastic
                    MapReduce                --args -d,EVENTDATE=$TODAY --step-name FirstStep
                                             --hive-script --arg s3://example/hive/query/2nd_step.q 
                                             --args -d,EVENTDATE=$TODAY --step-name SecondStep
検討


計測        仮説


     実装
しかしやはり、
⼈人間、
失敗をします。
      http://www.flickr.com/photos/proimos/4199675334/sizes/o/in/photostream/
検討

!   計測        仮説


         実装
失敗したらすぐに修正したいものです。
失敗したことを、すぐに知ることが⼤大事です。
そんなときは、
Jenkinsが教えてくれます。
./elastic-mapreduce



                                   Amazon Elastic
                                    MapReduce




MapReduceジョブの実⾏行行をまず、Jenkinsから⾏行行います。
これは定期的に実⾏行行されます。
./elastic-mapreduce



                                     Amazon Elastic
                                      MapReduce


                           Trigger
                           Parameterized
                           Build
param:job_id




      ジョブ実⾏行行後、job_idをパラメータとして渡し、
      新たなジョブを実⾏行行します。
./elastic-mapreduce



                                       Amazon Elastic
                                        MapReduce


                           Trigger
                           Parameterized
                           Build
param:job_id




                         monitoring
                         state of the job




  新しいジョブによってMapReduceジョブを監視します。
./elastic-mapreduce
                                                        FAILED.

                                       Amazon Elastic
                                        MapReduce


                           Trigger
                           Parameterized
                           Build
param:job_id




                         monitoring
                         state of the job




  仮にここで、ジョブが何らかの原因で失敗したとします。
./elastic-mapreduce
                                                       FAILED.

                                      Amazon Elastic
                                       MapReduce


                           Trigger
                           Parameterized
                           Build
param:job_id




                              Getting Log




   監視ジョブが失敗したことを検知し、
   Elastic MapReduceからapi経由でログを取得します。
./elastic-mapreduce



                                               Amazon Elastic
                                                MapReduce


                                    Trigger
                                    Parameterized
                                    Build
param:job_id




                                       Getting Log



mail, IRC, etc.
including the log.   ジョブが失敗したことを様々な⽅方法で通知します。
                     この際にログ⾃自体も送ります。
検討

!
計測        仮説


     実装
発表のまとめをします。
時間は限られています。
                                        しかし、
                                        調べたいことは⼭山積み。




http://www.flickr.com/photos/bogenfreund/556656621/sizes/o/in/photostream/
1⼈人で解析するのではなく、
周りのメンバーを巻き込みましょう。

誰もがデータについて考えられるような
環境を作りましょう。
しかしやはり、
⼈人間、
失敗をします。
      http://www.flickr.com/photos/proimos/4199675334/sizes/o/in/photostream/
なので道具を活かしましょう。
考える時間を
作りましょう。




      http://www.flickr.com/photos/darwinbell/5827849044/sizes/o/in/photostream/
データを観察し、想像しましょう。
⾓角度度を変えて、繰り返し繰り返し考えましょう。




           http://www.flickr.com/photos/srtagomez/5416367341/sizes/l/in/photostream/
検討


      計測        仮説


           実装

素早く回し、調べ、考え、またすぐに試しましょう。
継続的な解析ができる環境をつくりましょう。
解析にも
継続的デリバリを



      http://www.flickr.com/photos/columna/236353428/sizes/l/in/photostream/
参考資料料
Jenkinsについて
•    Welcome to Jenkins CI! | Jenkins CI
      –    http://jenkins-ci.org/
      –    公式サイトです。
•    Parameterized Build - Jenkins - Jenkins Wiki
      –    https://wiki.jenkins-ci.org/display/JENKINS/Parameterized+Build
      –    パラメータをジョブに渡して実⾏行行する⽅方法について書かれています。
•    Parameterized Trigger Plugin - Jenkins - Jenkins Wiki
      –    https://wiki.jenkins-ci.org/display/JENKINS/Parameterized+Trigger+Plugin
      –    パラメータをジョブからジョブに渡して実⾏行行するためのプラグインです。MapReduceジョブの監視のためにjob_id
           を渡す際にはこれを利利⽤用して監視⽤用ジョブを⽴立立ち上げています。
•    Build Pipeline Plugin - Jenkins - Jenkins Wiki
      –    https://wiki.jenkins-ci.org/display/JENKINS/Build+Pipeline+Plugin
      –    ビルドパイプラインを構築するためのプラグインです。ジョブの⼀一連の流流れを設定するために利利⽤用しています。基本
           的にデプロイやMapReduceに関するジョブについてはgit commitを起点としたパイプラインに配置するようにして
           います。
•    IRC Plugin - Jenkins - Jenkins Wiki
      –    https://wiki.jenkins-ci.org/display/JENKINS/IRC+Plugin
      –    IRCによる通知のためのプラグインです。
•    Email-ext plugin - Jenkins - Jenkins Wiki
      –    https://wiki.jenkins-ci.org/display/JENKINS/Email-ext+plugin
      –    Jenkinsによるメール通知の機能を拡張するプラグインです。
•    O'Reilly Japan - Jenkins
      –    http://www.oreilly.co.jp/books/9784873115344/
      –    オライリー・ジャパンから出版されているJenkins本です。Parameterized Triggerの設定の際に参考にしました。
Elastic MapReduceについて
•  Amazon Elastic MapReduce Ruby Client : Developer Tools :
   Amazon Web Services
   –  http://aws.amazon.com/developertools/2264
   –  全てのジョブのコントロールはコマンドラインツールを利利⽤用していま
      す。Jenkinsからのディスパッチについてもこれを利利⽤用しています。
•  Running Hive on Amazon Elastic MapReduce : Articles &
   Tutorials : Amazon Web Services
   –  http://aws.amazon.com/articles/2857
   –  Elastic MapReduce上でのHiveの利利⽤用に関する資料料がまとまっていま
      す。
•  Contextual Advertising using Apache Hive and Amazon EMR :
   Articles & Tutorials : Amazon Web Services
   –  http://aws.amazon.com/articles/2855
   –  Hiveによる分析の実例例が⽰示されています。⼀一連の流流れが書かれている
      ので、実際に試して⾒見見る場合には参考になると思います。
Apache Hiveについて
•  Programming Hive - O'Reilly Media
  –  http://shop.oreilly.com/product/
     0636920023555.do
  –  Hiveに関する仕様がよくまとまっています。
     もちろんWeb上やJIRAで参照できる内容がほ
     とんどですが、⼿手元においておくと安⼼心です。
Fabricについて
•  Github: fabric/fabric
  –  https://github.com/fabric/fabric
  –  デプロイにはfabricを利利⽤用しています。
     python製のデプロイツールです。
•  Fabric documentation
  –  http://docs.fabfile.org/
  –  公式のドキュメントです。やはりここが⼀一番
     情報が多いです。ただ実践的にどのように使
     うか、という点に関しては情報がまだまだ少
     ないです。
cosmi Relationship Suiteについて

•  adingo、ディスプレイ広告枠活⽤用型のCRMサービ
   ス「cosmi Relationship Suite」を開発  
  –  http://pressrelease.adingo.jp/news/2012/07/
     adingocrmcosmi--7f06.html
  –  cosmi Relationship Suiteのプレスリリースです。
•  【実はよく知らない】オーディエンスデータプ
   ラットフォームってなに?  
  –  https://www.facebook.com/note.php?
     note_id=222292327824741
  –  DMP、または、オーディエンスデータプラット
     フォームについてまとめた記事です。
その他
•  継続的デリバリのパターン
 –  http://www.infoq.com/jp/articles/
    Continous-Delivery-Patterns
 –  継続的デリバリについてよくまとまっていま
    す。私達の⾏行行なっている継続的デリバリは簡
    易易的なものです。Jenkinsなどのツールを利利⽤用
    することで、⽐比較的容易易に環境を構築するこ
    とができます。

Más contenido relacionado

La actualidad más candente

17 E-5 震災とHackとクラウドと ━ URIベースのCSLB
17 E-5 震災とHackとクラウドと ━ URIベースのCSLB17 E-5 震災とHackとクラウドと ━ URIベースのCSLB
17 E-5 震災とHackとクラウドと ━ URIベースのCSLB
Yuki KAN
 
AWSにおけるバッチ処理の ベストプラクティス - Developers.IO Meetup 05
AWSにおけるバッチ処理の ベストプラクティス - Developers.IO Meetup 05AWSにおけるバッチ処理の ベストプラクティス - Developers.IO Meetup 05
AWSにおけるバッチ処理の ベストプラクティス - Developers.IO Meetup 05
都元ダイスケ Miyamoto
 
AWS クックパッドの運用事例
AWS クックパッドの運用事例AWS クックパッドの運用事例
AWS クックパッドの運用事例
Satoshi Takada
 
パブリッククラウドサービスAmazon EC2の性能検証レポート (CADC研究レポート発表会用)
パブリッククラウドサービスAmazon EC2の性能検証レポート (CADC研究レポート発表会用)パブリッククラウドサービスAmazon EC2の性能検証レポート (CADC研究レポート発表会用)
パブリッククラウドサービスAmazon EC2の性能検証レポート (CADC研究レポート発表会用)
Yuuki Namikawa
 

La actualidad más candente (20)

松本克彦 ピグにおけるリアルタイムランキングの導入
松本克彦 ピグにおけるリアルタイムランキングの導入松本克彦 ピグにおけるリアルタイムランキングの導入
松本克彦 ピグにおけるリアルタイムランキングの導入
 
17 E-5 震災とHackとクラウドと ━ URIベースのCSLB
17 E-5 震災とHackとクラウドと ━ URIベースのCSLB17 E-5 震災とHackとクラウドと ━ URIベースのCSLB
17 E-5 震災とHackとクラウドと ━ URIベースのCSLB
 
AWS Lambdaで作るクローラー/スクレイピング
AWS Lambdaで作るクローラー/スクレイピングAWS Lambdaで作るクローラー/スクレイピング
AWS Lambdaで作るクローラー/スクレイピング
 
AWS Step FunctionとLambdaでディープラーニングの訓練を全自動化する
AWS Step FunctionとLambdaでディープラーニングの訓練を全自動化するAWS Step FunctionとLambdaでディープラーニングの訓練を全自動化する
AWS Step FunctionとLambdaでディープラーニングの訓練を全自動化する
 
ベンチャーCTO、AWSエバンジェリストを経て考える、クラウド時代に向き合うエンジニア像のこれから
ベンチャーCTO、AWSエバンジェリストを経て考える、クラウド時代に向き合うエンジニア像のこれからベンチャーCTO、AWSエバンジェリストを経て考える、クラウド時代に向き合うエンジニア像のこれから
ベンチャーCTO、AWSエバンジェリストを経て考える、クラウド時代に向き合うエンジニア像のこれから
 
AWSにおけるバッチ処理の ベストプラクティス - Developers.IO Meetup 05
AWSにおけるバッチ処理の ベストプラクティス - Developers.IO Meetup 05AWSにおけるバッチ処理の ベストプラクティス - Developers.IO Meetup 05
AWSにおけるバッチ処理の ベストプラクティス - Developers.IO Meetup 05
 
ビッグじゃなくても使えるSpark Streaming
ビッグじゃなくても使えるSpark Streamingビッグじゃなくても使えるSpark Streaming
ビッグじゃなくても使えるSpark Streaming
 
AWS クックパッドの運用事例
AWS クックパッドの運用事例AWS クックパッドの運用事例
AWS クックパッドの運用事例
 
誰にでもできるパフォーマンスチューニング
誰にでもできるパフォーマンスチューニング誰にでもできるパフォーマンスチューニング
誰にでもできるパフォーマンスチューニング
 
JAWS DAYS 2017 LT 古きを捨て新しきに近づける
JAWS DAYS 2017 LT 古きを捨て新しきに近づけるJAWS DAYS 2017 LT 古きを捨て新しきに近づける
JAWS DAYS 2017 LT 古きを捨て新しきに近づける
 
20170311 jawsdays 新訳 とあるアーキテクトのクラウドデザインパターン目録
20170311 jawsdays 新訳 とあるアーキテクトのクラウドデザインパターン目録20170311 jawsdays 新訳 とあるアーキテクトのクラウドデザインパターン目録
20170311 jawsdays 新訳 とあるアーキテクトのクラウドデザインパターン目録
 
アプリエンジニアからクラウド専用のインフラエンジニアになってみて
アプリエンジニアからクラウド専用のインフラエンジニアになってみてアプリエンジニアからクラウド専用のインフラエンジニアになってみて
アプリエンジニアからクラウド専用のインフラエンジニアになってみて
 
パブリッククラウドサービスAmazon EC2の性能検証レポート (CADC研究レポート発表会用)
パブリッククラウドサービスAmazon EC2の性能検証レポート (CADC研究レポート発表会用)パブリッククラウドサービスAmazon EC2の性能検証レポート (CADC研究レポート発表会用)
パブリッククラウドサービスAmazon EC2の性能検証レポート (CADC研究レポート発表会用)
 
ウェブアプリケーションのパフォーマンスチューニング
ウェブアプリケーションのパフォーマンスチューニングウェブアプリケーションのパフォーマンスチューニング
ウェブアプリケーションのパフォーマンスチューニング
 
Single Command Deployのための gradle-aws-plugin講座
Single Command Deployのための gradle-aws-plugin講座Single Command Deployのための gradle-aws-plugin講座
Single Command Deployのための gradle-aws-plugin講座
 
Cloud FormationによるBlue-Green Deployment - Dev io mtup11 003
Cloud FormationによるBlue-Green Deployment - Dev io mtup11 003Cloud FormationによるBlue-Green Deployment - Dev io mtup11 003
Cloud FormationによるBlue-Green Deployment - Dev io mtup11 003
 
Azure Load Testingを試してみた
Azure Load Testingを試してみたAzure Load Testingを試してみた
Azure Load Testingを試してみた
 
Serverless Architecture Overview #cdevc
Serverless Architecture Overview #cdevcServerless Architecture Overview #cdevc
Serverless Architecture Overview #cdevc
 
CodeBuildを身近にするためのはじめの一歩
CodeBuildを身近にするためのはじめの一歩CodeBuildを身近にするためのはじめの一歩
CodeBuildを身近にするためのはじめの一歩
 
Service worker が拓く mobile web の新しいかたち
Service worker が拓く mobile web の新しいかたちService worker が拓く mobile web の新しいかたち
Service worker が拓く mobile web の新しいかたち
 

Destacado

ゴールから始めよう!
ゴールから始めよう!ゴールから始めよう!
ゴールから始めよう!
VOYAGE GROUP
 
Androidにおけるテストに関して〜デバイスをどう選択するか〜
Androidにおけるテストに関して〜デバイスをどう選択するか〜Androidにおけるテストに関して〜デバイスをどう選択するか〜
Androidにおけるテストに関して〜デバイスをどう選択するか〜
VOYAGE GROUP
 
スマホ無料アプリのマネタイズについて【Adingo】
スマホ無料アプリのマネタイズについて【Adingo】スマホ無料アプリのマネタイズについて【Adingo】
スマホ無料アプリのマネタイズについて【Adingo】
VOYAGE GROUP
 
JavaScriptトレンド総括(2014)
JavaScriptトレンド総括(2014)JavaScriptトレンド総括(2014)
JavaScriptトレンド総括(2014)
VOYAGE GROUP
 
iPhoneアプリ「トリセツ」にて実践したリーンスタートアップ
iPhoneアプリ「トリセツ」にて実践したリーンスタートアップiPhoneアプリ「トリセツ」にて実践したリーンスタートアップ
iPhoneアプリ「トリセツ」にて実践したリーンスタートアップ
VOYAGE GROUP
 
Data Engineering at VOYAGE GROUP #jawsdays
Data Engineering at VOYAGE GROUP #jawsdaysData Engineering at VOYAGE GROUP #jawsdays
Data Engineering at VOYAGE GROUP #jawsdays
VOYAGE GROUP
 
[20130624]最近の開発環境について話してみる sakata
[20130624]最近の開発環境について話してみる sakata[20130624]最近の開発環境について話してみる sakata
[20130624]最近の開発環境について話してみる sakata
VOYAGE GROUP
 
事業内デザイナーのミッション(公開版) genesix 藤井幹大
事業内デザイナーのミッション(公開版) genesix 藤井幹大事業内デザイナーのミッション(公開版) genesix 藤井幹大
事業内デザイナーのミッション(公開版) genesix 藤井幹大
VOYAGE GROUP
 
【発表用】ウェブアナリスト養成講座「Lpoとabテスト」
【発表用】ウェブアナリスト養成講座「Lpoとabテスト」【発表用】ウェブアナリスト養成講座「Lpoとabテスト」
【発表用】ウェブアナリスト養成講座「Lpoとabテスト」
VOYAGE GROUP
 
JSON Schema で Web API のスキマを埋めよう
JSON Schema で Web API のスキマを埋めようJSON Schema で Web API のスキマを埋めよう
JSON Schema で Web API のスキマを埋めよう
VOYAGE GROUP
 

Destacado (20)

日本語化のススメ
日本語化のススメ日本語化のススメ
日本語化のススメ
 
From document-to-code
From document-to-codeFrom document-to-code
From document-to-code
 
ゴールから始めよう!
ゴールから始めよう!ゴールから始めよう!
ゴールから始めよう!
 
Androidにおけるテストに関して〜デバイスをどう選択するか〜
Androidにおけるテストに関して〜デバイスをどう選択するか〜Androidにおけるテストに関して〜デバイスをどう選択するか〜
Androidにおけるテストに関して〜デバイスをどう選択するか〜
 
スマホ無料アプリのマネタイズについて【Adingo】
スマホ無料アプリのマネタイズについて【Adingo】スマホ無料アプリのマネタイズについて【Adingo】
スマホ無料アプリのマネタイズについて【Adingo】
 
JavaScriptトレンド総括(2014)
JavaScriptトレンド総括(2014)JavaScriptトレンド総括(2014)
JavaScriptトレンド総括(2014)
 
[20140625]wwdc2014 feedback
[20140625]wwdc2014 feedback[20140625]wwdc2014 feedback
[20140625]wwdc2014 feedback
 
iPhoneアプリ「トリセツ」にて実践したリーンスタートアップ
iPhoneアプリ「トリセツ」にて実践したリーンスタートアップiPhoneアプリ「トリセツ」にて実践したリーンスタートアップ
iPhoneアプリ「トリセツ」にて実践したリーンスタートアップ
 
Data Engineering at VOYAGE GROUP #jawsdays
Data Engineering at VOYAGE GROUP #jawsdaysData Engineering at VOYAGE GROUP #jawsdays
Data Engineering at VOYAGE GROUP #jawsdays
 
AWS SDK for Go in #jawsmeguro
AWS SDK for Go in #jawsmeguroAWS SDK for Go in #jawsmeguro
AWS SDK for Go in #jawsmeguro
 
[20130624]最近の開発環境について話してみる sakata
[20130624]最近の開発環境について話してみる sakata[20130624]最近の開発環境について話してみる sakata
[20130624]最近の開発環境について話してみる sakata
 
事業内デザイナーのミッション(公開版) genesix 藤井幹大
事業内デザイナーのミッション(公開版) genesix 藤井幹大事業内デザイナーのミッション(公開版) genesix 藤井幹大
事業内デザイナーのミッション(公開版) genesix 藤井幹大
 
【発表用】ウェブアナリスト養成講座「Lpoとabテスト」
【発表用】ウェブアナリスト養成講座「Lpoとabテスト」【発表用】ウェブアナリスト養成講座「Lpoとabテスト」
【発表用】ウェブアナリスト養成講座「Lpoとabテスト」
 
開発リードタイム短縮への挑戦 〜とある現場のパターン・ランゲージ〜
開発リードタイム短縮への挑戦 〜とある現場のパターン・ランゲージ〜開発リードタイム短縮への挑戦 〜とある現場のパターン・ランゲージ〜
開発リードタイム短縮への挑戦 〜とある現場のパターン・ランゲージ〜
 
企業文化とコアバリューについて
企業文化とコアバリューについて企業文化とコアバリューについて
企業文化とコアバリューについて
 
レガシコード改善ガイド
レガシコード改善ガイドレガシコード改善ガイド
レガシコード改善ガイド
 
JSON Schema で Web API のスキマを埋めよう
JSON Schema で Web API のスキマを埋めようJSON Schema で Web API のスキマを埋めよう
JSON Schema で Web API のスキマを埋めよう
 
JenkinsとjMeterで負荷テストの自動化
JenkinsとjMeterで負荷テストの自動化JenkinsとjMeterで負荷テストの自動化
JenkinsとjMeterで負荷テストの自動化
 
【第6回テックヒルズ】検索基盤開発のための結合テスト環境の自動化
【第6回テックヒルズ】検索基盤開発のための結合テスト環境の自動化【第6回テックヒルズ】検索基盤開発のための結合テスト環境の自動化
【第6回テックヒルズ】検索基盤開発のための結合テスト環境の自動化
 
Jenkins実践入門目次チラ見せしちゃいます
Jenkins実践入門目次チラ見せしちゃいますJenkins実践入門目次チラ見せしちゃいます
Jenkins実践入門目次チラ見せしちゃいます
 

Similar a Jenkinsとhadoopを利用した継続的データ解析環境の構築

Mashup Award 7 Caravan in Fukuoka
Mashup Award 7 Caravan in FukuokaMashup Award 7 Caravan in Fukuoka
Mashup Award 7 Caravan in Fukuoka
Kazumi Hirose
 
AWSクラウドデザインパターン(CDP) - Eコマース編 -
AWSクラウドデザインパターン(CDP) - Eコマース編 -AWSクラウドデザインパターン(CDP) - Eコマース編 -
AWSクラウドデザインパターン(CDP) - Eコマース編 -
SORACOM, INC
 
AWSクラウドデザインパターン(CDP) - 概要編 -
AWSクラウドデザインパターン(CDP) - 概要編 - AWSクラウドデザインパターン(CDP) - 概要編 -
AWSクラウドデザインパターン(CDP) - 概要編 -
SORACOM, INC
 
Amazon EC2を使った実践SaaS運用事例
Amazon EC2を使った実践SaaS運用事例Amazon EC2を使った実践SaaS運用事例
Amazon EC2を使った実践SaaS運用事例
Yuuki Namikawa
 
Google Compute EngineとPipe API
Google Compute EngineとPipe APIGoogle Compute EngineとPipe API
Google Compute EngineとPipe API
maruyama097
 
Google Compute EngineとGAE Pipeline API
Google Compute EngineとGAE Pipeline APIGoogle Compute EngineとGAE Pipeline API
Google Compute EngineとGAE Pipeline API
maruyama097
 

Similar a Jenkinsとhadoopを利用した継続的データ解析環境の構築 (20)

Eight meets AWS
Eight meets AWSEight meets AWS
Eight meets AWS
 
[AWS Summit 2012] クラウドデザインパターン#6 CDP クラウド監視編
[AWS Summit 2012] クラウドデザインパターン#6 CDP クラウド監視編[AWS Summit 2012] クラウドデザインパターン#6 CDP クラウド監視編
[AWS Summit 2012] クラウドデザインパターン#6 CDP クラウド監視編
 
Mashup Award 7 Caravan in Fukuoka
Mashup Award 7 Caravan in FukuokaMashup Award 7 Caravan in Fukuoka
Mashup Award 7 Caravan in Fukuoka
 
同じサービスを ECSとOpsWorksで 運用してみた
同じサービスをECSとOpsWorksで運用してみた同じサービスをECSとOpsWorksで運用してみた
同じサービスを ECSとOpsWorksで 運用してみた
 
Amazon Web Services 最新事例集
Amazon Web Services 最新事例集Amazon Web Services 最新事例集
Amazon Web Services 最新事例集
 
[AWS Summit 2012] クラウドデザインパターン#5 CDP バッチ処理編
[AWS Summit 2012] クラウドデザインパターン#5 CDP バッチ処理編[AWS Summit 2012] クラウドデザインパターン#5 CDP バッチ処理編
[AWS Summit 2012] クラウドデザインパターン#5 CDP バッチ処理編
 
華麗なるElastic Beanstalkでの環境構築
華麗なるElastic Beanstalkでの環境構築華麗なるElastic Beanstalkでの環境構築
華麗なるElastic Beanstalkでの環境構築
 
20161027 hadoop summit Generating Recommendations at Amazon Scale with Apach...
20161027 hadoop summit  Generating Recommendations at Amazon Scale with Apach...20161027 hadoop summit  Generating Recommendations at Amazon Scale with Apach...
20161027 hadoop summit Generating Recommendations at Amazon Scale with Apach...
 
Ajn24
Ajn24Ajn24
Ajn24
 
Voicepic@FacebookNight
Voicepic@FacebookNightVoicepic@FacebookNight
Voicepic@FacebookNight
 
[AWS Summit 2012] クラウドデザインパターン#2 CDP 画像・動画配信編
[AWS Summit 2012] クラウドデザインパターン#2 CDP 画像・動画配信編 [AWS Summit 2012] クラウドデザインパターン#2 CDP 画像・動画配信編
[AWS Summit 2012] クラウドデザインパターン#2 CDP 画像・動画配信編
 
AWSクラウドデザインパターン(CDP) - Eコマース編 -
AWSクラウドデザインパターン(CDP) - Eコマース編 -AWSクラウドデザインパターン(CDP) - Eコマース編 -
AWSクラウドデザインパターン(CDP) - Eコマース編 -
 
AWSクラウドデザインパターン(CDP) - 概要編 -
AWSクラウドデザインパターン(CDP) - 概要編 - AWSクラウドデザインパターン(CDP) - 概要編 -
AWSクラウドデザインパターン(CDP) - 概要編 -
 
Amazon EC2を使った実践SaaS運用事例
Amazon EC2を使った実践SaaS運用事例Amazon EC2を使った実践SaaS運用事例
Amazon EC2を使った実践SaaS運用事例
 
Amazon EC2 Container Service Deep dive
Amazon EC2 Container Service Deep diveAmazon EC2 Container Service Deep dive
Amazon EC2 Container Service Deep dive
 
これでAWSマスター!? 初心者向けAWS簡単講座
これでAWSマスター!? 初心者向けAWS簡単講座これでAWSマスター!? 初心者向けAWS簡単講座
これでAWSマスター!? 初心者向けAWS簡単講座
 
Azure Antenna AI 概要
Azure Antenna AI 概要Azure Antenna AI 概要
Azure Antenna AI 概要
 
Google Compute EngineとPipe API
Google Compute EngineとPipe APIGoogle Compute EngineとPipe API
Google Compute EngineとPipe API
 
Google Compute EngineとGAE Pipeline API
Google Compute EngineとGAE Pipeline APIGoogle Compute EngineとGAE Pipeline API
Google Compute EngineとGAE Pipeline API
 
SAP on AWS情報
SAP on AWS情報SAP on AWS情報
SAP on AWS情報
 

Más de VOYAGE GROUP

Flux react現状確認会
Flux react現状確認会Flux react現状確認会
Flux react現状確認会
VOYAGE GROUP
 
Google playでのリワードアプリリジェクトからの今後のマネタイズ手段について インタースティシャル広告×クロスプロモーション-
Google playでのリワードアプリリジェクトからの今後のマネタイズ手段について インタースティシャル広告×クロスプロモーション-Google playでのリワードアプリリジェクトからの今後のマネタイズ手段について インタースティシャル広告×クロスプロモーション-
Google playでのリワードアプリリジェクトからの今後のマネタイズ手段について インタースティシャル広告×クロスプロモーション-
VOYAGE GROUP
 
セミナープレゼン資料【Adingo】 20130529 
セミナープレゼン資料【Adingo】 20130529 セミナープレゼン資料【Adingo】 20130529 
セミナープレゼン資料【Adingo】 20130529 
VOYAGE GROUP
 
セミナープレゼン資料【Adingo】 20130530 
セミナープレゼン資料【Adingo】 20130530 セミナープレゼン資料【Adingo】 20130530 
セミナープレゼン資料【Adingo】 20130530 
VOYAGE GROUP
 
Abテストノススメ
AbテストノススメAbテストノススメ
Abテストノススメ
VOYAGE GROUP
 
【発表用】Lpoワークショップ~組織でサイト改善をする方法~
【発表用】Lpoワークショップ~組織でサイト改善をする方法~【発表用】Lpoワークショップ~組織でサイト改善をする方法~
【発表用】Lpoワークショップ~組織でサイト改善をする方法~
VOYAGE GROUP
 
最新のマーケットアルゴリズムと、 アルゴリズムを踏まえてのプロモーション
最新のマーケットアルゴリズムと、 アルゴリズムを踏まえてのプロモーション最新のマーケットアルゴリズムと、 アルゴリズムを踏まえてのプロモーション
最新のマーケットアルゴリズムと、 アルゴリズムを踏まえてのプロモーション
VOYAGE GROUP
 
Phpではじめるオブジェクト指向(公開用)
Phpではじめるオブジェクト指向(公開用)Phpではじめるオブジェクト指向(公開用)
Phpではじめるオブジェクト指向(公開用)
VOYAGE GROUP
 
iphone5 発表イベント 速報まとめ
iphone5 発表イベント 速報まとめiphone5 発表イベント 速報まとめ
iphone5 発表イベント 速報まとめ
VOYAGE GROUP
 
iphone5 発表イベント 最速まとめLT
iphone5 発表イベント 最速まとめLTiphone5 発表イベント 最速まとめLT
iphone5 発表イベント 最速まとめLT
VOYAGE GROUP
 
Uxデザイン定義書ワークショップ201207
Uxデザイン定義書ワークショップ201207Uxデザイン定義書ワークショップ201207
Uxデザイン定義書ワークショップ201207
VOYAGE GROUP
 
Uxデザイン定義書テンプレート201207
Uxデザイン定義書テンプレート201207Uxデザイン定義書テンプレート201207
Uxデザイン定義書テンプレート201207
VOYAGE GROUP
 
Vgにおけるuxデザインとagile開発@ハッカー道場
Vgにおけるuxデザインとagile開発@ハッカー道場Vgにおけるuxデザインとagile開発@ハッカー道場
Vgにおけるuxデザインとagile開発@ハッカー道場
VOYAGE GROUP
 
デザインプロセス重視の「組織づくり」「ものづくり」
デザインプロセス重視の「組織づくり」「ものづくり」デザインプロセス重視の「組織づくり」「ものづくり」
デザインプロセス重視の「組織づくり」「ものづくり」
VOYAGE GROUP
 

Más de VOYAGE GROUP (18)

Flux react現状確認会
Flux react現状確認会Flux react現状確認会
Flux react現状確認会
 
Google playでのリワードアプリリジェクトからの今後のマネタイズ手段について インタースティシャル広告×クロスプロモーション-
Google playでのリワードアプリリジェクトからの今後のマネタイズ手段について インタースティシャル広告×クロスプロモーション-Google playでのリワードアプリリジェクトからの今後のマネタイズ手段について インタースティシャル広告×クロスプロモーション-
Google playでのリワードアプリリジェクトからの今後のマネタイズ手段について インタースティシャル広告×クロスプロモーション-
 
セミナープレゼン資料【Adingo】 20130529 
セミナープレゼン資料【Adingo】 20130529 セミナープレゼン資料【Adingo】 20130529 
セミナープレゼン資料【Adingo】 20130529 
 
セミナープレゼン資料【Adingo】 20130530 
セミナープレゼン資料【Adingo】 20130530 セミナープレゼン資料【Adingo】 20130530 
セミナープレゼン資料【Adingo】 20130530 
 
Abテストノススメ
AbテストノススメAbテストノススメ
Abテストノススメ
 
【発表用】Lpoワークショップ~組織でサイト改善をする方法~
【発表用】Lpoワークショップ~組織でサイト改善をする方法~【発表用】Lpoワークショップ~組織でサイト改善をする方法~
【発表用】Lpoワークショップ~組織でサイト改善をする方法~
 
最新のマーケットアルゴリズムと、 アルゴリズムを踏まえてのプロモーション
最新のマーケットアルゴリズムと、 アルゴリズムを踏まえてのプロモーション最新のマーケットアルゴリズムと、 アルゴリズムを踏まえてのプロモーション
最新のマーケットアルゴリズムと、 アルゴリズムを踏まえてのプロモーション
 
Phpではじめるオブジェクト指向(公開用)
Phpではじめるオブジェクト指向(公開用)Phpではじめるオブジェクト指向(公開用)
Phpではじめるオブジェクト指向(公開用)
 
Sprk2012 LT
Sprk2012 LTSprk2012 LT
Sprk2012 LT
 
フラットなPHPからフレームワークへ
フラットなPHPからフレームワークへ フラットなPHPからフレームワークへ
フラットなPHPからフレームワークへ
 
iphone5 発表イベント 速報まとめ
iphone5 発表イベント 速報まとめiphone5 発表イベント 速報まとめ
iphone5 発表イベント 速報まとめ
 
iphone5 発表イベント 最速まとめLT
iphone5 発表イベント 最速まとめLTiphone5 発表イベント 最速まとめLT
iphone5 発表イベント 最速まとめLT
 
リワード広告におけるリジェクト問題の現状
リワード広告におけるリジェクト問題の現状リワード広告におけるリジェクト問題の現状
リワード広告におけるリジェクト問題の現状
 
IT業界とソフトウェア技術者を取り巻く今日の様相と荒波の将来への船出
IT業界とソフトウェア技術者を取り巻く今日の様相と荒波の将来への船出IT業界とソフトウェア技術者を取り巻く今日の様相と荒波の将来への船出
IT業界とソフトウェア技術者を取り巻く今日の様相と荒波の将来への船出
 
Uxデザイン定義書ワークショップ201207
Uxデザイン定義書ワークショップ201207Uxデザイン定義書ワークショップ201207
Uxデザイン定義書ワークショップ201207
 
Uxデザイン定義書テンプレート201207
Uxデザイン定義書テンプレート201207Uxデザイン定義書テンプレート201207
Uxデザイン定義書テンプレート201207
 
Vgにおけるuxデザインとagile開発@ハッカー道場
Vgにおけるuxデザインとagile開発@ハッカー道場Vgにおけるuxデザインとagile開発@ハッカー道場
Vgにおけるuxデザインとagile開発@ハッカー道場
 
デザインプロセス重視の「組織づくり」「ものづくり」
デザインプロセス重視の「組織づくり」「ものづくり」デザインプロセス重視の「組織づくり」「ものづくり」
デザインプロセス重視の「組織づくり」「ものづくり」
 

Último

物流は成長の準備ができていますか? 警告 1 日あたり 1 章を超えて消費しないでください コンテンツが覚醒と変化への意志を引き起こす
物流は成長の準備ができていますか? 警告 1 日あたり 1 章を超えて消費しないでください コンテンツが覚醒と変化への意志を引き起こす物流は成長の準備ができていますか? 警告 1 日あたり 1 章を超えて消費しないでください コンテンツが覚醒と変化への意志を引き起こす
物流は成長の準備ができていますか? 警告 1 日あたり 1 章を超えて消費しないでください コンテンツが覚醒と変化への意志を引き起こす
Michael Rada
 

Último (6)

セルフケア研修で使えるカードゲーム『攻略!きみのストレスを発見せよ!: ゲームで身につくストレスマネジメント』
セルフケア研修で使えるカードゲーム『攻略!きみのストレスを発見せよ!: ゲームで身につくストレスマネジメント』セルフケア研修で使えるカードゲーム『攻略!きみのストレスを発見せよ!: ゲームで身につくストレスマネジメント』
セルフケア研修で使えるカードゲーム『攻略!きみのストレスを発見せよ!: ゲームで身につくストレスマネジメント』
 
Broadmedia Corporation. 240510fy2023_4q
Broadmedia Corporation.  240510fy2023_4qBroadmedia Corporation.  240510fy2023_4q
Broadmedia Corporation. 240510fy2023_4q
 
日本上場SaaS企業データを使った経験曲線の分析|売上成長によるコストダウン戦略
日本上場SaaS企業データを使った経験曲線の分析|売上成長によるコストダウン戦略日本上場SaaS企業データを使った経験曲線の分析|売上成長によるコストダウン戦略
日本上場SaaS企業データを使った経験曲線の分析|売上成長によるコストダウン戦略
 
共有用_aio基本保守プラン_WordPressサイト_20240509.pdf
共有用_aio基本保守プラン_WordPressサイト_20240509.pdf共有用_aio基本保守プラン_WordPressサイト_20240509.pdf
共有用_aio基本保守プラン_WordPressサイト_20240509.pdf
 
物流は成長の準備ができていますか? 警告 1 日あたり 1 章を超えて消費しないでください コンテンツが覚醒と変化への意志を引き起こす
物流は成長の準備ができていますか? 警告 1 日あたり 1 章を超えて消費しないでください コンテンツが覚醒と変化への意志を引き起こす物流は成長の準備ができていますか? 警告 1 日あたり 1 章を超えて消費しないでください コンテンツが覚醒と変化への意志を引き起こす
物流は成長の準備ができていますか? 警告 1 日あたり 1 章を超えて消費しないでください コンテンツが覚醒と変化への意志を引き起こす
 
company profile.pdf
company profile.pdfcompany profile.pdf
company profile.pdf
 

Jenkinsとhadoopを利用した継続的データ解析環境の構築