SlideShare una empresa de Scribd logo
1 de 34
SEGA Games Co., Ltd. SEGA Networks Company
SEGA :
Growth hacking by Spark ML
for Mobile games
◆ 自己紹介
SEGA Games Co., Ltd. SEGA Networks Company 2
村上 宰和(むらかみ ただかず)
所属
株式会社セガゲームス
セガネットワークスカンパニー
IT統括部 共通基盤開発部
データマイニングセクション
主な業務
・Hadoopベースのデータ基盤・分析基盤構築
・直近はSpark MLlibを活用した予測基盤構築
・業務課題に対する予測活用提案
マイブーム
・畑で野菜栽培
・コーヒードリッピング、テイスティング
・San Francisco 49ers(NFL)
◆ アジェンダ
SEGA Games Co., Ltd. SEGA Networks Company 3
1. Motivation
2. Challenge
3. Case Study
4. Summary
5. Next Challenge
1. Motivation
2. Challenge
3. Case Study
4. Summary
5. Next Challenge
SEGA Games Co., Ltd. SEGA Networks Company 4
Motivation
1
◆ モバイルゲームビジネスとは?
SEGA Games Co., Ltd. SEGA Networks Company 5
売上
日数
売り切り型ゲーム
モバイルゲーム
(悪い状態)
モバイルゲーム
(良い状態)
 今までの売り切り型とは異なり、継続的なサービスを提供するビジ
ネスモデル
 売上も、長期にわたり継続的に確保
売上
日数
売り切り型ゲーム
モバイルゲーム
(悪い状態)
モバイルゲーム
(良い状態)
 売上維持のために適切な【運営】が必要
 では、どうやって?
◆ ビジネスの課題
SEGA Games Co., Ltd. SEGA Networks Company 6
適 切 な 運 営
◆ ビジネスへの貢献
SEGA Games Co., Ltd. SEGA Networks Company 7
徹底的にデータを駆使して、適切な運営の実現に貢献する
あらゆるデータを精査し、これを活用してサービスを成長させる
= 【 グロースハック 】
◆ 分析による課題解決
SEGA Games Co., Ltd. SEGA Networks Company 8
 まずはデータ分析で解決
 具体的には、時系列分析、比較分析、内訳分析等を実施
急に売上が下がってきた!
巻き返したい
アクティブユーザが減少している。
歯止めをかけたい
イベントの出足が悪い。
途中でてこ入れしたい
前回販売したゲーム内商品が売れ
た!次回も売れたい!
売上関連のKPIで時系列的に悪化
トレンドの指標を改善
流出したユーザが属する層を内訳
分析で特定し改善
イベント関連データを内訳分析し、
悪化要因抽出・改善
各商品のデータを様々な軸で比較
し、好調な軸に着目
課題 解決策
◆ 【対症療法】 から 【予防】 へ
SEGA Games Co., Ltd. SEGA Networks Company 9
予測に基づく【 予防 】はできないのか?
分析による課題解決は【 対症療法 】
1. Motivation
2. Challenge
3. Case Study
4. Summary
5. Next Challenge
Challenge
2
SEGA Games Co., Ltd. SEGA Networks Company 10
◆ 予測によって解決する課題
SEGA Games Co., Ltd. SEGA Networks Company 11
ユーザの特徴を明確化してサー
ビス強化点としたい
ユーザのゲーム離れを抑止した
い
多様な属性のユーザにもゲーム
を楽しんで欲しい
売上が立たないタイトルをリ
リースしたくない
コンテンツのクリック率を向上
させたい
クエストバランス調整の属人化
を排除したい
類似ユーザをグループ分けする
と特徴が明確になる?
ゲームを辞めそうな人を予測し
て引き留めると良い?
ユーザ属性情報を予測し、属性
毎にサービスすると良い?
リリース前に売上予測を行い、
事前に改善できると良い?
ユーザ毎に最適なコンテンツ表
示ができると良い?
難易度や報酬等の要因で予測式
が導けると良い?
課題 仮説
1
2
3
4
5
6
◆ Spark MLlibでやってみた!
SEGA Games Co., Ltd. SEGA Networks Company 12
 予測を実現するために、 Spark MLlibを活用
 ユーザ動向データ等を「学習」して、予測能力を獲得
ユーザ動向データ等
◆ Spark MLlibとは?
SEGA Games Co., Ltd. SEGA Networks Company 13
種類 用途
分類 要素が該当するカテゴリを推測
回帰 予測計算式を導出して数量を予測
クラスタリング 要素の集合をグループ分けしつつ、要因抽出
協調フィルタリング レコメンデーションを行う
 Spark MLlibは、Hadoopのエコシステムの1つであるSparkに付
属するマシンラーニングライブラリ
 主に4つの種類・用途がある
◆ 使用したアルゴリズムと選定理由
SEGA Games Co., Ltd. SEGA Networks Company 14
 ロジスティック回帰 : 物事が発生する「確率」を予測する用途に最適
 K-means : クラスタ数が所与の場合、比較的高速かつ高精度
種類 アルゴリズム
分類
サポートベクタマシン(SVM)
デシジョンツリー(Gini Impurity/Entropy/Variance)
ナイーブベイズ
回帰
ロジスティック回帰
線形回帰
クラスタリング
K-means
混合正規分布モデル(GMM)
潜在的ディリクレ配分法(LDA)
協調フィルタリング 交互最小二乗法(ALS)
1. Motivation
2. Challenge
3. Case Study
4. Summary
5. Next Challenge
Case Study
3
SEGA Games Co., Ltd. SEGA Networks Company 15
◆ 予測によって解決した課題
SEGA Games Co., Ltd. SEGA Networks Company 16
ユーザの特徴を明確化してサー
ビス強化点としたい
ユーザのゲーム離れを抑止した
い
多様な属性のユーザにもゲーム
を楽しんで欲しい
売上が立たないタイトルをリ
リースしたくない
コンテンツのクリック率を向上
させたい
クエストバランス調整の属人化
を排除したい
類似ユーザをグループ分けする
と特徴が明確になる?
ゲームを辞めそうな人を予測し
て引き留めると良い?
ユーザ属性情報を予測し、属性
毎にサービスすると良い?
リリース前に売上予測を行い、
事前に改善できると良い?
ユーザ毎に最適なコンテンツ表
示ができると良い?
難易度や報酬等の要因で予測式
が導けると良い?
課題 仮説
1
2
3
4
5
6
◆ ケース① ユーザの特徴明確化
SEGA Games Co., Ltd. SEGA Networks Company 17
ユーザの特徴を明確化してサー
ビス強化点としたい
類似ユーザをグループ分けする
と特徴が明確になる?
課題 仮説
1
Spark MLlibのK-meansアルゴリズムで、ユーザを「類似した」ユー
ザ同士で3つのクラスタ(グループ)に分けた
⇒ どの変数(要因)でクラスタが明確に分かれるかを把握
解決策
◆ ケース① ユーザの特徴明確化
SEGA Games Co., Ltd. SEGA Networks Company 18
頻度
値
 変数X1、X2、X3においてクラスタが明確に分かれた
 ユーザの特徴は、これらの変数で説明可能
 ユーザの特徴を把握でき、サービス強化点として考慮できるように
なった
変数 X1 変数 X2 変数 X3
◆ ケース② ユーザのゲーム離れを抑止
SEGA Games Co., Ltd. SEGA Networks Company 19
ユーザのゲーム離れを抑止した
い
ゲームを辞めそうな人を予測し
て引き留めると良い?
課題 仮説
2
Spark MLlibのロジスティック回帰アルゴリズムで、ユーザのn日後残
存確率を予測
⇒ n日後残存確率に応じて、個別のサービスを提供
解決策
◆ ケース② ユーザのゲーム離れを抑止
SEGA Games Co., Ltd. SEGA Networks Company 20
 効果計測の指標として、【継続率】を適用
 継続率で約20%程度の向上を目指す
継続率(%)
週
対応前
対応後(予定)
◆ ケース② ユーザのゲーム離れを抑止
SEGA Games Co., Ltd. SEGA Networks Company 21
 n日後残存確率が High/Middle/Low のどれに該当するかによって、
ユーザをカテゴリ分け
n日後残存確率(%)
変数X
High
Middle
Low
実際には残存した
実際には辞めた
予測
実際
◆ ケース② ユーザのゲーム離れを抑止
SEGA Games Co., Ltd. SEGA Networks Company 22
 どのカテゴリでも、約10%以内の誤差で、 n日後残存確率の予測が
できた!
A : n日後残存確率の
カテゴリ(= x)
A’ : Aの中央値
B : 実際にn日後
に残存した割合
誤差
B – A’
Low
(x < 20%)
10% 3.37% -6.63%
Middle
(20% <= x < 80%)
50% 39.23% -10.77%
High
(80% <= x)
90% 95.43% 5.43%
◆ ケース② ユーザのゲーム離れを抑止
SEGA Games Co., Ltd. SEGA Networks Company 23
継続率(%)
週
対応後(実際)
(わずかに目標(+20%)には届かなかったけど…)
大幅(+15%)な継続率向上が見られた。
⇒ ユーザのゲーム離れ抑止に効果があった!
◆ ケース③ 多様な属性のユーザも楽しませる
SEGA Games Co., Ltd. SEGA Networks Company 24
多様な属性のユーザにもゲーム
を楽しんで欲しい
ユーザ属性情報を予測し、属性
毎にサービスすると良い?
課題 仮説
3
※ 今回はユーザの「性別」を予測
Spark MLlibのロジスティック回帰アルゴリ
ズムで、ユーザのプレイデータから性別を予
測
⇒ 予測属性に応じて、個別にサービスを提供
解決策
Event
A
Event
B
◆ ケース③ 多様な属性のユーザも楽しませる
SEGA Games Co., Ltd. SEGA Networks Company 25
* GoogleのTensorFlowにて検証。Spark MLlibでは未サポート
 いくつかのアルゴリズムを試行し、結果的にロジスティック回帰が
最も高い82%の精度を出した
 ユーザの性別を予測し個別にサービスを提供して、どちらの性別の
ユーザも楽しませる事ができるようになった
アルゴリズム 精度
ロジスティック回帰 82%
デシジョンツリー(Gini Impurity) 81%
* ディープラーニング(6層) 73%
* ニューラルネットワーク(2層) 71%
1. Motivation
2. Challenge
3. Case Study
4. Summary
5. Next Challenge
Summary
4
SEGA Games Co., Ltd. SEGA Networks Company 26
◆ まとめ
SEGA Games Co., Ltd. SEGA Networks Company 27
 Spark MLlibを使って予測したら、みんなに良い事があった
 データエンジニアにとっては、難しい予測処理をMLlibに
任せられた
 データアナリストにとっては、運営担当者に精度の高い予
測結果を提供できるようになった
 運営担当者にとっては、精度の高い予測結果を活用して、
「予防」対応を実施できるようになった
 エンドユーザにとっては、自分に合うサービスが増えて、
もっとプレイを継続したい気になれた
つまり、みんながHappyになった!!
1. Motivation
2. Challenge
3. Case Study
4. Summary
5. Next Challenge
Next Challenge
5
SEGA Games Co., Ltd. SEGA Networks Company 28
◆ 予測によって解決しようとしている課題
SEGA Games Co., Ltd. SEGA Networks Company 29
ユーザの特徴を明確化してサー
ビス強化点としたい
ユーザのゲーム離れを抑止した
い
多様な属性のユーザにもゲーム
を楽しんで欲しい
売上が立たないタイトルをリ
リースしたくない
コンテンツのクリック率を向上
させたい
クエストバランス調整の属人化
を排除したい
類似ユーザをグループ分けする
と特徴が明確になる?
ゲームを辞めそうな人を予測し
て引き留めると良い?
ユーザ属性情報を予測し、属性
毎にサービスすると良い?
リリース前に売上予測を行い、
事前に改善できると良い?
ユーザ毎に最適なコンテンツ表
示ができると良い?
難易度や報酬等の要因で予測式
が導けると良い?
課題 仮説
1
2
3
4
5
6
◆ ケース④ 不採算見込タイトルの事前改善
SEGA Games Co., Ltd. SEGA Networks Company 30
売上が立たないタイトルをリ
リースしたくない
リリース前に売上予測を行い、
事前に改善できると良い?
課題 仮説
4
Spark MLlibの線形回帰アルゴリズムで予測計算式を導出し、一定期
間後の売上高を予測
検討している解決策
売上
日数
now
◆ ケース⑤ コンテンツの認知度向上
SEGA Games Co., Ltd. SEGA Networks Company 31
コンテンツのクリック率を向上
させたい
ユーザ毎に最適なコンテンツ表
示ができると良い?
課題 仮説
5
Spark MLlibの交互最小二乗法(ALS)アルゴリズムで、自分に近い嗜
好を持つ他ユーザがクリックしたコンテンツをレコメンド
検討している解決策
A
B
C
C
X
Y
◆ ケース⑥ クエストバランス調整属人化排除
SEGA Games Co., Ltd. SEGA Networks Company 32
クエストバランス調整の属人化
を排除したい
難易度や報酬等の要因で予測式
が導けると良い?
課題 仮説
6
仮説も検討中
◆ Finally…
SEGA Games Co., Ltd. SEGA Networks Company 33
We are hiring!!
http://sega-net.com/recruit/
 ビッグデータ
 マシンラーニング
 モバイルゲーム に興味がある
 データエンジニア
 データアナリスト
SEGA Games Co., Ltd. SEGA Networks Company 34
Thank You

Más contenido relacionado

La actualidad más candente

DBREから始めるデータベースプラットフォーム
DBREから始めるデータベースプラットフォームDBREから始めるデータベースプラットフォーム
DBREから始めるデータベースプラットフォームInsight Technology, Inc.
 
ITの今とこれから public
ITの今とこれから publicITの今とこれから public
ITの今とこれから publicDaiyu Hatakeyama
 
リクルートライフスタイルの考える ストリームデータの活かし方(Hadoop Spark Conference2016)
リクルートライフスタイルの考えるストリームデータの活かし方(Hadoop Spark Conference2016)リクルートライフスタイルの考えるストリームデータの活かし方(Hadoop Spark Conference2016)
リクルートライフスタイルの考える ストリームデータの活かし方(Hadoop Spark Conference2016)Atsushi Kurumada
 
大規模サイトを支えるビッグデータプラットフォーム技術
大規模サイトを支えるビッグデータプラットフォーム技術大規模サイトを支えるビッグデータプラットフォーム技術
大規模サイトを支えるビッグデータプラットフォーム技術Yahoo!デベロッパーネットワーク
 
リクルートのビッグデータ活用基盤とデータ活用に向けた取組み
リクルートのビッグデータ活用基盤とデータ活用に向けた取組みリクルートのビッグデータ活用基盤とデータ活用に向けた取組み
リクルートのビッグデータ活用基盤とデータ活用に向けた取組みRecruit Technologies
 
Azure Webiner: より安定したWebサイト構築のためのAzure PaaS サービス群
Azure Webiner: より安定したWebサイト構築のためのAzure PaaS サービス群Azure Webiner: より安定したWebサイト構築のためのAzure PaaS サービス群
Azure Webiner: より安定したWebサイト構築のためのAzure PaaS サービス群Daiyu Hatakeyama
 
2014年4月17日 dstnHub発表スライド「dataspiderインターナル:アーキテクチャ編」
2014年4月17日 dstnHub発表スライド「dataspiderインターナル:アーキテクチャ編」2014年4月17日 dstnHub発表スライド「dataspiderインターナル:アーキテクチャ編」
2014年4月17日 dstnHub発表スライド「dataspiderインターナル:アーキテクチャ編」dstn
 
性能問題を起こしにくい信頼されるクラウド RDB のつくりかた
性能問題を起こしにくい信頼されるクラウド RDB のつくりかた性能問題を起こしにくい信頼されるクラウド RDB のつくりかた
性能問題を起こしにくい信頼されるクラウド RDB のつくりかたTomoyuki Oota
 
Pysparkで始めるデータ分析
Pysparkで始めるデータ分析Pysparkで始めるデータ分析
Pysparkで始めるデータ分析Tanaka Yuichi
 
Watson summit 2016_j2_5
Watson summit 2016_j2_5Watson summit 2016_j2_5
Watson summit 2016_j2_5Tanaka Yuichi
 
スタートアップカフェコザ - 最新 AI / Machine Learning 事情
スタートアップカフェコザ - 最新 AI / Machine Learning 事情スタートアップカフェコザ - 最新 AI / Machine Learning 事情
スタートアップカフェコザ - 最新 AI / Machine Learning 事情Daiyu Hatakeyama
 
情報爆発シンポジウム infoplosion
情報爆発シンポジウム infoplosion情報爆発シンポジウム infoplosion
情報爆発シンポジウム infoplosionRakuten Group, Inc.
 
MBAAで覚えるDBREの大事なおしごと
MBAAで覚えるDBREの大事なおしごとMBAAで覚えるDBREの大事なおしごと
MBAAで覚えるDBREの大事なおしごとInsight Technology, Inc.
 
Data Factory V2 新機能徹底活用入門
Data Factory V2 新機能徹底活用入門Data Factory V2 新機能徹底活用入門
Data Factory V2 新機能徹底活用入門Keisuke Fujikawa
 
初めてのSpark streaming 〜kafka+sparkstreamingの紹介〜
初めてのSpark streaming 〜kafka+sparkstreamingの紹介〜初めてのSpark streaming 〜kafka+sparkstreamingの紹介〜
初めてのSpark streaming 〜kafka+sparkstreamingの紹介〜Tanaka Yuichi
 
Data Scientist Workbench - dots0729
Data Scientist Workbench - dots0729Data Scientist Workbench - dots0729
Data Scientist Workbench - dots0729s. kaijima
 

La actualidad más candente (20)

楽天がHadoopを使う理由
楽天がHadoopを使う理由楽天がHadoopを使う理由
楽天がHadoopを使う理由
 
DBREから始めるデータベースプラットフォーム
DBREから始めるデータベースプラットフォームDBREから始めるデータベースプラットフォーム
DBREから始めるデータベースプラットフォーム
 
ITの今とこれから public
ITの今とこれから publicITの今とこれから public
ITの今とこれから public
 
Yahoo! JAPANのデータ基盤とHadoop #dbts2016
Yahoo! JAPANのデータ基盤とHadoop #dbts2016Yahoo! JAPANのデータ基盤とHadoop #dbts2016
Yahoo! JAPANのデータ基盤とHadoop #dbts2016
 
リクルートライフスタイルの考える ストリームデータの活かし方(Hadoop Spark Conference2016)
リクルートライフスタイルの考えるストリームデータの活かし方(Hadoop Spark Conference2016)リクルートライフスタイルの考えるストリームデータの活かし方(Hadoop Spark Conference2016)
リクルートライフスタイルの考える ストリームデータの活かし方(Hadoop Spark Conference2016)
 
大規模サイトを支えるビッグデータプラットフォーム技術
大規模サイトを支えるビッグデータプラットフォーム技術大規模サイトを支えるビッグデータプラットフォーム技術
大規模サイトを支えるビッグデータプラットフォーム技術
 
Lunch & Learn, AWS NoSQL Services
Lunch & Learn, AWS NoSQL ServicesLunch & Learn, AWS NoSQL Services
Lunch & Learn, AWS NoSQL Services
 
リクルートのビッグデータ活用基盤とデータ活用に向けた取組み
リクルートのビッグデータ活用基盤とデータ活用に向けた取組みリクルートのビッグデータ活用基盤とデータ活用に向けた取組み
リクルートのビッグデータ活用基盤とデータ活用に向けた取組み
 
Azure Webiner: より安定したWebサイト構築のためのAzure PaaS サービス群
Azure Webiner: より安定したWebサイト構築のためのAzure PaaS サービス群Azure Webiner: より安定したWebサイト構築のためのAzure PaaS サービス群
Azure Webiner: より安定したWebサイト構築のためのAzure PaaS サービス群
 
2014年4月17日 dstnHub発表スライド「dataspiderインターナル:アーキテクチャ編」
2014年4月17日 dstnHub発表スライド「dataspiderインターナル:アーキテクチャ編」2014年4月17日 dstnHub発表スライド「dataspiderインターナル:アーキテクチャ編」
2014年4月17日 dstnHub発表スライド「dataspiderインターナル:アーキテクチャ編」
 
性能問題を起こしにくい信頼されるクラウド RDB のつくりかた
性能問題を起こしにくい信頼されるクラウド RDB のつくりかた性能問題を起こしにくい信頼されるクラウド RDB のつくりかた
性能問題を起こしにくい信頼されるクラウド RDB のつくりかた
 
データ利活用を促進するメタデータ
データ利活用を促進するメタデータデータ利活用を促進するメタデータ
データ利活用を促進するメタデータ
 
Pysparkで始めるデータ分析
Pysparkで始めるデータ分析Pysparkで始めるデータ分析
Pysparkで始めるデータ分析
 
Watson summit 2016_j2_5
Watson summit 2016_j2_5Watson summit 2016_j2_5
Watson summit 2016_j2_5
 
スタートアップカフェコザ - 最新 AI / Machine Learning 事情
スタートアップカフェコザ - 最新 AI / Machine Learning 事情スタートアップカフェコザ - 最新 AI / Machine Learning 事情
スタートアップカフェコザ - 最新 AI / Machine Learning 事情
 
情報爆発シンポジウム infoplosion
情報爆発シンポジウム infoplosion情報爆発シンポジウム infoplosion
情報爆発シンポジウム infoplosion
 
MBAAで覚えるDBREの大事なおしごと
MBAAで覚えるDBREの大事なおしごとMBAAで覚えるDBREの大事なおしごと
MBAAで覚えるDBREの大事なおしごと
 
Data Factory V2 新機能徹底活用入門
Data Factory V2 新機能徹底活用入門Data Factory V2 新機能徹底活用入門
Data Factory V2 新機能徹底活用入門
 
初めてのSpark streaming 〜kafka+sparkstreamingの紹介〜
初めてのSpark streaming 〜kafka+sparkstreamingの紹介〜初めてのSpark streaming 〜kafka+sparkstreamingの紹介〜
初めてのSpark streaming 〜kafka+sparkstreamingの紹介〜
 
Data Scientist Workbench - dots0729
Data Scientist Workbench - dots0729Data Scientist Workbench - dots0729
Data Scientist Workbench - dots0729
 

Destacado

1000台規模のHadoopクラスタをHive/Tezアプリケーションにあわせてパフォーマンスチューニングした話
1000台規模のHadoopクラスタをHive/Tezアプリケーションにあわせてパフォーマンスチューニングした話1000台規模のHadoopクラスタをHive/Tezアプリケーションにあわせてパフォーマンスチューニングした話
1000台規模のHadoopクラスタをHive/Tezアプリケーションにあわせてパフォーマンスチューニングした話Yahoo!デベロッパーネットワーク
 
Business Innovation cases driven by AI and BigData technologies
Business Innovation cases driven by AI and BigData technologiesBusiness Innovation cases driven by AI and BigData technologies
Business Innovation cases driven by AI and BigData technologiesDataWorks Summit/Hadoop Summit
 
データ分析グループの組織編制とその課題 マーケティングにおけるKPI設計の失敗例 ABテストの活用と、機械学習の導入 #CWT2016
データ分析グループの組織編制とその課題 マーケティングにおけるKPI設計の失敗例 ABテストの活用と、機械学習の導入 #CWT2016データ分析グループの組織編制とその課題 マーケティングにおけるKPI設計の失敗例 ABテストの活用と、機械学習の導入 #CWT2016
データ分析グループの組織編制とその課題 マーケティングにおけるKPI設計の失敗例 ABテストの活用と、機械学習の導入 #CWT2016Tokoroten Nakayama
 
大規模データに対するデータサイエンスの進め方 #CWT2016
大規模データに対するデータサイエンスの進め方 #CWT2016大規模データに対するデータサイエンスの進め方 #CWT2016
大規模データに対するデータサイエンスの進め方 #CWT2016Cloudera Japan
 
Hadoop’s Impact on Recruit Company
Hadoop’s Impact on Recruit CompanyHadoop’s Impact on Recruit Company
Hadoop’s Impact on Recruit CompanyRecruit Technologies
 
sparksql-hive-bench-by-nec-hwx-at-hcj16
sparksql-hive-bench-by-nec-hwx-at-hcj16sparksql-hive-bench-by-nec-hwx-at-hcj16
sparksql-hive-bench-by-nec-hwx-at-hcj16Yifeng Jiang
 
Top 5 mistakes when writing Spark applications
Top 5 mistakes when writing Spark applicationsTop 5 mistakes when writing Spark applications
Top 5 mistakes when writing Spark applicationshadooparchbook
 

Destacado (8)

1000台規模のHadoopクラスタをHive/Tezアプリケーションにあわせてパフォーマンスチューニングした話
1000台規模のHadoopクラスタをHive/Tezアプリケーションにあわせてパフォーマンスチューニングした話1000台規模のHadoopクラスタをHive/Tezアプリケーションにあわせてパフォーマンスチューニングした話
1000台規模のHadoopクラスタをHive/Tezアプリケーションにあわせてパフォーマンスチューニングした話
 
Case Study: OLAP usability on Spark and Hadoop
Case Study: OLAP usability on Spark and HadoopCase Study: OLAP usability on Spark and Hadoop
Case Study: OLAP usability on Spark and Hadoop
 
Business Innovation cases driven by AI and BigData technologies
Business Innovation cases driven by AI and BigData technologiesBusiness Innovation cases driven by AI and BigData technologies
Business Innovation cases driven by AI and BigData technologies
 
データ分析グループの組織編制とその課題 マーケティングにおけるKPI設計の失敗例 ABテストの活用と、機械学習の導入 #CWT2016
データ分析グループの組織編制とその課題 マーケティングにおけるKPI設計の失敗例 ABテストの活用と、機械学習の導入 #CWT2016データ分析グループの組織編制とその課題 マーケティングにおけるKPI設計の失敗例 ABテストの活用と、機械学習の導入 #CWT2016
データ分析グループの組織編制とその課題 マーケティングにおけるKPI設計の失敗例 ABテストの活用と、機械学習の導入 #CWT2016
 
大規模データに対するデータサイエンスの進め方 #CWT2016
大規模データに対するデータサイエンスの進め方 #CWT2016大規模データに対するデータサイエンスの進め方 #CWT2016
大規模データに対するデータサイエンスの進め方 #CWT2016
 
Hadoop’s Impact on Recruit Company
Hadoop’s Impact on Recruit CompanyHadoop’s Impact on Recruit Company
Hadoop’s Impact on Recruit Company
 
sparksql-hive-bench-by-nec-hwx-at-hcj16
sparksql-hive-bench-by-nec-hwx-at-hcj16sparksql-hive-bench-by-nec-hwx-at-hcj16
sparksql-hive-bench-by-nec-hwx-at-hcj16
 
Top 5 mistakes when writing Spark applications
Top 5 mistakes when writing Spark applicationsTop 5 mistakes when writing Spark applications
Top 5 mistakes when writing Spark applications
 

Similar a SEGA : Growth hacking by Spark ML for Mobile games

大規模モバイルオンラインゲーム開発における チーム組成とワークフロー最適化
大規模モバイルオンラインゲーム開発における チーム組成とワークフロー最適化大規模モバイルオンラインゲーム開発における チーム組成とワークフロー最適化
大規模モバイルオンラインゲーム開発における チーム組成とワークフロー最適化KLab Inc. / Tech
 
Amebaソーシャルゲームにおけるr活用の体制と事例のご紹介
Amebaソーシャルゲームにおけるr活用の体制と事例のご紹介Amebaソーシャルゲームにおけるr活用の体制と事例のご紹介
Amebaソーシャルゲームにおけるr活用の体制と事例のご紹介Masanori Takano
 
SparkやBigQueryなどを用いた モバイルゲーム分析環境
SparkやBigQueryなどを用いたモバイルゲーム分析環境SparkやBigQueryなどを用いたモバイルゲーム分析環境
SparkやBigQueryなどを用いた モバイルゲーム分析環境yuichi_komatsu
 
モバイルゲームのためのデータ分析
モバイルゲームのためのデータ分析モバイルゲームのためのデータ分析
モバイルゲームのためのデータ分析AtsushiTakada1
 
スマホ版ログレスでグローバル展開を想定したサーバ構築をAnsibleで試してみた話
スマホ版ログレスでグローバル展開を想定したサーバ構築をAnsibleで試してみた話スマホ版ログレスでグローバル展開を想定したサーバ構築をAnsibleで試してみた話
スマホ版ログレスでグローバル展開を想定したサーバ構築をAnsibleで試してみた話Akihiro Sugeno
 
[db tech showcase Tokyo 2016] A25: ACIDトランザクションをサポートするエンタープライズ向けNoSQL Databas...
[db tech showcase Tokyo 2016] A25: ACIDトランザクションをサポートするエンタープライズ向けNoSQL Databas...[db tech showcase Tokyo 2016] A25: ACIDトランザクションをサポートするエンタープライズ向けNoSQL Databas...
[db tech showcase Tokyo 2016] A25: ACIDトランザクションをサポートするエンタープライズ向けNoSQL Databas...Insight Technology, Inc.
 
AmebaソーシャルゲームにおけるR活用の体制と事例のご紹介
AmebaソーシャルゲームにおけるR活用の体制と事例のご紹介AmebaソーシャルゲームにおけるR活用の体制と事例のご紹介
AmebaソーシャルゲームにおけるR活用の体制と事例のご紹介cyberagent
 
運用中のゲームにAIを導入するには〜プロジェクト推進・ユースケース・運用〜 [DeNA TechCon 2019]
運用中のゲームにAIを導入するには〜プロジェクト推進・ユースケース・運用〜 [DeNA TechCon 2019]運用中のゲームにAIを導入するには〜プロジェクト推進・ユースケース・運用〜 [DeNA TechCon 2019]
運用中のゲームにAIを導入するには〜プロジェクト推進・ユースケース・運用〜 [DeNA TechCon 2019]DeNA
 
E-commerce企業におけるビッグデータへの挑戦と課題‐機械学習への期待について‐
E-commerce企業におけるビッグデータへの挑戦と課題‐機械学習への期待について‐E-commerce企業におけるビッグデータへの挑戦と課題‐機械学習への期待について‐
E-commerce企業におけるビッグデータへの挑戦と課題‐機械学習への期待について‐Rakuten Group, Inc.
 
大規模ログ分析におけるAmazon Web Servicesの活用
大規模ログ分析におけるAmazon Web Servicesの活用大規模ログ分析におけるAmazon Web Servicesの活用
大規模ログ分析におけるAmazon Web Servicesの活用Shintaro Takemura
 
基調講演「データのグループウェア化」
基調講演「データのグループウェア化」基調講演「データのグループウェア化」
基調講演「データのグループウェア化」Cybozucommunity
 
A8 150206【サードウェア】drbdで実現する高可用性システムと災害対策
A8 150206【サードウェア】drbdで実現する高可用性システムと災害対策A8 150206【サードウェア】drbdで実現する高可用性システムと災害対策
A8 150206【サードウェア】drbdで実現する高可用性システムと災害対策softlayerjp
 
A8 150206【サードウェア】drbdで実現する高可用性システムと災害対策
A8 150206【サードウェア】drbdで実現する高可用性システムと災害対策A8 150206【サードウェア】drbdで実現する高可用性システムと災害対策
A8 150206【サードウェア】drbdで実現する高可用性システムと災害対策chenree3
 
はじパタ2章
はじパタ2章はじパタ2章
はじパタ2章tetsuro ito
 
アプリの「無事故リリース」を目指して~品質管理部によるSmartBeat活用事例~
アプリの「無事故リリース」を目指して~品質管理部によるSmartBeat活用事例~ アプリの「無事故リリース」を目指して~品質管理部によるSmartBeat活用事例~
アプリの「無事故リリース」を目指して~品質管理部によるSmartBeat活用事例~ CYBIRD Co.,Ltd.
 
Kansumi2013 tamagawa
Kansumi2013 tamagawaKansumi2013 tamagawa
Kansumi2013 tamagawaSORACOM, INC
 
JAWS-UG広島 - 2019-07-12 - 金融ビッグデータを守るリソースポリシー実例
JAWS-UG広島 - 2019-07-12 - 金融ビッグデータを守るリソースポリシー実例JAWS-UG広島 - 2019-07-12 - 金融ビッグデータを守るリソースポリシー実例
JAWS-UG広島 - 2019-07-12 - 金融ビッグデータを守るリソースポリシー実例Yutaro Ono
 
20131031 首都大学東京 cloud_computing講演会 講演資料(野上)
20131031 首都大学東京 cloud_computing講演会 講演資料(野上)20131031 首都大学東京 cloud_computing講演会 講演資料(野上)
20131031 首都大学東京 cloud_computing講演会 講演資料(野上)Daisuke Nogami
 
【Interop Tokyo 2016】 初心者でもわかるCisco SDNの概要
【Interop Tokyo 2016】 初心者でもわかるCisco SDNの概要【Interop Tokyo 2016】 初心者でもわかるCisco SDNの概要
【Interop Tokyo 2016】 初心者でもわかるCisco SDNの概要シスコシステムズ合同会社
 
機械学習 - MNIST の次のステップ
機械学習 - MNIST の次のステップ機械学習 - MNIST の次のステップ
機械学習 - MNIST の次のステップDaiyu Hatakeyama
 

Similar a SEGA : Growth hacking by Spark ML for Mobile games (20)

大規模モバイルオンラインゲーム開発における チーム組成とワークフロー最適化
大規模モバイルオンラインゲーム開発における チーム組成とワークフロー最適化大規模モバイルオンラインゲーム開発における チーム組成とワークフロー最適化
大規模モバイルオンラインゲーム開発における チーム組成とワークフロー最適化
 
Amebaソーシャルゲームにおけるr活用の体制と事例のご紹介
Amebaソーシャルゲームにおけるr活用の体制と事例のご紹介Amebaソーシャルゲームにおけるr活用の体制と事例のご紹介
Amebaソーシャルゲームにおけるr活用の体制と事例のご紹介
 
SparkやBigQueryなどを用いた モバイルゲーム分析環境
SparkやBigQueryなどを用いたモバイルゲーム分析環境SparkやBigQueryなどを用いたモバイルゲーム分析環境
SparkやBigQueryなどを用いた モバイルゲーム分析環境
 
モバイルゲームのためのデータ分析
モバイルゲームのためのデータ分析モバイルゲームのためのデータ分析
モバイルゲームのためのデータ分析
 
スマホ版ログレスでグローバル展開を想定したサーバ構築をAnsibleで試してみた話
スマホ版ログレスでグローバル展開を想定したサーバ構築をAnsibleで試してみた話スマホ版ログレスでグローバル展開を想定したサーバ構築をAnsibleで試してみた話
スマホ版ログレスでグローバル展開を想定したサーバ構築をAnsibleで試してみた話
 
[db tech showcase Tokyo 2016] A25: ACIDトランザクションをサポートするエンタープライズ向けNoSQL Databas...
[db tech showcase Tokyo 2016] A25: ACIDトランザクションをサポートするエンタープライズ向けNoSQL Databas...[db tech showcase Tokyo 2016] A25: ACIDトランザクションをサポートするエンタープライズ向けNoSQL Databas...
[db tech showcase Tokyo 2016] A25: ACIDトランザクションをサポートするエンタープライズ向けNoSQL Databas...
 
AmebaソーシャルゲームにおけるR活用の体制と事例のご紹介
AmebaソーシャルゲームにおけるR活用の体制と事例のご紹介AmebaソーシャルゲームにおけるR活用の体制と事例のご紹介
AmebaソーシャルゲームにおけるR活用の体制と事例のご紹介
 
運用中のゲームにAIを導入するには〜プロジェクト推進・ユースケース・運用〜 [DeNA TechCon 2019]
運用中のゲームにAIを導入するには〜プロジェクト推進・ユースケース・運用〜 [DeNA TechCon 2019]運用中のゲームにAIを導入するには〜プロジェクト推進・ユースケース・運用〜 [DeNA TechCon 2019]
運用中のゲームにAIを導入するには〜プロジェクト推進・ユースケース・運用〜 [DeNA TechCon 2019]
 
E-commerce企業におけるビッグデータへの挑戦と課題‐機械学習への期待について‐
E-commerce企業におけるビッグデータへの挑戦と課題‐機械学習への期待について‐E-commerce企業におけるビッグデータへの挑戦と課題‐機械学習への期待について‐
E-commerce企業におけるビッグデータへの挑戦と課題‐機械学習への期待について‐
 
大規模ログ分析におけるAmazon Web Servicesの活用
大規模ログ分析におけるAmazon Web Servicesの活用大規模ログ分析におけるAmazon Web Servicesの活用
大規模ログ分析におけるAmazon Web Servicesの活用
 
基調講演「データのグループウェア化」
基調講演「データのグループウェア化」基調講演「データのグループウェア化」
基調講演「データのグループウェア化」
 
A8 150206【サードウェア】drbdで実現する高可用性システムと災害対策
A8 150206【サードウェア】drbdで実現する高可用性システムと災害対策A8 150206【サードウェア】drbdで実現する高可用性システムと災害対策
A8 150206【サードウェア】drbdで実現する高可用性システムと災害対策
 
A8 150206【サードウェア】drbdで実現する高可用性システムと災害対策
A8 150206【サードウェア】drbdで実現する高可用性システムと災害対策A8 150206【サードウェア】drbdで実現する高可用性システムと災害対策
A8 150206【サードウェア】drbdで実現する高可用性システムと災害対策
 
はじパタ2章
はじパタ2章はじパタ2章
はじパタ2章
 
アプリの「無事故リリース」を目指して~品質管理部によるSmartBeat活用事例~
アプリの「無事故リリース」を目指して~品質管理部によるSmartBeat活用事例~ アプリの「無事故リリース」を目指して~品質管理部によるSmartBeat活用事例~
アプリの「無事故リリース」を目指して~品質管理部によるSmartBeat活用事例~
 
Kansumi2013 tamagawa
Kansumi2013 tamagawaKansumi2013 tamagawa
Kansumi2013 tamagawa
 
JAWS-UG広島 - 2019-07-12 - 金融ビッグデータを守るリソースポリシー実例
JAWS-UG広島 - 2019-07-12 - 金融ビッグデータを守るリソースポリシー実例JAWS-UG広島 - 2019-07-12 - 金融ビッグデータを守るリソースポリシー実例
JAWS-UG広島 - 2019-07-12 - 金融ビッグデータを守るリソースポリシー実例
 
20131031 首都大学東京 cloud_computing講演会 講演資料(野上)
20131031 首都大学東京 cloud_computing講演会 講演資料(野上)20131031 首都大学東京 cloud_computing講演会 講演資料(野上)
20131031 首都大学東京 cloud_computing講演会 講演資料(野上)
 
【Interop Tokyo 2016】 初心者でもわかるCisco SDNの概要
【Interop Tokyo 2016】 初心者でもわかるCisco SDNの概要【Interop Tokyo 2016】 初心者でもわかるCisco SDNの概要
【Interop Tokyo 2016】 初心者でもわかるCisco SDNの概要
 
機械学習 - MNIST の次のステップ
機械学習 - MNIST の次のステップ機械学習 - MNIST の次のステップ
機械学習 - MNIST の次のステップ
 

Más de DataWorks Summit/Hadoop Summit

Unleashing the Power of Apache Atlas with Apache Ranger
Unleashing the Power of Apache Atlas with Apache RangerUnleashing the Power of Apache Atlas with Apache Ranger
Unleashing the Power of Apache Atlas with Apache RangerDataWorks Summit/Hadoop Summit
 
Enabling Digital Diagnostics with a Data Science Platform
Enabling Digital Diagnostics with a Data Science PlatformEnabling Digital Diagnostics with a Data Science Platform
Enabling Digital Diagnostics with a Data Science PlatformDataWorks Summit/Hadoop Summit
 
Double Your Hadoop Performance with Hortonworks SmartSense
Double Your Hadoop Performance with Hortonworks SmartSenseDouble Your Hadoop Performance with Hortonworks SmartSense
Double Your Hadoop Performance with Hortonworks SmartSenseDataWorks Summit/Hadoop Summit
 
Building a Large-Scale, Adaptive Recommendation Engine with Apache Flink and ...
Building a Large-Scale, Adaptive Recommendation Engine with Apache Flink and ...Building a Large-Scale, Adaptive Recommendation Engine with Apache Flink and ...
Building a Large-Scale, Adaptive Recommendation Engine with Apache Flink and ...DataWorks Summit/Hadoop Summit
 
Real-Time Anomaly Detection using LSTM Auto-Encoders with Deep Learning4J on ...
Real-Time Anomaly Detection using LSTM Auto-Encoders with Deep Learning4J on ...Real-Time Anomaly Detection using LSTM Auto-Encoders with Deep Learning4J on ...
Real-Time Anomaly Detection using LSTM Auto-Encoders with Deep Learning4J on ...DataWorks Summit/Hadoop Summit
 
Mool - Automated Log Analysis using Data Science and ML
Mool - Automated Log Analysis using Data Science and MLMool - Automated Log Analysis using Data Science and ML
Mool - Automated Log Analysis using Data Science and MLDataWorks Summit/Hadoop Summit
 
The Challenge of Driving Business Value from the Analytics of Things (AOT)
The Challenge of Driving Business Value from the Analytics of Things (AOT)The Challenge of Driving Business Value from the Analytics of Things (AOT)
The Challenge of Driving Business Value from the Analytics of Things (AOT)DataWorks Summit/Hadoop Summit
 
From Regulatory Process Verification to Predictive Maintenance and Beyond wit...
From Regulatory Process Verification to Predictive Maintenance and Beyond wit...From Regulatory Process Verification to Predictive Maintenance and Beyond wit...
From Regulatory Process Verification to Predictive Maintenance and Beyond wit...DataWorks Summit/Hadoop Summit
 

Más de DataWorks Summit/Hadoop Summit (20)

Running Apache Spark & Apache Zeppelin in Production
Running Apache Spark & Apache Zeppelin in ProductionRunning Apache Spark & Apache Zeppelin in Production
Running Apache Spark & Apache Zeppelin in Production
 
State of Security: Apache Spark & Apache Zeppelin
State of Security: Apache Spark & Apache ZeppelinState of Security: Apache Spark & Apache Zeppelin
State of Security: Apache Spark & Apache Zeppelin
 
Unleashing the Power of Apache Atlas with Apache Ranger
Unleashing the Power of Apache Atlas with Apache RangerUnleashing the Power of Apache Atlas with Apache Ranger
Unleashing the Power of Apache Atlas with Apache Ranger
 
Enabling Digital Diagnostics with a Data Science Platform
Enabling Digital Diagnostics with a Data Science PlatformEnabling Digital Diagnostics with a Data Science Platform
Enabling Digital Diagnostics with a Data Science Platform
 
Revolutionize Text Mining with Spark and Zeppelin
Revolutionize Text Mining with Spark and ZeppelinRevolutionize Text Mining with Spark and Zeppelin
Revolutionize Text Mining with Spark and Zeppelin
 
Double Your Hadoop Performance with Hortonworks SmartSense
Double Your Hadoop Performance with Hortonworks SmartSenseDouble Your Hadoop Performance with Hortonworks SmartSense
Double Your Hadoop Performance with Hortonworks SmartSense
 
Hadoop Crash Course
Hadoop Crash CourseHadoop Crash Course
Hadoop Crash Course
 
Data Science Crash Course
Data Science Crash CourseData Science Crash Course
Data Science Crash Course
 
Apache Spark Crash Course
Apache Spark Crash CourseApache Spark Crash Course
Apache Spark Crash Course
 
Dataflow with Apache NiFi
Dataflow with Apache NiFiDataflow with Apache NiFi
Dataflow with Apache NiFi
 
Schema Registry - Set you Data Free
Schema Registry - Set you Data FreeSchema Registry - Set you Data Free
Schema Registry - Set you Data Free
 
Building a Large-Scale, Adaptive Recommendation Engine with Apache Flink and ...
Building a Large-Scale, Adaptive Recommendation Engine with Apache Flink and ...Building a Large-Scale, Adaptive Recommendation Engine with Apache Flink and ...
Building a Large-Scale, Adaptive Recommendation Engine with Apache Flink and ...
 
Real-Time Anomaly Detection using LSTM Auto-Encoders with Deep Learning4J on ...
Real-Time Anomaly Detection using LSTM Auto-Encoders with Deep Learning4J on ...Real-Time Anomaly Detection using LSTM Auto-Encoders with Deep Learning4J on ...
Real-Time Anomaly Detection using LSTM Auto-Encoders with Deep Learning4J on ...
 
Mool - Automated Log Analysis using Data Science and ML
Mool - Automated Log Analysis using Data Science and MLMool - Automated Log Analysis using Data Science and ML
Mool - Automated Log Analysis using Data Science and ML
 
How Hadoop Makes the Natixis Pack More Efficient
How Hadoop Makes the Natixis Pack More Efficient How Hadoop Makes the Natixis Pack More Efficient
How Hadoop Makes the Natixis Pack More Efficient
 
HBase in Practice
HBase in Practice HBase in Practice
HBase in Practice
 
The Challenge of Driving Business Value from the Analytics of Things (AOT)
The Challenge of Driving Business Value from the Analytics of Things (AOT)The Challenge of Driving Business Value from the Analytics of Things (AOT)
The Challenge of Driving Business Value from the Analytics of Things (AOT)
 
Breaking the 1 Million OPS/SEC Barrier in HOPS Hadoop
Breaking the 1 Million OPS/SEC Barrier in HOPS HadoopBreaking the 1 Million OPS/SEC Barrier in HOPS Hadoop
Breaking the 1 Million OPS/SEC Barrier in HOPS Hadoop
 
From Regulatory Process Verification to Predictive Maintenance and Beyond wit...
From Regulatory Process Verification to Predictive Maintenance and Beyond wit...From Regulatory Process Verification to Predictive Maintenance and Beyond wit...
From Regulatory Process Verification to Predictive Maintenance and Beyond wit...
 
Backup and Disaster Recovery in Hadoop
Backup and Disaster Recovery in Hadoop Backup and Disaster Recovery in Hadoop
Backup and Disaster Recovery in Hadoop
 

SEGA : Growth hacking by Spark ML for Mobile games

  • 1. SEGA Games Co., Ltd. SEGA Networks Company SEGA : Growth hacking by Spark ML for Mobile games
  • 2. ◆ 自己紹介 SEGA Games Co., Ltd. SEGA Networks Company 2 村上 宰和(むらかみ ただかず) 所属 株式会社セガゲームス セガネットワークスカンパニー IT統括部 共通基盤開発部 データマイニングセクション 主な業務 ・Hadoopベースのデータ基盤・分析基盤構築 ・直近はSpark MLlibを活用した予測基盤構築 ・業務課題に対する予測活用提案 マイブーム ・畑で野菜栽培 ・コーヒードリッピング、テイスティング ・San Francisco 49ers(NFL)
  • 3. ◆ アジェンダ SEGA Games Co., Ltd. SEGA Networks Company 3 1. Motivation 2. Challenge 3. Case Study 4. Summary 5. Next Challenge
  • 4. 1. Motivation 2. Challenge 3. Case Study 4. Summary 5. Next Challenge SEGA Games Co., Ltd. SEGA Networks Company 4 Motivation 1
  • 5. ◆ モバイルゲームビジネスとは? SEGA Games Co., Ltd. SEGA Networks Company 5 売上 日数 売り切り型ゲーム モバイルゲーム (悪い状態) モバイルゲーム (良い状態)  今までの売り切り型とは異なり、継続的なサービスを提供するビジ ネスモデル  売上も、長期にわたり継続的に確保
  • 7. ◆ ビジネスへの貢献 SEGA Games Co., Ltd. SEGA Networks Company 7 徹底的にデータを駆使して、適切な運営の実現に貢献する あらゆるデータを精査し、これを活用してサービスを成長させる = 【 グロースハック 】
  • 8. ◆ 分析による課題解決 SEGA Games Co., Ltd. SEGA Networks Company 8  まずはデータ分析で解決  具体的には、時系列分析、比較分析、内訳分析等を実施 急に売上が下がってきた! 巻き返したい アクティブユーザが減少している。 歯止めをかけたい イベントの出足が悪い。 途中でてこ入れしたい 前回販売したゲーム内商品が売れ た!次回も売れたい! 売上関連のKPIで時系列的に悪化 トレンドの指標を改善 流出したユーザが属する層を内訳 分析で特定し改善 イベント関連データを内訳分析し、 悪化要因抽出・改善 各商品のデータを様々な軸で比較 し、好調な軸に着目 課題 解決策
  • 9. ◆ 【対症療法】 から 【予防】 へ SEGA Games Co., Ltd. SEGA Networks Company 9 予測に基づく【 予防 】はできないのか? 分析による課題解決は【 対症療法 】
  • 10. 1. Motivation 2. Challenge 3. Case Study 4. Summary 5. Next Challenge Challenge 2 SEGA Games Co., Ltd. SEGA Networks Company 10
  • 11. ◆ 予測によって解決する課題 SEGA Games Co., Ltd. SEGA Networks Company 11 ユーザの特徴を明確化してサー ビス強化点としたい ユーザのゲーム離れを抑止した い 多様な属性のユーザにもゲーム を楽しんで欲しい 売上が立たないタイトルをリ リースしたくない コンテンツのクリック率を向上 させたい クエストバランス調整の属人化 を排除したい 類似ユーザをグループ分けする と特徴が明確になる? ゲームを辞めそうな人を予測し て引き留めると良い? ユーザ属性情報を予測し、属性 毎にサービスすると良い? リリース前に売上予測を行い、 事前に改善できると良い? ユーザ毎に最適なコンテンツ表 示ができると良い? 難易度や報酬等の要因で予測式 が導けると良い? 課題 仮説 1 2 3 4 5 6
  • 12. ◆ Spark MLlibでやってみた! SEGA Games Co., Ltd. SEGA Networks Company 12  予測を実現するために、 Spark MLlibを活用  ユーザ動向データ等を「学習」して、予測能力を獲得 ユーザ動向データ等
  • 13. ◆ Spark MLlibとは? SEGA Games Co., Ltd. SEGA Networks Company 13 種類 用途 分類 要素が該当するカテゴリを推測 回帰 予測計算式を導出して数量を予測 クラスタリング 要素の集合をグループ分けしつつ、要因抽出 協調フィルタリング レコメンデーションを行う  Spark MLlibは、Hadoopのエコシステムの1つであるSparkに付 属するマシンラーニングライブラリ  主に4つの種類・用途がある
  • 14. ◆ 使用したアルゴリズムと選定理由 SEGA Games Co., Ltd. SEGA Networks Company 14  ロジスティック回帰 : 物事が発生する「確率」を予測する用途に最適  K-means : クラスタ数が所与の場合、比較的高速かつ高精度 種類 アルゴリズム 分類 サポートベクタマシン(SVM) デシジョンツリー(Gini Impurity/Entropy/Variance) ナイーブベイズ 回帰 ロジスティック回帰 線形回帰 クラスタリング K-means 混合正規分布モデル(GMM) 潜在的ディリクレ配分法(LDA) 協調フィルタリング 交互最小二乗法(ALS)
  • 15. 1. Motivation 2. Challenge 3. Case Study 4. Summary 5. Next Challenge Case Study 3 SEGA Games Co., Ltd. SEGA Networks Company 15
  • 16. ◆ 予測によって解決した課題 SEGA Games Co., Ltd. SEGA Networks Company 16 ユーザの特徴を明確化してサー ビス強化点としたい ユーザのゲーム離れを抑止した い 多様な属性のユーザにもゲーム を楽しんで欲しい 売上が立たないタイトルをリ リースしたくない コンテンツのクリック率を向上 させたい クエストバランス調整の属人化 を排除したい 類似ユーザをグループ分けする と特徴が明確になる? ゲームを辞めそうな人を予測し て引き留めると良い? ユーザ属性情報を予測し、属性 毎にサービスすると良い? リリース前に売上予測を行い、 事前に改善できると良い? ユーザ毎に最適なコンテンツ表 示ができると良い? 難易度や報酬等の要因で予測式 が導けると良い? 課題 仮説 1 2 3 4 5 6
  • 17. ◆ ケース① ユーザの特徴明確化 SEGA Games Co., Ltd. SEGA Networks Company 17 ユーザの特徴を明確化してサー ビス強化点としたい 類似ユーザをグループ分けする と特徴が明確になる? 課題 仮説 1 Spark MLlibのK-meansアルゴリズムで、ユーザを「類似した」ユー ザ同士で3つのクラスタ(グループ)に分けた ⇒ どの変数(要因)でクラスタが明確に分かれるかを把握 解決策
  • 18. ◆ ケース① ユーザの特徴明確化 SEGA Games Co., Ltd. SEGA Networks Company 18 頻度 値  変数X1、X2、X3においてクラスタが明確に分かれた  ユーザの特徴は、これらの変数で説明可能  ユーザの特徴を把握でき、サービス強化点として考慮できるように なった 変数 X1 変数 X2 変数 X3
  • 19. ◆ ケース② ユーザのゲーム離れを抑止 SEGA Games Co., Ltd. SEGA Networks Company 19 ユーザのゲーム離れを抑止した い ゲームを辞めそうな人を予測し て引き留めると良い? 課題 仮説 2 Spark MLlibのロジスティック回帰アルゴリズムで、ユーザのn日後残 存確率を予測 ⇒ n日後残存確率に応じて、個別のサービスを提供 解決策
  • 20. ◆ ケース② ユーザのゲーム離れを抑止 SEGA Games Co., Ltd. SEGA Networks Company 20  効果計測の指標として、【継続率】を適用  継続率で約20%程度の向上を目指す 継続率(%) 週 対応前 対応後(予定)
  • 21. ◆ ケース② ユーザのゲーム離れを抑止 SEGA Games Co., Ltd. SEGA Networks Company 21  n日後残存確率が High/Middle/Low のどれに該当するかによって、 ユーザをカテゴリ分け n日後残存確率(%) 変数X High Middle Low 実際には残存した 実際には辞めた 予測 実際
  • 22. ◆ ケース② ユーザのゲーム離れを抑止 SEGA Games Co., Ltd. SEGA Networks Company 22  どのカテゴリでも、約10%以内の誤差で、 n日後残存確率の予測が できた! A : n日後残存確率の カテゴリ(= x) A’ : Aの中央値 B : 実際にn日後 に残存した割合 誤差 B – A’ Low (x < 20%) 10% 3.37% -6.63% Middle (20% <= x < 80%) 50% 39.23% -10.77% High (80% <= x) 90% 95.43% 5.43%
  • 23. ◆ ケース② ユーザのゲーム離れを抑止 SEGA Games Co., Ltd. SEGA Networks Company 23 継続率(%) 週 対応後(実際) (わずかに目標(+20%)には届かなかったけど…) 大幅(+15%)な継続率向上が見られた。 ⇒ ユーザのゲーム離れ抑止に効果があった!
  • 24. ◆ ケース③ 多様な属性のユーザも楽しませる SEGA Games Co., Ltd. SEGA Networks Company 24 多様な属性のユーザにもゲーム を楽しんで欲しい ユーザ属性情報を予測し、属性 毎にサービスすると良い? 課題 仮説 3 ※ 今回はユーザの「性別」を予測 Spark MLlibのロジスティック回帰アルゴリ ズムで、ユーザのプレイデータから性別を予 測 ⇒ 予測属性に応じて、個別にサービスを提供 解決策 Event A Event B
  • 25. ◆ ケース③ 多様な属性のユーザも楽しませる SEGA Games Co., Ltd. SEGA Networks Company 25 * GoogleのTensorFlowにて検証。Spark MLlibでは未サポート  いくつかのアルゴリズムを試行し、結果的にロジスティック回帰が 最も高い82%の精度を出した  ユーザの性別を予測し個別にサービスを提供して、どちらの性別の ユーザも楽しませる事ができるようになった アルゴリズム 精度 ロジスティック回帰 82% デシジョンツリー(Gini Impurity) 81% * ディープラーニング(6層) 73% * ニューラルネットワーク(2層) 71%
  • 26. 1. Motivation 2. Challenge 3. Case Study 4. Summary 5. Next Challenge Summary 4 SEGA Games Co., Ltd. SEGA Networks Company 26
  • 27. ◆ まとめ SEGA Games Co., Ltd. SEGA Networks Company 27  Spark MLlibを使って予測したら、みんなに良い事があった  データエンジニアにとっては、難しい予測処理をMLlibに 任せられた  データアナリストにとっては、運営担当者に精度の高い予 測結果を提供できるようになった  運営担当者にとっては、精度の高い予測結果を活用して、 「予防」対応を実施できるようになった  エンドユーザにとっては、自分に合うサービスが増えて、 もっとプレイを継続したい気になれた つまり、みんながHappyになった!!
  • 28. 1. Motivation 2. Challenge 3. Case Study 4. Summary 5. Next Challenge Next Challenge 5 SEGA Games Co., Ltd. SEGA Networks Company 28
  • 29. ◆ 予測によって解決しようとしている課題 SEGA Games Co., Ltd. SEGA Networks Company 29 ユーザの特徴を明確化してサー ビス強化点としたい ユーザのゲーム離れを抑止した い 多様な属性のユーザにもゲーム を楽しんで欲しい 売上が立たないタイトルをリ リースしたくない コンテンツのクリック率を向上 させたい クエストバランス調整の属人化 を排除したい 類似ユーザをグループ分けする と特徴が明確になる? ゲームを辞めそうな人を予測し て引き留めると良い? ユーザ属性情報を予測し、属性 毎にサービスすると良い? リリース前に売上予測を行い、 事前に改善できると良い? ユーザ毎に最適なコンテンツ表 示ができると良い? 難易度や報酬等の要因で予測式 が導けると良い? 課題 仮説 1 2 3 4 5 6
  • 30. ◆ ケース④ 不採算見込タイトルの事前改善 SEGA Games Co., Ltd. SEGA Networks Company 30 売上が立たないタイトルをリ リースしたくない リリース前に売上予測を行い、 事前に改善できると良い? 課題 仮説 4 Spark MLlibの線形回帰アルゴリズムで予測計算式を導出し、一定期 間後の売上高を予測 検討している解決策 売上 日数 now
  • 31. ◆ ケース⑤ コンテンツの認知度向上 SEGA Games Co., Ltd. SEGA Networks Company 31 コンテンツのクリック率を向上 させたい ユーザ毎に最適なコンテンツ表 示ができると良い? 課題 仮説 5 Spark MLlibの交互最小二乗法(ALS)アルゴリズムで、自分に近い嗜 好を持つ他ユーザがクリックしたコンテンツをレコメンド 検討している解決策 A B C C X Y
  • 32. ◆ ケース⑥ クエストバランス調整属人化排除 SEGA Games Co., Ltd. SEGA Networks Company 32 クエストバランス調整の属人化 を排除したい 難易度や報酬等の要因で予測式 が導けると良い? 課題 仮説 6 仮説も検討中
  • 33. ◆ Finally… SEGA Games Co., Ltd. SEGA Networks Company 33 We are hiring!! http://sega-net.com/recruit/  ビッグデータ  マシンラーニング  モバイルゲーム に興味がある  データエンジニア  データアナリスト
  • 34. SEGA Games Co., Ltd. SEGA Networks Company 34 Thank You