Uplift Modelling 入門（1）

Uplift Modelling入門(1)
- 費用対効果の最大化を目的とした最新データマイニング手法 -

@yokkuns: 里洋平
yohei0511@gmail.com
2012.03.10 第21回Tokyo.R

2012年3月10日土曜日

AGENDA

◆ 自己紹介

◆ Uplift Modellingとは


自己紹介

時系列解析や異常検知などの方法論を
実ビジネスに適用するデータマイニングエンジニア

◆ 名前: 里洋平
◆ ID : yokkuns
◆ 職業:
データマイニングエンジニア
◆ 統計解析パターン認識機械学
習データマイニング NLP 金融工学
などを勉強中


活動例: 勉強会の主催・執筆

Tokyo.R主催

パッケージ本執筆しました！


活動例: 動画レコメンド
閲覧されている動画の情報を用いて
おすすめ動画を表示する


活動例: 市場予測

Web上の情報から市場予測


活動例: 異常検知
Anomaly detection

複数時系列から異常な振る舞いを検知する

C
A
時系列のモデリング複数時系列の異常検知 B

時系列A 時系列A

異常な振る舞い
時系列B

時系列C 時系列B 時系列C

異常な振る舞いの時系列を検出

例1:トラフィック異常検知例2:CM効果のノイズ除去

トラフィックA ケースA
CM効果
トラフィックB ケースB

トラフィックC 調査ケースC

異常な振る舞いをしている異常な振る舞いをしているケースを
トラフィックの原因を調査する除外して、CMの効果を算出する
85

活動例: 時系列解析と異常検知
Anomaly detection

新しいデータと過去時系列モデルの乖離から異常検出

8000.0000
異常スコア推移 3.0000
モデル構築
異常値
◇例 : ARIMAモデル 2.2500

5970.7500 1.5000

0.7500

3941.5000 0

異常スコアの算出
-0.7500

◇例 : 対数損失

1912.2500 -1.5000

-2.2500

-117.0000 -3.0000

t
4/ 週
4/ 1週
4/ 8週
5/ 週
5/ 週
5/ 週
5/ 週
5/ 週
6/ 週
6/ 週
6/ 週
6/ 週
7/ 週
7/ 週
7/ 週
7/ 8週
週
4

25
2
9
16
23
30
6
13
20
27
4
11

25
1
1

1
4/

86

活動例: 時系列解析と影響分析
TV Commercial Eﬀects

時系列的な振る舞いの特徴から各KPIへのCMの影響度を算出
イベン
CM時系列ト

新規
登録

CM ARPP
U

ARPU

各KPIの時系列
その他
外部
継続率
要因

ケース

87


活動例: データマイニングCROSS


Uplift Modellingとは
費用対効果の最大化を目的とした最新のデータマイニング手法
介入による行動変化をモデル化し効果を最大化する

介入による4つの行動パターン
介入を受けた場合の反応

No あまのじゃく無関心

YES テッパン説得可能！

YES No
介入を受けなかった場合の反応


これまでのマーケティングモデル
顧客を有望な顧客とそうでない顧客に分類し
有望な顧客だけをターゲットにする事で費用対効果を向上させる

◆ 浸透モデル
・既に製品を購入した顧客を特徴づけるモデル

◆ 購入モデル
・最近購入した顧客を特徴づけるモデル
・浸透モデルに似てるが、最近の履歴に注目し、顧客の特性の変化を捉える

◆ レスポンスモデル
・マーケティング活動に反応して購入した顧客を特徴づけるモデル


レスポンスモデリング
処置群の反応データを用いて
レスポンスをモデル化し、ターゲットを決める

Training Data 従来のレスポンスモデリング
反応なし反応あり
処置群

処置群分類結果
反応ありの場合
良いターゲット

予測対象


レスポンスモデリングの課題
処置群だけで学習しているため
介入による行動変化を考慮出来ていない


あまのじゃく説得可能！
処置群

処置群
無関心テッパン

分類結果

予測対象


レスポンスモデリングの課題
処置群だけで学習しているため
介入による行動変化を考慮出来ていない

介入しなければ
反応した

処置群

処置群

介入しなくても
反応した分類結果

予測対象


処置群と対照群を用いた学習
処置群と対照群の両方を学習データとする事で
介入による行動変化を捉える

Training Data

処置群

処置群
対照群

説得可能！あまのじゃく
対照群


予測対象


Uplift Modelling
単純な反応あり・反応なしではなく
介入による行動変化をモデル化しターゲットを決める

Training Data Response Uplift Modelling
L R
あまのじゃく
説得可能！
処置群

処置群
無関心

テッパン

分類結果
R の場合
あまのじゃく
対照群

説得可能！良いターゲット
対照群

無関心

テッパン

予測対象


分割基準
行動変化によるレスポンス率増と
その重要性を最大化する分割を行う

L R
あまのじゃく
処置群(T)

説得可能！
無関心

テッパン

UL UR

あまのじゃく
対照群(C)

説得可能！
無関心
テッパン


分割基準

L R
あまのじゃく
処置群(T)

説得可能！
無関心

テッパン

UL UR

あまのじゃく
対照群(C)

説得可能！
無関心
テッパン

◆ 行動変化によるレスポンス率の増分

◆ 重要性 (t統計量の2乗)


分割基準

L R
あまのじゃく
処置群(T)

説得可能！
無関心

テッパン

UL UR

あまのじゃく L
対照群(C)

説得可能！
無関心
テッパン

◆ 行動変化によるレスポンス率の増分

◆ 重要性 (t統計量の2乗) L R


介入による行動変化の定式化
介入による行動変化を
介入効果とグループ効果の相互作用として表現

L R

介入による効果介入による効果
処置群(T)

グループ効果グループ効果
相互作用相互作用

UL UR

対照群(C)


※Cの介入効果 = Lのグループ効果 = CR相互作用 = TL相互作用 = CL相互作用 = 0 とおく

介入による行動変化の推定
相互作用はRグループとLグループの増分の差で推定される

L R

処置群(T)


UL UR

対照群(C)


※Cの介入効果 = Lのグループ効果 = CR相互作用 = TL相互作用 = CL相互作用 = 0 とおく

介入による行動変化の推定値の誤差と重要性
介入による行動変化は回帰係数として算出され
その重要性はt統計量で与えられる
T:1, C:0 R:1, L:0 Xi1Xi2

基準値

介入効果

グループ効果

相互作用

◆ 標準誤差の算出 ◆ t統計量の2乗


Rでの実行は？


Rでの実行は？

まだパッケージが存在しない


Rでの実行は？

まだパッケージが存在しない

iAnalysisと共同開発予定！


謝辞
Uplift Modellingの存在はisseing333さんが教えてくださいました！
ありがとうございます！


次回以降の

発表者・LTを募集しています！


ご清聴ありがとうございました！


以下参考資料


参考資料

◆ t統計量

http://en.wikipedia.org/wiki/T-statistic

◆ 線形回帰

http://ja.wikipedia.org/wiki/%E7%B7%9A
%E5%BD%A2%E5%9B%9E%E5%B8%B0

◆ Real-World Uplift Modelling with Signiﬁcance-Based Uplift Trees

http://stochasticsolutions.com/sbut.html


Uplift Modelling 入門（1）

Recomendados

Recomendados

Más contenido relacionado

La actualidad más candente

La actualidad más candente (20)

Similar a Uplift Modelling 入門（1）

Similar a Uplift Modelling 入門（1） (11)

Más de Yohei Sato

Más de Yohei Sato (19)

Uplift Modelling 入門（1）