SlideShare a Scribd company logo
1 of 20
Download to read offline
Estimating the Effect of Advertisment
by Varian’s approach with R
Shota Yasui
Japan.R 2015-12-05
広告の効果を機械学習を使って推定するという話。
広告の効果をちゃんと推定するのは難しい
どちらの方に多く広告を出稿しますか?
Selection Bias
• マーケターは相性の良さそうなタイミングや場所で多
く出稿する。
• この時単純に売り上げの差分を広告の効果と主張する
のはNG
カリフォル
ニア
アリゾナ
Sales
広告の効果?
Selection Bias
• 効果を推定したい事象がランダムには割り振られていない。
• その事を加味した推定方法を利用しなければ、推定された効果はselection
biasを内包した状態になる。
• こういった状況に対処する為によく使うものが、
• Instrumental Variable Method
• Propensity Score
広告の効果
元々の相性
今回はHal Varianが2014年にBig Data: New Tricks
for Econometricsという論文で提唱したアプロー
チをRでやってみた。
データ
• KaggleのRossmann Store Salesのデータを利
用する。
• ドイツにあるドラッグストア1115店舗の3年
分の売上とそれに関連する店舗の特徴データ。
• このデータの中にPromotionという変数が0 or
1のダミー変数で入ってる
• 今回はこのPromotionの変数が広告であるとい
う仮定を行い分析を進める。
Promotion = 0
モデル学習データ
10 hold cv
Promotion = 0

の比較対象データ
Promotion = 1
の予測対象データ
モデル学習
未学習のデータとしてモデ
ルに投入して予測値を算出。
結
果
1. 比較してみる。
2. Promotion = 1データでの予
測値と実売上の差分を見る。
N=37万
N=32万
N=14万
流れ
学習されたモデルを広告が無い世界での売
り上げを予測してくれるものだと捉える。
モデル
• Gradient Boosting Decision Treeを採用。
• Xgboostパッケージで学習
• 理由は慣れてるから。
• Ntree = 3000 Shrinkage = 0.5 Max.depth = 5
• Log(売上)に対して学習   Log(Sales) = f(Features) +
error
• 10 hold CVでrmseが0.07程度。
Promotion = 0

の比較対象データ
• 横軸がモデルでの予測。
• 縦軸が実際の売上。
※このデータはモデルにとって未知のデータ。
Rmseは0.072
• 事象の構造に変化が無ければ、予測はある程度上手く行く。(右)
• 事象の構造に変化が有れば、予測はずれる。(左)
• データの差が広告のみであるならば、実際の売上の値とモデルの予
測値との乖離が広告の効果であると言える。
• Promotion = 1のデータの予測値とlog(sales)の差の平均は0.46
• この値を対数差分の近似として捉えれば、Promotionの効果は平
均的に売上に対して46%の増加をもたらすと考えられる。
• ただし、Promotion = 1のデータセットとPromotion = 0のデータ
セット間で広告の投下と相関しているような差が発生していなけ
れば・・・
• 例えばクリスマスシーズンは全ての店と全ての年で広告を出して
いる状態なら、クリスマスシーズンのデータはPromotion = 1の
データセットにしか入っていない状態になる。
• 結果この46%の増加の中にはクリスマスシーズンというセレク
ションバイアスが含まれていることになる。
結果のまとめ
+α:広告効果の推定値に対しての学習
• Ntree = 500
• Shrinkage = 0.5
• Max.depth = 5
• Store type
• 曜日
• 商品の品ぞろえ
• 露点
• 競合店との距離
• あたりが広告効果と思われる差分
の“予測には”効いてる。
• こういった要素から広告効果の受
けやすい店舗とかが解
る・・・・・・・かも。
Enjoy!

More Related Content

More from Shota Yasui

Dynamic panel in tokyo r
Dynamic panel in tokyo rDynamic panel in tokyo r
Dynamic panel in tokyo r
Shota Yasui
 

More from Shota Yasui (14)

L 05 bandit with causality-公開版
L 05 bandit with causality-公開版L 05 bandit with causality-公開版
L 05 bandit with causality-公開版
 
Contextual package
Contextual packageContextual package
Contextual package
 
PaperFriday: The selective labels problem
PaperFriday: The selective labels problemPaperFriday: The selective labels problem
PaperFriday: The selective labels problem
 
TokyoR 20180421
TokyoR 20180421TokyoR 20180421
TokyoR 20180421
 
何故あなたの機械学習はビジネスを改善出来ないのか?
何故あなたの機械学習はビジネスを改善出来ないのか?何故あなたの機械学習はビジネスを改善出来ないのか?
何故あなたの機械学習はビジネスを改善出来ないのか?
 
木と電話と選挙(causalTree)
木と電話と選挙(causalTree)木と電話と選挙(causalTree)
木と電話と選挙(causalTree)
 
計量経済学と 機械学習の交差点入り口 (公開用)
計量経済学と 機械学習の交差点入り口 (公開用)計量経済学と 機械学習の交差点入り口 (公開用)
計量経済学と 機械学習の交差点入り口 (公開用)
 
Factorization machines with r
Factorization machines with rFactorization machines with r
Factorization machines with r
 
Prml nn
Prml nnPrml nn
Prml nn
 
Xgboost for share
Xgboost for shareXgboost for share
Xgboost for share
 
重回帰分析で頑張る
重回帰分析で頑張る重回帰分析で頑張る
重回帰分析で頑張る
 
Dynamic panel in tokyo r
Dynamic panel in tokyo rDynamic panel in tokyo r
Dynamic panel in tokyo r
 
Rで部屋探し For slide share
Rで部屋探し For slide shareRで部屋探し For slide share
Rで部屋探し For slide share
 
Salmon cycle
Salmon cycleSalmon cycle
Salmon cycle
 

Recently uploaded

The_Five_Books_Overview_Presentation_2024
The_Five_Books_Overview_Presentation_2024The_Five_Books_Overview_Presentation_2024
The_Five_Books_Overview_Presentation_2024
koheioishi1
 
TokyoTechGraduateExaminationPresentation
TokyoTechGraduateExaminationPresentationTokyoTechGraduateExaminationPresentation
TokyoTechGraduateExaminationPresentation
YukiTerazawa
 

Recently uploaded (7)

The_Five_Books_Overview_Presentation_2024
The_Five_Books_Overview_Presentation_2024The_Five_Books_Overview_Presentation_2024
The_Five_Books_Overview_Presentation_2024
 
生成AIの回答内容の修正を課題としたレポートについて:お茶の水女子大学「授業・研究における生成系AIの活用事例」での講演資料
生成AIの回答内容の修正を課題としたレポートについて:お茶の水女子大学「授業・研究における生成系AIの活用事例」での講演資料生成AIの回答内容の修正を課題としたレポートについて:お茶の水女子大学「授業・研究における生成系AIの活用事例」での講演資料
生成AIの回答内容の修正を課題としたレポートについて:お茶の水女子大学「授業・研究における生成系AIの活用事例」での講演資料
 
TokyoTechGraduateExaminationPresentation
TokyoTechGraduateExaminationPresentationTokyoTechGraduateExaminationPresentation
TokyoTechGraduateExaminationPresentation
 
ゲーム理論 BASIC 演習106 -価格の交渉ゲーム-#ゲーム理論 #gametheory #数学
ゲーム理論 BASIC 演習106 -価格の交渉ゲーム-#ゲーム理論 #gametheory #数学ゲーム理論 BASIC 演習106 -価格の交渉ゲーム-#ゲーム理論 #gametheory #数学
ゲーム理論 BASIC 演習106 -価格の交渉ゲーム-#ゲーム理論 #gametheory #数学
 
2024年度 東京工業大学 工学院 機械系 大学院 修士課程 入試 説明会 資料
2024年度 東京工業大学 工学院 機械系 大学院 修士課程 入試 説明会 資料2024年度 東京工業大学 工学院 機械系 大学院 修士課程 入試 説明会 資料
2024年度 東京工業大学 工学院 機械系 大学院 修士課程 入試 説明会 資料
 
次世代機の製品コンセプトを描く ~未来の機械を創造してみよう~
次世代機の製品コンセプトを描く ~未来の機械を創造してみよう~次世代機の製品コンセプトを描く ~未来の機械を創造してみよう~
次世代機の製品コンセプトを描く ~未来の機械を創造してみよう~
 
東京工業大学 環境・社会理工学院 建築学系 大学院入学入試・進学説明会2024_v2
東京工業大学 環境・社会理工学院 建築学系 大学院入学入試・進学説明会2024_v2東京工業大学 環境・社会理工学院 建築学系 大学院入学入試・進学説明会2024_v2
東京工業大学 環境・社会理工学院 建築学系 大学院入学入試・進学説明会2024_v2
 

Estimating the effect of advertising with Machine learning