More Related Content
More from Shota Yasui (14)
Estimating the effect of advertising with Machine learning
- 13. データ
• KaggleのRossmann Store Salesのデータを利
用する。
• ドイツにあるドラッグストア1115店舗の3年
分の売上とそれに関連する店舗の特徴データ。
• このデータの中にPromotionという変数が0 or
1のダミー変数で入ってる
• 今回はこのPromotionの変数が広告であるとい
う仮定を行い分析を進める。
- 14. Promotion = 0
モデル学習データ
10 hold cv
Promotion = 0
の比較対象データ
Promotion = 1
の予測対象データ
モデル学習
未学習のデータとしてモデ
ルに投入して予測値を算出。
結
果
1. 比較してみる。
2. Promotion = 1データでの予
測値と実売上の差分を見る。
N=37万
N=32万
N=14万
流れ
学習されたモデルを広告が無い世界での売
り上げを予測してくれるものだと捉える。
- 15. モデル
• Gradient Boosting Decision Treeを採用。
• Xgboostパッケージで学習
• 理由は慣れてるから。
• Ntree = 3000 Shrinkage = 0.5 Max.depth = 5
• Log(売上)に対して学習 Log(Sales) = f(Features) +
error
• 10 hold CVでrmseが0.07程度。
- 18. • Promotion = 1のデータの予測値とlog(sales)の差の平均は0.46
• この値を対数差分の近似として捉えれば、Promotionの効果は平
均的に売上に対して46%の増加をもたらすと考えられる。
• ただし、Promotion = 1のデータセットとPromotion = 0のデータ
セット間で広告の投下と相関しているような差が発生していなけ
れば・・・
• 例えばクリスマスシーズンは全ての店と全ての年で広告を出して
いる状態なら、クリスマスシーズンのデータはPromotion = 1の
データセットにしか入っていない状態になる。
• 結果この46%の増加の中にはクリスマスシーズンというセレク
ションバイアスが含まれていることになる。
結果のまとめ
- 19. +α:広告効果の推定値に対しての学習
• Ntree = 500
• Shrinkage = 0.5
• Max.depth = 5
• Store type
• 曜日
• 商品の品ぞろえ
• 露点
• 競合店との距離
• あたりが広告効果と思われる差分
の“予測には”効いてる。
• こういった要素から広告効果の受
けやすい店舗とかが解
る・・・・・・・かも。