Towards a robust modeling of temporal interest change patterns for behavioral targeting
1. Towards a Robust Modeling of
Temporal Interest Change Patterns for
Behavioral Targeting
Mohamed Aly, Sandeep Pandey, Vanja Josifovski, Kuanal Punera
Seeloz Inc.., Santa Clara, CA, USA
Twiter, 1355 Market St, San Francisco, CA 94103
Google Inc., 1600 Amphitheatre Parkway, Mountain View, CA 94103
RelateIQ, Palo Alto, CA, USA
(WWW 2013)
7. PROPOSED APPROACH
- baseline feature weighting -
◆event特徴量
- Bag of Event
3回訪問しているが異なる日に訪問したのは回訪問しているが異なる日に訪問したのは回訪問しているが異なる日に訪問したのは回訪問しているが異なる日に訪問したのは2日日日日
p,q,rはそれぞれ異なるトピック(はそれぞれ異なるトピック(はそれぞれ異なるトピック(はそれぞれ異なるトピック(sports etc)のページを示す)のページを示す)のページを示す)のページを示す
((((piの添え字の添え字の添え字の添え字iははははi日に訪問したことを示す)日に訪問したことを示す)日に訪問したことを示す)日に訪問したことを示す)
Frequency bag of events
※※※※当該論文の元となっている論文では特徴ベクトルは単純に当該論文の元となっている論文では特徴ベクトルは単純に当該論文の元となっている論文では特徴ベクトルは単純に当該論文の元となっている論文では特徴ベクトルは単純にBoEを各特徴(を各特徴(を各特徴(を各特徴(view, queryなど)について正規化したベクトルなど)について正規化したベクトルなど)について正規化したベクトルなど)について正規化したベクトル
参考)参考)参考)参考)
feature p
(例(例(例(例:page viewに関するに関するに関するに関する
FBoE))))
8. PROPOSED APPROACH
- features: recency of user interests -
◆pの減衰強度特徴量の重みの計算
減衰係数減衰係数減衰係数減衰係数行動特徴量行動特徴量行動特徴量行動特徴量
特徴ベクトル特徴ベクトル特徴ベクトル特徴ベクトルpののののn番目の変数のユー番目の変数のユー番目の変数のユー番目の変数のユー
ザ履歴の最後の行動発生時間ザ履歴の最後の行動発生時間ザ履歴の最後の行動発生時間ザ履歴の最後の行動発生時間
◆行動特徴量pのrecency featureの重み
※※※※tpiは特徴量ベクトルは特徴量ベクトルは特徴量ベクトルは特徴量ベクトルxののののi番目の行動が起きた日付番目の行動が起きた日付番目の行動が起きた日付番目の行動が起きた日付
iはベクトルはベクトルはベクトルはベクトルxののののi番目の変数(行動)番目の変数(行動)番目の変数(行動)番目の変数(行動)
※※※※どのくらい変化したか、の方が重要度高いので次はそれについて見ていくどのくらい変化したか、の方が重要度高いので次はそれについて見ていくどのくらい変化したか、の方が重要度高いので次はそれについて見ていくどのくらい変化したか、の方が重要度高いので次はそれについて見ていく
9. PROPOSED APPROACH
- features: change in user interests -
-Long Term Absolute Interest Change
-Short Term Absolute Interest Change
◆バイアスを避けるため、異なる時間で興味の変化度合いを比較
target timeの一つ前の期間をの一つ前の期間をの一つ前の期間をの一つ前の期間を
表している表している表している表している
特徴特徴特徴特徴pののののi番目の変数の行動番目の変数の行動番目の変数の行動番目の変数の行動
が起きた回数が起きた回数が起きた回数が起きた回数
P-1の期間では起きてない行動の期間では起きてない行動の期間では起きてない行動の期間では起きてない行動
の総和の総和の総和の総和
※※※※差を見るだけでは元々の興味の高さという特徴量が消えてしまうので、割合を見る差を見るだけでは元々の興味の高さという特徴量が消えてしまうので、割合を見る差を見るだけでは元々の興味の高さという特徴量が消えてしまうので、割合を見る差を見るだけでは元々の興味の高さという特徴量が消えてしまうので、割合を見る
ユーザのユーザのユーザのユーザのpについての全行についての全行についての全行についての全行
動履歴の合計動履歴の合計動履歴の合計動履歴の合計
10. PROPOSED APPROACH
- features: change in user interests -
◆Long Term Relative Interest Change
全ユーザ履歴内の全ユーザ履歴内の全ユーザ履歴内の全ユーザ履歴内のpの正規化の正規化の正規化の正規化
された平滑化荷重された平滑化荷重された平滑化荷重された平滑化荷重
期間期間期間期間P-1で起こった特徴量pので起こった特徴量pので起こった特徴量pので起こった特徴量pの
正規化された平滑化加重正規化された平滑化加重正規化された平滑化加重正規化された平滑化加重
11. PROPOSED APPROACH
- features: change in user interests -
◆Short Term Relative Interest Change
P-1ととととP-2の期間は同数であるの期間は同数であるの期間は同数であるの期間は同数である
ことが望ましいが、履歴が短ことが望ましいが、履歴が短ことが望ましいが、履歴が短ことが望ましいが、履歴が短
いユーザもいるので、日の平いユーザもいるので、日の平いユーザもいるので、日の平いユーザもいるので、日の平
均値をとっている均値をとっている均値をとっている均値をとっている
平滑化にはラプラススムー平滑化にはラプラススムー平滑化にはラプラススムー平滑化にはラプラススムー
ジングを使うジングを使うジングを使うジングを使う
((((0値回避)値回避)値回避)値回避)
これがラプラススムージンこれがラプラススムージンこれがラプラススムージンこれがラプラススムージン
グのグのグのグのααααの値(の値(の値(の値(?))))
22. EMPIRICAL ANALYSIS
- analysis and discussion of results -
※※※※d=1.1ででででAUCが最も高いが最も高いが最も高いが最も高い
d=1.1とすればとすればとすればとすれば2週間で週間で週間で週間でweigthが約が約が約が約1/4となるとなるとなるとなる
◆最適な減衰係数の探索
- baselineはd=1
23. EMPIRICAL ANALYSIS
- analysis and discussion of results -
◆異なるperiod sizeでのパフォーマンスの違い
※※※※P=14までの改善効果が大きいまでの改善効果が大きいまでの改善効果が大きいまでの改善効果が大きい
P=28の時点での時点での時点での時点でAUCが下がり始めるが下がり始めるが下がり始めるが下がり始める
これは これは これは これはLaplace smoothingの効果が弱くなってくるからの効果が弱くなってくるからの効果が弱くなってくるからの効果が弱くなってくるから
period size = 7days
24. EMPIRICAL ANALYSIS
- analysis and discussion of results -
◆異なるキャンペーンでの比較
※※※※cosmeticsに関してはいつも買っているアイテムの情報を捨てることになるため過去に関してはいつも買っているアイテムの情報を捨てることになるため過去に関してはいつも買っているアイテムの情報を捨てることになるため過去に関してはいつも買っているアイテムの情報を捨てることになるため過去
データを捨てると不利に働いたデータを捨てると不利に働いたデータを捨てると不利に働いたデータを捨てると不利に働いた
25. EMPIRICAL ANALYSIS
- analysis and discussion of results -
◆各特徴量の影響力
※※※※RecencyととととPositive Long Term Relative Interest Changeの影響は大きいの影響は大きいの影響は大きいの影響は大きい
frequencyととととDecayed Intensityの影響は小さいの影響は小さいの影響は小さいの影響は小さい
frequency