Más contenido relacionado
La actualidad más candente (19)
Jaws2008 Presen2
- 1. ABMによるECサイトのレコメンド
設計の分析
○梅田 卓志, 小山友介, 出口弘
東京工業大学大学院 総合理工学研究科
umeda07[At]cs.dis.titech.ac.jp
※配布資料とは一部内容が異なります。
1
新田/寺野/出口研合同合宿 ‘08 http://umekoumeda.net/
- 2. 発表の流れ/目的
• 流れ
1. 目的と方法論
2. モデル
3. シミュレーション設定と結果
4. 結論と今後の課題
5. 参考文献,QA等
• 目的
– レコメンドアルゴリズム他、情報工学がご専門の方
からも、ご意見を伺いたい
– 実験方法、前提、分析、シナリオ等に関して、アドバ
イスいただければ と思います。よろしくお願いしま
す。
2
新田/寺野/出口研合同合宿 ‘08 http://umekoumeda.net/
- 3. 1. 目的と方法論
3
新田/寺野/出口研合同合宿 ‘08 http://umekoumeda.net/
- 4. 1-1. 背景
日米のEC市場規模(兆円)
180 162 EC市場規模が増加
160 148
140 • 前年比21.7%増
140
120 104
100 92 95
80
60 レコメンド機能を導入する
サイトが増加
40
20
0
2005 2006 2007
カスタマイズの必要性
日本 米国 • 個別の市場構造に応じたパラ
メータ設定が必須
4
新田/寺野/出口研合同合宿 ‘08 http://umekoumeda.net/
- 5. 1-2. レコメンドの分類(1/2)
ルール コンテン ベイジア 協調フィル
手法 タリング
ベース ツベース ンネット
意図したレ 商品毎の
ColdStartに
利点 コメンドが 設定が不
強い
実施できる 要
• ルール設定 • ColdStart問
ルール設 が面倒 チューニン 題
欠点
定が面倒 • 意外性ある グ困難 • 疎なデータ
レコメンドが 群への対処
困難
5
新田/寺野/出口研合同合宿 ‘08 http://umekoumeda.net/
- 6. 1-2. レコメンドの分類(2/2)
• 協調フィルタリング
– メモリベース
• ユーザベース
– モデルベース
• アイテムベース
• ベイジアンネットを用いたアプローチ
– そのほか小技
• SD分解による投票行列の圧縮
• クラスタリングによる縮約
6
新田/寺野/出口研合同合宿 ‘08 http://umekoumeda.net/
- 7. 1-3. 目的
• ABSを用いたレコメンド評価法の提案
– 市場構造(顧客属性・商品属性)を考慮
– 時系列での市場環境の変化を考慮
– ユーザ間の相互作用があるタイプのレコメンドア
ルゴリズムに対して有用
• 協調ファイルタリング(ユーザベース)の場合
について、実際に分析
– ネイバー数(パラメータ)と市場構造の関係を分
析
7
新田/寺野/出口研合同合宿 ‘08 http://umekoumeda.net/
- 8. 1-4. 方法論
• ABMを用いたモデル化を行う
レコメン – レコメンド手法のモデル+顧客や
ド手法 商品属性・関係性をモデルに加
モデル える
• 利点
– 市場構造の考慮:
• 顧客属性, 消費者行動(ex:嗜好の
ABMを用い 分布)に応じたレコメンド評価・設計
顧客属 たレコメンド • 商品特性(ex: 人気度合い)に応じ
性 たレコメンド評価・設計
評価/設計
– 動的な環境変化:
モデル • 市場構造が時系列で変化する場
合
• 新商品の随時追加
• システム導入時の超スパースな
商品属 データに対する対応
性 – 容易性:
• 他手法と比較して
• What-If分析等、様々な条件を仮定
した上での分析も可能
8
新田/寺野/出口研合同合宿 ‘08 http://umekoumeda.net/
- 9. 1-5. 他の方法論との比較
容易性 市場構造 環境の
動的変化
クロス
バリデーション ○ × ×
被験者実験 × ○ △
ABM ○
9
新田/寺野/出口研合同合宿 ‘08 http://umekoumeda.net/
- 11. 2-1. モデルの全体像
商品は、1カテゴリに分類される
消費者 顧客 購買
モデル 推薦
•顧客はカテゴ
リ毎の選好を EC Site
保持 購買 • 商品1(カテゴリ1)
•ハフモデル 顧客 • 商品2(カテゴリ2)
推薦 • 商品3(カテゴリ3)
購買
顧客 推薦
レコメンド
モデル
協調フィルタリング手法
でのレコメンドを実施
11
新田/寺野/出口研合同合宿 ‘08 http://umekoumeda.net/
- 12. 2-2. 消費者モデル
• W1 : 商品カテゴリを重視する度合い
• W2 : ECサイトからのレコメンドを重視する度合い
• W3 : 商品の販売数・人気度合を重視する度合い
• α:自分が好きなカテゴリの商品ならば1, それ以外は0
• β:t-1期にレコメンドされた商品は1,それ以外は0
• γ : 商品の販売数
• PS’ : まだ購入していない商品の集合
• Roulette(): ルーレット選択
12
新田/寺野/出口研合同合宿 ‘08 http://umekoumeda.net/
- 13. 2-3. レコメンドモデル
• 重みが最大の商品をレコメンド
• 消費者uについて商品pの重みを計算
– Vip: 消費者iが商品pを購入している場合1,購入し
ていない場合0
– Wu,i: 消費者u,i間の類似度。コサイン距離を用い
て算出。
– NEu : 消費者uと類似度が高い|NE|人の消費者の
集合。|NE| をネイバー数と呼ぶ。
13
新田/寺野/出口研合同合宿 ‘08 http://umekoumeda.net/
- 14. 2-4. 評価指標
• 各消費者の精度を平均した値を利用
• 時刻tにおける消費者uの精度:
– 購入した商品の中で、消費者uが好きなカテゴリ
の商品の数 / 購入した商品の数
14
新田/寺野/出口研合同合宿 ‘08 http://umekoumeda.net/
- 16. 3-1. シミュレーションの共通設定
• パラメータ設定について
パラメータ名 パラメータ値
時間 50期
カテゴリ数 10
商品数 2000
W1,w2,w3 各シナリオにて
市場構造 1 or 2 (後述)
• 実験方法について
– 各シナリオについて10回試行し、各消費者・各時刻で
の平均値・分散値を算出
16
新田/寺野/出口研合同合宿 ‘08 http://umekoumeda.net/
- 17. 3-2. 嗜好のクラスタ化の影響
市場構造1. 市場構造2.
1 1 1
1 2 3
2 3 4
1 2 3 2 2 2
1 3 4
カテゴリ1 カテゴリ2 カテゴリ3
に興味が に興味が に興味が
1
ある消費 2
ある消費 3
ある消費 各消費者がランダムに2つ
3 3 3
者群 者群 者群 1 2 4
のカテゴリに興味を持つ
• 嗜好のクラスタ化度合が、レコメンドに、いかなる影響を与えるか?
• 全消費者について、(w1,w2,w3 ) = (0.9, 0.1,0.0)
• 極端な2パターン
17
新田/寺野/出口研合同合宿 ‘08 http://umekoumeda.net/
- 18. 3-2. 嗜好のクラスタ化の影響(2/2)
市場構造1の精度 市場構造2の精度
0.7 0.5
0.45
0.6
0.4
0.5 0.35
0.4 0.3
0.25
0.3
0.2
0.2 0.15
0.1
5349 0.1
4541 5349
37 33 29 4541 0.05
37 33
25 21 29 25
17 0 21 17 0
13 9 13 9
5 5
1 1
sinario1_n5 sinario1_n10 sinario1_n15 sinario1_n20 sinario2_n5 sinario2_n10 sinario2_n15 sinario2_n20
sinario1_n25 sinario1_n30 sinario1_n35 sinario1_n40 sinario2_n25 sinario2_n30 sinario2_n35 sinario2_n40
sinario1_n45 sinario1_n50 sinario1_n60 sinario1_n70 sinario2_n45 sinario2_n50 sinario2_n60 sinario2_n70
• 嗜好のクラスタ化の有無によらず、ネイバー数=5あたりで精度が最大
•ネイバー数が増加:ノイズを含んでしまう。真に選好が一致している消費者
は、たかだか10人
• 嗜好のクラスタ化が緩む→ 精度が下がる
18
新田/寺野/出口研合同合宿 ‘08 http://umekoumeda.net/
- 19. 3-3. トレンド追随型消費者の影響(1/2)
•(w1, w2, w3) = ( 0.5, 0.1 , 0.4)
トレンド追随型 •自分の選好にマッチした商品、過去にレコメンドされた商
品の他に、 「売れ筋の商品」「人気の商品」を基準に、購
消費者 入商品を決定
• 流行に敏感な人
•(w1, w2, w3) = ( 0.9, 0.1 , 0.0)
一般 •自分の選好にマッチした商品、過去にレコメンドされた商
消費者 品を基準に、購入商品を決定
• 一般消費者とトレンド追随型消費者が混在した環境
• 購買頻度一定、市場構造2 にて実験
– Ex) 音楽市場。自分の趣味に忠実・ニッチ志向の消費者+とりあえずオリコン上位に出てき
そうな楽曲をチェックする消費者
• 一般消費者の平均精度を測定
19
新田/寺野/出口研合同合宿 ‘08 http://umekoumeda.net/
- 20. 3-3. トレンド追随型消費者の影響(2/2)
トレンド追随型消費者 30% トレンド追随型消費者 70%
0.35
0.45
0.4 0.3
0.35
一般消費者の精度
0.25
0.3
0.2 |NE| = 5
0.25
|NE|= 10
0.2 0.15
|NE| = 20
0.15 |NE| = 30
0.1
0.1
0.05
0.05
0 0
1 4 7 10 13 16 19 22 25 28 31 34 37 40 43 46 49 52 1 4 7 10 13 16 19 22 25 28 31 34 37 40 43 46 49 52
• 追随型が一定数以下で存在
– 初期のスパースな環境下で、ネイバー数が大きい方がうまくいく場合がある
– Because:
• 極めて嗜好データが尐ない中で、うまく真の選好が一致した消費者を発見できていない→ネイバー数
が大きいほうが良い
– ミクロでみる必要性
• 追随型が一定以上存在
– 初期のスパースな環境下で、レコメンドが機能しない
– Because:
• ノイズとなる消費者が多すぎる
– 仮にランダムなレコメンドを実施→精度は0.2
20
新田/寺野/出口研合同合宿 ‘08 http://umekoumeda.net/
- 21. 3-4. 優良顧客の影響(1/3)
優良顧客 •購買頻度 = 0.8
20 %
非優良顧客
•購買頻度 = 0.2
80 %
• (w1,w2,w3) = (0.9, 0.1, 0.0)
• 「尐しの優良顧客」と「大量の優良顧客」が混在し、スパースな環
境
– 「一部の消費者だけが、大量購入」というのは、よくあるパターン
21
新田/寺野/出口研合同合宿 ‘08 http://umekoumeda.net/
- 22. 3-5. 優良顧客の影響(2/3)
市場構造1 市場構造2
0.6 0.45
0.4
0.5
0.35
優良顧客の精度
優良顧客の精度
0.4 0.3 |NE|=5
0.25 |NE|=10
0.3
0.2 |NE|=15
0.2 0.15 |NE|=20
0.1 |NE|=25
0.1
0.05
0 0
1 4 7 10 13 16 19 22 25 28 31 34 37 40 43 46 49 52 1 4 7 10 13 16 19 22 25 28 31 34 37 40 43 46 49 52
• 市場構造1,2 ともに・・
– 初期において、ネイバー数を、やや大きく設定する必要あり
– ネイバー数=5 (通常時に最適なネイバー数)は、初期において
最悪
– Because:
• 大半の消費者が「非優良顧客」であり、今までのシナリオと比較して
も、初期時の投票行列が極めてスパース→ より多くのユーザの購
買履歴を参照する必要性が生じた
22
新田/寺野/出口研合同合宿 ‘08 http://umekoumeda.net/
- 23. 3-5. 優良顧客の影響(3/3)
市場構造1
0.6 市場構造2
0.5
0.5 0.45
非優良顧客の精度
0.4
非優良顧客の精度
0.4
0.35
0.3 |NE|=5
0.3
|NE|=10
0.25
|NE|=15
0.2 0.2
|NE|=20
0.15
0.1 |NE|=25
0.1
0 0.05
1 4 7 10 13 16 19 22 25 28 31 34 37 40 43 46 49 52 0
1 4 7 101316192225283134374043464952
• 常にネイバー数=5が最適
– Because: 非優良顧客の場合、投票行列がスパースな環境下で
多くのユーザのデータを考慮することが、ノイズになりやすい
• 優良顧客と非優良顧客で、最適なネイバー数が異なる
23
新田/寺野/出口研合同合宿 ‘08 http://umekoumeda.net/
- 24. 4. 結論と今後の課題
24
新田/寺野/出口研合同合宿 ‘08 http://umekoumeda.net/
- 25. 4-1. 結論
市場構造 時期 対象 ネイバー数
通常時 尐
優良顧客,非優良 システム導入時 優良顧客 多
顧客が存在
非優良顧客 尐
一定期間以降 優良顧客 尐
非優良顧客 尐
トレンド追随型消 システム導入時 多
費者が一定以下
にて存在
一定期間以降 尐
25
新田/寺野/出口研合同合宿 ‘08 http://umekoumeda.net/
- 26. 4-1. 結論
• 基本的に、ネイバー数は小さな値の方が良い
が、市場構造によっては異なる場合がある
– トレンド追随型消費者や優良・非優良顧客が存
在する場合には、ネイバー数を大きくした方が良
い場合がある
• 実際のパラメータ調整へ役立てる可能性
26
新田/寺野/出口研合同合宿 ‘08 http://umekoumeda.net/
- 27. 4-2. 今後の課題
• ミクロデータに対する分析
• 市場構造1,2の中間の場合を想定した分析
• アイテムベース手法の評価
27
新田/寺野/出口研合同合宿 ‘08 http://umekoumeda.net/