Jaws2008 Presen2

ABMによるECサイトのレコメンド
設計の分析
○梅田卓志, 小山友介, 出口弘
東京工業大学大学院総合理工学研究科
umeda07[At]cs.dis.titech.ac.jp
※配布資料とは一部内容が異なります。

1
新田/寺野/出口研合同合宿 ‘08 http://umekoumeda.net/

発表の流れ/目的
• 流れ
1. 目的と方法論
2. モデル
3. シミュレーション設定と結果
4. 結論と今後の課題
5. 参考文献,QA等

• 目的
– レコメンドアルゴリズム他、情報工学がご専門の方
からも、ご意見を伺いたい
– 実験方法、前提、分析、シナリオ等に関して、アドバ
イスいただければと思います。よろしくお願いしま
す。

2

1. 目的と方法論

3

1-1. 背景
日米のEC市場規模(兆円)
180 162 EC市場規模が増加
160 148
140 • 前年比21.7%増
140
120 104
100 92 95
80
60 レコメンド機能を導入する
サイトが増加
40
20
0
2005 2006 2007
カスタマイズの必要性
日本米国 • 個別の市場構造に応じたパラ
メータ設定が必須

4

1-2. レコメンドの分類(1/2)
ルールコンテンベイジア協調フィル
手法タリング
ベースツベースンネット

意図したレ商品毎の
ColdStartに
利点コメンドが設定が不
強い
実施できる要

• ルール設定 • ColdStart問
ルール設が面倒チューニン題
欠点
定が面倒 • 意外性あるグ困難 • 疎なデータ
レコメンドが群への対処
困難

5

1-2. レコメンドの分類(2/2)
• 協調フィルタリング
– メモリベース
• ユーザベース
– モデルベース
• アイテムベース
• ベイジアンネットを用いたアプローチ
– そのほか小技
• SD分解による投票行列の圧縮
• クラスタリングによる縮約

6

1-3. 目的
• ABSを用いたレコメンド評価法の提案
– 市場構造(顧客属性・商品属性)を考慮
– 時系列での市場環境の変化を考慮
– ユーザ間の相互作用があるタイプのレコメンドア
ルゴリズムに対して有用
• 協調ファイルタリング（ユーザベース）の場合
について、実際に分析
– ネイバー数（パラメータ）と市場構造の関係を分
析

7

1-4. 方法論
• ABMを用いたモデル化を行う
レコメン – レコメンド手法のモデル＋顧客や
ド手法商品属性・関係性をモデルに加
モデルえる
• 利点
– 市場構造の考慮：
• 顧客属性, 消費者行動(ex:嗜好の
ABMを用い分布）に応じたレコメンド評価・設計
顧客属たレコメンド • 商品特性(ex: 人気度合い）に応じ
性たレコメンド評価・設計
評価/設計
– 動的な環境変化：
モデル • 市場構造が時系列で変化する場
合
• 新商品の随時追加
• システム導入時の超スパースな
商品属データに対する対応
性 – 容易性：
• 他手法と比較して
• What-If分析等、様々な条件を仮定
した上での分析も可能

8

1-5. 他の方法論との比較

容易性市場構造環境の
動的変化

クロス
バリデーション ○ × ×

被験者実験 × ○ △

ABM ○

9

※ 詳細は、配布資料をご覧ください。

2. モデル

10

2-1. モデルの全体像

商品は、1カテゴリに分類される

消費者顧客購買
モデル推薦
•顧客はカテゴ
リ毎の選好を EC Site
保持購買 • 商品1(カテゴリ1）
•ハフモデル顧客 • 商品2(カテゴリ2)
推薦 • 商品3(カテゴリ3)

購買

顧客推薦
レコメンド
モデル
協調フィルタリング手法
でのレコメンドを実施
11

2-2. 消費者モデル

• W1 : 商品カテゴリを重視する度合い
• W2 : ECサイトからのレコメンドを重視する度合い
• W3 : 商品の販売数・人気度合を重視する度合い
• α：自分が好きなカテゴリの商品ならば1, それ以外は0
• β：t-1期にレコメンドされた商品は1,それ以外は0
• γ : 商品の販売数
• PS’ : まだ購入していない商品の集合
• Roulette(): ルーレット選択

12

2-3. レコメンドモデル

• 重みが最大の商品をレコメンド
• 消費者uについて商品pの重みを計算
– Vip: 消費者iが商品pを購入している場合1,購入し
ていない場合0
– Wu,i: 消費者u,i間の類似度。コサイン距離を用い
て算出。
– NEu : 消費者uと類似度が高い|NE|人の消費者の
集合。|NE| をネイバー数と呼ぶ。

13

2-4. 評価指標

• 各消費者の精度を平均した値を利用
• 時刻tにおける消費者uの精度：
– 購入した商品の中で、消費者uが好きなカテゴリ
の商品の数 / 購入した商品の数

14

ここからは、pptをご覧ください。配布資料とは内容が異なります。

3. シミュレーション結果
• 市場構造1,2 の場合での比較
• トレンド追随型消費者の影響
• 優良顧客（消費者）の影響

15

3-1. シミュレーションの共通設定
• パラメータ設定について
パラメータ名パラメータ値
時間 50期
カテゴリ数 10
商品数 2000
W1,w2,w3 各シナリオにて
市場構造 1 or 2 (後述)

• 実験方法について
– 各シナリオについて10回試行し、各消費者・各時刻で
の平均値・分散値を算出

16

3-2. 嗜好のクラスタ化の影響
市場構造1. 市場構造2.

1 1 1
1 2 3
2 3 ４

1 2 3 2 2 2
1 3 4

カテゴリ1 カテゴリ2 カテゴリ3
に興味がに興味がに興味が
1
ある消費 2
ある消費 3
ある消費各消費者がランダムに2つ
3 3 3
者群者群者群 1 2 4
のカテゴリに興味を持つ

• 嗜好のクラスタ化度合が、レコメンドに、いかなる影響を与えるか？
• 全消費者について、(w1,w2,w3 ) = (0.9, 0.1,0.0)
• 極端な2パターン
17

3-2. 嗜好のクラスタ化の影響(2/2)
市場構造1の精度市場構造2の精度

0.7 0.5
0.45
0.6
0.4
0.5 0.35

0.4 0.3
0.25
0.3
0.2

0.2 0.15
0.1
5349 0.1
4541 5349
37 33 29 4541 0.05
37 33
25 21 29 25
17 0 21 17 0
13 9 13 9
5 5
1 1

sinario1_n5 sinario1_n10 sinario1_n15 sinario1_n20 sinario2_n5 sinario2_n10 sinario2_n15 sinario2_n20

• 嗜好のクラスタ化の有無によらず、ネイバー数=5あたりで精度が最大
•ネイバー数が増加：ノイズを含んでしまう。真に選好が一致している消費者
は、たかだか10人
• 嗜好のクラスタ化が緩む→ 精度が下がる
18

3-3. トレンド追随型消費者の影響(1/2)
•(w1, w2, w3) = ( 0.5, 0.1 , 0.4)
トレンド追随型 •自分の選好にマッチした商品、過去にレコメンドされた商
品の他に、「売れ筋の商品」「人気の商品」を基準に、購
消費者入商品を決定
• 流行に敏感な人

•(w1, w2, w3) = ( 0.9, 0.1 , 0.0)
一般 •自分の選好にマッチした商品、過去にレコメンドされた商
消費者品を基準に、購入商品を決定

• 一般消費者とトレンド追随型消費者が混在した環境
• 購買頻度一定、市場構造2 にて実験
– Ex) 音楽市場。自分の趣味に忠実・ニッチ志向の消費者＋とりあえずオリコン上位に出てき
そうな楽曲をチェックする消費者
• 一般消費者の平均精度を測定

19

3-3. トレンド追随型消費者の影響(2/2)
トレンド追随型消費者 30% トレンド追随型消費者 70%
0.35
0.45

0.4 0.3
0.35
一般消費者の精度

0.25
0.3
0.2 |NE| = 5
0.25
|NE|= 10
0.2 0.15
|NE| = 20
0.15 |NE| = 30
0.1
0.1
0.05
0.05

0 0
1 4 7 10 13 16 19 22 25 28 31 34 37 40 43 46 49 52 1 4 7 10 13 16 19 22 25 28 31 34 37 40 43 46 49 52

• 追随型が一定数以下で存在
– 初期のスパースな環境下で、ネイバー数が大きい方がうまくいく場合がある
– Because:
• 極めて嗜好データが尐ない中で、うまく真の選好が一致した消費者を発見できていない→ネイバー数
が大きいほうが良い
– ミクロでみる必要性
• 追随型が一定以上存在
– 初期のスパースな環境下で、レコメンドが機能しない
– Because:
• ノイズとなる消費者が多すぎる
– 仮にランダムなレコメンドを実施→精度は0.2
20

3-4. 優良顧客の影響(1/3)

優良顧客 •購買頻度 = 0.8
20 %

非優良顧客
•購買頻度 = 0.2
80 %

• (w1,w2,w3) = (0.9, 0.1, 0.0)
• 「尐しの優良顧客」と「大量の優良顧客」が混在し、スパースな環
境
– 「一部の消費者だけが、大量購入」というのは、よくあるパターン

21

市場構造1 市場構造2
0.6 0.45
0.4
0.5
0.35
優良顧客の精度

優良顧客の精度
0.4 0.3 |NE|=5
0.25 |NE|=10
0.3
0.2 |NE|=15
0.2 0.15 |NE|=20
0.1 |NE|=25
0.1
0.05
0 0
1 4 7 10 13 16 19 22 25 28 31 34 37 40 43 46 49 52 1 4 7 10 13 16 19 22 25 28 31 34 37 40 43 46 49 52

• 市場構造1,2 ともに・・
– 初期において、ネイバー数を、やや大きく設定する必要あり
– ネイバー数=5 (通常時に最適なネイバー数）は、初期において
最悪
– Because:
• 大半の消費者が「非優良顧客」であり、今までのシナリオと比較して
も、初期時の投票行列が極めてスパース→ より多くのユーザの購
買履歴を参照する必要性が生じた
22


市場構造1
0.6 市場構造2
0.5
0.5 0.45
非優良顧客の精度

0.4

非優良顧客の精度
0.4
0.35

0.3 |NE|=5
0.3
|NE|=10
0.25
|NE|=15
0.2 0.2
|NE|=20
0.15
0.1 |NE|=25
0.1

0 0.05
1 4 7 10 13 16 19 22 25 28 31 34 37 40 43 46 49 52 0
1 4 7 101316192225283134374043464952

• 常にネイバー数=5が最適
– Because: 非優良顧客の場合、投票行列がスパースな環境下で
多くのユーザのデータを考慮することが、ノイズになりやすい
• 優良顧客と非優良顧客で、最適なネイバー数が異なる

23

4. 結論と今後の課題

24

4-1. 結論
市場構造時期対象ネイバー数

通常時尐

優良顧客,非優良システム導入時優良顧客多
顧客が存在
非優良顧客尐

一定期間以降優良顧客尐

非優良顧客尐

トレンド追随型消システム導入時多
費者が一定以下
にて存在
一定期間以降尐

25

4-1. 結論
• 基本的に、ネイバー数は小さな値の方が良い
が、市場構造によっては異なる場合がある
– トレンド追随型消費者や優良・非優良顧客が存
在する場合には、ネイバー数を大きくした方が良
い場合がある
• 実際のパラメータ調整へ役立てる可能性

26

4-2. 今後の課題
• ミクロデータに対する分析
• 市場構造1,2の中間の場合を想定した分析
• アイテムベース手法の評価

27

Jaws2008 Presen2

Recomendados

Recomendados

Más contenido relacionado

La actualidad más candente

La actualidad más candente (19)

Destacado

Destacado (7)

Jaws2008 Presen2