SlideShare una empresa de Scribd logo
1 de 27
Descargar para leer sin conexión
ABMによるECサイトのレコメンド
        設計の分析
          ○梅田 卓志, 小山友介, 出口弘
        東京工業大学大学院 総合理工学研究科
          umeda07[At]cs.dis.titech.ac.jp
        ※配布資料とは一部内容が異なります。


                                                     1
新田/寺野/出口研合同合宿 ‘08                    http://umekoumeda.net/
発表の流れ/目的
 •   流れ
     1.   目的と方法論
     2.   モデル
     3.   シミュレーション設定と結果
     4.   結論と今後の課題
     5.   参考文献,QA等

 •   目的
     – レコメンドアルゴリズム他、情報工学がご専門の方
       からも、ご意見を伺いたい
     – 実験方法、前提、分析、シナリオ等に関して、アドバ
       イスいただければ と思います。よろしくお願いしま
       す。

                                          2
新田/寺野/出口研合同合宿 ‘08         http://umekoumeda.net/
1. 目的と方法論




                                    3
新田/寺野/出口研合同合宿 ‘08   http://umekoumeda.net/
1-1. 背景
              日米のEC市場規模(兆円)
  180                           162         EC市場規模が増加
  160               148
        140                                 • 前年比21.7%増
  140
  120                                 104
  100         92          95
   80
   60                                       レコメンド機能を導入する
                                            サイトが増加
   40
   20
    0
         2005           2006     2007
                                            カスタマイズの必要性
                   日本     米国                • 個別の市場構造に応じたパラ
                                              メータ設定が必須



                                                                      4
新田/寺野/出口研合同合宿 ‘08                                     http://umekoumeda.net/
1-2. レコメンドの分類(1/2)
           ルール コンテン ベイジア                     協調フィル
  手法                                          タリング
           ベース ツベース ンネット

           意図したレ                               商品毎の
                    ColdStartに
    利点     コメンドが                               設定が不
                       強い
           実施できる                                 要




                    • ルール設定                   • ColdStart問
            ルール設      が面倒        チューニン          題
    欠点
            定が面倒    • 意外性ある       グ困難         • 疎なデータ
                      レコメンドが                    群への対処
                      困難



                                                             5
新田/寺野/出口研合同合宿 ‘08                        http://umekoumeda.net/
1-2. レコメンドの分類(2/2)
 • 協調フィルタリング
   – メモリベース
      • ユーザベース
   – モデルベース
      • アイテムベース
      • ベイジアンネットを用いたアプローチ
   – そのほか小技
      • SD分解による投票行列の圧縮
      • クラスタリングによる縮約



                                            6
新田/寺野/出口研合同合宿 ‘08           http://umekoumeda.net/
1-3. 目的
 • ABSを用いたレコメンド評価法の提案
   – 市場構造(顧客属性・商品属性)を考慮
   – 時系列での市場環境の変化を考慮
   – ユーザ間の相互作用があるタイプのレコメンドア
     ルゴリズムに対して有用
 • 協調ファイルタリング(ユーザベース)の場合
   について、実際に分析
   – ネイバー数(パラメータ)と市場構造の関係を分
     析


                                              7
新田/寺野/出口研合同合宿 ‘08             http://umekoumeda.net/
1-4. 方法論
                       • ABMを用いたモデル化を行う
 レコメン                    – レコメンド手法のモデル+顧客や
 ド手法                       商品属性・関係性をモデルに加
 モデル                       える
                       • 利点
                         – 市場構造の考慮:
                              • 顧客属性, 消費者行動(ex:嗜好の
           ABMを用い               分布)に応じたレコメンド評価・設計
 顧客属       たレコメンド             • 商品特性(ex: 人気度合い)に応じ
  性                             たレコメンド評価・設計
           評価/設計
                         – 動的な環境変化:
             モデル              • 市場構造が時系列で変化する場
                                合
                              • 新商品の随時追加
                              • システム導入時の超スパースな
 商品属                            データに対する対応
  性                      – 容易性:
                              • 他手法と比較して
                              • What-If分析等、様々な条件を仮定
                                した上での分析も可能

                                                        8
新田/寺野/出口研合同合宿 ‘08                       http://umekoumeda.net/
1-5. 他の方法論との比較

                容易性     市場構造   環境の
                               動的変化

     クロス
   バリデーション          ○     ×        ×



   被験者実験            ×     ○        △



     ABM                  ○




                                                9
新田/寺野/出口研合同合宿 ‘08               http://umekoumeda.net/
※ 詳細は、配布資料をご覧ください。

  2. モデル




                                      10
新田/寺野/出口研合同合宿 ‘08      http://umekoumeda.net/
2-1. モデルの全体像

                          商品は、1カテゴリに分類される

 消費者       顧客       購買
 モデル                推薦
•顧客はカテゴ
 リ毎の選好を                    EC Site
   保持               購買   • 商品1(カテゴリ1)
 •ハフモデル   顧客             • 商品2(カテゴリ2)
                    推薦   • 商品3(カテゴリ3)

                    購買

           顧客       推薦
                                     レコメンド
                                      モデル
                               協調フィルタリング手法
                                でのレコメンドを実施
                                                 11
新田/寺野/出口研合同合宿 ‘08                 http://umekoumeda.net/
2-2. 消費者モデル



 •   W1 : 商品カテゴリを重視する度合い
 •   W2 : ECサイトからのレコメンドを重視する度合い
 •   W3 : 商品の販売数・人気度合を重視する度合い
 •   α:自分が好きなカテゴリの商品ならば1, それ以外は0
 •   β:t-1期にレコメンドされた商品は1,それ以外は0
 •   γ : 商品の販売数
 •   PS’ : まだ購入していない商品の集合
 •   Roulette(): ルーレット選択

                                         12
新田/寺野/出口研合同合宿 ‘08         http://umekoumeda.net/
2-3. レコメンドモデル




 • 重みが最大の商品をレコメンド
 • 消費者uについて商品pの重みを計算
    – Vip: 消費者iが商品pを購入している場合1,購入し
      ていない場合0
    – Wu,i: 消費者u,i間の類似度。コサイン距離を用い
      て算出。
    – NEu : 消費者uと類似度が高い|NE|人の消費者の
      集合。|NE| をネイバー数と呼ぶ。

                                          13
新田/寺野/出口研合同合宿 ‘08          http://umekoumeda.net/
2-4. 評価指標



 • 各消費者の精度を平均した値を利用
 • 時刻tにおける消費者uの精度:
   – 購入した商品の中で、消費者uが好きなカテゴリ
     の商品の数 / 購入した商品の数




                                          14
新田/寺野/出口研合同合宿 ‘08          http://umekoumeda.net/
ここからは、pptをご覧ください。配布資料とは内容が異なります。

  3. シミュレーション結果
    • 市場構造1,2 の場合での比較
    • トレンド追随型消費者の影響
    • 優良顧客(消費者)の影響




                                             15
新田/寺野/出口研合同合宿 ‘08             http://umekoumeda.net/
3-1. シミュレーションの共通設定
 • パラメータ設定について
       パラメータ名       パラメータ値
       時間           50期
       カテゴリ数        10
       商品数          2000
       W1,w2,w3     各シナリオにて
       市場構造         1 or 2 (後述)


 • 実験方法について
   – 各シナリオについて10回試行し、各消費者・各時刻で
     の平均値・分散値を算出

                                                 16
新田/寺野/出口研合同合宿 ‘08                 http://umekoumeda.net/
3-2. 嗜好のクラスタ化の影響
  市場構造1.                     市場構造2.

                               1      1        1
    1      2        3
                               2      3        4



    1      2        3          2      2        2
                               1      3        4

 カテゴリ1   カテゴリ2   カテゴリ3
 に興味が    に興味が    に興味が
    1
 ある消費       2
         ある消費       3
                 ある消費       各消費者がランダムに2つ
                              3   3   3
  者群      者群      者群          1   2   4
                            のカテゴリに興味を持つ



 • 嗜好のクラスタ化度合が、レコメンドに、いかなる影響を与えるか?
 • 全消費者について、(w1,w2,w3 ) = (0.9, 0.1,0.0)
 • 極端な2パターン
                                                     17
新田/寺野/出口研合同合宿 ‘08                     http://umekoumeda.net/
3-2. 嗜好のクラスタ化の影響(2/2)
                             市場構造1の精度                                                                 市場構造2の精度

                                                                        0.7                                                                    0.5
                                                                                                                                               0.45
                                                                        0.6
                                                                                                                                               0.4
                                                                        0.5                                                                    0.35

                                                                        0.4                                                                    0.3
                                                                                                                                               0.25
                                                                        0.3
                                                                                                                                               0.2

                                                                        0.2                                                                    0.15
                                                                                                                                               0.1
  5349                                                                  0.1
      4541                                                                    5349
           37   33 29                                                             4541                                                         0.05
                                                                                      37 33
                        25 21                                                                 29 25
                              17                                        0                             21 17                                    0
                                   13 9                                                                       13 9
                                          5                                                                           5
                                               1                                                                          1

       sinario1_n5        sinario1_n10    sinario1_n15   sinario1_n20           sinario2_n5      sinario2_n10        sinario2_n15   sinario2_n20
       sinario1_n25       sinario1_n30    sinario1_n35   sinario1_n40           sinario2_n25     sinario2_n30        sinario2_n35   sinario2_n40
       sinario1_n45       sinario1_n50    sinario1_n60   sinario1_n70           sinario2_n45     sinario2_n50        sinario2_n60   sinario2_n70


 • 嗜好のクラスタ化の有無によらず、ネイバー数=5あたりで精度が最大
    •ネイバー数が増加:ノイズを含んでしまう。真に選好が一致している消費者
    は、たかだか10人
 • 嗜好のクラスタ化が緩む→ 精度が下がる
                                                                                                                                                   18
新田/寺野/出口研合同合宿 ‘08                                                                                                    http://umekoumeda.net/
3-3. トレンド追随型消費者の影響(1/2)
             •(w1, w2, w3) = ( 0.5, 0.1 , 0.4)
トレンド追随型      •自分の選好にマッチした商品、過去にレコメンドされた商
             品の他に、 「売れ筋の商品」「人気の商品」を基準に、購
  消費者        入商品を決定
             • 流行に敏感な人



             •(w1, w2, w3) = ( 0.9, 0.1 , 0.0)
     一般      •自分の選好にマッチした商品、過去にレコメンドされた商
     消費者     品を基準に、購入商品を決定


 •   一般消費者とトレンド追随型消費者が混在した環境
 •   購買頻度一定、市場構造2 にて実験
     – Ex) 音楽市場。自分の趣味に忠実・ニッチ志向の消費者+とりあえずオリコン上位に出てき
       そうな楽曲をチェックする消費者
 •   一般消費者の平均精度を測定


                                                       19
新田/寺野/出口研合同合宿 ‘08                       http://umekoumeda.net/
3-3. トレンド追随型消費者の影響(2/2)
                   トレンド追随型消費者 30%                                                         トレンド追随型消費者 70%
                                                                        0.35
            0.45

             0.4                                                         0.3
            0.35
 一般消費者の精度




                                                                        0.25
             0.3
                                                                         0.2                                                        |NE| = 5
            0.25
                                                                                                                                    |NE|= 10
             0.2                                                        0.15
                                                                                                                                    |NE| = 20
            0.15                                                                                                                    |NE| = 30
                                                                         0.1
             0.1
                                                                        0.05
            0.05

              0                                                           0
                   1 4 7 10 13 16 19 22 25 28 31 34 37 40 43 46 49 52          1 4 7 10 13 16 19 22 25 28 31 34 37 40 43 46 49 52

 •          追随型が一定数以下で存在
              – 初期のスパースな環境下で、ネイバー数が大きい方がうまくいく場合がある
              – Because:
                        •   極めて嗜好データが尐ない中で、うまく真の選好が一致した消費者を発見できていない→ネイバー数
                            が大きいほうが良い
              – ミクロでみる必要性
 •          追随型が一定以上存在
              – 初期のスパースな環境下で、レコメンドが機能しない
              – Because:
                        •   ノイズとなる消費者が多すぎる
              – 仮にランダムなレコメンドを実施→精度は0.2
                                                                                                                                                20
新田/寺野/出口研合同合宿 ‘08                                                                                                         http://umekoumeda.net/
3-4. 優良顧客の影響(1/3)

   優良顧客      •購買頻度 = 0.8
    20 %




  非優良顧客
             •購買頻度 = 0.2
    80 %

 • (w1,w2,w3) = (0.9, 0.1, 0.0)
 • 「尐しの優良顧客」と「大量の優良顧客」が混在し、スパースな環
   境
   – 「一部の消費者だけが、大量購入」というのは、よくあるパターン


                                            21
新田/寺野/出口研合同合宿 ‘08            http://umekoumeda.net/
3-5. 優良顧客の影響(2/3)
                               市場構造1                                                                      市場構造2
          0.6                                                                  0.45
                                                                                0.4
          0.5
                                                                               0.35
優良顧客の精度




                                                                     優良顧客の精度
          0.4                                                                   0.3                                                        |NE|=5
                                                                               0.25                                                        |NE|=10
          0.3
                                                                                0.2                                                        |NE|=15
          0.2                                                                  0.15                                                        |NE|=20
                                                                                0.1                                                        |NE|=25
          0.1
                                                                               0.05
           0                                                                     0
                1 4 7 10 13 16 19 22 25 28 31 34 37 40 43 46 49 52                    1 4 7 10 13 16 19 22 25 28 31 34 37 40 43 46 49 52



          • 市場構造1,2 ともに・・
                 – 初期において、ネイバー数を、やや大きく設定する必要あり
                 – ネイバー数=5 (通常時に最適なネイバー数)は、初期において
                   最悪
                 – Because:
                        • 大半の消費者が「非優良顧客」であり、今までのシナリオと比較して
                          も、初期時の投票行列が極めてスパース→ より多くのユーザの購
                          買履歴を参照する必要性が生じた
                                                                                                                                                     22

新田/寺野/出口研合同合宿 ‘08                                                                                                     http://umekoumeda.net/
3-5. 優良顧客の影響(3/3)
                            市場構造1
            0.6                                                                                     市場構造2
                                                                                   0.5
            0.5                                                                   0.45
 非優良顧客の精度




                                                                                   0.4




                                                                       非優良顧客の精度
            0.4
                                                                                  0.35

                                                                                   0.3                                          |NE|=5
            0.3
                                                                                                                                |NE|=10
                                                                                  0.25
                                                                                                                                |NE|=15
            0.2                                                                    0.2
                                                                                                                                |NE|=20
                                                                                  0.15
            0.1                                                                                                                 |NE|=25
                                                                                   0.1

             0                                                                    0.05
                  1 4 7 10 13 16 19 22 25 28 31 34 37 40 43 46 49 52                0
                                                                                         1 4 7 101316192225283134374043464952

 • 常にネイバー数=5が最適
              – Because: 非優良顧客の場合、投票行列がスパースな環境下で
                多くのユーザのデータを考慮することが、ノイズになりやすい
 • 優良顧客と非優良顧客で、最適なネイバー数が異なる

                                                                                                                                23
新田/寺野/出口研合同合宿 ‘08                                                                                            http://umekoumeda.net/
4. 結論と今後の課題




                                   24
新田/寺野/出口研合同合宿 ‘08   http://umekoumeda.net/
4-1. 結論
   市場構造       時期        対象      ネイバー数

   通常時                          尐

   優良顧客,非優良 システム導入時     優良顧客    多
   顧客が存在
                        非優良顧客   尐

              一定期間以降    優良顧客    尐

                        非優良顧客   尐

   トレンド追随型消   システム導入時           多
   費者が一定以下
   にて存在
              一定期間以降            尐




                                                   25
新田/寺野/出口研合同合宿 ‘08                   http://umekoumeda.net/
4-1. 結論
 • 基本的に、ネイバー数は小さな値の方が良い
   が、市場構造によっては異なる場合がある
   – トレンド追随型消費者や優良・非優良顧客が存
     在する場合には、ネイバー数を大きくした方が良
     い場合がある
 • 実際のパラメータ調整へ役立てる可能性




                                             26
新田/寺野/出口研合同合宿 ‘08             http://umekoumeda.net/
4-2. 今後の課題
 • ミクロデータに対する分析
 • 市場構造1,2の中間の場合を想定した分析
 • アイテムベース手法の評価




                                          27
新田/寺野/出口研合同合宿 ‘08          http://umekoumeda.net/

Más contenido relacionado

La actualidad más candente

【12-E-2】 SEC流品質作りこみESQR 組込みソフトウェア開発向け品質作り込みガイドの紹介
【12-E-2】 SEC流品質作りこみESQR 組込みソフトウェア開発向け品質作り込みガイドの紹介【12-E-2】 SEC流品質作りこみESQR 組込みソフトウェア開発向け品質作り込みガイドの紹介
【12-E-2】 SEC流品質作りこみESQR 組込みソフトウェア開発向け品質作り込みガイドの紹介
devsumi2009
 
Hr 017 社會新鮮人生涯規劃
Hr 017 社會新鮮人生涯規劃Hr 017 社會新鮮人生涯規劃
Hr 017 社會新鮮人生涯規劃
handbook
 
【13-C-6】 帳票開発に時間かけすぎていませんか?~もっと簡単に「作る」現場、「使う」現場の最適解を探る~
【13-C-6】 帳票開発に時間かけすぎていませんか?~もっと簡単に「作る」現場、「使う」現場の最適解を探る~【13-C-6】 帳票開発に時間かけすぎていませんか?~もっと簡単に「作る」現場、「使う」現場の最適解を探る~
【13-C-6】 帳票開発に時間かけすぎていませんか?~もっと簡単に「作る」現場、「使う」現場の最適解を探る~
devsumi2009
 

La actualidad más candente (19)

Persona design method / ペルソナ概論
Persona design method / ペルソナ概論Persona design method / ペルソナ概論
Persona design method / ペルソナ概論
 
12-E-3 カードゲームでプロマネ疑似体験
12-E-3 カードゲームでプロマネ疑似体験12-E-3 カードゲームでプロマネ疑似体験
12-E-3 カードゲームでプロマネ疑似体験
 
5 13 Internet
5 13 Internet5 13 Internet
5 13 Internet
 
【12-E-2】 SEC流品質作りこみESQR 組込みソフトウェア開発向け品質作り込みガイドの紹介
【12-E-2】 SEC流品質作りこみESQR 組込みソフトウェア開発向け品質作り込みガイドの紹介【12-E-2】 SEC流品質作りこみESQR 組込みソフトウェア開発向け品質作り込みガイドの紹介
【12-E-2】 SEC流品質作りこみESQR 組込みソフトウェア開発向け品質作り込みガイドの紹介
 
Hr 017 社會新鮮人生涯規劃
Hr 017 社會新鮮人生涯規劃Hr 017 社會新鮮人生涯規劃
Hr 017 社會新鮮人生涯規劃
 
勉強会カンファレンス2009 IT勉強会カレンダーと募集ツール
勉強会カンファレンス2009 IT勉強会カレンダーと募集ツール勉強会カンファレンス2009 IT勉強会カレンダーと募集ツール
勉強会カンファレンス2009 IT勉強会カレンダーと募集ツール
 
PFI会社案内
PFI会社案内PFI会社案内
PFI会社案内
 
2009年4月8日セミナー 2.Sedue新機能
2009年4月8日セミナー 2.Sedue新機能2009年4月8日セミナー 2.Sedue新機能
2009年4月8日セミナー 2.Sedue新機能
 
5 20web1
5 20web15 20web1
5 20web1
 
入門啟示錄Ch07簡報
入門啟示錄Ch07簡報入門啟示錄Ch07簡報
入門啟示錄Ch07簡報
 
2009年4月8日セミナー 1.オープニング
2009年4月8日セミナー 1.オープニング2009年4月8日セミナー 1.オープニング
2009年4月8日セミナー 1.オープニング
 
【13-C-6】 帳票開発に時間かけすぎていませんか?~もっと簡単に「作る」現場、「使う」現場の最適解を探る~
【13-C-6】 帳票開発に時間かけすぎていませんか?~もっと簡単に「作る」現場、「使う」現場の最適解を探る~【13-C-6】 帳票開発に時間かけすぎていませんか?~もっと簡単に「作る」現場、「使う」現場の最適解を探る~
【13-C-6】 帳票開発に時間かけすぎていませんか?~もっと簡単に「作る」現場、「使う」現場の最適解を探る~
 
2009年4月8日セミナー 4.レコメンデーション Q&A
2009年4月8日セミナー 4.レコメンデーション Q&A2009年4月8日セミナー 4.レコメンデーション Q&A
2009年4月8日セミナー 4.レコメンデーション Q&A
 
4 22blog
4 22blog4 22blog
4 22blog
 
Medical Education Japan
Medical Education JapanMedical Education Japan
Medical Education Japan
 
2009年4月8日セミナー 3.SSD向け全文検索エンジン
2009年4月8日セミナー 3.SSD向け全文検索エンジン2009年4月8日セミナー 3.SSD向け全文検索エンジン
2009年4月8日セミナー 3.SSD向け全文検索エンジン
 
enNetforum Fukuoka Panelist
enNetforum Fukuoka PanelistenNetforum Fukuoka Panelist
enNetforum Fukuoka Panelist
 
入門啟示錄Ch08簡報
入門啟示錄Ch08簡報入門啟示錄Ch08簡報
入門啟示錄Ch08簡報
 
25000社以上採用計測ソリューション
25000社以上採用計測ソリューション25000社以上採用計測ソリューション
25000社以上採用計測ソリューション
 

Destacado

Summerseminar 2007
Summerseminar 2007Summerseminar 2007
Summerseminar 2007
umekoumeda
 
夏ゼミプレゼン 4xp
夏ゼミプレゼン 4xp夏ゼミプレゼン 4xp
夏ゼミプレゼン 4xp
umekoumeda
 
Self Introduction
Self IntroductionSelf Introduction
Self Introduction
umekoumeda
 

Destacado (7)

Summerseminar 2007
Summerseminar 2007Summerseminar 2007
Summerseminar 2007
 
夏ゼミプレゼン 4xp
夏ゼミプレゼン 4xp夏ゼミプレゼン 4xp
夏ゼミプレゼン 4xp
 
Video Recommender in Viki (VikiでのVideoレコメンド事例)
Video Recommender in Viki (VikiでのVideoレコメンド事例)Video Recommender in Viki (VikiでのVideoレコメンド事例)
Video Recommender in Viki (VikiでのVideoレコメンド事例)
 
【DBDA勉強会2013】Doing Bayesian Data Analysis Chapter 8: Inferring Two Binomial P...
【DBDA勉強会2013】Doing Bayesian Data Analysis Chapter 8: Inferring Two Binomial P...【DBDA勉強会2013】Doing Bayesian Data Analysis Chapter 8: Inferring Two Binomial P...
【DBDA勉強会2013】Doing Bayesian Data Analysis Chapter 8: Inferring Two Binomial P...
 
【DBDA勉強会2013】Doing Bayesian Data Analysis Chapter 16: Metric Predicted Variab...
【DBDA勉強会2013】Doing Bayesian Data Analysis Chapter 16: Metric Predicted Variab...【DBDA勉強会2013】Doing Bayesian Data Analysis Chapter 16: Metric Predicted Variab...
【DBDA勉強会2013】Doing Bayesian Data Analysis Chapter 16: Metric Predicted Variab...
 
夏ゼミプレゼン 4xp
夏ゼミプレゼン 4xp夏ゼミプレゼン 4xp
夏ゼミプレゼン 4xp
 
Self Introduction
Self IntroductionSelf Introduction
Self Introduction
 

Jaws2008 Presen2

  • 1. ABMによるECサイトのレコメンド 設計の分析 ○梅田 卓志, 小山友介, 出口弘 東京工業大学大学院 総合理工学研究科 umeda07[At]cs.dis.titech.ac.jp ※配布資料とは一部内容が異なります。 1 新田/寺野/出口研合同合宿 ‘08 http://umekoumeda.net/
  • 2. 発表の流れ/目的 • 流れ 1. 目的と方法論 2. モデル 3. シミュレーション設定と結果 4. 結論と今後の課題 5. 参考文献,QA等 • 目的 – レコメンドアルゴリズム他、情報工学がご専門の方 からも、ご意見を伺いたい – 実験方法、前提、分析、シナリオ等に関して、アドバ イスいただければ と思います。よろしくお願いしま す。 2 新田/寺野/出口研合同合宿 ‘08 http://umekoumeda.net/
  • 3. 1. 目的と方法論 3 新田/寺野/出口研合同合宿 ‘08 http://umekoumeda.net/
  • 4. 1-1. 背景 日米のEC市場規模(兆円) 180 162 EC市場規模が増加 160 148 140 • 前年比21.7%増 140 120 104 100 92 95 80 60 レコメンド機能を導入する サイトが増加 40 20 0 2005 2006 2007 カスタマイズの必要性 日本 米国 • 個別の市場構造に応じたパラ メータ設定が必須 4 新田/寺野/出口研合同合宿 ‘08 http://umekoumeda.net/
  • 5. 1-2. レコメンドの分類(1/2) ルール コンテン ベイジア 協調フィル 手法 タリング ベース ツベース ンネット 意図したレ 商品毎の ColdStartに 利点 コメンドが 設定が不 強い 実施できる 要 • ルール設定 • ColdStart問 ルール設 が面倒 チューニン 題 欠点 定が面倒 • 意外性ある グ困難 • 疎なデータ レコメンドが 群への対処 困難 5 新田/寺野/出口研合同合宿 ‘08 http://umekoumeda.net/
  • 6. 1-2. レコメンドの分類(2/2) • 協調フィルタリング – メモリベース • ユーザベース – モデルベース • アイテムベース • ベイジアンネットを用いたアプローチ – そのほか小技 • SD分解による投票行列の圧縮 • クラスタリングによる縮約 6 新田/寺野/出口研合同合宿 ‘08 http://umekoumeda.net/
  • 7. 1-3. 目的 • ABSを用いたレコメンド評価法の提案 – 市場構造(顧客属性・商品属性)を考慮 – 時系列での市場環境の変化を考慮 – ユーザ間の相互作用があるタイプのレコメンドア ルゴリズムに対して有用 • 協調ファイルタリング(ユーザベース)の場合 について、実際に分析 – ネイバー数(パラメータ)と市場構造の関係を分 析 7 新田/寺野/出口研合同合宿 ‘08 http://umekoumeda.net/
  • 8. 1-4. 方法論 • ABMを用いたモデル化を行う レコメン – レコメンド手法のモデル+顧客や ド手法 商品属性・関係性をモデルに加 モデル える • 利点 – 市場構造の考慮: • 顧客属性, 消費者行動(ex:嗜好の ABMを用い 分布)に応じたレコメンド評価・設計 顧客属 たレコメンド • 商品特性(ex: 人気度合い)に応じ 性 たレコメンド評価・設計 評価/設計 – 動的な環境変化: モデル • 市場構造が時系列で変化する場 合 • 新商品の随時追加 • システム導入時の超スパースな 商品属 データに対する対応 性 – 容易性: • 他手法と比較して • What-If分析等、様々な条件を仮定 した上での分析も可能 8 新田/寺野/出口研合同合宿 ‘08 http://umekoumeda.net/
  • 9. 1-5. 他の方法論との比較 容易性 市場構造 環境の 動的変化 クロス バリデーション ○ × × 被験者実験 × ○ △ ABM ○ 9 新田/寺野/出口研合同合宿 ‘08 http://umekoumeda.net/
  • 10. ※ 詳細は、配布資料をご覧ください。 2. モデル 10 新田/寺野/出口研合同合宿 ‘08 http://umekoumeda.net/
  • 11. 2-1. モデルの全体像 商品は、1カテゴリに分類される 消費者 顧客 購買 モデル 推薦 •顧客はカテゴ リ毎の選好を EC Site 保持 購買 • 商品1(カテゴリ1) •ハフモデル 顧客 • 商品2(カテゴリ2) 推薦 • 商品3(カテゴリ3) 購買 顧客 推薦 レコメンド モデル 協調フィルタリング手法 でのレコメンドを実施 11 新田/寺野/出口研合同合宿 ‘08 http://umekoumeda.net/
  • 12. 2-2. 消費者モデル • W1 : 商品カテゴリを重視する度合い • W2 : ECサイトからのレコメンドを重視する度合い • W3 : 商品の販売数・人気度合を重視する度合い • α:自分が好きなカテゴリの商品ならば1, それ以外は0 • β:t-1期にレコメンドされた商品は1,それ以外は0 • γ : 商品の販売数 • PS’ : まだ購入していない商品の集合 • Roulette(): ルーレット選択 12 新田/寺野/出口研合同合宿 ‘08 http://umekoumeda.net/
  • 13. 2-3. レコメンドモデル • 重みが最大の商品をレコメンド • 消費者uについて商品pの重みを計算 – Vip: 消費者iが商品pを購入している場合1,購入し ていない場合0 – Wu,i: 消費者u,i間の類似度。コサイン距離を用い て算出。 – NEu : 消費者uと類似度が高い|NE|人の消費者の 集合。|NE| をネイバー数と呼ぶ。 13 新田/寺野/出口研合同合宿 ‘08 http://umekoumeda.net/
  • 14. 2-4. 評価指標 • 各消費者の精度を平均した値を利用 • 時刻tにおける消費者uの精度: – 購入した商品の中で、消費者uが好きなカテゴリ の商品の数 / 購入した商品の数 14 新田/寺野/出口研合同合宿 ‘08 http://umekoumeda.net/
  • 15. ここからは、pptをご覧ください。配布資料とは内容が異なります。 3. シミュレーション結果 • 市場構造1,2 の場合での比較 • トレンド追随型消費者の影響 • 優良顧客(消費者)の影響 15 新田/寺野/出口研合同合宿 ‘08 http://umekoumeda.net/
  • 16. 3-1. シミュレーションの共通設定 • パラメータ設定について パラメータ名 パラメータ値 時間 50期 カテゴリ数 10 商品数 2000 W1,w2,w3 各シナリオにて 市場構造 1 or 2 (後述) • 実験方法について – 各シナリオについて10回試行し、各消費者・各時刻で の平均値・分散値を算出 16 新田/寺野/出口研合同合宿 ‘08 http://umekoumeda.net/
  • 17. 3-2. 嗜好のクラスタ化の影響 市場構造1. 市場構造2. 1 1 1 1 2 3 2 3 4 1 2 3 2 2 2 1 3 4 カテゴリ1 カテゴリ2 カテゴリ3 に興味が に興味が に興味が 1 ある消費 2 ある消費 3 ある消費 各消費者がランダムに2つ 3 3 3 者群 者群 者群 1 2 4 のカテゴリに興味を持つ • 嗜好のクラスタ化度合が、レコメンドに、いかなる影響を与えるか? • 全消費者について、(w1,w2,w3 ) = (0.9, 0.1,0.0) • 極端な2パターン 17 新田/寺野/出口研合同合宿 ‘08 http://umekoumeda.net/
  • 18. 3-2. 嗜好のクラスタ化の影響(2/2) 市場構造1の精度 市場構造2の精度 0.7 0.5 0.45 0.6 0.4 0.5 0.35 0.4 0.3 0.25 0.3 0.2 0.2 0.15 0.1 5349 0.1 4541 5349 37 33 29 4541 0.05 37 33 25 21 29 25 17 0 21 17 0 13 9 13 9 5 5 1 1 sinario1_n5 sinario1_n10 sinario1_n15 sinario1_n20 sinario2_n5 sinario2_n10 sinario2_n15 sinario2_n20 sinario1_n25 sinario1_n30 sinario1_n35 sinario1_n40 sinario2_n25 sinario2_n30 sinario2_n35 sinario2_n40 sinario1_n45 sinario1_n50 sinario1_n60 sinario1_n70 sinario2_n45 sinario2_n50 sinario2_n60 sinario2_n70 • 嗜好のクラスタ化の有無によらず、ネイバー数=5あたりで精度が最大 •ネイバー数が増加:ノイズを含んでしまう。真に選好が一致している消費者 は、たかだか10人 • 嗜好のクラスタ化が緩む→ 精度が下がる 18 新田/寺野/出口研合同合宿 ‘08 http://umekoumeda.net/
  • 19. 3-3. トレンド追随型消費者の影響(1/2) •(w1, w2, w3) = ( 0.5, 0.1 , 0.4) トレンド追随型 •自分の選好にマッチした商品、過去にレコメンドされた商 品の他に、 「売れ筋の商品」「人気の商品」を基準に、購 消費者 入商品を決定 • 流行に敏感な人 •(w1, w2, w3) = ( 0.9, 0.1 , 0.0) 一般 •自分の選好にマッチした商品、過去にレコメンドされた商 消費者 品を基準に、購入商品を決定 • 一般消費者とトレンド追随型消費者が混在した環境 • 購買頻度一定、市場構造2 にて実験 – Ex) 音楽市場。自分の趣味に忠実・ニッチ志向の消費者+とりあえずオリコン上位に出てき そうな楽曲をチェックする消費者 • 一般消費者の平均精度を測定 19 新田/寺野/出口研合同合宿 ‘08 http://umekoumeda.net/
  • 20. 3-3. トレンド追随型消費者の影響(2/2) トレンド追随型消費者 30% トレンド追随型消費者 70% 0.35 0.45 0.4 0.3 0.35 一般消費者の精度 0.25 0.3 0.2 |NE| = 5 0.25 |NE|= 10 0.2 0.15 |NE| = 20 0.15 |NE| = 30 0.1 0.1 0.05 0.05 0 0 1 4 7 10 13 16 19 22 25 28 31 34 37 40 43 46 49 52 1 4 7 10 13 16 19 22 25 28 31 34 37 40 43 46 49 52 • 追随型が一定数以下で存在 – 初期のスパースな環境下で、ネイバー数が大きい方がうまくいく場合がある – Because: • 極めて嗜好データが尐ない中で、うまく真の選好が一致した消費者を発見できていない→ネイバー数 が大きいほうが良い – ミクロでみる必要性 • 追随型が一定以上存在 – 初期のスパースな環境下で、レコメンドが機能しない – Because: • ノイズとなる消費者が多すぎる – 仮にランダムなレコメンドを実施→精度は0.2 20 新田/寺野/出口研合同合宿 ‘08 http://umekoumeda.net/
  • 21. 3-4. 優良顧客の影響(1/3) 優良顧客 •購買頻度 = 0.8 20 % 非優良顧客 •購買頻度 = 0.2 80 % • (w1,w2,w3) = (0.9, 0.1, 0.0) • 「尐しの優良顧客」と「大量の優良顧客」が混在し、スパースな環 境 – 「一部の消費者だけが、大量購入」というのは、よくあるパターン 21 新田/寺野/出口研合同合宿 ‘08 http://umekoumeda.net/
  • 22. 3-5. 優良顧客の影響(2/3) 市場構造1 市場構造2 0.6 0.45 0.4 0.5 0.35 優良顧客の精度 優良顧客の精度 0.4 0.3 |NE|=5 0.25 |NE|=10 0.3 0.2 |NE|=15 0.2 0.15 |NE|=20 0.1 |NE|=25 0.1 0.05 0 0 1 4 7 10 13 16 19 22 25 28 31 34 37 40 43 46 49 52 1 4 7 10 13 16 19 22 25 28 31 34 37 40 43 46 49 52 • 市場構造1,2 ともに・・ – 初期において、ネイバー数を、やや大きく設定する必要あり – ネイバー数=5 (通常時に最適なネイバー数)は、初期において 最悪 – Because: • 大半の消費者が「非優良顧客」であり、今までのシナリオと比較して も、初期時の投票行列が極めてスパース→ より多くのユーザの購 買履歴を参照する必要性が生じた 22 新田/寺野/出口研合同合宿 ‘08 http://umekoumeda.net/
  • 23. 3-5. 優良顧客の影響(3/3) 市場構造1 0.6 市場構造2 0.5 0.5 0.45 非優良顧客の精度 0.4 非優良顧客の精度 0.4 0.35 0.3 |NE|=5 0.3 |NE|=10 0.25 |NE|=15 0.2 0.2 |NE|=20 0.15 0.1 |NE|=25 0.1 0 0.05 1 4 7 10 13 16 19 22 25 28 31 34 37 40 43 46 49 52 0 1 4 7 101316192225283134374043464952 • 常にネイバー数=5が最適 – Because: 非優良顧客の場合、投票行列がスパースな環境下で 多くのユーザのデータを考慮することが、ノイズになりやすい • 優良顧客と非優良顧客で、最適なネイバー数が異なる 23 新田/寺野/出口研合同合宿 ‘08 http://umekoumeda.net/
  • 24. 4. 結論と今後の課題 24 新田/寺野/出口研合同合宿 ‘08 http://umekoumeda.net/
  • 25. 4-1. 結論 市場構造 時期 対象 ネイバー数 通常時 尐 優良顧客,非優良 システム導入時 優良顧客 多 顧客が存在 非優良顧客 尐 一定期間以降 優良顧客 尐 非優良顧客 尐 トレンド追随型消 システム導入時 多 費者が一定以下 にて存在 一定期間以降 尐 25 新田/寺野/出口研合同合宿 ‘08 http://umekoumeda.net/
  • 26. 4-1. 結論 • 基本的に、ネイバー数は小さな値の方が良い が、市場構造によっては異なる場合がある – トレンド追随型消費者や優良・非優良顧客が存 在する場合には、ネイバー数を大きくした方が良 い場合がある • 実際のパラメータ調整へ役立てる可能性 26 新田/寺野/出口研合同合宿 ‘08 http://umekoumeda.net/
  • 27. 4-2. 今後の課題 • ミクロデータに対する分析 • 市場構造1,2の中間の場合を想定した分析 • アイテムベース手法の評価 27 新田/寺野/出口研合同合宿 ‘08 http://umekoumeda.net/