SlideShare una empresa de Scribd logo
1 de 7
Descargar para leer sin conexión
Contrasting Offline and Online Results
when Evaluating Recommendation
Algorithms
神嶌 敏弘
RecSys2016勉強会
1
概要
2
推薦システムはオフラインでホールドアウトデータに対して評価され
ることが一般的だが,その結果はオンライン評価と異なるという報告
↓
既存研究では,オフライン・オンライン評価で利用者が違っていたの
で,同一利用者集団での評価を試みる
研究課題
1. 利用者中心評価での相対順位を,オフラインの予測精度に基づくア
ルゴリズムによって予測できるか?
2. ロングテールアイテムに対する予測精度のオフラインの評価尺度に
基づく順位は,利用者中心の評価のそれと同等か?
3. 利用者中心評価における推薦の効用をオフライン評価尺度で予測で
きるか?
データと被験者
3
Movielens 1M データの映画に詳細情報を付加した自作サイト
オフライン評価:被験者は大学のメーリングリストで募集,241人
が平均137件のフィードバック

→ 4種類のアルゴリズムを訓練
オンライン評価:4種のアルゴリズムの推薦結果を一つのリストに集
約し映画情報と共に提示

→ 100人が全アイテムについて見たいと思うかなどを回答
比較手法
4
POP:最も人気のあるものを推薦するベースライン手法.利用者個
人の嗜好は無視
MF80:[12]の行列分解,因子数 80,オフラインの評価は最もよい
MF400:[2] に基づき,因子数を400に増やしてロングテールアイ
テムを対象にした行列分解
I2ICF:[10] のアイテムベースのメモリベース手法.他のアルゴリズ
ムとは異なった推薦の傾向
全アイテムについての評価
5
オフラインで統計的に有意な差が観測されても,それをオンライン
の結果を確認することはできなかった
	 	 	
MF400 MF80
POP I2I
p = 0.05 p = 0.05 p = 0.05
MF80 MF400
POP I2I
p = 0.05 p = 0.05 p = 0.1
Algorithm Offline Online
I2I 0.438 0.546
MF80 0.504 0.598
MF400 0.454 0.604
POP 0.340 0.516
Offline	precision	all	items
Online	precision	all	items
勝ってる方から
負けてる方に矢印
ロングテールアイテムに対する評価
6
オンラインとオフラインで結果は一致
オフラインでは,MF80のロングテールへの精度は,MF400 や
I2ICF よりずっと悪く,データ全体での評価とは大きく異なる	 	 	
MF80
MF400
POP
I2I
p = 0.05
p = 0.05
p = 0.05
p = 0.05
p = 0.05
p = 0.05
Offline	=	Online	precision	long	tail	items
Algorithm Offline Online
I2I 0.280 0.356
MF80 0.018 0.054
MF400 0.360 0.628
POP 0.000 0.000
有用性の比較
7
オフライン評価で良かったMF80が,有用な推薦では有意に悪い
まだ知らなくて適合するアイテムを推薦したとき有用と見なす
	 	 	
MF400I2I
POP
p = 0.05 p = 0.05
MF80
p = 0.05 p = 0.05
p = 0.05
Useful	recommendations
Algorithm Online
I2I 0.126
MF80 0.082
MF400 0.116
POP 0.026

Más contenido relacionado

Destacado

アプリデザインのお勉強 UI/UXのお話
アプリデザインのお勉強 UI/UXのお話アプリデザインのお勉強 UI/UXのお話
アプリデザインのお勉強 UI/UXのお話shinta rock
 
少し未来のコードレビュー
少し未来のコードレビュー少し未来のコードレビュー
少し未来のコードレビューzaru sakuraba
 
WEBページを表示するまで
WEBページを表示するまでWEBページを表示するまで
WEBページを表示するまでShoichi Kakizaki
 
ほんわかSwift勉強資料
ほんわかSwift勉強資料ほんわかSwift勉強資料
ほんわかSwift勉強資料kouhei kawamata
 
非エンジニア向けHTML勉強会その1
非エンジニア向けHTML勉強会その1非エンジニア向けHTML勉強会その1
非エンジニア向けHTML勉強会その1Karino Kyohei
 
0528 kanntigai ui_ux
0528 kanntigai ui_ux0528 kanntigai ui_ux
0528 kanntigai ui_uxSaori Matsui
 
OpenOpt の線形計画で圧縮センシング
OpenOpt の線形計画で圧縮センシングOpenOpt の線形計画で圧縮センシング
OpenOpt の線形計画で圧縮センシングToshihiro Kamishima
 
Pythonによる機械学習実験の管理
Pythonによる機械学習実験の管理Pythonによる機械学習実験の管理
Pythonによる機械学習実験の管理Toshihiro Kamishima
 
Hadoop x spark x 機械学習を利用した実践的活用術 最新
Hadoop x spark x 機械学習を利用した実践的活用術 最新Hadoop x spark x 機械学習を利用した実践的活用術 最新
Hadoop x spark x 機械学習を利用した実践的活用術 最新NHN テコラス株式会社
 
科学技術計算関連Pythonパッケージの概要
科学技術計算関連Pythonパッケージの概要科学技術計算関連Pythonパッケージの概要
科学技術計算関連Pythonパッケージの概要Toshihiro Kamishima
 
Omnichannel CE Index 2016 - Retailers Are You Leading Or Lagging
Omnichannel CE Index 2016 - Retailers Are You Leading Or LaggingOmnichannel CE Index 2016 - Retailers Are You Leading Or Lagging
Omnichannel CE Index 2016 - Retailers Are You Leading Or LaggingJennifer T. Lee
 
How Travel Companies Can Improve Mobile Advertising & Call Center Performance
How Travel Companies Can Improve Mobile Advertising & Call Center PerformanceHow Travel Companies Can Improve Mobile Advertising & Call Center Performance
How Travel Companies Can Improve Mobile Advertising & Call Center PerformanceJohn Busby
 
Omnichannel: The Reality of Retail - Prolific North Live 2016
Omnichannel: The Reality of Retail - Prolific North Live 2016Omnichannel: The Reality of Retail - Prolific North Live 2016
Omnichannel: The Reality of Retail - Prolific North Live 2016PushON Ltd
 
GrowCommerce 2016 — Shopping Apps: A Deep Dive into Mobile User Acquisition T...
GrowCommerce 2016 — Shopping Apps: A Deep Dive into Mobile User Acquisition T...GrowCommerce 2016 — Shopping Apps: A Deep Dive into Mobile User Acquisition T...
GrowCommerce 2016 — Shopping Apps: A Deep Dive into Mobile User Acquisition T...Grow.co
 
Online and Offline Marketing: How To Connect the Dots - Fort Wayne Social Med...
Online and Offline Marketing: How To Connect the Dots - Fort Wayne Social Med...Online and Offline Marketing: How To Connect the Dots - Fort Wayne Social Med...
Online and Offline Marketing: How To Connect the Dots - Fort Wayne Social Med...Cirrus ABS
 

Destacado (15)

アプリデザインのお勉強 UI/UXのお話
アプリデザインのお勉強 UI/UXのお話アプリデザインのお勉強 UI/UXのお話
アプリデザインのお勉強 UI/UXのお話
 
少し未来のコードレビュー
少し未来のコードレビュー少し未来のコードレビュー
少し未来のコードレビュー
 
WEBページを表示するまで
WEBページを表示するまでWEBページを表示するまで
WEBページを表示するまで
 
ほんわかSwift勉強資料
ほんわかSwift勉強資料ほんわかSwift勉強資料
ほんわかSwift勉強資料
 
非エンジニア向けHTML勉強会その1
非エンジニア向けHTML勉強会その1非エンジニア向けHTML勉強会その1
非エンジニア向けHTML勉強会その1
 
0528 kanntigai ui_ux
0528 kanntigai ui_ux0528 kanntigai ui_ux
0528 kanntigai ui_ux
 
OpenOpt の線形計画で圧縮センシング
OpenOpt の線形計画で圧縮センシングOpenOpt の線形計画で圧縮センシング
OpenOpt の線形計画で圧縮センシング
 
Pythonによる機械学習実験の管理
Pythonによる機械学習実験の管理Pythonによる機械学習実験の管理
Pythonによる機械学習実験の管理
 
Hadoop x spark x 機械学習を利用した実践的活用術 最新
Hadoop x spark x 機械学習を利用した実践的活用術 最新Hadoop x spark x 機械学習を利用した実践的活用術 最新
Hadoop x spark x 機械学習を利用した実践的活用術 最新
 
科学技術計算関連Pythonパッケージの概要
科学技術計算関連Pythonパッケージの概要科学技術計算関連Pythonパッケージの概要
科学技術計算関連Pythonパッケージの概要
 
Omnichannel CE Index 2016 - Retailers Are You Leading Or Lagging
Omnichannel CE Index 2016 - Retailers Are You Leading Or LaggingOmnichannel CE Index 2016 - Retailers Are You Leading Or Lagging
Omnichannel CE Index 2016 - Retailers Are You Leading Or Lagging
 
How Travel Companies Can Improve Mobile Advertising & Call Center Performance
How Travel Companies Can Improve Mobile Advertising & Call Center PerformanceHow Travel Companies Can Improve Mobile Advertising & Call Center Performance
How Travel Companies Can Improve Mobile Advertising & Call Center Performance
 
Omnichannel: The Reality of Retail - Prolific North Live 2016
Omnichannel: The Reality of Retail - Prolific North Live 2016Omnichannel: The Reality of Retail - Prolific North Live 2016
Omnichannel: The Reality of Retail - Prolific North Live 2016
 
GrowCommerce 2016 — Shopping Apps: A Deep Dive into Mobile User Acquisition T...
GrowCommerce 2016 — Shopping Apps: A Deep Dive into Mobile User Acquisition T...GrowCommerce 2016 — Shopping Apps: A Deep Dive into Mobile User Acquisition T...
GrowCommerce 2016 — Shopping Apps: A Deep Dive into Mobile User Acquisition T...
 
Online and Offline Marketing: How To Connect the Dots - Fort Wayne Social Med...
Online and Offline Marketing: How To Connect the Dots - Fort Wayne Social Med...Online and Offline Marketing: How To Connect the Dots - Fort Wayne Social Med...
Online and Offline Marketing: How To Connect the Dots - Fort Wayne Social Med...
 

Más de Toshihiro Kamishima

RecSys2018論文読み会 資料
RecSys2018論文読み会 資料RecSys2018論文読み会 資料
RecSys2018論文読み会 資料Toshihiro Kamishima
 
機械学習研究でのPythonの利用
機械学習研究でのPythonの利用機械学習研究でのPythonの利用
機械学習研究でのPythonの利用Toshihiro Kamishima
 
Considerations on Recommendation Independence for a Find-Good-Items Task
Considerations on Recommendation Independence for a Find-Good-Items TaskConsiderations on Recommendation Independence for a Find-Good-Items Task
Considerations on Recommendation Independence for a Find-Good-Items TaskToshihiro Kamishima
 
Future Directions of Fairness-Aware Data Mining: Recommendation, Causality, a...
Future Directions of Fairness-Aware Data Mining: Recommendation, Causality, a...Future Directions of Fairness-Aware Data Mining: Recommendation, Causality, a...
Future Directions of Fairness-Aware Data Mining: Recommendation, Causality, a...Toshihiro Kamishima
 
Correcting Popularity Bias by Enhancing Recommendation Neutrality
Correcting Popularity Bias by Enhancing Recommendation NeutralityCorrecting Popularity Bias by Enhancing Recommendation Neutrality
Correcting Popularity Bias by Enhancing Recommendation NeutralityToshihiro Kamishima
 
PyMCがあれば,ベイズ推定でもう泣いたりなんかしない
PyMCがあれば,ベイズ推定でもう泣いたりなんかしないPyMCがあれば,ベイズ推定でもう泣いたりなんかしない
PyMCがあれば,ベイズ推定でもう泣いたりなんかしないToshihiro Kamishima
 
The Independence of Fairness-aware Classifiers
The Independence of Fairness-aware ClassifiersThe Independence of Fairness-aware Classifiers
The Independence of Fairness-aware ClassifiersToshihiro Kamishima
 
Efficiency Improvement of Neutrality-Enhanced Recommendation
Efficiency Improvement of Neutrality-Enhanced RecommendationEfficiency Improvement of Neutrality-Enhanced Recommendation
Efficiency Improvement of Neutrality-Enhanced RecommendationToshihiro Kamishima
 
Absolute and Relative Clustering
Absolute and Relative ClusteringAbsolute and Relative Clustering
Absolute and Relative ClusteringToshihiro Kamishima
 
Consideration on Fairness-aware Data Mining
Consideration on Fairness-aware Data MiningConsideration on Fairness-aware Data Mining
Consideration on Fairness-aware Data MiningToshihiro Kamishima
 
Fairness-aware Classifier with Prejudice Remover Regularizer
Fairness-aware Classifier with Prejudice Remover RegularizerFairness-aware Classifier with Prejudice Remover Regularizer
Fairness-aware Classifier with Prejudice Remover RegularizerToshihiro Kamishima
 
Enhancement of the Neutrality in Recommendation
Enhancement of the Neutrality in RecommendationEnhancement of the Neutrality in Recommendation
Enhancement of the Neutrality in RecommendationToshihiro Kamishima
 
Fairness-aware Learning through Regularization Approach
Fairness-aware Learning through Regularization ApproachFairness-aware Learning through Regularization Approach
Fairness-aware Learning through Regularization ApproachToshihiro Kamishima
 

Más de Toshihiro Kamishima (18)

RecSys2018論文読み会 資料
RecSys2018論文読み会 資料RecSys2018論文読み会 資料
RecSys2018論文読み会 資料
 
WSDM2018読み会 資料
WSDM2018読み会 資料WSDM2018読み会 資料
WSDM2018読み会 資料
 
Recommendation Independence
Recommendation IndependenceRecommendation Independence
Recommendation Independence
 
機械学習研究でのPythonの利用
機械学習研究でのPythonの利用機械学習研究でのPythonの利用
機械学習研究でのPythonの利用
 
Considerations on Recommendation Independence for a Find-Good-Items Task
Considerations on Recommendation Independence for a Find-Good-Items TaskConsiderations on Recommendation Independence for a Find-Good-Items Task
Considerations on Recommendation Independence for a Find-Good-Items Task
 
KDD2016勉強会 資料
KDD2016勉強会 資料KDD2016勉強会 資料
KDD2016勉強会 資料
 
WSDM2016勉強会 資料
WSDM2016勉強会 資料WSDM2016勉強会 資料
WSDM2016勉強会 資料
 
ICML2015読み会 資料
ICML2015読み会 資料ICML2015読み会 資料
ICML2015読み会 資料
 
Future Directions of Fairness-Aware Data Mining: Recommendation, Causality, a...
Future Directions of Fairness-Aware Data Mining: Recommendation, Causality, a...Future Directions of Fairness-Aware Data Mining: Recommendation, Causality, a...
Future Directions of Fairness-Aware Data Mining: Recommendation, Causality, a...
 
Correcting Popularity Bias by Enhancing Recommendation Neutrality
Correcting Popularity Bias by Enhancing Recommendation NeutralityCorrecting Popularity Bias by Enhancing Recommendation Neutrality
Correcting Popularity Bias by Enhancing Recommendation Neutrality
 
PyMCがあれば,ベイズ推定でもう泣いたりなんかしない
PyMCがあれば,ベイズ推定でもう泣いたりなんかしないPyMCがあれば,ベイズ推定でもう泣いたりなんかしない
PyMCがあれば,ベイズ推定でもう泣いたりなんかしない
 
The Independence of Fairness-aware Classifiers
The Independence of Fairness-aware ClassifiersThe Independence of Fairness-aware Classifiers
The Independence of Fairness-aware Classifiers
 
Efficiency Improvement of Neutrality-Enhanced Recommendation
Efficiency Improvement of Neutrality-Enhanced RecommendationEfficiency Improvement of Neutrality-Enhanced Recommendation
Efficiency Improvement of Neutrality-Enhanced Recommendation
 
Absolute and Relative Clustering
Absolute and Relative ClusteringAbsolute and Relative Clustering
Absolute and Relative Clustering
 
Consideration on Fairness-aware Data Mining
Consideration on Fairness-aware Data MiningConsideration on Fairness-aware Data Mining
Consideration on Fairness-aware Data Mining
 
Fairness-aware Classifier with Prejudice Remover Regularizer
Fairness-aware Classifier with Prejudice Remover RegularizerFairness-aware Classifier with Prejudice Remover Regularizer
Fairness-aware Classifier with Prejudice Remover Regularizer
 
Enhancement of the Neutrality in Recommendation
Enhancement of the Neutrality in RecommendationEnhancement of the Neutrality in Recommendation
Enhancement of the Neutrality in Recommendation
 
Fairness-aware Learning through Regularization Approach
Fairness-aware Learning through Regularization ApproachFairness-aware Learning through Regularization Approach
Fairness-aware Learning through Regularization Approach
 

RecSys2016勉強会 資料