SlideShare a Scribd company logo
Enviar búsqueda
Cargar
Iniciar sesión
Registrarse
レコメンデーション(協調フィルタリング)の基礎
Denunciar
Katsuhiro Takata
Seguir
Kauli
15 de May de 2010
•
0 recomendaciones
•
5,349 vistas
1
de
28
レコメンデーション(協調フィルタリング)の基礎
15 de May de 2010
•
0 recomendaciones
•
5,349 vistas
Descargar ahora
Descargar para leer sin conexión
Denunciar
Tecnología
TokyoWebMining, 2010/05/16
Katsuhiro Takata
Seguir
Kauli
Recomendados
Sano web広告最適化20131018v3
Masakazu Sano
31K vistas
•
38 diapositivas
パーソナル広告配信徹底入門
yskn67
5K vistas
•
17 diapositivas
人工知能Xファッション最前線
Kazuki Baba
7.9K vistas
•
29 diapositivas
Masakazu Sano Tokyowebmining 37 20140621
Masakazu Sano
6.8K vistas
•
25 diapositivas
Sano tokyowebmining 36_20140526
Masakazu Sano
6.5K vistas
•
21 diapositivas
Mlct 20150430v2
Masakazu Sano
4.3K vistas
•
24 diapositivas
Más contenido relacionado
La actualidad más candente
楽天ad4U 行動スキミング広告
rakuten
1.5K vistas
•
14 diapositivas
フルスクラッチで書いたアドサーバの開発運用史
Innami Satoshi
1.3K vistas
•
23 diapositivas
食べログデータから見る東新宿と西早稲田のランチ事情
Jun Ishitsuka
778 vistas
•
19 diapositivas
Big data解析ビジネス
Mie Mori
3.5K vistas
•
26 diapositivas
Prophet入門【R編】Facebookの時系列予測ツール
hoxo_m
38.2K vistas
•
62 diapositivas
[データマイニング+WEB勉強会][R勉強会] 創設の思い・目的・進行方針
Koichi Hamada
2.3K vistas
•
39 diapositivas
La actualidad más candente
(7)
楽天ad4U 行動スキミング広告
rakuten
•
1.5K vistas
フルスクラッチで書いたアドサーバの開発運用史
Innami Satoshi
•
1.3K vistas
食べログデータから見る東新宿と西早稲田のランチ事情
Jun Ishitsuka
•
778 vistas
Big data解析ビジネス
Mie Mori
•
3.5K vistas
Prophet入門【R編】Facebookの時系列予測ツール
hoxo_m
•
38.2K vistas
[データマイニング+WEB勉強会][R勉強会] 創設の思い・目的・進行方針
Koichi Hamada
•
2.3K vistas
EC-CUBEとAWSの美味しい関係?
義隆 川路
•
4.8K vistas
Destacado
集合知プログラミング 第6章 ドキュメントとフィルタリング~draft
Kenji Koshikawa
5K vistas
•
51 diapositivas
HTML5時代の技術の恩恵を受けるには
Sho Ito
4K vistas
•
31 diapositivas
Photoshopで学ぶ、一生使える色調補正 先生:藤本 圭先生
schoowebcampus
4.1K vistas
•
53 diapositivas
WebフォントとSVGフォント
Jun Fujisawa
13.1K vistas
•
21 diapositivas
CSSにもオブジェクト指向を - OOCSSことはじめ
Nisei Kimura
5.4K vistas
•
46 diapositivas
テスト環境から本番環境へ、URLが異なる環境にWordPressを移行する方法
Ryujiro Yamamoto
55.4K vistas
•
28 diapositivas
Destacado
(20)
集合知プログラミング 第6章 ドキュメントとフィルタリング~draft
Kenji Koshikawa
•
5K vistas
HTML5時代の技術の恩恵を受けるには
Sho Ito
•
4K vistas
Photoshopで学ぶ、一生使える色調補正 先生:藤本 圭先生
schoowebcampus
•
4.1K vistas
WebフォントとSVGフォント
Jun Fujisawa
•
13.1K vistas
CSSにもオブジェクト指向を - OOCSSことはじめ
Nisei Kimura
•
5.4K vistas
テスト環境から本番環境へ、URLが異なる環境にWordPressを移行する方法
Ryujiro Yamamoto
•
55.4K vistas
ディレクターからみたMovable Type + PowerCMSの優位性
Renji Yoneda
•
8.8K vistas
シロクマ本に学ぶエクスペリエンスのための手技法 by 篠原 稔和 - presentation from IA CAMP 2015
Sociomedia
•
4K vistas
Webアクセシビリティの標準規格「JIS X 8341-3:2010」準拠のための試験方法(最新版)
Web Accessibility Infrastructure Committee (WAIC)
•
5.7K vistas
Chromeでjavascriptデバッグ!まず半歩♪
Yuji Nojima
•
21.7K vistas
Photoshopで効率よくデザインしよう!
Marie Suenaga
•
23.8K vistas
-入門- enchant.js でゲームを作ろう
nico0927
•
7.5K vistas
.htaccessによるリダイレクト徹底解説
Cherry Pie Web
•
165.6K vistas
悩まないコーディングをしよう! OOCSS,SMACSSを用いた、読みやすくてメンテナブルなCSS設計(Sass対応)
Horiguchi Seito
•
60.9K vistas
ウェブデザインの本質と、構成要素
vanillate cocoa
•
8.4K vistas
今必要なCSSアーキテクチャ
Mayu Kimura
•
75.9K vistas
コーディングが上達するコツ
evol-ni
•
29.8K vistas
Webアプリケーション負荷試験実践入門
樽八 仲川
•
50.8K vistas
WordPressプラグイン作成入門
Yuji Nojima
•
39K vistas
ノンプログラマーのためのjQuery入門
Hayato Mizuno
•
149K vistas
Similar a レコメンデーション(協調フィルタリング)の基礎
協調フィルタリング with Mahout
Katsuhiro Takata
6.4K vistas
•
22 diapositivas
広告ログの解析システム
Katsuhiro Takata
3.1K vistas
•
17 diapositivas
20120822_dstn技術交流会_DataSpider接続先技術動向
dstn
887 vistas
•
29 diapositivas
ライフエンジンを支える検索エンジンの作り方
Chiaki Hatanaka
1.1K vistas
•
21 diapositivas
20120126 mnlgy 1
takaoka susumu
5.9K vistas
•
21 diapositivas
jubatus pressrelease
JubatusOfficial
8.8K vistas
•
18 diapositivas
Similar a レコメンデーション(協調フィルタリング)の基礎
(20)
協調フィルタリング with Mahout
Katsuhiro Takata
•
6.4K vistas
広告ログの解析システム
Katsuhiro Takata
•
3.1K vistas
20120822_dstn技術交流会_DataSpider接続先技術動向
dstn
•
887 vistas
ライフエンジンを支える検索エンジンの作り方
Chiaki Hatanaka
•
1.1K vistas
20120126 mnlgy 1
takaoka susumu
•
5.9K vistas
jubatus pressrelease
JubatusOfficial
•
8.8K vistas
情報爆発シンポジウム infoplosion
Rakuten Group, Inc.
•
1.4K vistas
WWW2018 論文読み会 Web Search and Mining
cyberagent
•
1.4K vistas
Digital strategy in Japanese
Yoshinori Kawamura
•
435 vistas
Jmrx講演資料0723(配布用)[1]
Shigeru Kishikawa
•
627 vistas
World ia day
Yoshifumi Seki
•
10.8K vistas
コンテンツマーケティングにおける”16の基本的手法”とは?
陽平 中山
•
1.5K vistas
ビッグデータ&データマネジメント展
Recruit Technologies
•
6.5K vistas
統合キャンペーン管理プラットフォーム概要
Go Sugihara
•
3.4K vistas
【Medix】解析サービスのご案内資料
Shinichiro Oho
•
940 vistas
BigQueryとTableauによるカスタマージャーニー分析
CROSSHACK, Inc.
•
374 vistas
Cookpad TechConf 2016 - DWHに必要なこと
Minero Aoki
•
45.6K vistas
大規模データ時代に求められる自然言語処理
Preferred Networks
•
27.3K vistas
0から始めるhp集客の真髄シリーズ<その2>
Tatematsu Digital Solution KK
•
293 vistas
Aws summits2014 サイバーエージェント_ユーザーの趣味嗜好に適した広告配信システムdynalystができるまでad_techstudioでの...
Boss4434
•
4.9K vistas
Último
CatBoost on GPU のひみつ
Takuji Tahara
203 vistas
•
30 diapositivas
テスト自動化.pdf
ssuserf8ea02
16 vistas
•
26 diapositivas
遠隔お酌IoTLT2309.pptx
Yoshiaki Ito
57 vistas
•
12 diapositivas
IGDA Japan SIG Audio #20-1 室内・野外でのマイク収録と整音.pdf
IGDA Japan SIG-Audio
97 vistas
•
31 diapositivas
GraphQLはどんな時に使うか
Yutaka Tachibana
6 vistas
•
37 diapositivas
20230921_IoTLT_vol103_kitazaki_v1.pdf
Ayachika Kitazaki
81 vistas
•
16 diapositivas
Último
(10)
CatBoost on GPU のひみつ
Takuji Tahara
•
203 vistas
テスト自動化.pdf
ssuserf8ea02
•
16 vistas
遠隔お酌IoTLT2309.pptx
Yoshiaki Ito
•
57 vistas
IGDA Japan SIG Audio #20-1 室内・野外でのマイク収録と整音.pdf
IGDA Japan SIG-Audio
•
97 vistas
GraphQLはどんな時に使うか
Yutaka Tachibana
•
6 vistas
20230921_IoTLT_vol103_kitazaki_v1.pdf
Ayachika Kitazaki
•
81 vistas
松下研究室紹介_関西大学高槻キャンパスオープンキャンパス
Matsushita Laboratory
•
26 vistas
gtk4_gem_usage.pdf
ssuser0ef4681
•
11 vistas
2023情報処理学会関西支部大会-G12.pdf
KoseiShimoda1
•
6 vistas
CCoE実践者コミュニティ#1_CCoEが進めるセキュリティカイゼンの旅.pptx
Tomoaki Tada
•
25 vistas
レコメンデーション(協調フィルタリング)の基礎
1.
レコメンデーション活用編 --- 開発者より
--- Karubi Namuru May 16, 2010
2.
自己紹介 ●
Karubi Namuru – 詳しくは名刺交換で ● Ph.D. in CS, RD Engineer ● Twitter : @karubi ● facebook : http://facebook.com/karubi ● 出身:広島,居住:東京 , Seongnam
3.
学生時代の話
● 在学中の研究 ● 統計的手法による日常行動分析 – 実世界:ライフログ – ウェブ:閲覧, clicks 200 200 180 180 160 160 140 140 120 120 100 100 80 80 60 60 40 40 20 20 0 0
4.
現在使っている知識 ●
膨大な情報の処理 ● 疎な分散処理 ● 時系列情報を参照する情報推薦 ● コンテクスト抽出 ● 状況変化型の情報推薦 – いつも一緒ではない,時間は刻々と進む
5.
今日の基本スタンス ●
開発者としての LT ● 統計処理など大規模計算をインターネットの サービスでつかう – 計算開始から終了まで3日かかるとかだめ! – インフラコストが馬鹿にならない! – 運用,とにかく止めちゃだめ! ● もちろんビジネス – できれば金儲けしたいよ
6.
お話をする応用について (1) ●
おさらい ● 大きく分類して3つの方法論がある – コンテンツベースフィルタリング – ルールベースフィルタリング – 協調フィルタリング
7.
お話をする応用について (2) ●
画像を利用する推薦サービス ● 画像特徴量を利用する ● 疎結合な分散処理 – 当時流行のクラウドコンピューティング, Amazon EC2 – 分散処理, Apache Hadoop ● 知財化 ● Amazon WebServices エバンジェリストに紹介 – ApacheCon US 2008, Nov.
8.
お話をする応用について (3) ●
広告配信サービス ● コンテンツ連動広告 – 現在サービス中のため,話せるレベルで ... ● 大規模なログ処理の例,機械学習 – Apache Hadoop – Apache Mahout (たぶん世界最初の商用で利用 ● 閲覧者の需要をどのようにして見つけるのか?
9.
軽めにおさらい ●
レコメンドのアプローチ ● コンテンツベース ● ルールベース ● 協調フィルタリング ● Hamadakoichi さんが詳解している!(はず – おさらい程度でー
10.
コンテンツベースフィルタリング ●
内容に合わせた見合うアイテムを見つける方法 ● Content-based filtering ● 好きな監督・俳優・ジャンルなどを決める ● その組み合わせに即して,アイテムを決める – 映画「プリティ・ウーマン」を選択すると ● ラブロマンス ● ジュリア・ロバーツ → 「ノッティングヒル」を推薦 ● ラブロマンス ● ジュリア・ロバーツ
11.
ルールベースフィルタリング ●
エキスパートシステム ● AI の研究分野 ● 専門家の知識をルールのようにプロセスにする – 映画「プリティ・ウーマン」を選択すると ● 「元となった映画がある場合は併せて推薦する」ルール → 「マイ・フェア・レディ」を推薦
12.
協調フィルタリング ●
似た人が与えた評価を利用して,アイテムの評 価を予測する ● 多くの利用者の嗜好情報を蓄積すること ● ある人と嗜好の類似する他の人の情報 ● クチコミの原理と例えられる – 趣味の似た人からの意見を参考にする
13.
考え方 ●
ユーザ A がアイテム X を好む ● アイテム X を好む別のユーザ B が好むアイテム Y が存在する ● ユーザ A もアイテム Y を好むのではないか ● 実装で利用するのはユーザ同士の類似度 – たとえば,同じアイテムにつけた評価の相関係数
14.
対象する情報 ●
明示的な情報源 ● ユーザの評価がついているもの – レビュー ● 明示的に選択したもの – 評価ポイント ● 暗示的な情報源 ● システムの操作履歴 – ブラウザの閲覧履歴
15.
明示的な情報の具体例 ●
評価の内容 ● 例えば映画の場合 – この映画は面白かった,つまらなかった – ◯◯ 点 – 評価を与えた映画の組み合わせ ● レビューリスト
16.
画像を利用する推薦サービス ●
概要 ● 画像を特徴量にする(色,形など) ● それぞれの特徴量に対して閲覧者が評価を与えてい るとする ● 閲覧者の嗜好を協調フィルタリング
17.
画像を利用した動機 ●
協調フィルタリングでは対応しづらい世界もあ る ● データが集まるまでマトモに機能しない → プロダクトライフサイクルの短い商材に向かない ● コンテンツベースフィルタリング ● なにの情報を対象にするのか ● 収集もしなければならない ● できるだけ汎化したい
18.
どのような情報を利用するのか ●
色 ● 色空間系 ● 質感 ● 素材感 ● 形 ● 境界 ● モデルと背景の問題
19.
どのような開発をするのか ●
計算量が多い ● 画像を特徴化 ● 協調フィルタリング ● 更新頻度が早い – 商品の入れ替えが早い(こまめな商品追加 – 在庫も薄い(洋服の場合 ● 止めてはならない
20.
具体的な対策 ●
Apache Hadoop ● 分散して計算 ● Map Reduce できるようにデータ構造に注意する ● Amazon EC2 ● インスタンスを API で増やせる – 危機の予感がしたときに作ればいい ● 従量課金 – 止めれば料金が掛からないのでベンチャーでも安心
21.
適用結果
現地で ApacheCon のために Amazon WebServices のエヴァンジェリストに紹介した動画 http://www.youtube.com/watch?v=SkI_2bznyk0
22.
広告配信サービス ●
概要 ● コンテンツ連動広告 – ウェブページの内容に沿った広告
23.
広告に推薦は有効に働くか ●
クリック保証型広告の場合 ● 成果が「広告のクリック」 ● 閲覧者のニーズ通りの広告が出れば利得が最大 – 最もクリックされるために配信会社は儲かる – 広告主のサイトに商材に興味のある閲覧者が集まるため に,広告主のビジネスも成功して儲かる ● インプレッション保証型広告 ● 成果が「広告の閲覧」 ● 今回は対象外
24.
どのような情報を利用するのか ●
ウェブページの情報 ● 特徴語? ● 閲覧者の情報 ● 過去の履歴? ● などなど色々な情報があります ※ 実サービスでは複数の情報をきちんと調理することが一番良いと思います.
25.
どのような開発をするのか (1) ●
膨大な配信量 ● たとえば一般的な新聞社 – 配信規模:約 2 億 PV / month – 閲覧者:約 2000 万 UU / month ● 広告配信の場合 – 配信規模も閲覧者も新聞社より多い
26.
どのような開発をするのか (2) ●
配信速度 ● 止めてはいけない ● 金が絡みますので ● 計算量を気にしなくてはならない ● 配信ログ
27.
ログの調理の具体例 ●
Apache Hadoop ● 前と同様 ● Apache Mahout ● 高度な機械学習
28.
まとめ ●
インターネットでサービスするのは大変 ● 技術屋に求められるスキル ● 計算ロジックの説明を求められる ● 配信量が増えるサービスの場合は,突然増えても問 題ないように考えておく ● 運用の手間は少ない方がいい ● 質問あればこちらまで gogokarubi@gmail.com まで