SlideShare una empresa de Scribd logo
1 de 19
Descargar para leer sin conexión
BigQuery MLの行列分解モデルを
用いた推薦システムの基礎
2022/07/30 機械学習の社会実装勉強会第13回
岩澤 幸太朗
Summary
➢ 推薦システムの基礎
○ コンテンツベースフィルタリング
○ 協調フィルタリング
➢ BigQueryMLで協調フィルタリングを用いたモデル作成・予測
➢ 膨大なコンテンツからユーザーの興味に合わせたものを提示
➢ どのコンテンツに価値があるかの特定を助ける
➢ 本、映画、ニュース など応用領域は多岐
推薦システム
プライバシー問題等、様々な課題を内包しているが、今回は議論しない
❏ ユーザー:膨大なコンテンツから興味にあったものを見つけられる
❏ サービス運営:利用者の体験向上
推薦システムの分類
➢ コンテンツベースフィルタリング (Content-Based Filtering)
○ アイテムの特徴に基づいて推薦
○ 新しい商品でも推薦可能
➢ 協調フィルタリング (Collaborative Filtering)
○ 他人の評価を参考に推薦
○ 新しいユーザ,商品には対応できない
➢ 統合アプローチ
似た嗜好の人が高評価
好きな俳優が出演して
いる映画
過去のレーティング情報を用いて特
徴の嗜好を推測
コンテンツベースフィルタリング
➢ 嗜好にあった特徴を備えたアイテムを推薦
映画 :監督、俳優、ジャンル、受賞歴、配給会社
ニュース:タイトル、ジャンル、本文キーワード
嗜好データ
ジャンル:サスペンス
俳優:デニーロ
私
『アンタッチャブル』(1987)
禁酒法時代のシカゴを舞台に、ギャングのボス、アル・カポネ(ロバート
・デニーロ)と合衆国財務官の攻防を描く、クライムサスペンス。ブライ
アン・デ・パルマ監督作。
協調フィルタリング
映画の趣味の合う友人 A
そこまで合わない友人 B
是枝裕和監督の最新作
よかったよ
新海誠監督の最新作
よかったよ
➢ 過去のレーティング情報を用いて嗜
好のマッチ度合いを計算する
私 是枝監督の最新作を推薦
推薦システム
➢ 5段階評価、未評価は「?」
➢ 未評価のうち最も評価が高いと推定できる映画を推薦
映画1 映画2 映画3 映画4
私 4 ? 2 5
A 4 5 2 5
B ? 1 5 2
協調フィルタリング
私に映画2を推薦する
高評価、低評価が同じ → 嗜好が似ている
➢ 類似度の定量化 → 相関係数、コサイン類似度 ..
➢ 行列分解による近似
推薦システム
フィードバックの分類
➢ 明示的フィードバック:ユーザーに質問して回答を得る
○ ユーザーが映画をレーティング
➢ 暗黙的フィードバック:ユーザーの行動から評価を推測
○ ユーザーがその映画を閲覧した時間
○ ソフトを購入したかどうか
明示的獲得 暗黙的獲得
データ量 少 多
正確度 高 低
未評価と不
支持の区別
明確 不明確
認知 認知 不認知
協調フィルタリング
➢ 類似度に基づく手法
○ 商品数、ユーザー数が膨大で疎なデータには難しい →次元削減が必要
➢ 行列分解に基づく手法
○ アイテム評価行列を低次元行列 U, Vに近似
岩田具治「機械学習に基づく推薦システム」p.11
https://ibisml.org/archive/ibis2014/IBIS2014tutorial_iwata_color.pdf
疎な行列
使用データセット(映画のレーティング)
1 million ratings from 6000 users on 4000 movies.
Released 2/2003.
https://grouplens.org/datasets/movielens/1m/
映画タイトル(1920年代 - 2000年)
レーティング情報
MovieLens | https://movielens.org/home
Demo
使用したNotebook:
https://github.com/kootr/ml-study-session/tree/main/20220730_reccomendation_mf
補足: BigQuery スロット
model_type='matrix_factorization' 指定のために、スロット購入が必要(コミット期間は: FLEX)
補足: BigQuery スロット
予約作成
補足: BigQuery スロット
割り当ての作成
補足: BigQuery スロット
クエリの実行
補足: BigQuery スロット
割り当て、予約の削除
補足: BigQuery スロット
コミットメントの削除
結果
my ratings predicted ratings(知らない映画ばかりでした )
- 神嶌 敏弘 「推薦システム」
https://www.kamishima.net/archive/recsys.pdf 
- BigQuery ML を使用して映画の評価に基づきレコメンデーションを行う
https://cloud.google.com/bigquery-ml/docs/bigqueryml-mf-explicit-tutorial
- 岩田具治「機械学習に基づく推薦システム」
https://ibisml.org/archive/ibis2014/IBIS2014tutorial_iwata_color.pdf
参考

Más contenido relacionado

La actualidad más candente

La actualidad más candente (20)

Transformer メタサーベイ
Transformer メタサーベイTransformer メタサーベイ
Transformer メタサーベイ
 
【メタサーベイ】基盤モデル / Foundation Models
【メタサーベイ】基盤モデル / Foundation Models【メタサーベイ】基盤モデル / Foundation Models
【メタサーベイ】基盤モデル / Foundation Models
 
MLOps に基づく AI/ML 実運用最前線 ~画像、動画データにおける MLOps 事例のご紹介~(映像情報メディア学会2021年冬季大会企画セッショ...
MLOps に基づく AI/ML 実運用最前線 ~画像、動画データにおける MLOps 事例のご紹介~(映像情報メディア学会2021年冬季大会企画セッショ...MLOps に基づく AI/ML 実運用最前線 ~画像、動画データにおける MLOps 事例のご紹介~(映像情報メディア学会2021年冬季大会企画セッショ...
MLOps に基づく AI/ML 実運用最前線 ~画像、動画データにおける MLOps 事例のご紹介~(映像情報メディア学会2021年冬季大会企画セッショ...
 
ChatGPTは思ったほど賢くない
ChatGPTは思ったほど賢くないChatGPTは思ったほど賢くない
ChatGPTは思ったほど賢くない
 
リクルート式 自然言語処理技術の適応事例紹介
リクルート式 自然言語処理技術の適応事例紹介リクルート式 自然言語処理技術の適応事例紹介
リクルート式 自然言語処理技術の適応事例紹介
 
【DL輪読会】ViT + Self Supervised Learningまとめ
【DL輪読会】ViT + Self Supervised Learningまとめ【DL輪読会】ViT + Self Supervised Learningまとめ
【DL輪読会】ViT + Self Supervised Learningまとめ
 
推薦アルゴリズムの今までとこれから
推薦アルゴリズムの今までとこれから推薦アルゴリズムの今までとこれから
推薦アルゴリズムの今までとこれから
 
モデルベース協調フィルタリングにおける推薦の透明性に関する検討
モデルベース協調フィルタリングにおける推薦の透明性に関する検討モデルベース協調フィルタリングにおける推薦の透明性に関する検討
モデルベース協調フィルタリングにおける推薦の透明性に関する検討
 
2019年度チュートリアルBPE
2019年度チュートリアルBPE2019年度チュートリアルBPE
2019年度チュートリアルBPE
 
深層生成モデルと世界モデル(2020/11/20版)
深層生成モデルと世界モデル(2020/11/20版)深層生成モデルと世界モデル(2020/11/20版)
深層生成モデルと世界モデル(2020/11/20版)
 
全力解説!Transformer
全力解説!Transformer全力解説!Transformer
全力解説!Transformer
 
Machine learning CI/CD with OSS
Machine learning CI/CD with OSSMachine learning CI/CD with OSS
Machine learning CI/CD with OSS
 
backbone としての timm 入門
backbone としての timm 入門backbone としての timm 入門
backbone としての timm 入門
 
Anomaly detection 系の論文を一言でまとめた
Anomaly detection 系の論文を一言でまとめたAnomaly detection 系の論文を一言でまとめた
Anomaly detection 系の論文を一言でまとめた
 
Kubernetesによる機械学習基盤への挑戦
Kubernetesによる機械学習基盤への挑戦Kubernetesによる機械学習基盤への挑戦
Kubernetesによる機械学習基盤への挑戦
 
深層学習による自然言語処理入門: word2vecからBERT, GPT-3まで
深層学習による自然言語処理入門: word2vecからBERT, GPT-3まで深層学習による自然言語処理入門: word2vecからBERT, GPT-3まで
深層学習による自然言語処理入門: word2vecからBERT, GPT-3まで
 
SSII2022 [OS3-02] Federated Learningの基礎と応用
SSII2022 [OS3-02] Federated Learningの基礎と応用SSII2022 [OS3-02] Federated Learningの基礎と応用
SSII2022 [OS3-02] Federated Learningの基礎と応用
 
Semantic segmentation
Semantic segmentationSemantic segmentation
Semantic segmentation
 
画像処理ライブラリ OpenCV で 出来ること・出来ないこと
画像処理ライブラリ OpenCV で 出来ること・出来ないこと画像処理ライブラリ OpenCV で 出来ること・出来ないこと
画像処理ライブラリ OpenCV で 出来ること・出来ないこと
 
AWSではじめるMLOps
AWSではじめるMLOpsAWSではじめるMLOps
AWSではじめるMLOps
 

Similar a BigQuery MLの行列分解モデルを 用いた推薦システムの基礎

DEIM2019 楽天技術研究所の研究とケーススタディ(推薦システム)
DEIM2019 楽天技術研究所の研究とケーススタディ(推薦システム)DEIM2019 楽天技術研究所の研究とケーススタディ(推薦システム)
DEIM2019 楽天技術研究所の研究とケーススタディ(推薦システム)
Sho Nakamura
 
ナレッジ共有ベース業務スタイル変革ソリューションKCUBE
ナレッジ共有ベース業務スタイル変革ソリューションKCUBEナレッジ共有ベース業務スタイル変革ソリューションKCUBE
ナレッジ共有ベース業務スタイル変革ソリューションKCUBE
Erin Kim
 
Intalio japan special cloud workshop
Intalio japan special cloud workshopIntalio japan special cloud workshop
Intalio japan special cloud workshop
Daisuke Sugai
 
Asahikawa_Ict 20120726
Asahikawa_Ict 20120726Asahikawa_Ict 20120726
Asahikawa_Ict 20120726
kspro
 

Similar a BigQuery MLの行列分解モデルを 用いた推薦システムの基礎 (20)

行列分解の数学的基礎.pdf
行列分解の数学的基礎.pdf行列分解の数学的基礎.pdf
行列分解の数学的基礎.pdf
 
DEIM2019 楽天技術研究所の研究とケーススタディ(推薦システム)
DEIM2019 楽天技術研究所の研究とケーススタディ(推薦システム)DEIM2019 楽天技術研究所の研究とケーススタディ(推薦システム)
DEIM2019 楽天技術研究所の研究とケーススタディ(推薦システム)
 
Recsys2016勉強会
Recsys2016勉強会Recsys2016勉強会
Recsys2016勉強会
 
情報検索のためのユーザモデル
情報検索のためのユーザモデル情報検索のためのユーザモデル
情報検索のためのユーザモデル
 
ナレッジ共有ベース業務スタイル変革ソリューションKCUBE
ナレッジ共有ベース業務スタイル変革ソリューションKCUBEナレッジ共有ベース業務スタイル変革ソリューションKCUBE
ナレッジ共有ベース業務スタイル変革ソリューションKCUBE
 
How to organize data science project (データサイエンスプロジェクトの始め方101)
How to organize data science project (データサイエンスプロジェクトの始め方101)How to organize data science project (データサイエンスプロジェクトの始め方101)
How to organize data science project (データサイエンスプロジェクトの始め方101)
 
Intalio japan special cloud workshop
Intalio japan special cloud workshopIntalio japan special cloud workshop
Intalio japan special cloud workshop
 
初めてのデータ分析基盤構築をまかされた、その時何を考えておくと良いのか
初めてのデータ分析基盤構築をまかされた、その時何を考えておくと良いのか初めてのデータ分析基盤構築をまかされた、その時何を考えておくと良いのか
初めてのデータ分析基盤構築をまかされた、その時何を考えておくと良いのか
 
Machine learning microservice_management
Machine learning microservice_managementMachine learning microservice_management
Machine learning microservice_management
 
Asahikawa_Ict 20120726
Asahikawa_Ict 20120726Asahikawa_Ict 20120726
Asahikawa_Ict 20120726
 
Oracle Data Minerハンズオンセミナー170927:②Oracle data minerハンズオン資料
Oracle Data Minerハンズオンセミナー170927:②Oracle data minerハンズオン資料Oracle Data Minerハンズオンセミナー170927:②Oracle data minerハンズオン資料
Oracle Data Minerハンズオンセミナー170927:②Oracle data minerハンズオン資料
 
ビジネスモデル・ジェネレーション「Patterns」
ビジネスモデル・ジェネレーション「Patterns」ビジネスモデル・ジェネレーション「Patterns」
ビジネスモデル・ジェネレーション「Patterns」
 
分散表現を用いたリアルタイム学習型セッションベース推薦システム
分散表現を用いたリアルタイム学習型セッションベース推薦システム分散表現を用いたリアルタイム学習型セッションベース推薦システム
分散表現を用いたリアルタイム学習型セッションベース推薦システム
 
YJTC18 D-4 AnnexML: 近似最近傍検索を⽤いたextreme multi-label分類の⾼速化
YJTC18 D-4 AnnexML: 近似最近傍検索を⽤いたextreme multi-label分類の⾼速化YJTC18 D-4 AnnexML: 近似最近傍検索を⽤いたextreme multi-label分類の⾼速化
YJTC18 D-4 AnnexML: 近似最近傍検索を⽤いたextreme multi-label分類の⾼速化
 
ML基盤メタサーベイ cvpaper.challenge #meta-study-group勉強会(2019/03/15)
ML基盤メタサーベイ cvpaper.challenge #meta-study-group勉強会(2019/03/15)ML基盤メタサーベイ cvpaper.challenge #meta-study-group勉強会(2019/03/15)
ML基盤メタサーベイ cvpaper.challenge #meta-study-group勉強会(2019/03/15)
 
ゼロから始めるレコメンダシステム
ゼロから始めるレコメンダシステムゼロから始めるレコメンダシステム
ゼロから始めるレコメンダシステム
 
実積ゼミの説明2015
実積ゼミの説明2015実積ゼミの説明2015
実積ゼミの説明2015
 
Sexi勉強会0630
Sexi勉強会0630Sexi勉強会0630
Sexi勉強会0630
 
機械学習応用のためのソフトウェアエンジニアリングパターン
機械学習応用のためのソフトウェアエンジニアリングパターン機械学習応用のためのソフトウェアエンジニアリングパターン
機械学習応用のためのソフトウェアエンジニアリングパターン
 
実積ゼミの説明2014
実積ゼミの説明2014実積ゼミの説明2014
実積ゼミの説明2014
 

Más de 幸太朗 岩澤

Más de 幸太朗 岩澤 (13)

15. Transformerを用いた言語処理技術の発展.pdf
15. Transformerを用いた言語処理技術の発展.pdf15. Transformerを用いた言語処理技術の発展.pdf
15. Transformerを用いた言語処理技術の発展.pdf
 
14. BigQuery ML を用いた多変量時系列データの解析.pdf
14. BigQuery ML を用いた多変量時系列データの解析.pdf14. BigQuery ML を用いた多変量時系列データの解析.pdf
14. BigQuery ML を用いた多変量時系列データの解析.pdf
 
BigQuery ML for unstructured data
BigQuery ML for unstructured dataBigQuery ML for unstructured data
BigQuery ML for unstructured data
 
12. Diffusion Model の数学的基礎.pdf
12. Diffusion Model の数学的基礎.pdf12. Diffusion Model の数学的基礎.pdf
12. Diffusion Model の数学的基礎.pdf
 
Vertex AI Pipelinesで BigQuery MLのワークフローを管理 (ETL ~ デプロイまで)
Vertex AI Pipelinesで BigQuery MLのワークフローを管理 (ETL ~ デプロイまで)Vertex AI Pipelinesで BigQuery MLのワークフローを管理 (ETL ~ デプロイまで)
Vertex AI Pipelinesで BigQuery MLのワークフローを管理 (ETL ~ デプロイまで)
 
Vertex AI Pipelinesで BigQuery MLのワークフローを管理
Vertex AI Pipelinesで BigQuery MLのワークフローを管理Vertex AI Pipelinesで BigQuery MLのワークフローを管理
Vertex AI Pipelinesで BigQuery MLのワークフローを管理
 
7. Vertex AI Model Registryで BigQuery MLのモデルを管理する
7. Vertex AI Model Registryで BigQuery MLのモデルを管理する7. Vertex AI Model Registryで BigQuery MLのモデルを管理する
7. Vertex AI Model Registryで BigQuery MLのモデルを管理する
 
6. Vertex AI Workbench による Notebook 環境.pdf
6. Vertex AI Workbench による Notebook 環境.pdf6. Vertex AI Workbench による Notebook 環境.pdf
6. Vertex AI Workbench による Notebook 環境.pdf
 
5. Big Query Explainable AIの紹介
5. Big Query Explainable AIの紹介5. Big Query Explainable AIの紹介
5. Big Query Explainable AIの紹介
 
4. CycleGANの画像変換と現代美術への応用
4. CycleGANの画像変換と現代美術への応用4. CycleGANの画像変換と現代美術への応用
4. CycleGANの画像変換と現代美術への応用
 
3. Vertex AIを用いた時系列データの解析
3. Vertex AIを用いた時系列データの解析3. Vertex AIを用いた時系列データの解析
3. Vertex AIを用いた時系列データの解析
 
2. BigQuery ML を用いた時系列データの解析 (ARIMA model)
2. BigQuery ML を用いた時系列データの解析 (ARIMA model)2. BigQuery ML を用いた時系列データの解析 (ARIMA model)
2. BigQuery ML を用いた時系列データの解析 (ARIMA model)
 
1. BigQueryを中心にした ML datapipelineの概要
1. BigQueryを中心にした ML datapipelineの概要1. BigQueryを中心にした ML datapipelineの概要
1. BigQueryを中心にした ML datapipelineの概要
 

Último

Último (11)

LoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアルLoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
 
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
 
論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding
論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding
論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding
 
LoRaWANスマート距離検出センサー DS20L カタログ LiDARデバイス
LoRaWANスマート距離検出センサー  DS20L  カタログ  LiDARデバイスLoRaWANスマート距離検出センサー  DS20L  カタログ  LiDARデバイス
LoRaWANスマート距離検出センサー DS20L カタログ LiDARデバイス
 
Observabilityは従来型の監視と何が違うのか(キンドリルジャパン社内勉強会:2022年10月27日発表)
Observabilityは従来型の監視と何が違うのか(キンドリルジャパン社内勉強会:2022年10月27日発表)Observabilityは従来型の監視と何が違うのか(キンドリルジャパン社内勉強会:2022年10月27日発表)
Observabilityは従来型の監視と何が違うのか(キンドリルジャパン社内勉強会:2022年10月27日発表)
 
新人研修 後半 2024/04/26の勉強会で発表されたものです。
新人研修 後半        2024/04/26の勉強会で発表されたものです。新人研修 後半        2024/04/26の勉強会で発表されたものです。
新人研修 後半 2024/04/26の勉強会で発表されたものです。
 
論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games
論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games
論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games
 
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
 
論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...
論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...
論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...
 
知識ゼロの営業マンでもできた!超速で初心者を脱する、悪魔的学習ステップ3選.pptx
知識ゼロの営業マンでもできた!超速で初心者を脱する、悪魔的学習ステップ3選.pptx知識ゼロの営業マンでもできた!超速で初心者を脱する、悪魔的学習ステップ3選.pptx
知識ゼロの営業マンでもできた!超速で初心者を脱する、悪魔的学習ステップ3選.pptx
 
Utilizing Ballerina for Cloud Native Integrations
Utilizing Ballerina for Cloud Native IntegrationsUtilizing Ballerina for Cloud Native Integrations
Utilizing Ballerina for Cloud Native Integrations
 

BigQuery MLの行列分解モデルを 用いた推薦システムの基礎