Personalized Fashion Recommendation from Personal Social Media Data An Item to Set Metric Learning Approach

H
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
DLゼミ
2021/06/27
北海道大学 大学院情報科学研究院
情報理工学部門 複合情報工学分野 調和系工学研究室
修士2年 右田 幹
Personalized Fashion Recommendation from
Personal Social Media Data: An Item-to-Set
Metric Learning Approach
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
論文情報 2
• タイトル
– Personalized Fashion Recommendation from Personal Social Media Data: An Item-
to-Set Metric Learning Approach
• 著者
– Haitian Zheng 1, Kefei Wu 1, Jong-Hwi Park 1 , Wei Zhu 1, Jiebo Luo 1
• 1 Rochester, USA
• 出典及び出典日
– 2021 IEEE International Conference on Big Data (Big Data)
• 論文URL
– https://arxiv.org/pdf/2005.12439.pdf
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
概要 3
・オンラインショッピングの成長により、服装の推薦精度が重要な
タスクになり、個人の好みもソーシャルメディアデータから分かる
ようになった
・ソーシャルメディアデータを用いて、個人の好みに沿った衣服の
推薦を提案
・過去のアイテムと新しいアイテムの距離を計算して学習する枠組
みを提案する
・マルチモダリティな特徴量やクロスモダリティな融合方法を使用
する
・実験では、ソーシャルメディアに実在するデータを用いて、他の
手法よりも優れた成果を出すことができた
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
背景 4
・ソーシャルネットワークの普及
・ファッション系オンラインコミュニティの登場(図1)
個人の服の好みが理解可能に
ソーシャルメディアデータを用いた衣服推薦に
関する研究はあまりやられていない
理由
・データが粗く、直接モデルに入力することが困難
・ユーザーが複数の好みを持つ場合、単純にアイテ
ムの類似度のみで推薦することは不適
ソーシャルメディアデータを用いて
個人の好みに合わせた衣服推薦システムを提案
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
背景 5
目的を達成するための新規性
・新たなアイテムの距離を捉える指標の提案
⁃ 近傍重要度(neighboring importance): アイテム同時の類似度が小さいも
のを除外
⁃ 集合内重要度(intra-set importance): ノイズや外れ値を除外
・ユーザー特有のアイテム間距離(user-specific item-to-set
metric)
⁃ 類似度計算をする前に、アイテムの特徴量について、ユーザー固有の空間を
作成
・マルチモーダルな埋め込み
- 画像だけでなく、単語(ハッシュタグ、タイトル)も特徴量として扱う
・クロスゲート融合
- 単語の誤字、ミスなどを考慮
・提案手法の検証として、ソーシャルメディアのデータを使用して
行う
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
データセットの用意 6
クローリングするサイト
⁃ lookbook.nu(URL: https://lookbook.nu/)
・2293人のユーザーから、最新の投稿100個分取得
⁃ フォロワーが多いアカウントは、ファッションブランド
の広告用が主
⁃ 7000人のフォロワーはクローリングの対象外とする
・データの構成(ユーザーに対して)
⁃ Looks : 見られてる数
⁃ Likes : いいねした数
⁃ Fans : フォロワー数
⁃ Followings : フォローした数
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
データセットの用意 7
データの構成
タイトル ハッシュタグ
・単語の頻度
・アイテムの頻度
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
データセットの用意 8
データの前処理
・画像データ
⁃ 複数人映っている画像(右図)に対して
人物検出を実装
 人物のbounding-boxを取得し、スコアが
最も高いものを採用
⁃ グレースケース画像は除外
・単語データ
⁃ Wikipediaを事前学習したGloveにより、テキストを特徴量変換する
⁃ ハッシュタグ
 Viterbi algorithm(尤もらしい状態系列を推定)を使用して、単語セグ
メントを算出
 各単語から、特徴量を作成
⁃ タイトル
 各単語の埋め込みを利用
複数人が映っている例
画像と単語データの特徴量を連結
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
モデル構築 9
説明の大まかな流れ
1,特徴量抽出
2,アイテム間の距離測定
3,モデルの学習方法
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
モデル構築 10
1:特徴量抽出
𝑥 = (𝑥 𝑖𝑚
, 𝑥 ℎ
, 𝑥(𝑡)
)
特徴量を結合(マルチモーダル)
・𝑥 𝑖𝑚 : 画像特徴量
・ 𝑥 ℎ : ハッシュタグ特徴量
・ 𝑥(𝑡)
: タイトル特徴量
特徴量抽出のアーキテクチャー
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
モデル構築 11
特徴量抽出のアーキテクチャー
画像特徴量抽出
・Body parsing model の適用
⁃ 11個の衣服領域を抽出
*領域として含めるもの
ドレス、コート、パンツ、スカート
*含めないもの
顔、髪、背景
靴、サングラス(希少部位)
・事前学習済みの画像認識モデル
(VGG19)に入力
1:特徴量抽出
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
モデル構築 12
𝑥 ℎ
= {𝑎𝑎1
ℎ
, … , 𝑎𝑎𝑚
ℎ
}
・Attentive averagingの適用
⁃ ハッシュタグの量によって、ベクトルの大きさが異な
るため、特徴量の重みを平均する
⁃ Softmax関数を用いる
𝑒𝑖 = 𝑎𝑎1
ℎ
𝑎𝑖 =
exp(𝑒𝑖)
𝑗 exp(𝑒𝑗)
𝑎𝑎 ℎ
=
𝑖=1
𝑚
𝑎𝑖𝑖
(ℎ)
ハッシュタグ特徴量抽出
・ハッシュタグがない場合
⁃ ゼロベクトルで埋める
・MLPの適用
⁃ 意味が異なっていても、同じファッションスタイルを表すものに対応する
ため
⁃ 例:レザージャケット、ブラック(ゴススタイル)
1:特徴量抽出
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
モデル構築 13
タイトルの特徴量抽出
ハッシュタグのときと過程は同様
𝑥 𝑡
= {𝑎𝑎1
𝑡
, … , 𝑎𝑎𝑚
𝑡
}
𝑒𝑖 = 𝑎𝑎1
𝑡
𝑎𝑖 =
exp(𝑒𝑖)
𝑗 exp(𝑒𝑗)
𝑎𝑎 𝑡
=
𝑖=1
𝑚
𝑎𝑖𝑖
(𝑡)
1:特徴量抽出
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
モデル構築 14
Cross-modality Gated Fusion
特徴量には、誤りも含まれる可能性も
・スペルミス
・領域推定のミス
クロスモダリティ融合を実装
先にハッシュタグとタイトルをクロスさせる
⁃ 画像よりもノイズが少なく、画像情
報を補完的に持っているため
𝑎𝑎 ℎ
← 𝑎𝑎 ℎ
⨀𝜎(𝑓𝑖𝑙_ℎ(𝑎𝑎 𝑡
))
𝑎𝑎 𝑡
← 𝑎𝑎 𝑡
⨀𝜎(𝑓𝑖𝑙_𝑡(𝑎𝑎 𝑡
)) 𝑓𝑖𝑙_ℎ , 𝑓𝑖𝑙_𝑡 : filtering score
⨀ : 要素積
𝜎 : シグモイド関数
1:特徴量抽出
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
モデル構築 15
Cross-modality Gated Fusion
特徴量には、誤りも含まれる可能性も
・スペルミス
・領域推定のミス
クロスモダリティ融合を実装
先にハッシュタグとタイトルをクロスさせる
⁃ 画像よりもノイズが少なく、画像情
報を補完的に持っているため
𝑎𝑎 ℎ ← 𝑎𝑎 ℎ ⨀𝜎(𝑓𝑖𝑙_ℎ(𝑎𝑎 𝑡 ))
𝑎𝑎 𝑡 ← 𝑎𝑎 𝑡 ⨀𝜎(𝑓𝑖𝑙_𝑡(𝑎𝑎 𝑡 )) 𝑓𝑖𝑙_ℎ , 𝑓𝑖𝑙_𝑡 : filtering score
⨀ : 要素積
𝜎 : シグモイド関数
𝑓 𝑖
← 𝑎𝑎 𝑖
⨀𝜎(𝑓𝑖𝑙__𝑖([𝑎𝑎 ℎ
, 𝑎𝑎 𝑡
]))
1:特徴量抽出
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
モデル構築 16
Cross-modality Gated Fusion
特徴量には、誤りも含まれる可能性も
・スペルミス
・領域推定のミス
クロスモダリティ融合を実装
先にハッシュタグとタイトルをクロスさせる
⁃ 画像よりもノイズが少なく、画像情
報を補完的に持っているため
𝑎𝑎 ℎ
← 𝑎𝑎 ℎ
⨀𝜎(𝑓𝑖𝑙_ℎ(𝑎𝑎 𝑡
))
𝑎𝑎 𝑡
← 𝑎𝑎 𝑡
⨀𝜎(𝑓𝑖𝑙_𝑡(𝑎𝑎 𝑡
))
𝑓𝑖𝑙_ℎ , 𝑓𝑖𝑙_𝑡 : filtering score
⨀ : 要素積
𝜎 : シグモイド関数
𝑓 𝑖 ← 𝑎𝑎 𝑖 ⨀𝜎(𝑓𝑖𝑙__𝑖([𝑎𝑎 ℎ , 𝑎𝑎 𝑡 ]))
𝑎𝑎𝑖 ← 𝑓𝑢𝑠𝑖𝑜𝑛(𝑎𝑎 𝑖 , 𝑎𝑎 ℎ , 𝑎𝑎 𝑡 )
全ての特徴量を融合
1:特徴量抽出
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
モデル構築 17
典型的な類似度測定方法
1,特定のアイテムと全アイテムの距離の平均を計算
𝐷𝑎𝑣𝑔 𝑆, =
1
𝐾
𝑖=1
𝐾
𝑑 𝑎𝑎𝑖 , = 𝑑(
1
𝐾
𝑖=1
𝐾
𝑎𝑎𝑖 , )
𝑑 𝑏𝑖 − 𝑏𝑗 = 𝑏𝑖 − 𝑏𝑗
2
2,最近傍項目間距離
𝐷𝑛𝑛 𝑆, = 𝑚𝑖𝑛𝑖=1
𝐾
𝑑 𝑎𝑎𝑖 , = 𝑑 𝑎𝑎𝑖∗ , 𝑖∗
= arg 𝑚𝑖𝑛𝑖=1
𝐾
𝑑 𝑎𝑎𝑖 ,
𝑖∗に該当する特徴量の重み1 , 残りの項目に重み0を割り当てる
問題点:ユーザーが複数の好みがある場合、考慮することが困難
問題点:最小演算では外れ値、ノイズの影響を受けやすく
最も近いアイテムの特徴量しか更新されない
新たな距離測定方法を提案
2:アイテム間の距離測定
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
モデル構築 18
新しい距離測定法
⁃ アイテムごとに重要度重みを割り当てる
𝑆 ∶ データセット
𝑓 ∶ クエリ
𝐷 𝑆, = 𝑑(
𝑖=1
𝐾
𝑎𝑎𝑖 , )
𝑎𝑎𝑖 =
exp(𝑤𝑖)
𝑗 exp(𝑤𝑗)
𝑤𝑖 = 𝐾(𝑎𝑎𝑖; , 𝑆)
重要度重み
距離の算出方法
重要度重みの右辺については、次ページにて説明
2:アイテム間の距離測定
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
モデル構築 19
重要度推定
𝑢 𝑎𝑎𝑖; = −𝛾𝑑(𝑎𝑎𝑖, ) 𝛾 : 正の値を取る、パラメータ
全てのアイテムを更新できるため、複数の好みがあるユーザーに有効
Intra-set importance weight
𝛾 : 正の値を取る、パラメータ
𝑣 𝑎𝑎𝑖; , 𝑆 = 〇𝑣 𝑎𝑎𝑖, 𝑠𝑡𝑎𝑡 𝑆 ,
〇𝑣 ∶ 入力ベクトルからスカラーを出力
𝑠𝑡𝑎𝑡 𝑆 : 全ての特徴次元に沿った集合Sの統計量
*平均値、標準偏差、最小値、最大値を用いて、
統計量を計算し、求まったものをベクトルに連結
総合重要度重み
𝐾 𝑎𝑎𝑖; , 𝑆 =𝑢 𝑎𝑎𝑖; + 𝑣 𝑎𝑎𝑖; , 𝑆
新しい距離測定法
⁃ アイテムごとに重要度重みを割り当てる
2:アイテム間の距離測定
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
モデル構築 20
User-specific Metric Space
⁃ ユーザーごとに考慮した評価指標があることで、それぞれの好みに
対応できる
𝑆 = (〇𝑡(𝑠𝑡𝑎𝑡 𝑆 ))
𝐷𝑢𝑠 𝑆, = 𝑑((𝑆)⨀
𝑖=1
𝐾
𝑎𝑎𝑖𝑖 , (𝑆)⨀)
User-specific item-to-set metric
スケーリングベクトル
⨀ : 乗算
距離を計算する前に、ユーザーが重要視であろう特徴をフィルタリング
新しい距離測定法
⁃ アイテムごとに重要度重みを割り当てる
2:アイテム間の距離測定
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
モデル構築 21
正のペアのアイテムは近づけ、そうでないものの距離は遠くする
𝑆 個のアイテムから、 𝐾種類を選ぶ
𝑓+ : 正例
𝑓𝑗
−
𝑗=1
𝑚
∶ 𝑓+
に該当しない不例
次の式の、負の対数尤度を最小化(するように学習?)
ℒ(𝑆 , 𝑓+
, 𝑓𝑗
−
𝑗=1
𝑚
) = log
exp(−𝐷(𝑆,𝑓+))
exp(−𝐷(𝑆,𝑓+)) + 𝑗=1
𝑚
exp(−𝐷(𝑆,𝑓𝑗
−−
))
テスト時
⁃ ユーザーの投稿情報から、学習した項目間距離で集合に近い項目を推薦
*𝐷については、前ページの式を採用
3: 学習過程
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
実験 22
実装の詳細
⁃ Pytorchを使用
⁃ 初回の学習率 : 0.001
⁃ 最適化:SGD
⁃ バッチサイズ : 32
⁃ 正例と負のデータ(m=50)の51枚を用意し、推薦する服装を出力
⁃ ランダムに10人のユーザーを選択し、投稿画像を入力
⁃ 50回行った平均が結果となる
データセット(p7~9)を実験でも用いる(訓練、テストに分割)
 訓練データ : 1834
 テストデータ : 459
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
結果 23
定量的評価
Top-kにより評価(k = 1,10,25)
・random guess : ランダム
・triplet+avg : データの埋め込みを学習し、アイテム間距離を平均
距離で計算(p18の1)
・triplet+NN : データの埋め込みを学習し、アイテム間距離を最近
傍で計算(p18の2)
・DN4 : 画像-クラス間指標(3-NNを用いる)を取り入れ、推薦の
ために三重項損失を用いたもの
Recall@1のとき、我々の手法はrandom guessの230倍の精度
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
結果 24
定量的評価
Multimodalities and Fusion
マルチモーダル特徴量の
利用による効果
w/ : 特徴量として利用している
w/o : 特徴量として利用していない
att : attentive feature averagingを利用したか
cross : cross-modalを利用したか
・w/att : attentive feature
averagingを利用した
・w/o cross : cross-modalを
利用していない
・hashtagが最も有益な情報
・attentive feature averagingは精度向上に貢献している
・multi-modality fusionは精度向上に貢献している
・cross-modal gated fusionは精度向上に貢献している
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
結果 25
定量的評価
Multimodalities and Fusion
マルチモーダル特徴量の
利用による効果
w/ : 特徴量として利用している
w/o : 特徴量として利用していない
att : attentive feature averagingを利用したか
cross : cross-modalを利用したか
・w/att : attentive feature
averagingを利用した
・w/o cross : cross-modalを
利用していない
・hashtagが最も有益な情報
・attentive feature averagingは精度向上に貢献している
・multi-modality fusionは精度向上に貢献している
・cross-modal gated fusionは精度向上に貢献している
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
結果 26
定量的評価
Multimodalities and Fusion
マルチモーダル特徴量の
利用による効果
w/ : 特徴量として利用している
w/o : 特徴量として利用していない
att : attentive feature averagingを利用したか
cross : cross-modalを利用したか
・w/att : attentive feature
averagingを利用した
・w/o cross : cross-modalを
利用していない
・hashtagが最も有益な情報
・attentive feature averagingは精度向上に貢献している
・multi-modality fusionは精度向上に貢献している
・cross-modal gated fusionは精度向上に貢献している
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
結果 27
定量的評価
Metric designs
・NN : p18の2、で表した
最近傍項目間距離
・average : p18の1、で表した項目間距離の平均
・ours w/v : p20の式、重要度重みを使用するが、Intra-set
importance weightのみ
・ours w/ u+v : p20の式。総合重要度重みを使用
・average w/ : p21で説明した、ユーザーごとに考慮した評価指標
・ours full : 全ての提案手法を取り入れた
*w/ v と w/ u+vは、average(既存手法)より精度が高い
*average w/は、averageやw/ u+vに勝る。特に、fullだと
averageの約2倍とかある
提案手法の優位性が示せる
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
結果 28
定量的評価
Influence of set size
・ユーザー数を変化
ユーザー数が多くなるほど精度が向上
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
結果 29
定性的評価
Top-3 の結果
recall : 18.9%(459人中87人が正し
く予測できた)ときの、推薦した
服装について
赤いボックスは、正解
一貫性は保てている
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
結果 30
一貫性は保てている
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
結果 31
定性的評価
重要度重みの効果
Ours w/u+v
・衣服の特徴をより細かく表せている。
・複数の嗜好をより正確に柔軟に読み取れている
Average(p18の1)と
Ours w/u+v(p20の重要度結合)
の埋め込みを可視化
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
conclusion 32
・ソーシャルメディアデータを用いて、個人の服装に関
するタスクに取り組んだ
・投稿された画像と推薦服のアイテム間距離に着目
・最近傍重要度や集合重要度を使用し、様々な服への興
味やデータのノイズに対応
・ユーザー固有の空間変換を提案し、好みを学習
・マルチモダリティなデータ、かつクロスモダリティな
融合を提案
・ソーシャルメディアに実在しているデータで実験を
行った結果、有効性を示せた
1 de 32

Recomendados

Self-supervised Learning of Adversarial Example: Towards Good Generalizations... por
Self-supervised Learning of Adversarial Example:Towards Good Generalizations...Self-supervised Learning of Adversarial Example:Towards Good Generalizations...
Self-supervised Learning of Adversarial Example: Towards Good Generalizations...harmonylab
472 vistas21 diapositivas
Efficient Deep Reinforcement Learning with Imitative Expert Priors for Autono... por
Efficient Deep Reinforcement Learning with Imitative Expert Priors for Autono...Efficient Deep Reinforcement Learning with Imitative Expert Priors for Autono...
Efficient Deep Reinforcement Learning with Imitative Expert Priors for Autono...harmonylab
489 vistas32 diapositivas
MASTERING ATARI WITH DISCRETE WORLD MODELS (DreamerV2) por
MASTERING ATARI WITH DISCRETE WORLD MODELS (DreamerV2)MASTERING ATARI WITH DISCRETE WORLD MODELS (DreamerV2)
MASTERING ATARI WITH DISCRETE WORLD MODELS (DreamerV2)harmonylab
2.4K vistas47 diapositivas
Fine Grained Fashion Similarity Prediction by Attribute Specific Embedding Le... por
Fine Grained Fashion Similarity Prediction by Attribute Specific Embedding Le...Fine Grained Fashion Similarity Prediction by Attribute Specific Embedding Le...
Fine Grained Fashion Similarity Prediction by Attribute Specific Embedding Le...harmonylab
340 vistas36 diapositivas
Towards Faster and Stabilized GAN Training for High-fidelity Few-shot Image S... por
Towards Faster and Stabilized GAN Training for High-fidelity Few-shot Image S...Towards Faster and Stabilized GAN Training for High-fidelity Few-shot Image S...
Towards Faster and Stabilized GAN Training for High-fidelity Few-shot Image S...harmonylab
1K vistas19 diapositivas
Emotionally Intelligent Fashion Design Using CNN and GAN por
Emotionally Intelligent Fashion Design Using CNN and GANEmotionally Intelligent Fashion Design Using CNN and GAN
Emotionally Intelligent Fashion Design Using CNN and GANharmonylab
603 vistas21 diapositivas

Más contenido relacionado

Similar a Personalized Fashion Recommendation from Personal Social Media Data An Item to Set Metric Learning Approach

【卒業論文】深層生成モデルを用いたユーザ意図に基づく衣服画像の生成に関する研究 por
【卒業論文】深層生成モデルを用いたユーザ意図に基づく衣服画像の生成に関する研究【卒業論文】深層生成モデルを用いたユーザ意図に基づく衣服画像の生成に関する研究
【卒業論文】深層生成モデルを用いたユーザ意図に基づく衣服画像の生成に関する研究harmonylab
522 vistas28 diapositivas
2021 09 29_dl_hirata por
2021 09 29_dl_hirata2021 09 29_dl_hirata
2021 09 29_dl_hirataharmonylab
853 vistas23 diapositivas
Towards Total Recall in Industrial Anomaly Detection por
Towards Total Recall in Industrial Anomaly DetectionTowards Total Recall in Industrial Anomaly Detection
Towards Total Recall in Industrial Anomaly Detectionharmonylab
1.2K vistas31 diapositivas
DLゼミ: ViTPose: Simple Vision Transformer Baselines for Human Pose Estimation por
DLゼミ: ViTPose: Simple Vision Transformer Baselines for Human Pose EstimationDLゼミ: ViTPose: Simple Vision Transformer Baselines for Human Pose Estimation
DLゼミ: ViTPose: Simple Vision Transformer Baselines for Human Pose Estimationharmonylab
747 vistas24 diapositivas
ReAct: Synergizing Reasoning and Acting in Language Models por
ReAct: Synergizing Reasoning and Acting in Language ModelsReAct: Synergizing Reasoning and Acting in Language Models
ReAct: Synergizing Reasoning and Acting in Language Modelsharmonylab
782 vistas50 diapositivas
MLP-Mixer: An all-MLP Architecture for Vision por
MLP-Mixer: An all-MLP Architecture for VisionMLP-Mixer: An all-MLP Architecture for Vision
MLP-Mixer: An all-MLP Architecture for Visionharmonylab
657 vistas25 diapositivas

Similar a Personalized Fashion Recommendation from Personal Social Media Data An Item to Set Metric Learning Approach(20)

【卒業論文】深層生成モデルを用いたユーザ意図に基づく衣服画像の生成に関する研究 por harmonylab
【卒業論文】深層生成モデルを用いたユーザ意図に基づく衣服画像の生成に関する研究【卒業論文】深層生成モデルを用いたユーザ意図に基づく衣服画像の生成に関する研究
【卒業論文】深層生成モデルを用いたユーザ意図に基づく衣服画像の生成に関する研究
harmonylab522 vistas
2021 09 29_dl_hirata por harmonylab
2021 09 29_dl_hirata2021 09 29_dl_hirata
2021 09 29_dl_hirata
harmonylab853 vistas
Towards Total Recall in Industrial Anomaly Detection por harmonylab
Towards Total Recall in Industrial Anomaly DetectionTowards Total Recall in Industrial Anomaly Detection
Towards Total Recall in Industrial Anomaly Detection
harmonylab1.2K vistas
DLゼミ: ViTPose: Simple Vision Transformer Baselines for Human Pose Estimation por harmonylab
DLゼミ: ViTPose: Simple Vision Transformer Baselines for Human Pose EstimationDLゼミ: ViTPose: Simple Vision Transformer Baselines for Human Pose Estimation
DLゼミ: ViTPose: Simple Vision Transformer Baselines for Human Pose Estimation
harmonylab747 vistas
ReAct: Synergizing Reasoning and Acting in Language Models por harmonylab
ReAct: Synergizing Reasoning and Acting in Language ModelsReAct: Synergizing Reasoning and Acting in Language Models
ReAct: Synergizing Reasoning and Acting in Language Models
harmonylab782 vistas
MLP-Mixer: An all-MLP Architecture for Vision por harmonylab
MLP-Mixer: An all-MLP Architecture for VisionMLP-Mixer: An all-MLP Architecture for Vision
MLP-Mixer: An all-MLP Architecture for Vision
harmonylab657 vistas
You Only Learn One Representation: Unified Network for Multiple Tasks por harmonylab
You Only Learn One Representation: Unified Network for Multiple TasksYou Only Learn One Representation: Unified Network for Multiple Tasks
You Only Learn One Representation: Unified Network for Multiple Tasks
harmonylab1.3K vistas
ArcFace: Additive Angular Margin Loss for Deep Face Recognition por harmonylab
ArcFace: Additive Angular Margin Loss for Deep Face RecognitionArcFace: Additive Angular Margin Loss for Deep Face Recognition
ArcFace: Additive Angular Margin Loss for Deep Face Recognition
harmonylab813 vistas
Outfit net fashion outfit recommendation with attention based multiple instan... por harmonylab
Outfit net fashion outfit recommendation with attention based multiple instan...Outfit net fashion outfit recommendation with attention based multiple instan...
Outfit net fashion outfit recommendation with attention based multiple instan...
harmonylab906 vistas
SegFormer: Simple and Efficient Design for Semantic Segmentation with Transfo... por harmonylab
SegFormer: Simple and Efficient Design for Semantic Segmentation with Transfo...SegFormer: Simple and Efficient Design for Semantic Segmentation with Transfo...
SegFormer: Simple and Efficient Design for Semantic Segmentation with Transfo...
harmonylab915 vistas
A Generalist Agent por harmonylab
A Generalist AgentA Generalist Agent
A Generalist Agent
harmonylab835 vistas
ロードヒーティング制御における深層学習を用いた路面画像認識に関する研究 por harmonylab
ロードヒーティング制御における深層学習を用いた路面画像認識に関する研究ロードヒーティング制御における深層学習を用いた路面画像認識に関する研究
ロードヒーティング制御における深層学習を用いた路面画像認識に関する研究
harmonylab812 vistas
A Study on Generation of Deformed Route Maps using Octilinear Grid por harmonylab
A Study on Generation of Deformed Route Maps using Octilinear GridA Study on Generation of Deformed Route Maps using Octilinear Grid
A Study on Generation of Deformed Route Maps using Octilinear Grid
harmonylab480 vistas
Feature Erasing and Diffusion Network for Occluded Person Re-Identification por harmonylab
Feature Erasing and Diffusion Network for Occluded Person Re-IdentificationFeature Erasing and Diffusion Network for Occluded Person Re-Identification
Feature Erasing and Diffusion Network for Occluded Person Re-Identification
harmonylab661 vistas
深層学習を用いたバス乗客画像の属性推定 に関する研究 por harmonylab
深層学習を用いたバス乗客画像の属性推定 に関する研究深層学習を用いたバス乗客画像の属性推定 に関する研究
深層学習を用いたバス乗客画像の属性推定 に関する研究
harmonylab504 vistas
DeBERTaV3: Improving DeBERTa using ELECTRA-Style Pre-Training with Gradient-D... por harmonylab
DeBERTaV3: Improving DeBERTa using ELECTRA-Style Pre-Training with Gradient-D...DeBERTaV3: Improving DeBERTa using ELECTRA-Style Pre-Training with Gradient-D...
DeBERTaV3: Improving DeBERTa using ELECTRA-Style Pre-Training with Gradient-D...
harmonylab1.1K vistas
NeurIPS2021から見るメタ学習の研究動向 - 第83回人工知能セミナー (2022.3.7)「AIトレンド・トップカンファレンス報告会(NeurI... por DeepEyeVision, Inc.
NeurIPS2021から見るメタ学習の研究動向 - 第83回人工知能セミナー (2022.3.7)「AIトレンド・トップカンファレンス報告会(NeurI...NeurIPS2021から見るメタ学習の研究動向 - 第83回人工知能セミナー (2022.3.7)「AIトレンド・トップカンファレンス報告会(NeurI...
NeurIPS2021から見るメタ学習の研究動向 - 第83回人工知能セミナー (2022.3.7)「AIトレンド・トップカンファレンス報告会(NeurI...
DeepEyeVision, Inc.274 vistas
A Study on Clothing Recommendation Information Presentation System Based on C... por harmonylab
A Study on Clothing Recommendation Information Presentation System Based on C...A Study on Clothing Recommendation Information Presentation System Based on C...
A Study on Clothing Recommendation Information Presentation System Based on C...
harmonylab447 vistas
DLゼミ: MobileOne: An Improved One millisecond Mobile Backbone por harmonylab
DLゼミ: MobileOne: An Improved One millisecond Mobile BackboneDLゼミ: MobileOne: An Improved One millisecond Mobile Backbone
DLゼミ: MobileOne: An Improved One millisecond Mobile Backbone
harmonylab101 vistas
2021 haizoku por harmonylab
2021 haizoku2021 haizoku
2021 haizoku
harmonylab303 vistas

Más de harmonylab

Voyager: An Open-Ended Embodied Agent with Large Language Models por
Voyager: An Open-Ended Embodied Agent with Large Language ModelsVoyager: An Open-Ended Embodied Agent with Large Language Models
Voyager: An Open-Ended Embodied Agent with Large Language Modelsharmonylab
522 vistas44 diapositivas
DLゼミ: Ego-Body Pose Estimation via Ego-Head Pose Estimation por
DLゼミ: Ego-Body Pose Estimation via Ego-Head Pose EstimationDLゼミ: Ego-Body Pose Estimation via Ego-Head Pose Estimation
DLゼミ: Ego-Body Pose Estimation via Ego-Head Pose Estimationharmonylab
784 vistas36 diapositivas
形態素解析を用いた帝国議会議事速記録の変遷に関する研究 por
形態素解析を用いた帝国議会議事速記録の変遷に関する研究形態素解析を用いた帝国議会議事速記録の変遷に関する研究
形態素解析を用いた帝国議会議事速記録の変遷に関する研究harmonylab
346 vistas32 diapositivas
灯油タンク内の液面高計測を用いた 灯油残量推定システムに関する研究 por
灯油タンク内の液面高計測を用いた灯油残量推定システムに関する研究灯油タンク内の液面高計測を用いた灯油残量推定システムに関する研究
灯油タンク内の液面高計測を用いた 灯油残量推定システムに関する研究harmonylab
306 vistas25 diapositivas
深層自己回帰モデルを用いた俳句の生成と評価に関する研究 por
深層自己回帰モデルを用いた俳句の生成と評価に関する研究深層自己回帰モデルを用いた俳句の生成と評価に関する研究
深層自己回帰モデルを用いた俳句の生成と評価に関する研究harmonylab
457 vistas35 diapositivas
競輪におけるレーティングシステムを用いた予想記事生成に関する研究 por
競輪におけるレーティングシステムを用いた予想記事生成に関する研究競輪におけるレーティングシステムを用いた予想記事生成に関する研究
競輪におけるレーティングシステムを用いた予想記事生成に関する研究harmonylab
1.1K vistas24 diapositivas

Más de harmonylab(16)

Voyager: An Open-Ended Embodied Agent with Large Language Models por harmonylab
Voyager: An Open-Ended Embodied Agent with Large Language ModelsVoyager: An Open-Ended Embodied Agent with Large Language Models
Voyager: An Open-Ended Embodied Agent with Large Language Models
harmonylab522 vistas
DLゼミ: Ego-Body Pose Estimation via Ego-Head Pose Estimation por harmonylab
DLゼミ: Ego-Body Pose Estimation via Ego-Head Pose EstimationDLゼミ: Ego-Body Pose Estimation via Ego-Head Pose Estimation
DLゼミ: Ego-Body Pose Estimation via Ego-Head Pose Estimation
harmonylab784 vistas
形態素解析を用いた帝国議会議事速記録の変遷に関する研究 por harmonylab
形態素解析を用いた帝国議会議事速記録の変遷に関する研究形態素解析を用いた帝国議会議事速記録の変遷に関する研究
形態素解析を用いた帝国議会議事速記録の変遷に関する研究
harmonylab346 vistas
灯油タンク内の液面高計測を用いた 灯油残量推定システムに関する研究 por harmonylab
灯油タンク内の液面高計測を用いた灯油残量推定システムに関する研究灯油タンク内の液面高計測を用いた灯油残量推定システムに関する研究
灯油タンク内の液面高計測を用いた 灯油残量推定システムに関する研究
harmonylab306 vistas
深層自己回帰モデルを用いた俳句の生成と評価に関する研究 por harmonylab
深層自己回帰モデルを用いた俳句の生成と評価に関する研究深層自己回帰モデルを用いた俳句の生成と評価に関する研究
深層自己回帰モデルを用いた俳句の生成と評価に関する研究
harmonylab457 vistas
競輪におけるレーティングシステムを用いた予想記事生成に関する研究 por harmonylab
競輪におけるレーティングシステムを用いた予想記事生成に関する研究競輪におけるレーティングシステムを用いた予想記事生成に関する研究
競輪におけるレーティングシステムを用いた予想記事生成に関する研究
harmonylab1.1K vistas
【卒業論文】B2Bオークションにおけるユーザ別 入札行動予測に関する研究 por harmonylab
【卒業論文】B2Bオークションにおけるユーザ別 入札行動予測に関する研究【卒業論文】B2Bオークションにおけるユーザ別 入札行動予測に関する研究
【卒業論文】B2Bオークションにおけるユーザ別 入札行動予測に関する研究
harmonylab490 vistas
A Study on Estimation of Household Kerosene Consumption for Optimization of D... por harmonylab
A Study on Estimation of Household Kerosene Consumption for Optimization of D...A Study on Estimation of Household Kerosene Consumption for Optimization of D...
A Study on Estimation of Household Kerosene Consumption for Optimization of D...
harmonylab313 vistas
マルチエージェント深層強化学習による自動運転車両の追越行動の獲得に関する研究 por harmonylab
マルチエージェント深層強化学習による自動運転車両の追越行動の獲得に関する研究マルチエージェント深層強化学習による自動運転車両の追越行動の獲得に関する研究
マルチエージェント深層強化学習による自動運転車両の追越行動の獲得に関する研究
harmonylab383 vistas
A Study on the Generation of Clothing Captions Highlighting the Differences b... por harmonylab
A Study on the Generation of Clothing Captions Highlighting the Differences b...A Study on the Generation of Clothing Captions Highlighting the Differences b...
A Study on the Generation of Clothing Captions Highlighting the Differences b...
harmonylab563 vistas
ZeroCap: Zero-Shot Image-to-Text Generation for Visual-Semantic Arithmetic por harmonylab
ZeroCap: Zero-Shot Image-to-Text Generation for Visual-Semantic ArithmeticZeroCap: Zero-Shot Image-to-Text Generation for Visual-Semantic Arithmetic
ZeroCap: Zero-Shot Image-to-Text Generation for Visual-Semantic Arithmetic
harmonylab449 vistas
2022年度調和系工学研究室配属説明会資料 por harmonylab
2022年度調和系工学研究室配属説明会資料2022年度調和系工学研究室配属説明会資料
2022年度調和系工学研究室配属説明会資料
harmonylab320 vistas
CKL_about_panf2022.pdf por harmonylab
CKL_about_panf2022.pdfCKL_about_panf2022.pdf
CKL_about_panf2022.pdf
harmonylab220 vistas
Outracing champion Gran Turismo drivers with deep reinforcement learning por harmonylab
Outracing champion Gran Turismo drivers with deep reinforcement learningOutracing champion Gran Turismo drivers with deep reinforcement learning
Outracing champion Gran Turismo drivers with deep reinforcement learning
harmonylab556 vistas
Solving Quantitative Reasoning Problems with Language Models por harmonylab
Solving Quantitative Reasoning Problems with Language ModelsSolving Quantitative Reasoning Problems with Language Models
Solving Quantitative Reasoning Problems with Language Models
harmonylab494 vistas
MAUVE: Measuring the Gap Between Neural Text and Human Text using Divergence ... por harmonylab
MAUVE: Measuring the Gap Between Neural Text and Human Text using Divergence ...MAUVE: Measuring the Gap Between Neural Text and Human Text using Divergence ...
MAUVE: Measuring the Gap Between Neural Text and Human Text using Divergence ...
harmonylab514 vistas

Último

定例会スライド_キャチs 公開用.pdf por
定例会スライド_キャチs 公開用.pdf定例会スライド_キャチs 公開用.pdf
定例会スライド_キャチs 公開用.pdfKeio Robotics Association
132 vistas64 diapositivas
Keycloakの全体像: 基本概念、ユースケース、そして最新の開発動向 por
Keycloakの全体像: 基本概念、ユースケース、そして最新の開発動向Keycloakの全体像: 基本概念、ユースケース、そして最新の開発動向
Keycloakの全体像: 基本概念、ユースケース、そして最新の開発動向Hitachi, Ltd. OSS Solution Center.
89 vistas26 diapositivas
今、改めて考えるPostgreSQLプラットフォーム - マルチクラウドとポータビリティ -(PostgreSQL Conference Japan 20... por
今、改めて考えるPostgreSQLプラットフォーム - マルチクラウドとポータビリティ -(PostgreSQL Conference Japan 20...今、改めて考えるPostgreSQLプラットフォーム - マルチクラウドとポータビリティ -(PostgreSQL Conference Japan 20...
今、改めて考えるPostgreSQLプラットフォーム - マルチクラウドとポータビリティ -(PostgreSQL Conference Japan 20...NTT DATA Technology & Innovation
151 vistas42 diapositivas
Windows 11 information that can be used at the development site por
Windows 11 information that can be used at the development siteWindows 11 information that can be used at the development site
Windows 11 information that can be used at the development siteAtomu Hidaka
90 vistas41 diapositivas
SNMPセキュリティ超入門 por
SNMPセキュリティ超入門SNMPセキュリティ超入門
SNMPセキュリティ超入門mkoda
453 vistas15 diapositivas

Último(12)

今、改めて考えるPostgreSQLプラットフォーム - マルチクラウドとポータビリティ -(PostgreSQL Conference Japan 20... por NTT DATA Technology & Innovation
今、改めて考えるPostgreSQLプラットフォーム - マルチクラウドとポータビリティ -(PostgreSQL Conference Japan 20...今、改めて考えるPostgreSQLプラットフォーム - マルチクラウドとポータビリティ -(PostgreSQL Conference Japan 20...
今、改めて考えるPostgreSQLプラットフォーム - マルチクラウドとポータビリティ -(PostgreSQL Conference Japan 20...
Windows 11 information that can be used at the development site por Atomu Hidaka
Windows 11 information that can be used at the development siteWindows 11 information that can be used at the development site
Windows 11 information that can be used at the development site
Atomu Hidaka90 vistas
SNMPセキュリティ超入門 por mkoda
SNMPセキュリティ超入門SNMPセキュリティ超入門
SNMPセキュリティ超入門
mkoda453 vistas
SSH応用編_20231129.pdf por icebreaker4
SSH応用編_20231129.pdfSSH応用編_20231129.pdf
SSH応用編_20231129.pdf
icebreaker4380 vistas
速習! PostgreSQL専用HAソフトウェア: Patroni(PostgreSQL Conference Japan 2023 発表資料) por NTT DATA Technology & Innovation
速習! PostgreSQL専用HAソフトウェア: Patroni(PostgreSQL Conference Japan 2023 発表資料)速習! PostgreSQL専用HAソフトウェア: Patroni(PostgreSQL Conference Japan 2023 発表資料)
速習! PostgreSQL専用HAソフトウェア: Patroni(PostgreSQL Conference Japan 2023 発表資料)
The Things Stack説明資料 by The Things Industries por CRI Japan, Inc.
The Things Stack説明資料 by The Things IndustriesThe Things Stack説明資料 by The Things Industries
The Things Stack説明資料 by The Things Industries
CRI Japan, Inc.76 vistas
PCCC23:東京大学情報基盤センター 「Society5.0の実現を目指す『計算・データ・学習』の融合による革新的スーパーコンピューティング」 por PC Cluster Consortium
PCCC23:東京大学情報基盤センター 「Society5.0の実現を目指す『計算・データ・学習』の融合による革新的スーパーコンピューティング」PCCC23:東京大学情報基盤センター 「Society5.0の実現を目指す『計算・データ・学習』の融合による革新的スーパーコンピューティング」
PCCC23:東京大学情報基盤センター 「Society5.0の実現を目指す『計算・データ・学習』の融合による革新的スーパーコンピューティング」
PCCC23:富士通株式会社 テーマ1「次世代高性能・省電力プロセッサ『FUJITSU-MONAKA』」 por PC Cluster Consortium
PCCC23:富士通株式会社 テーマ1「次世代高性能・省電力プロセッサ『FUJITSU-MONAKA』」PCCC23:富士通株式会社 テーマ1「次世代高性能・省電力プロセッサ『FUJITSU-MONAKA』」
PCCC23:富士通株式会社 テーマ1「次世代高性能・省電力プロセッサ『FUJITSU-MONAKA』」
光コラボは契約してはいけない por Takuya Matsunaga
光コラボは契約してはいけない光コラボは契約してはいけない
光コラボは契約してはいけない
Takuya Matsunaga25 vistas

Personalized Fashion Recommendation from Personal Social Media Data An Item to Set Metric Learning Approach

  • 1. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. DLゼミ 2021/06/27 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 調和系工学研究室 修士2年 右田 幹 Personalized Fashion Recommendation from Personal Social Media Data: An Item-to-Set Metric Learning Approach
  • 2. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. 論文情報 2 • タイトル – Personalized Fashion Recommendation from Personal Social Media Data: An Item- to-Set Metric Learning Approach • 著者 – Haitian Zheng 1, Kefei Wu 1, Jong-Hwi Park 1 , Wei Zhu 1, Jiebo Luo 1 • 1 Rochester, USA • 出典及び出典日 – 2021 IEEE International Conference on Big Data (Big Data) • 論文URL – https://arxiv.org/pdf/2005.12439.pdf
  • 3. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. 概要 3 ・オンラインショッピングの成長により、服装の推薦精度が重要な タスクになり、個人の好みもソーシャルメディアデータから分かる ようになった ・ソーシャルメディアデータを用いて、個人の好みに沿った衣服の 推薦を提案 ・過去のアイテムと新しいアイテムの距離を計算して学習する枠組 みを提案する ・マルチモダリティな特徴量やクロスモダリティな融合方法を使用 する ・実験では、ソーシャルメディアに実在するデータを用いて、他の 手法よりも優れた成果を出すことができた
  • 4. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. 背景 4 ・ソーシャルネットワークの普及 ・ファッション系オンラインコミュニティの登場(図1) 個人の服の好みが理解可能に ソーシャルメディアデータを用いた衣服推薦に 関する研究はあまりやられていない 理由 ・データが粗く、直接モデルに入力することが困難 ・ユーザーが複数の好みを持つ場合、単純にアイテ ムの類似度のみで推薦することは不適 ソーシャルメディアデータを用いて 個人の好みに合わせた衣服推薦システムを提案
  • 5. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. 背景 5 目的を達成するための新規性 ・新たなアイテムの距離を捉える指標の提案 ⁃ 近傍重要度(neighboring importance): アイテム同時の類似度が小さいも のを除外 ⁃ 集合内重要度(intra-set importance): ノイズや外れ値を除外 ・ユーザー特有のアイテム間距離(user-specific item-to-set metric) ⁃ 類似度計算をする前に、アイテムの特徴量について、ユーザー固有の空間を 作成 ・マルチモーダルな埋め込み - 画像だけでなく、単語(ハッシュタグ、タイトル)も特徴量として扱う ・クロスゲート融合 - 単語の誤字、ミスなどを考慮 ・提案手法の検証として、ソーシャルメディアのデータを使用して 行う
  • 6. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. データセットの用意 6 クローリングするサイト ⁃ lookbook.nu(URL: https://lookbook.nu/) ・2293人のユーザーから、最新の投稿100個分取得 ⁃ フォロワーが多いアカウントは、ファッションブランド の広告用が主 ⁃ 7000人のフォロワーはクローリングの対象外とする ・データの構成(ユーザーに対して) ⁃ Looks : 見られてる数 ⁃ Likes : いいねした数 ⁃ Fans : フォロワー数 ⁃ Followings : フォローした数
  • 7. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. データセットの用意 7 データの構成 タイトル ハッシュタグ ・単語の頻度 ・アイテムの頻度
  • 8. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. データセットの用意 8 データの前処理 ・画像データ ⁃ 複数人映っている画像(右図)に対して 人物検出を実装  人物のbounding-boxを取得し、スコアが 最も高いものを採用 ⁃ グレースケース画像は除外 ・単語データ ⁃ Wikipediaを事前学習したGloveにより、テキストを特徴量変換する ⁃ ハッシュタグ  Viterbi algorithm(尤もらしい状態系列を推定)を使用して、単語セグ メントを算出  各単語から、特徴量を作成 ⁃ タイトル  各単語の埋め込みを利用 複数人が映っている例 画像と単語データの特徴量を連結
  • 9. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. モデル構築 9 説明の大まかな流れ 1,特徴量抽出 2,アイテム間の距離測定 3,モデルの学習方法
  • 10. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. モデル構築 10 1:特徴量抽出 𝑥 = (𝑥 𝑖𝑚 , 𝑥 ℎ , 𝑥(𝑡) ) 特徴量を結合(マルチモーダル) ・𝑥 𝑖𝑚 : 画像特徴量 ・ 𝑥 ℎ : ハッシュタグ特徴量 ・ 𝑥(𝑡) : タイトル特徴量 特徴量抽出のアーキテクチャー
  • 11. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. モデル構築 11 特徴量抽出のアーキテクチャー 画像特徴量抽出 ・Body parsing model の適用 ⁃ 11個の衣服領域を抽出 *領域として含めるもの ドレス、コート、パンツ、スカート *含めないもの 顔、髪、背景 靴、サングラス(希少部位) ・事前学習済みの画像認識モデル (VGG19)に入力 1:特徴量抽出
  • 12. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. モデル構築 12 𝑥 ℎ = {𝑎𝑎1 ℎ , … , 𝑎𝑎𝑚 ℎ } ・Attentive averagingの適用 ⁃ ハッシュタグの量によって、ベクトルの大きさが異な るため、特徴量の重みを平均する ⁃ Softmax関数を用いる 𝑒𝑖 = 𝑎𝑎1 ℎ 𝑎𝑖 = exp(𝑒𝑖) 𝑗 exp(𝑒𝑗) 𝑎𝑎 ℎ = 𝑖=1 𝑚 𝑎𝑖𝑖 (ℎ) ハッシュタグ特徴量抽出 ・ハッシュタグがない場合 ⁃ ゼロベクトルで埋める ・MLPの適用 ⁃ 意味が異なっていても、同じファッションスタイルを表すものに対応する ため ⁃ 例:レザージャケット、ブラック(ゴススタイル) 1:特徴量抽出
  • 13. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. モデル構築 13 タイトルの特徴量抽出 ハッシュタグのときと過程は同様 𝑥 𝑡 = {𝑎𝑎1 𝑡 , … , 𝑎𝑎𝑚 𝑡 } 𝑒𝑖 = 𝑎𝑎1 𝑡 𝑎𝑖 = exp(𝑒𝑖) 𝑗 exp(𝑒𝑗) 𝑎𝑎 𝑡 = 𝑖=1 𝑚 𝑎𝑖𝑖 (𝑡) 1:特徴量抽出
  • 14. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. モデル構築 14 Cross-modality Gated Fusion 特徴量には、誤りも含まれる可能性も ・スペルミス ・領域推定のミス クロスモダリティ融合を実装 先にハッシュタグとタイトルをクロスさせる ⁃ 画像よりもノイズが少なく、画像情 報を補完的に持っているため 𝑎𝑎 ℎ ← 𝑎𝑎 ℎ ⨀𝜎(𝑓𝑖𝑙_ℎ(𝑎𝑎 𝑡 )) 𝑎𝑎 𝑡 ← 𝑎𝑎 𝑡 ⨀𝜎(𝑓𝑖𝑙_𝑡(𝑎𝑎 𝑡 )) 𝑓𝑖𝑙_ℎ , 𝑓𝑖𝑙_𝑡 : filtering score ⨀ : 要素積 𝜎 : シグモイド関数 1:特徴量抽出
  • 15. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. モデル構築 15 Cross-modality Gated Fusion 特徴量には、誤りも含まれる可能性も ・スペルミス ・領域推定のミス クロスモダリティ融合を実装 先にハッシュタグとタイトルをクロスさせる ⁃ 画像よりもノイズが少なく、画像情 報を補完的に持っているため 𝑎𝑎 ℎ ← 𝑎𝑎 ℎ ⨀𝜎(𝑓𝑖𝑙_ℎ(𝑎𝑎 𝑡 )) 𝑎𝑎 𝑡 ← 𝑎𝑎 𝑡 ⨀𝜎(𝑓𝑖𝑙_𝑡(𝑎𝑎 𝑡 )) 𝑓𝑖𝑙_ℎ , 𝑓𝑖𝑙_𝑡 : filtering score ⨀ : 要素積 𝜎 : シグモイド関数 𝑓 𝑖 ← 𝑎𝑎 𝑖 ⨀𝜎(𝑓𝑖𝑙__𝑖([𝑎𝑎 ℎ , 𝑎𝑎 𝑡 ])) 1:特徴量抽出
  • 16. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. モデル構築 16 Cross-modality Gated Fusion 特徴量には、誤りも含まれる可能性も ・スペルミス ・領域推定のミス クロスモダリティ融合を実装 先にハッシュタグとタイトルをクロスさせる ⁃ 画像よりもノイズが少なく、画像情 報を補完的に持っているため 𝑎𝑎 ℎ ← 𝑎𝑎 ℎ ⨀𝜎(𝑓𝑖𝑙_ℎ(𝑎𝑎 𝑡 )) 𝑎𝑎 𝑡 ← 𝑎𝑎 𝑡 ⨀𝜎(𝑓𝑖𝑙_𝑡(𝑎𝑎 𝑡 )) 𝑓𝑖𝑙_ℎ , 𝑓𝑖𝑙_𝑡 : filtering score ⨀ : 要素積 𝜎 : シグモイド関数 𝑓 𝑖 ← 𝑎𝑎 𝑖 ⨀𝜎(𝑓𝑖𝑙__𝑖([𝑎𝑎 ℎ , 𝑎𝑎 𝑡 ])) 𝑎𝑎𝑖 ← 𝑓𝑢𝑠𝑖𝑜𝑛(𝑎𝑎 𝑖 , 𝑎𝑎 ℎ , 𝑎𝑎 𝑡 ) 全ての特徴量を融合 1:特徴量抽出
  • 17. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. モデル構築 17 典型的な類似度測定方法 1,特定のアイテムと全アイテムの距離の平均を計算 𝐷𝑎𝑣𝑔 𝑆, = 1 𝐾 𝑖=1 𝐾 𝑑 𝑎𝑎𝑖 , = 𝑑( 1 𝐾 𝑖=1 𝐾 𝑎𝑎𝑖 , ) 𝑑 𝑏𝑖 − 𝑏𝑗 = 𝑏𝑖 − 𝑏𝑗 2 2,最近傍項目間距離 𝐷𝑛𝑛 𝑆, = 𝑚𝑖𝑛𝑖=1 𝐾 𝑑 𝑎𝑎𝑖 , = 𝑑 𝑎𝑎𝑖∗ , 𝑖∗ = arg 𝑚𝑖𝑛𝑖=1 𝐾 𝑑 𝑎𝑎𝑖 , 𝑖∗に該当する特徴量の重み1 , 残りの項目に重み0を割り当てる 問題点:ユーザーが複数の好みがある場合、考慮することが困難 問題点:最小演算では外れ値、ノイズの影響を受けやすく 最も近いアイテムの特徴量しか更新されない 新たな距離測定方法を提案 2:アイテム間の距離測定
  • 18. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. モデル構築 18 新しい距離測定法 ⁃ アイテムごとに重要度重みを割り当てる 𝑆 ∶ データセット 𝑓 ∶ クエリ 𝐷 𝑆, = 𝑑( 𝑖=1 𝐾 𝑎𝑎𝑖 , ) 𝑎𝑎𝑖 = exp(𝑤𝑖) 𝑗 exp(𝑤𝑗) 𝑤𝑖 = 𝐾(𝑎𝑎𝑖; , 𝑆) 重要度重み 距離の算出方法 重要度重みの右辺については、次ページにて説明 2:アイテム間の距離測定
  • 19. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. モデル構築 19 重要度推定 𝑢 𝑎𝑎𝑖; = −𝛾𝑑(𝑎𝑎𝑖, ) 𝛾 : 正の値を取る、パラメータ 全てのアイテムを更新できるため、複数の好みがあるユーザーに有効 Intra-set importance weight 𝛾 : 正の値を取る、パラメータ 𝑣 𝑎𝑎𝑖; , 𝑆 = 〇𝑣 𝑎𝑎𝑖, 𝑠𝑡𝑎𝑡 𝑆 , 〇𝑣 ∶ 入力ベクトルからスカラーを出力 𝑠𝑡𝑎𝑡 𝑆 : 全ての特徴次元に沿った集合Sの統計量 *平均値、標準偏差、最小値、最大値を用いて、 統計量を計算し、求まったものをベクトルに連結 総合重要度重み 𝐾 𝑎𝑎𝑖; , 𝑆 =𝑢 𝑎𝑎𝑖; + 𝑣 𝑎𝑎𝑖; , 𝑆 新しい距離測定法 ⁃ アイテムごとに重要度重みを割り当てる 2:アイテム間の距離測定
  • 20. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. モデル構築 20 User-specific Metric Space ⁃ ユーザーごとに考慮した評価指標があることで、それぞれの好みに 対応できる 𝑆 = (〇𝑡(𝑠𝑡𝑎𝑡 𝑆 )) 𝐷𝑢𝑠 𝑆, = 𝑑((𝑆)⨀ 𝑖=1 𝐾 𝑎𝑎𝑖𝑖 , (𝑆)⨀) User-specific item-to-set metric スケーリングベクトル ⨀ : 乗算 距離を計算する前に、ユーザーが重要視であろう特徴をフィルタリング 新しい距離測定法 ⁃ アイテムごとに重要度重みを割り当てる 2:アイテム間の距離測定
  • 21. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. モデル構築 21 正のペアのアイテムは近づけ、そうでないものの距離は遠くする 𝑆 個のアイテムから、 𝐾種類を選ぶ 𝑓+ : 正例 𝑓𝑗 − 𝑗=1 𝑚 ∶ 𝑓+ に該当しない不例 次の式の、負の対数尤度を最小化(するように学習?) ℒ(𝑆 , 𝑓+ , 𝑓𝑗 − 𝑗=1 𝑚 ) = log exp(−𝐷(𝑆,𝑓+)) exp(−𝐷(𝑆,𝑓+)) + 𝑗=1 𝑚 exp(−𝐷(𝑆,𝑓𝑗 −− )) テスト時 ⁃ ユーザーの投稿情報から、学習した項目間距離で集合に近い項目を推薦 *𝐷については、前ページの式を採用 3: 学習過程
  • 22. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. 実験 22 実装の詳細 ⁃ Pytorchを使用 ⁃ 初回の学習率 : 0.001 ⁃ 最適化:SGD ⁃ バッチサイズ : 32 ⁃ 正例と負のデータ(m=50)の51枚を用意し、推薦する服装を出力 ⁃ ランダムに10人のユーザーを選択し、投稿画像を入力 ⁃ 50回行った平均が結果となる データセット(p7~9)を実験でも用いる(訓練、テストに分割)  訓練データ : 1834  テストデータ : 459
  • 23. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. 結果 23 定量的評価 Top-kにより評価(k = 1,10,25) ・random guess : ランダム ・triplet+avg : データの埋め込みを学習し、アイテム間距離を平均 距離で計算(p18の1) ・triplet+NN : データの埋め込みを学習し、アイテム間距離を最近 傍で計算(p18の2) ・DN4 : 画像-クラス間指標(3-NNを用いる)を取り入れ、推薦の ために三重項損失を用いたもの Recall@1のとき、我々の手法はrandom guessの230倍の精度
  • 24. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. 結果 24 定量的評価 Multimodalities and Fusion マルチモーダル特徴量の 利用による効果 w/ : 特徴量として利用している w/o : 特徴量として利用していない att : attentive feature averagingを利用したか cross : cross-modalを利用したか ・w/att : attentive feature averagingを利用した ・w/o cross : cross-modalを 利用していない ・hashtagが最も有益な情報 ・attentive feature averagingは精度向上に貢献している ・multi-modality fusionは精度向上に貢献している ・cross-modal gated fusionは精度向上に貢献している
  • 25. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. 結果 25 定量的評価 Multimodalities and Fusion マルチモーダル特徴量の 利用による効果 w/ : 特徴量として利用している w/o : 特徴量として利用していない att : attentive feature averagingを利用したか cross : cross-modalを利用したか ・w/att : attentive feature averagingを利用した ・w/o cross : cross-modalを 利用していない ・hashtagが最も有益な情報 ・attentive feature averagingは精度向上に貢献している ・multi-modality fusionは精度向上に貢献している ・cross-modal gated fusionは精度向上に貢献している
  • 26. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. 結果 26 定量的評価 Multimodalities and Fusion マルチモーダル特徴量の 利用による効果 w/ : 特徴量として利用している w/o : 特徴量として利用していない att : attentive feature averagingを利用したか cross : cross-modalを利用したか ・w/att : attentive feature averagingを利用した ・w/o cross : cross-modalを 利用していない ・hashtagが最も有益な情報 ・attentive feature averagingは精度向上に貢献している ・multi-modality fusionは精度向上に貢献している ・cross-modal gated fusionは精度向上に貢献している
  • 27. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. 結果 27 定量的評価 Metric designs ・NN : p18の2、で表した 最近傍項目間距離 ・average : p18の1、で表した項目間距離の平均 ・ours w/v : p20の式、重要度重みを使用するが、Intra-set importance weightのみ ・ours w/ u+v : p20の式。総合重要度重みを使用 ・average w/ : p21で説明した、ユーザーごとに考慮した評価指標 ・ours full : 全ての提案手法を取り入れた *w/ v と w/ u+vは、average(既存手法)より精度が高い *average w/は、averageやw/ u+vに勝る。特に、fullだと averageの約2倍とかある 提案手法の優位性が示せる
  • 28. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. 結果 28 定量的評価 Influence of set size ・ユーザー数を変化 ユーザー数が多くなるほど精度が向上
  • 29. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. 結果 29 定性的評価 Top-3 の結果 recall : 18.9%(459人中87人が正し く予測できた)ときの、推薦した 服装について 赤いボックスは、正解 一貫性は保てている
  • 30. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. 結果 30 一貫性は保てている
  • 31. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. 結果 31 定性的評価 重要度重みの効果 Ours w/u+v ・衣服の特徴をより細かく表せている。 ・複数の嗜好をより正確に柔軟に読み取れている Average(p18の1)と Ours w/u+v(p20の重要度結合) の埋め込みを可視化
  • 32. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. conclusion 32 ・ソーシャルメディアデータを用いて、個人の服装に関 するタスクに取り組んだ ・投稿された画像と推薦服のアイテム間距離に着目 ・最近傍重要度や集合重要度を使用し、様々な服への興 味やデータのノイズに対応 ・ユーザー固有の空間変換を提案し、好みを学習 ・マルチモダリティなデータ、かつクロスモダリティな 融合を提案 ・ソーシャルメディアに実在しているデータで実験を 行った結果、有効性を示せた