SlideShare a Scribd company logo
1 of 21
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
北海道大学 大学院情報科学研究院
情報理工学部門 複合情報工学分野 調和系工学研究室
修士2年 右田 幹
Emotionally Intelligent Fashion Design Using
CNN and GAN
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
論文情報 2
• タイトル
– Emotionally Intelligent Fashion Design Using CNN and GAN
• 著者
– Cheng Yang, Yuliang Zhou, authors Lingang Wu
• 出典及び出典日
– Computer-Aided Design and Applications, 2021 03
• 論文URL
– http://cad-journal.net/files/vol_18/CAD_18(5)_2021_900-913.pdf
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
概要 3
・消費者の抱くイメージとファッション商品のマッチングを目的
・商品イメージを分類( Product Image Recognition model )、生成
( Intelligent Design Generation Model )するモデルを提案
・Product Image Recognition modelモデルは、CNNベースにより構築
・Intelligent Design Generation Modelモデルは、DCGANとConditinal GAN
を組み合わせたものにより構築
・今回は、靴の画像に照準を絞る
・実験結果から、提案手法の実現可能性と有効性が示せた
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
背景 4
本研究では靴を対象にして、商品イメージの設計手法を検討
 商品イメージの認識(Product Image Recognition model )、生成(Intelligent Design
Generation Model)を行う
製品性能が全体的に向上した
 選ぶ上で機能よりもイメージが先行
 消費者が望むイメージを把握することが重要に
機械学習により、消費者の感情を判断するモデルが登場
 Jaber : クラスタリングにより、女優を親密さに応じて分類
 Bell and Bala : CNNをもちいて、インテリアデザインに基づいて、配置する製品本体の
識別や類似製品の検索を実現
一方で、深層学習を利用して、ユーザーのイメージに基づいた
製品のデザイン分析に関する研究や開発はほとんどない
上記を実現することで、商品イメージの定義のみで
欲求通りの製品デザインを、容易かつ大量に取得可能
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
Product Image Recognition model 5
①データセット作成
②使用するイメージ選択
③商品のイメージをラベル付け
④CNNによる学習実装
⑤結果
Product Image Recognition modelの概要
説明の流れ
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
Product Image Recognition model 6
使用したデータセット:UT Zappos 50K
 複数ブランドの50,025枚の靴の写真が
含まれる
UT Zappos 50K データセットの一部
商品イメージ用語選出
・86個を選出(関連研究、雑誌、ECサイトなどを参考)
・同じ意味を持つものを削除し、63個残す
 例。 “publicized-introverted”、“publicized-understated”
・工業デザイン学科の大学院生・教員30名によりフィルタリング
 画像に対して、最も適したイメージ用語を選択してもらう
 15人以上によって正しく選択されたイメージ用語のみ。45個選出した
データセット
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
Product Image Recognition model 7
クラスタリングの概要
商品イメージのクラスタリング
 工業デザイン学科の大学院生・教員22名が参加
データセット
・2乗和誤差の和(SSE)により最適なクラスタ数を決定。
 4クラスタに分けたとき、明らかな変曲点があったため、これに
・4つのクラスタについて、各代表の単語ペアを選択
 gorgeous-plain, modern-retro, casual-formal, and male-female.
・各自、45個を自らの判断でクラスタリング
 クラスタ数、各クラスタに含まれる個数など、
制限はなし
・同じグループに含まれる単語同士の出現回数
を計算(45×45の行列に記入)
Female Retro …
Female ☓ 2 2
Retro 2 ☓ 3
… 3 4 ☓
行列の例
・スペクトルクラスタリングによりクラスタをグループ化
データからグラフを生成。グラフの連結性に注目してクラスタリングする手法
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
Product Image Recognition model 8
被検者の選定
・工業デザイン学科の大学教員と大学院生38名
 23歳から40歳の男性17名、女性21名
 一般消費者に比べ、商品イメージの知見がある
アンケート
・50,025枚のデータセットから無作為に1,200枚選出
・1200枚を無作為に12個のグループに分類。12種類のアンケートが出来上がる
アンケートの1例
商品イメージのラベル付け
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
Product Image Recognition model 9
ラベル付け結果
・Positive:各商品に対して、全体のスコア平均が0より大きい
・Negative:各商品に対して、全体のスコア平均が0より小さい
・Neutral (扱わないため、非表示):各商品に対して、全体のスコア平均が0
各指標
(左側がPositive)
Positive Negative Total
Female - Male 426 503 929
Retro - Modern 525 398 923
Formal - Casual 778 200 978
Plain - Gorgeous 417 509 926
ラベル付け結果
商品イメージのラベル付け
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
Product Image Recognition model 10
・CNNの入力に対応させるために、正方形に変換
 元々の画像サイズは136×102
 白Paddingを追加。歪みを回避
・データの分割
 Train data : 7割
 Test data : 3割
・RGB値の平均値を算出
 各画像の値から平均値を差し引き、これを用いる
・ Train dataに、画像を水平に反転させたものを追加
・224×224に変換。CNNに入力
UT Zappos 50K データセットの一部
前処理
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
Product Image Recognition model 11
・靴の画像認識のために、VGG16を使用
・出力層は、ソフトマックス関数を採用
 各指標は、0~1の実数を取る
VGG16の概要
指標(p9)に合わせて
4次元に変更
・損失関数(weighted cross entropy)
𝑙𝑜𝑠𝑠 =
𝑖=1
𝑛
𝛼𝑖𝐶𝐸𝑖
𝑖=1
𝑛
𝛼𝑖
𝑛 ∶ 学習する画像の数
𝛼𝑖 ∶ 𝑖番目の商品イメージの平均スコア
𝐶𝐸𝑖: 𝑖番目の交差エントロピー誤差
実装
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
Product Image Recognition model 12
・weight decayの使用(過学習対策)
 L2正則化とλ∑𝑤𝑖を損失関数に。(減衰率 λ=0.0005)
・パラメータ更新 : Momentum SGD
学習時の詳細設定
𝑊𝑡+1
= 𝑊𝑡
− 𝜂
𝜕𝐿 𝑊𝑡
𝜕𝑊𝑡 + 𝛽𝛥𝑊𝑡
𝐿 ∶ 損失関数
𝛽 ∶ 0.9
𝜂 : 0.0001(100epochごとに0.1倍)
・neutralは使用しない
 イメージが無いから
・学習の様子
実装
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
Product Image Recognition model 13
・standard loss( standard cross entropy )と
weighted cross ( weighted cross entropy )で比較
 重みの導入と精度や学習効率の関係を確認するため
・weighted cross の方が精度が高い
・100epochのほうが低い
 オーバーフィッティングの影響
50 epoch 100 epoch
結果
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
Intelligent Design Generation Model 14
Product Image Recognition Modelで用いたデータセットだけでは不十分
 UT Zappos 50Kから10240個の靴をランダムに選択
 Product Image Recognition Modelよりラベル付け。大規模なデータセットを作成
各指標
(左側がPositive)
Positive Negative Total
Female - Male 4807 5433 10240
Retro - Modern 5844 4396 10240
Formal - Casual 7689 2551 10240
Plain - Gorgeous 4995 5245 10240
ラベル付け結果
データの前処理
GANを用いて、想定するイメージかつ革新的な製品を生成する
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
Intelligent Design Generation Model 15
・DCGANとConditional GANから成る
・Generator
 入力:100次元分の乱数、4次元(Female、Male、Formal、Casual)
の商品ラベルに関するone hot encodingの連結
⁃ 特徴を沢山持つのは稀だから
⁃ ユーザーは1~2個のスタイルを選ぶことが多い
 出力:画像を生成
Generator Discriminator
実装
・Discriminator
 入力:本物の画像、Discriminatorの出力
 出力:0~1の実数値(本物か偽物かを判定)
・収束するまで交互に学習
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
Intelligent Design Generation Model 16
・ GeneratorとDiscriminatorを交互に更新
 Generatorを固定、 Discriminatorを2回更新
 Discriminatorを固定、 Generatorを1回更新
・batch size=32
・1 epochごとに320回学習。100epoch学習
・ GeneratorとDiscriminatorのパラメータ:正規分布(平均0, 標準偏差0.02)
・Adamによりパラメータ更新
・ Discriminatorの活性化関数:Leaky ReLU
学習時の詳細設定
学習時間に応じて、高品質な画像を生成
1 epoch 10 epoch 100 epoch
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
Intelligent Design Generation Model 17
・右図は不適なサンプルも入っている
・イメージをもとに靴を生成できる
・生成された2000枚の画像のうち、不適なサンプルの割合は4.1%ほどあった
 プロのデザイナーの知見に基づいて評価
定性的な評価
100epochでの生成結果
不適なサンプルが生成された理由
・靴の色が複雑なものがある
・靴紐が細いものがある
 靴紐と本体の繋がりがわかりにくい
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
Intelligent Design Generation Model 18
・アンケート実施
 生成された商品がイメージと合致しているか検証するため
・工業デザイン学科の大学院生・教員20名が被検者
 23歳から40歳までの男性7名、女性13名
・320枚のサンプルを作成
 4.1%の不適なサンプルを除去。各イメージごとに25枚選択(合計100枚)
・被検者は、1枚のサンプルごとにイメージを選択
 各自の経験をもとに選択
 「Male Casual」、「Male Formal」 、「Female Casual」、「Female Formal」、
「non-conformance(どれにも適さない)」から選択
定量的な評価
16人以上(8割以上)の被検者が正しい選択をした場合
その生成サンプルはイメージ通り(True)と判断
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
Intelligent Design Generation Model 19
定量的な評価
誤ったパターンについて
結果
(例)Female Casual
・約半数のみがFemale Casualを選択したサンプルが2枚
 Female Casual以外では、多くの人がnon-conformanceを選択
・ non-conformanceを選択したうちの一人は、 Neutral Casual と判断した
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
考察 20
・ファッション以外でも、他分野の商品イメージに対して適応可能
Intelligent Design Generation Modelの応用
(例)自動車
 必要な準備
⁃ 自動車画像の用意
⁃ ユーザーによる、イメージ評価(「モダン-レトロ」、「流行り-伝統的」な
ど)をしてもらう
(例)人間への支援
 デザイナー
⁃ 生成された画像を参考に、改善が可能(労働時間削減、作業効率向上)
 ユーザー
⁃ 生成された画像をもとに、自分の好みの理解につながる(外観の形成)
・現段階での課題:労力がかかる
 画像は同じ視点から撮影
 人手により行われるラベル付け
 上記2つを満たしたラベル付き画像が大量にある
教師なし学習による商品イメージ認識を検討
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
結論 21
・消費者の抱くイメージとファッション商品のマッチングを目的
・Product Image Recognition modelは、ユーザーとデザイナーの認識の一
致のため
・Intelligent Design Generation Modelは、革新的な商品を生成できる
・今回は、靴の画像に照準を絞る
・実験結果から、提案手法の実現可能性と有効性が示せた

More Related Content

What's hot

三次元表現まとめ(深層学習を中心に)
三次元表現まとめ(深層学習を中心に)三次元表現まとめ(深層学習を中心に)
三次元表現まとめ(深層学習を中心に)Tomohiro Motoda
 
CVPR2018のPointCloudのCNN論文とSPLATNet
CVPR2018のPointCloudのCNN論文とSPLATNetCVPR2018のPointCloudのCNN論文とSPLATNet
CVPR2018のPointCloudのCNN論文とSPLATNetTakuya Minagawa
 
DLゼミ: Ego-Body Pose Estimation via Ego-Head Pose Estimation
DLゼミ: Ego-Body Pose Estimation via Ego-Head Pose EstimationDLゼミ: Ego-Body Pose Estimation via Ego-Head Pose Estimation
DLゼミ: Ego-Body Pose Estimation via Ego-Head Pose Estimationharmonylab
 
深層学習を用いたバス乗客画像の属性推定 に関する研究
深層学習を用いたバス乗客画像の属性推定 に関する研究深層学習を用いたバス乗客画像の属性推定 に関する研究
深層学習を用いたバス乗客画像の属性推定 に関する研究harmonylab
 
[DL輪読会]Deep High-Resolution Representation Learning for Human Pose Estimation
[DL輪読会]Deep High-Resolution Representation Learning for Human Pose Estimation[DL輪読会]Deep High-Resolution Representation Learning for Human Pose Estimation
[DL輪読会]Deep High-Resolution Representation Learning for Human Pose EstimationDeep Learning JP
 
Towards Total Recall in Industrial Anomaly Detection
Towards Total Recall in Industrial Anomaly DetectionTowards Total Recall in Industrial Anomaly Detection
Towards Total Recall in Industrial Anomaly Detectionharmonylab
 
SSII2019TS: 実践カメラキャリブレーション ~カメラを用いた実世界計測の基礎と応用~
SSII2019TS: 実践カメラキャリブレーション ~カメラを用いた実世界計測の基礎と応用~SSII2019TS: 実践カメラキャリブレーション ~カメラを用いた実世界計測の基礎と応用~
SSII2019TS: 実践カメラキャリブレーション ~カメラを用いた実世界計測の基礎と応用~SSII
 
遠赤外線カメラと可視カメラを利用した悪条件下における画像取得
遠赤外線カメラと可視カメラを利用した悪条件下における画像取得遠赤外線カメラと可視カメラを利用した悪条件下における画像取得
遠赤外線カメラと可視カメラを利用した悪条件下における画像取得Masayuki Tanaka
 
「解説資料」ViTPose: Simple Vision Transformer Baselines for Human Pose Estimation
「解説資料」ViTPose: Simple Vision Transformer Baselines for Human Pose Estimation 「解説資料」ViTPose: Simple Vision Transformer Baselines for Human Pose Estimation
「解説資料」ViTPose: Simple Vision Transformer Baselines for Human Pose Estimation Takumi Ohkuma
 
SSII2021 [OS3-01] 設備や環境の高品質計測点群取得と自動モデル化技術
SSII2021 [OS3-01] 設備や環境の高品質計測点群取得と自動モデル化技術SSII2021 [OS3-01] 設備や環境の高品質計測点群取得と自動モデル化技術
SSII2021 [OS3-01] 設備や環境の高品質計測点群取得と自動モデル化技術SSII
 
条件付き確率場の推論と学習
条件付き確率場の推論と学習条件付き確率場の推論と学習
条件付き確率場の推論と学習Masaki Saito
 
[DL輪読会]Meta-Learning Probabilistic Inference for Prediction
[DL輪読会]Meta-Learning Probabilistic Inference for Prediction[DL輪読会]Meta-Learning Probabilistic Inference for Prediction
[DL輪読会]Meta-Learning Probabilistic Inference for PredictionDeep Learning JP
 
パターン認識と機械学習入門
パターン認識と機械学習入門パターン認識と機械学習入門
パターン認識と機械学習入門Momoko Hayamizu
 
VisualSFMとMeshLabとCloudCompareによるドローン撮影画像を用いたデジタル地図作成
VisualSFMとMeshLabとCloudCompareによるドローン撮影画像を用いたデジタル地図作成VisualSFMとMeshLabとCloudCompareによるドローン撮影画像を用いたデジタル地図作成
VisualSFMとMeshLabとCloudCompareによるドローン撮影画像を用いたデジタル地図作成Hiroshi Yamaguchi
 
第7回WBAシンポジウム:予測符号化モデルとしての 深層予測学習とロボット知能化
第7回WBAシンポジウム:予測符号化モデルとしての 深層予測学習とロボット知能化第7回WBAシンポジウム:予測符号化モデルとしての 深層予測学習とロボット知能化
第7回WBAシンポジウム:予測符号化モデルとしての 深層予測学習とロボット知能化The Whole Brain Architecture Initiative
 
SSII2020TS: 物理ベースビジョンの過去・現在・未来 〜 カメラ・物体・光のインタラクションを モデル化するには 〜
SSII2020TS: 物理ベースビジョンの過去・現在・未来 〜 カメラ・物体・光のインタラクションを モデル化するには 〜SSII2020TS: 物理ベースビジョンの過去・現在・未来 〜 カメラ・物体・光のインタラクションを モデル化するには 〜
SSII2020TS: 物理ベースビジョンの過去・現在・未来 〜 カメラ・物体・光のインタラクションを モデル化するには 〜SSII
 

What's hot (20)

三次元表現まとめ(深層学習を中心に)
三次元表現まとめ(深層学習を中心に)三次元表現まとめ(深層学習を中心に)
三次元表現まとめ(深層学習を中心に)
 
CVPR2018のPointCloudのCNN論文とSPLATNet
CVPR2018のPointCloudのCNN論文とSPLATNetCVPR2018のPointCloudのCNN論文とSPLATNet
CVPR2018のPointCloudのCNN論文とSPLATNet
 
DLゼミ: Ego-Body Pose Estimation via Ego-Head Pose Estimation
DLゼミ: Ego-Body Pose Estimation via Ego-Head Pose EstimationDLゼミ: Ego-Body Pose Estimation via Ego-Head Pose Estimation
DLゼミ: Ego-Body Pose Estimation via Ego-Head Pose Estimation
 
深層学習を用いたバス乗客画像の属性推定 に関する研究
深層学習を用いたバス乗客画像の属性推定 に関する研究深層学習を用いたバス乗客画像の属性推定 に関する研究
深層学習を用いたバス乗客画像の属性推定 に関する研究
 
[DL輪読会]Deep High-Resolution Representation Learning for Human Pose Estimation
[DL輪読会]Deep High-Resolution Representation Learning for Human Pose Estimation[DL輪読会]Deep High-Resolution Representation Learning for Human Pose Estimation
[DL輪読会]Deep High-Resolution Representation Learning for Human Pose Estimation
 
Towards Total Recall in Industrial Anomaly Detection
Towards Total Recall in Industrial Anomaly DetectionTowards Total Recall in Industrial Anomaly Detection
Towards Total Recall in Industrial Anomaly Detection
 
SSII2019TS: 実践カメラキャリブレーション ~カメラを用いた実世界計測の基礎と応用~
SSII2019TS: 実践カメラキャリブレーション ~カメラを用いた実世界計測の基礎と応用~SSII2019TS: 実践カメラキャリブレーション ~カメラを用いた実世界計測の基礎と応用~
SSII2019TS: 実践カメラキャリブレーション ~カメラを用いた実世界計測の基礎と応用~
 
遠赤外線カメラと可視カメラを利用した悪条件下における画像取得
遠赤外線カメラと可視カメラを利用した悪条件下における画像取得遠赤外線カメラと可視カメラを利用した悪条件下における画像取得
遠赤外線カメラと可視カメラを利用した悪条件下における画像取得
 
「解説資料」ViTPose: Simple Vision Transformer Baselines for Human Pose Estimation
「解説資料」ViTPose: Simple Vision Transformer Baselines for Human Pose Estimation 「解説資料」ViTPose: Simple Vision Transformer Baselines for Human Pose Estimation
「解説資料」ViTPose: Simple Vision Transformer Baselines for Human Pose Estimation
 
Visual slam
Visual slamVisual slam
Visual slam
 
SSII2021 [OS3-01] 設備や環境の高品質計測点群取得と自動モデル化技術
SSII2021 [OS3-01] 設備や環境の高品質計測点群取得と自動モデル化技術SSII2021 [OS3-01] 設備や環境の高品質計測点群取得と自動モデル化技術
SSII2021 [OS3-01] 設備や環境の高品質計測点群取得と自動モデル化技術
 
LiDARとSensor Fusion
LiDARとSensor FusionLiDARとSensor Fusion
LiDARとSensor Fusion
 
条件付き確率場の推論と学習
条件付き確率場の推論と学習条件付き確率場の推論と学習
条件付き確率場の推論と学習
 
[DL輪読会]Meta-Learning Probabilistic Inference for Prediction
[DL輪読会]Meta-Learning Probabilistic Inference for Prediction[DL輪読会]Meta-Learning Probabilistic Inference for Prediction
[DL輪読会]Meta-Learning Probabilistic Inference for Prediction
 
パターン認識と機械学習入門
パターン認識と機械学習入門パターン認識と機械学習入門
パターン認識と機械学習入門
 
画像処理応用
画像処理応用画像処理応用
画像処理応用
 
VisualSFMとMeshLabとCloudCompareによるドローン撮影画像を用いたデジタル地図作成
VisualSFMとMeshLabとCloudCompareによるドローン撮影画像を用いたデジタル地図作成VisualSFMとMeshLabとCloudCompareによるドローン撮影画像を用いたデジタル地図作成
VisualSFMとMeshLabとCloudCompareによるドローン撮影画像を用いたデジタル地図作成
 
第7回WBAシンポジウム:予測符号化モデルとしての 深層予測学習とロボット知能化
第7回WBAシンポジウム:予測符号化モデルとしての 深層予測学習とロボット知能化第7回WBAシンポジウム:予測符号化モデルとしての 深層予測学習とロボット知能化
第7回WBAシンポジウム:予測符号化モデルとしての 深層予測学習とロボット知能化
 
Tokyo r53
Tokyo r53Tokyo r53
Tokyo r53
 
SSII2020TS: 物理ベースビジョンの過去・現在・未来 〜 カメラ・物体・光のインタラクションを モデル化するには 〜
SSII2020TS: 物理ベースビジョンの過去・現在・未来 〜 カメラ・物体・光のインタラクションを モデル化するには 〜SSII2020TS: 物理ベースビジョンの過去・現在・未来 〜 カメラ・物体・光のインタラクションを モデル化するには 〜
SSII2020TS: 物理ベースビジョンの過去・現在・未来 〜 カメラ・物体・光のインタラクションを モデル化するには 〜
 

Similar to Emotionally Intelligent Fashion Design Using CNN and GAN

【卒業論文】印象タグを用いた衣服画像生成システムに関する研究
【卒業論文】印象タグを用いた衣服画像生成システムに関する研究【卒業論文】印象タグを用いた衣服画像生成システムに関する研究
【卒業論文】印象タグを用いた衣服画像生成システムに関する研究harmonylab
 
Self-supervised Learning of Adversarial Example: Towards Good Generalizations...
Self-supervised Learning of Adversarial Example:Towards Good Generalizations...Self-supervised Learning of Adversarial Example:Towards Good Generalizations...
Self-supervised Learning of Adversarial Example: Towards Good Generalizations...harmonylab
 
DLゼミ:Primitive Generation and Semantic-related Alignment for Universal Zero-S...
DLゼミ:Primitive Generation and Semantic-related Alignment for Universal Zero-S...DLゼミ:Primitive Generation and Semantic-related Alignment for Universal Zero-S...
DLゼミ:Primitive Generation and Semantic-related Alignment for Universal Zero-S...harmonylab
 
Personalized Fashion Recommendation from Personal Social Media Data An Item t...
Personalized Fashion Recommendation from Personal Social Media Data An Item t...Personalized Fashion Recommendation from Personal Social Media Data An Item t...
Personalized Fashion Recommendation from Personal Social Media Data An Item t...harmonylab
 
Efficient Deep Reinforcement Learning with Imitative Expert Priors for Autono...
Efficient Deep Reinforcement Learning with Imitative Expert Priors for Autono...Efficient Deep Reinforcement Learning with Imitative Expert Priors for Autono...
Efficient Deep Reinforcement Learning with Imitative Expert Priors for Autono...harmonylab
 
MASTERING ATARI WITH DISCRETE WORLD MODELS (DreamerV2)
MASTERING ATARI WITH DISCRETE WORLD MODELS (DreamerV2)MASTERING ATARI WITH DISCRETE WORLD MODELS (DreamerV2)
MASTERING ATARI WITH DISCRETE WORLD MODELS (DreamerV2)harmonylab
 
MLP-Mixer: An all-MLP Architecture for Vision
MLP-Mixer: An all-MLP Architecture for VisionMLP-Mixer: An all-MLP Architecture for Vision
MLP-Mixer: An all-MLP Architecture for Visionharmonylab
 
All That’s ‘Human’ Is Not Gold Evaluating Human Evaluation of Generated Text
All That’s ‘Human’ Is Not Gold Evaluating Human Evaluation of Generated TextAll That’s ‘Human’ Is Not Gold Evaluating Human Evaluation of Generated Text
All That’s ‘Human’ Is Not Gold Evaluating Human Evaluation of Generated Textharmonylab
 
SegFormer: Simple and Efficient Design for Semantic Segmentation with Transfo...
SegFormer: Simple and Efficient Design for Semantic Segmentation with Transfo...SegFormer: Simple and Efficient Design for Semantic Segmentation with Transfo...
SegFormer: Simple and Efficient Design for Semantic Segmentation with Transfo...harmonylab
 
You Only Learn One Representation: Unified Network for Multiple Tasks
You Only Learn One Representation: Unified Network for Multiple TasksYou Only Learn One Representation: Unified Network for Multiple Tasks
You Only Learn One Representation: Unified Network for Multiple Tasksharmonylab
 
Fine Grained Fashion Similarity Prediction by Attribute Specific Embedding Le...
Fine Grained Fashion Similarity Prediction by Attribute Specific Embedding Le...Fine Grained Fashion Similarity Prediction by Attribute Specific Embedding Le...
Fine Grained Fashion Similarity Prediction by Attribute Specific Embedding Le...harmonylab
 
Semi-Supervised Neural Architecture Search
Semi-Supervised Neural Architecture SearchSemi-Supervised Neural Architecture Search
Semi-Supervised Neural Architecture Searchharmonylab
 
2021 09 29_dl_hirata
2021 09 29_dl_hirata2021 09 29_dl_hirata
2021 09 29_dl_hirataharmonylab
 
ロードヒーティング制御における深層学習を用いた路面画像認識に関する研究
ロードヒーティング制御における深層学習を用いた路面画像認識に関する研究ロードヒーティング制御における深層学習を用いた路面画像認識に関する研究
ロードヒーティング制御における深層学習を用いた路面画像認識に関する研究harmonylab
 
Outfit net fashion outfit recommendation with attention based multiple instan...
Outfit net fashion outfit recommendation with attention based multiple instan...Outfit net fashion outfit recommendation with attention based multiple instan...
Outfit net fashion outfit recommendation with attention based multiple instan...harmonylab
 
DLゼミ: ViTPose: Simple Vision Transformer Baselines for Human Pose Estimation
DLゼミ: ViTPose: Simple Vision Transformer Baselines for Human Pose EstimationDLゼミ: ViTPose: Simple Vision Transformer Baselines for Human Pose Estimation
DLゼミ: ViTPose: Simple Vision Transformer Baselines for Human Pose Estimationharmonylab
 
Feature Erasing and Diffusion Network for Occluded Person Re-Identification
Feature Erasing and Diffusion Network for Occluded Person Re-IdentificationFeature Erasing and Diffusion Network for Occluded Person Re-Identification
Feature Erasing and Diffusion Network for Occluded Person Re-Identificationharmonylab
 

Similar to Emotionally Intelligent Fashion Design Using CNN and GAN (20)

【卒業論文】印象タグを用いた衣服画像生成システムに関する研究
【卒業論文】印象タグを用いた衣服画像生成システムに関する研究【卒業論文】印象タグを用いた衣服画像生成システムに関する研究
【卒業論文】印象タグを用いた衣服画像生成システムに関する研究
 
Self-supervised Learning of Adversarial Example: Towards Good Generalizations...
Self-supervised Learning of Adversarial Example:Towards Good Generalizations...Self-supervised Learning of Adversarial Example:Towards Good Generalizations...
Self-supervised Learning of Adversarial Example: Towards Good Generalizations...
 
DLゼミ:Primitive Generation and Semantic-related Alignment for Universal Zero-S...
DLゼミ:Primitive Generation and Semantic-related Alignment for Universal Zero-S...DLゼミ:Primitive Generation and Semantic-related Alignment for Universal Zero-S...
DLゼミ:Primitive Generation and Semantic-related Alignment for Universal Zero-S...
 
Personalized Fashion Recommendation from Personal Social Media Data An Item t...
Personalized Fashion Recommendation from Personal Social Media Data An Item t...Personalized Fashion Recommendation from Personal Social Media Data An Item t...
Personalized Fashion Recommendation from Personal Social Media Data An Item t...
 
Efficient Deep Reinforcement Learning with Imitative Expert Priors for Autono...
Efficient Deep Reinforcement Learning with Imitative Expert Priors for Autono...Efficient Deep Reinforcement Learning with Imitative Expert Priors for Autono...
Efficient Deep Reinforcement Learning with Imitative Expert Priors for Autono...
 
MASTERING ATARI WITH DISCRETE WORLD MODELS (DreamerV2)
MASTERING ATARI WITH DISCRETE WORLD MODELS (DreamerV2)MASTERING ATARI WITH DISCRETE WORLD MODELS (DreamerV2)
MASTERING ATARI WITH DISCRETE WORLD MODELS (DreamerV2)
 
MLP-Mixer: An all-MLP Architecture for Vision
MLP-Mixer: An all-MLP Architecture for VisionMLP-Mixer: An all-MLP Architecture for Vision
MLP-Mixer: An all-MLP Architecture for Vision
 
All That’s ‘Human’ Is Not Gold Evaluating Human Evaluation of Generated Text
All That’s ‘Human’ Is Not Gold Evaluating Human Evaluation of Generated TextAll That’s ‘Human’ Is Not Gold Evaluating Human Evaluation of Generated Text
All That’s ‘Human’ Is Not Gold Evaluating Human Evaluation of Generated Text
 
SegFormer: Simple and Efficient Design for Semantic Segmentation with Transfo...
SegFormer: Simple and Efficient Design for Semantic Segmentation with Transfo...SegFormer: Simple and Efficient Design for Semantic Segmentation with Transfo...
SegFormer: Simple and Efficient Design for Semantic Segmentation with Transfo...
 
You Only Learn One Representation: Unified Network for Multiple Tasks
You Only Learn One Representation: Unified Network for Multiple TasksYou Only Learn One Representation: Unified Network for Multiple Tasks
You Only Learn One Representation: Unified Network for Multiple Tasks
 
Fine Grained Fashion Similarity Prediction by Attribute Specific Embedding Le...
Fine Grained Fashion Similarity Prediction by Attribute Specific Embedding Le...Fine Grained Fashion Similarity Prediction by Attribute Specific Embedding Le...
Fine Grained Fashion Similarity Prediction by Attribute Specific Embedding Le...
 
2021 haizoku
2021 haizoku2021 haizoku
2021 haizoku
 
2021 haizoku
2021 haizoku2021 haizoku
2021 haizoku
 
Semi-Supervised Neural Architecture Search
Semi-Supervised Neural Architecture SearchSemi-Supervised Neural Architecture Search
Semi-Supervised Neural Architecture Search
 
2021 09 29_dl_hirata
2021 09 29_dl_hirata2021 09 29_dl_hirata
2021 09 29_dl_hirata
 
修士論文
修士論文修士論文
修士論文
 
ロードヒーティング制御における深層学習を用いた路面画像認識に関する研究
ロードヒーティング制御における深層学習を用いた路面画像認識に関する研究ロードヒーティング制御における深層学習を用いた路面画像認識に関する研究
ロードヒーティング制御における深層学習を用いた路面画像認識に関する研究
 
Outfit net fashion outfit recommendation with attention based multiple instan...
Outfit net fashion outfit recommendation with attention based multiple instan...Outfit net fashion outfit recommendation with attention based multiple instan...
Outfit net fashion outfit recommendation with attention based multiple instan...
 
DLゼミ: ViTPose: Simple Vision Transformer Baselines for Human Pose Estimation
DLゼミ: ViTPose: Simple Vision Transformer Baselines for Human Pose EstimationDLゼミ: ViTPose: Simple Vision Transformer Baselines for Human Pose Estimation
DLゼミ: ViTPose: Simple Vision Transformer Baselines for Human Pose Estimation
 
Feature Erasing and Diffusion Network for Occluded Person Re-Identification
Feature Erasing and Diffusion Network for Occluded Person Re-IdentificationFeature Erasing and Diffusion Network for Occluded Person Re-Identification
Feature Erasing and Diffusion Network for Occluded Person Re-Identification
 

More from harmonylab

【修士論文】代替出勤者の選定業務における依頼順決定方法に関する研究   千坂知也
【修士論文】代替出勤者の選定業務における依頼順決定方法に関する研究   千坂知也【修士論文】代替出勤者の選定業務における依頼順決定方法に関する研究   千坂知也
【修士論文】代替出勤者の選定業務における依頼順決定方法に関する研究   千坂知也harmonylab
 
【修士論文】経路探索のための媒介中心性に基づく道路ネットワーク階層化手法に関する研究
【修士論文】経路探索のための媒介中心性に基づく道路ネットワーク階層化手法に関する研究【修士論文】経路探索のための媒介中心性に基づく道路ネットワーク階層化手法に関する研究
【修士論文】経路探索のための媒介中心性に基づく道路ネットワーク階層化手法に関する研究harmonylab
 
A Study on Decision Support System for Snow Removal Dispatch using Road Surfa...
A Study on Decision Support System for Snow Removal Dispatch using Road Surfa...A Study on Decision Support System for Snow Removal Dispatch using Road Surfa...
A Study on Decision Support System for Snow Removal Dispatch using Road Surfa...harmonylab
 
【卒業論文】大規模言語モデルを用いたマニュアル文章修正手法に関する研究
【卒業論文】大規模言語モデルを用いたマニュアル文章修正手法に関する研究【卒業論文】大規模言語モデルを用いたマニュアル文章修正手法に関する研究
【卒業論文】大規模言語モデルを用いたマニュアル文章修正手法に関する研究harmonylab
 
DLゼミ: MobileOne: An Improved One millisecond Mobile Backbone
DLゼミ: MobileOne: An Improved One millisecond Mobile BackboneDLゼミ: MobileOne: An Improved One millisecond Mobile Backbone
DLゼミ: MobileOne: An Improved One millisecond Mobile Backboneharmonylab
 
DLゼミ: Llama 2: Open Foundation and Fine-Tuned Chat Models
DLゼミ: Llama 2: Open Foundation and Fine-Tuned Chat ModelsDLゼミ: Llama 2: Open Foundation and Fine-Tuned Chat Models
DLゼミ: Llama 2: Open Foundation and Fine-Tuned Chat Modelsharmonylab
 
Voyager: An Open-Ended Embodied Agent with Large Language Models
Voyager: An Open-Ended Embodied Agent with Large Language ModelsVoyager: An Open-Ended Embodied Agent with Large Language Models
Voyager: An Open-Ended Embodied Agent with Large Language Modelsharmonylab
 
ReAct: Synergizing Reasoning and Acting in Language Models
ReAct: Synergizing Reasoning and Acting in Language ModelsReAct: Synergizing Reasoning and Acting in Language Models
ReAct: Synergizing Reasoning and Acting in Language Modelsharmonylab
 
形態素解析を用いた帝国議会議事速記録の変遷に関する研究
形態素解析を用いた帝国議会議事速記録の変遷に関する研究形態素解析を用いた帝国議会議事速記録の変遷に関する研究
形態素解析を用いた帝国議会議事速記録の変遷に関する研究harmonylab
 
灯油タンク内の液面高計測を用いた 灯油残量推定システムに関する研究
灯油タンク内の液面高計測を用いた灯油残量推定システムに関する研究灯油タンク内の液面高計測を用いた灯油残量推定システムに関する研究
灯油タンク内の液面高計測を用いた 灯油残量推定システムに関する研究harmonylab
 
深層自己回帰モデルを用いた俳句の生成と評価に関する研究
深層自己回帰モデルを用いた俳句の生成と評価に関する研究深層自己回帰モデルを用いた俳句の生成と評価に関する研究
深層自己回帰モデルを用いた俳句の生成と評価に関する研究harmonylab
 
競輪におけるレーティングシステムを用いた予想記事生成に関する研究
競輪におけるレーティングシステムを用いた予想記事生成に関する研究競輪におけるレーティングシステムを用いた予想記事生成に関する研究
競輪におけるレーティングシステムを用いた予想記事生成に関する研究harmonylab
 
【卒業論文】B2Bオークションにおけるユーザ別 入札行動予測に関する研究
【卒業論文】B2Bオークションにおけるユーザ別 入札行動予測に関する研究【卒業論文】B2Bオークションにおけるユーザ別 入札行動予測に関する研究
【卒業論文】B2Bオークションにおけるユーザ別 入札行動予測に関する研究harmonylab
 
A Study on Estimation of Household Kerosene Consumption for Optimization of D...
A Study on Estimation of Household Kerosene Consumption for Optimization of D...A Study on Estimation of Household Kerosene Consumption for Optimization of D...
A Study on Estimation of Household Kerosene Consumption for Optimization of D...harmonylab
 
A Study on Generation of Deformed Route Maps using Octilinear Grid
A Study on Generation of Deformed Route Maps using Octilinear GridA Study on Generation of Deformed Route Maps using Octilinear Grid
A Study on Generation of Deformed Route Maps using Octilinear Gridharmonylab
 
A Study on Clothing Recommendation Information Presentation System Based on C...
A Study on Clothing Recommendation Information Presentation System Based on C...A Study on Clothing Recommendation Information Presentation System Based on C...
A Study on Clothing Recommendation Information Presentation System Based on C...harmonylab
 
DeBERTaV3: Improving DeBERTa using ELECTRA-Style Pre-Training with Gradient-D...
DeBERTaV3: Improving DeBERTa using ELECTRA-Style Pre-Training with Gradient-D...DeBERTaV3: Improving DeBERTa using ELECTRA-Style Pre-Training with Gradient-D...
DeBERTaV3: Improving DeBERTa using ELECTRA-Style Pre-Training with Gradient-D...harmonylab
 
ZeroCap: Zero-Shot Image-to-Text Generation for Visual-Semantic Arithmetic
ZeroCap: Zero-Shot Image-to-Text Generation for Visual-Semantic ArithmeticZeroCap: Zero-Shot Image-to-Text Generation for Visual-Semantic Arithmetic
ZeroCap: Zero-Shot Image-to-Text Generation for Visual-Semantic Arithmeticharmonylab
 
2022年度調和系工学研究室配属説明会資料
2022年度調和系工学研究室配属説明会資料2022年度調和系工学研究室配属説明会資料
2022年度調和系工学研究室配属説明会資料harmonylab
 
CKL_about_panf2022.pdf
CKL_about_panf2022.pdfCKL_about_panf2022.pdf
CKL_about_panf2022.pdfharmonylab
 

More from harmonylab (20)

【修士論文】代替出勤者の選定業務における依頼順決定方法に関する研究   千坂知也
【修士論文】代替出勤者の選定業務における依頼順決定方法に関する研究   千坂知也【修士論文】代替出勤者の選定業務における依頼順決定方法に関する研究   千坂知也
【修士論文】代替出勤者の選定業務における依頼順決定方法に関する研究   千坂知也
 
【修士論文】経路探索のための媒介中心性に基づく道路ネットワーク階層化手法に関する研究
【修士論文】経路探索のための媒介中心性に基づく道路ネットワーク階層化手法に関する研究【修士論文】経路探索のための媒介中心性に基づく道路ネットワーク階層化手法に関する研究
【修士論文】経路探索のための媒介中心性に基づく道路ネットワーク階層化手法に関する研究
 
A Study on Decision Support System for Snow Removal Dispatch using Road Surfa...
A Study on Decision Support System for Snow Removal Dispatch using Road Surfa...A Study on Decision Support System for Snow Removal Dispatch using Road Surfa...
A Study on Decision Support System for Snow Removal Dispatch using Road Surfa...
 
【卒業論文】大規模言語モデルを用いたマニュアル文章修正手法に関する研究
【卒業論文】大規模言語モデルを用いたマニュアル文章修正手法に関する研究【卒業論文】大規模言語モデルを用いたマニュアル文章修正手法に関する研究
【卒業論文】大規模言語モデルを用いたマニュアル文章修正手法に関する研究
 
DLゼミ: MobileOne: An Improved One millisecond Mobile Backbone
DLゼミ: MobileOne: An Improved One millisecond Mobile BackboneDLゼミ: MobileOne: An Improved One millisecond Mobile Backbone
DLゼミ: MobileOne: An Improved One millisecond Mobile Backbone
 
DLゼミ: Llama 2: Open Foundation and Fine-Tuned Chat Models
DLゼミ: Llama 2: Open Foundation and Fine-Tuned Chat ModelsDLゼミ: Llama 2: Open Foundation and Fine-Tuned Chat Models
DLゼミ: Llama 2: Open Foundation and Fine-Tuned Chat Models
 
Voyager: An Open-Ended Embodied Agent with Large Language Models
Voyager: An Open-Ended Embodied Agent with Large Language ModelsVoyager: An Open-Ended Embodied Agent with Large Language Models
Voyager: An Open-Ended Embodied Agent with Large Language Models
 
ReAct: Synergizing Reasoning and Acting in Language Models
ReAct: Synergizing Reasoning and Acting in Language ModelsReAct: Synergizing Reasoning and Acting in Language Models
ReAct: Synergizing Reasoning and Acting in Language Models
 
形態素解析を用いた帝国議会議事速記録の変遷に関する研究
形態素解析を用いた帝国議会議事速記録の変遷に関する研究形態素解析を用いた帝国議会議事速記録の変遷に関する研究
形態素解析を用いた帝国議会議事速記録の変遷に関する研究
 
灯油タンク内の液面高計測を用いた 灯油残量推定システムに関する研究
灯油タンク内の液面高計測を用いた灯油残量推定システムに関する研究灯油タンク内の液面高計測を用いた灯油残量推定システムに関する研究
灯油タンク内の液面高計測を用いた 灯油残量推定システムに関する研究
 
深層自己回帰モデルを用いた俳句の生成と評価に関する研究
深層自己回帰モデルを用いた俳句の生成と評価に関する研究深層自己回帰モデルを用いた俳句の生成と評価に関する研究
深層自己回帰モデルを用いた俳句の生成と評価に関する研究
 
競輪におけるレーティングシステムを用いた予想記事生成に関する研究
競輪におけるレーティングシステムを用いた予想記事生成に関する研究競輪におけるレーティングシステムを用いた予想記事生成に関する研究
競輪におけるレーティングシステムを用いた予想記事生成に関する研究
 
【卒業論文】B2Bオークションにおけるユーザ別 入札行動予測に関する研究
【卒業論文】B2Bオークションにおけるユーザ別 入札行動予測に関する研究【卒業論文】B2Bオークションにおけるユーザ別 入札行動予測に関する研究
【卒業論文】B2Bオークションにおけるユーザ別 入札行動予測に関する研究
 
A Study on Estimation of Household Kerosene Consumption for Optimization of D...
A Study on Estimation of Household Kerosene Consumption for Optimization of D...A Study on Estimation of Household Kerosene Consumption for Optimization of D...
A Study on Estimation of Household Kerosene Consumption for Optimization of D...
 
A Study on Generation of Deformed Route Maps using Octilinear Grid
A Study on Generation of Deformed Route Maps using Octilinear GridA Study on Generation of Deformed Route Maps using Octilinear Grid
A Study on Generation of Deformed Route Maps using Octilinear Grid
 
A Study on Clothing Recommendation Information Presentation System Based on C...
A Study on Clothing Recommendation Information Presentation System Based on C...A Study on Clothing Recommendation Information Presentation System Based on C...
A Study on Clothing Recommendation Information Presentation System Based on C...
 
DeBERTaV3: Improving DeBERTa using ELECTRA-Style Pre-Training with Gradient-D...
DeBERTaV3: Improving DeBERTa using ELECTRA-Style Pre-Training with Gradient-D...DeBERTaV3: Improving DeBERTa using ELECTRA-Style Pre-Training with Gradient-D...
DeBERTaV3: Improving DeBERTa using ELECTRA-Style Pre-Training with Gradient-D...
 
ZeroCap: Zero-Shot Image-to-Text Generation for Visual-Semantic Arithmetic
ZeroCap: Zero-Shot Image-to-Text Generation for Visual-Semantic ArithmeticZeroCap: Zero-Shot Image-to-Text Generation for Visual-Semantic Arithmetic
ZeroCap: Zero-Shot Image-to-Text Generation for Visual-Semantic Arithmetic
 
2022年度調和系工学研究室配属説明会資料
2022年度調和系工学研究室配属説明会資料2022年度調和系工学研究室配属説明会資料
2022年度調和系工学研究室配属説明会資料
 
CKL_about_panf2022.pdf
CKL_about_panf2022.pdfCKL_about_panf2022.pdf
CKL_about_panf2022.pdf
 

Recently uploaded

Postman LT Fukuoka_Quick Prototype_By Daniel
Postman LT Fukuoka_Quick Prototype_By DanielPostman LT Fukuoka_Quick Prototype_By Daniel
Postman LT Fukuoka_Quick Prototype_By Danieldanielhu54
 
論文紹介:Semantic segmentation using Vision Transformers: A survey
論文紹介:Semantic segmentation using Vision Transformers: A survey論文紹介:Semantic segmentation using Vision Transformers: A survey
論文紹介:Semantic segmentation using Vision Transformers: A surveyToru Tamaki
 
SOPを理解する 2024/04/19 の勉強会で発表されたものです
SOPを理解する       2024/04/19 の勉強会で発表されたものですSOPを理解する       2024/04/19 の勉強会で発表されたものです
SOPを理解する 2024/04/19 の勉強会で発表されたものですiPride Co., Ltd.
 
スマートフォンを用いた新生児あやし動作の教示システム
スマートフォンを用いた新生児あやし動作の教示システムスマートフォンを用いた新生児あやし動作の教示システム
スマートフォンを用いた新生児あやし動作の教示システムsugiuralab
 
論文紹介:Automated Classification of Model Errors on ImageNet
論文紹介:Automated Classification of Model Errors on ImageNet論文紹介:Automated Classification of Model Errors on ImageNet
論文紹介:Automated Classification of Model Errors on ImageNetToru Tamaki
 
[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略
[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略
[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略Ryo Sasaki
 
論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...
論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...
論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...Toru Tamaki
 
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介Yuma Ohgami
 
TSAL operation mechanism and circuit diagram.pdf
TSAL operation mechanism and circuit diagram.pdfTSAL operation mechanism and circuit diagram.pdf
TSAL operation mechanism and circuit diagram.pdftaisei2219
 

Recently uploaded (9)

Postman LT Fukuoka_Quick Prototype_By Daniel
Postman LT Fukuoka_Quick Prototype_By DanielPostman LT Fukuoka_Quick Prototype_By Daniel
Postman LT Fukuoka_Quick Prototype_By Daniel
 
論文紹介:Semantic segmentation using Vision Transformers: A survey
論文紹介:Semantic segmentation using Vision Transformers: A survey論文紹介:Semantic segmentation using Vision Transformers: A survey
論文紹介:Semantic segmentation using Vision Transformers: A survey
 
SOPを理解する 2024/04/19 の勉強会で発表されたものです
SOPを理解する       2024/04/19 の勉強会で発表されたものですSOPを理解する       2024/04/19 の勉強会で発表されたものです
SOPを理解する 2024/04/19 の勉強会で発表されたものです
 
スマートフォンを用いた新生児あやし動作の教示システム
スマートフォンを用いた新生児あやし動作の教示システムスマートフォンを用いた新生児あやし動作の教示システム
スマートフォンを用いた新生児あやし動作の教示システム
 
論文紹介:Automated Classification of Model Errors on ImageNet
論文紹介:Automated Classification of Model Errors on ImageNet論文紹介:Automated Classification of Model Errors on ImageNet
論文紹介:Automated Classification of Model Errors on ImageNet
 
[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略
[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略
[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略
 
論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...
論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...
論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...
 
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介
 
TSAL operation mechanism and circuit diagram.pdf
TSAL operation mechanism and circuit diagram.pdfTSAL operation mechanism and circuit diagram.pdf
TSAL operation mechanism and circuit diagram.pdf
 

Emotionally Intelligent Fashion Design Using CNN and GAN

  • 1. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 調和系工学研究室 修士2年 右田 幹 Emotionally Intelligent Fashion Design Using CNN and GAN
  • 2. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. 論文情報 2 • タイトル – Emotionally Intelligent Fashion Design Using CNN and GAN • 著者 – Cheng Yang, Yuliang Zhou, authors Lingang Wu • 出典及び出典日 – Computer-Aided Design and Applications, 2021 03 • 論文URL – http://cad-journal.net/files/vol_18/CAD_18(5)_2021_900-913.pdf
  • 3. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. 概要 3 ・消費者の抱くイメージとファッション商品のマッチングを目的 ・商品イメージを分類( Product Image Recognition model )、生成 ( Intelligent Design Generation Model )するモデルを提案 ・Product Image Recognition modelモデルは、CNNベースにより構築 ・Intelligent Design Generation Modelモデルは、DCGANとConditinal GAN を組み合わせたものにより構築 ・今回は、靴の画像に照準を絞る ・実験結果から、提案手法の実現可能性と有効性が示せた
  • 4. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. 背景 4 本研究では靴を対象にして、商品イメージの設計手法を検討  商品イメージの認識(Product Image Recognition model )、生成(Intelligent Design Generation Model)を行う 製品性能が全体的に向上した  選ぶ上で機能よりもイメージが先行  消費者が望むイメージを把握することが重要に 機械学習により、消費者の感情を判断するモデルが登場  Jaber : クラスタリングにより、女優を親密さに応じて分類  Bell and Bala : CNNをもちいて、インテリアデザインに基づいて、配置する製品本体の 識別や類似製品の検索を実現 一方で、深層学習を利用して、ユーザーのイメージに基づいた 製品のデザイン分析に関する研究や開発はほとんどない 上記を実現することで、商品イメージの定義のみで 欲求通りの製品デザインを、容易かつ大量に取得可能
  • 5. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. Product Image Recognition model 5 ①データセット作成 ②使用するイメージ選択 ③商品のイメージをラベル付け ④CNNによる学習実装 ⑤結果 Product Image Recognition modelの概要 説明の流れ
  • 6. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. Product Image Recognition model 6 使用したデータセット:UT Zappos 50K  複数ブランドの50,025枚の靴の写真が 含まれる UT Zappos 50K データセットの一部 商品イメージ用語選出 ・86個を選出(関連研究、雑誌、ECサイトなどを参考) ・同じ意味を持つものを削除し、63個残す  例。 “publicized-introverted”、“publicized-understated” ・工業デザイン学科の大学院生・教員30名によりフィルタリング  画像に対して、最も適したイメージ用語を選択してもらう  15人以上によって正しく選択されたイメージ用語のみ。45個選出した データセット
  • 7. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. Product Image Recognition model 7 クラスタリングの概要 商品イメージのクラスタリング  工業デザイン学科の大学院生・教員22名が参加 データセット ・2乗和誤差の和(SSE)により最適なクラスタ数を決定。  4クラスタに分けたとき、明らかな変曲点があったため、これに ・4つのクラスタについて、各代表の単語ペアを選択  gorgeous-plain, modern-retro, casual-formal, and male-female. ・各自、45個を自らの判断でクラスタリング  クラスタ数、各クラスタに含まれる個数など、 制限はなし ・同じグループに含まれる単語同士の出現回数 を計算(45×45の行列に記入) Female Retro … Female ☓ 2 2 Retro 2 ☓ 3 … 3 4 ☓ 行列の例 ・スペクトルクラスタリングによりクラスタをグループ化 データからグラフを生成。グラフの連結性に注目してクラスタリングする手法
  • 8. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. Product Image Recognition model 8 被検者の選定 ・工業デザイン学科の大学教員と大学院生38名  23歳から40歳の男性17名、女性21名  一般消費者に比べ、商品イメージの知見がある アンケート ・50,025枚のデータセットから無作為に1,200枚選出 ・1200枚を無作為に12個のグループに分類。12種類のアンケートが出来上がる アンケートの1例 商品イメージのラベル付け
  • 9. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. Product Image Recognition model 9 ラベル付け結果 ・Positive:各商品に対して、全体のスコア平均が0より大きい ・Negative:各商品に対して、全体のスコア平均が0より小さい ・Neutral (扱わないため、非表示):各商品に対して、全体のスコア平均が0 各指標 (左側がPositive) Positive Negative Total Female - Male 426 503 929 Retro - Modern 525 398 923 Formal - Casual 778 200 978 Plain - Gorgeous 417 509 926 ラベル付け結果 商品イメージのラベル付け
  • 10. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. Product Image Recognition model 10 ・CNNの入力に対応させるために、正方形に変換  元々の画像サイズは136×102  白Paddingを追加。歪みを回避 ・データの分割  Train data : 7割  Test data : 3割 ・RGB値の平均値を算出  各画像の値から平均値を差し引き、これを用いる ・ Train dataに、画像を水平に反転させたものを追加 ・224×224に変換。CNNに入力 UT Zappos 50K データセットの一部 前処理
  • 11. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. Product Image Recognition model 11 ・靴の画像認識のために、VGG16を使用 ・出力層は、ソフトマックス関数を採用  各指標は、0~1の実数を取る VGG16の概要 指標(p9)に合わせて 4次元に変更 ・損失関数(weighted cross entropy) 𝑙𝑜𝑠𝑠 = 𝑖=1 𝑛 𝛼𝑖𝐶𝐸𝑖 𝑖=1 𝑛 𝛼𝑖 𝑛 ∶ 学習する画像の数 𝛼𝑖 ∶ 𝑖番目の商品イメージの平均スコア 𝐶𝐸𝑖: 𝑖番目の交差エントロピー誤差 実装
  • 12. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. Product Image Recognition model 12 ・weight decayの使用(過学習対策)  L2正則化とλ∑𝑤𝑖を損失関数に。(減衰率 λ=0.0005) ・パラメータ更新 : Momentum SGD 学習時の詳細設定 𝑊𝑡+1 = 𝑊𝑡 − 𝜂 𝜕𝐿 𝑊𝑡 𝜕𝑊𝑡 + 𝛽𝛥𝑊𝑡 𝐿 ∶ 損失関数 𝛽 ∶ 0.9 𝜂 : 0.0001(100epochごとに0.1倍) ・neutralは使用しない  イメージが無いから ・学習の様子 実装
  • 13. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. Product Image Recognition model 13 ・standard loss( standard cross entropy )と weighted cross ( weighted cross entropy )で比較  重みの導入と精度や学習効率の関係を確認するため ・weighted cross の方が精度が高い ・100epochのほうが低い  オーバーフィッティングの影響 50 epoch 100 epoch 結果
  • 14. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. Intelligent Design Generation Model 14 Product Image Recognition Modelで用いたデータセットだけでは不十分  UT Zappos 50Kから10240個の靴をランダムに選択  Product Image Recognition Modelよりラベル付け。大規模なデータセットを作成 各指標 (左側がPositive) Positive Negative Total Female - Male 4807 5433 10240 Retro - Modern 5844 4396 10240 Formal - Casual 7689 2551 10240 Plain - Gorgeous 4995 5245 10240 ラベル付け結果 データの前処理 GANを用いて、想定するイメージかつ革新的な製品を生成する
  • 15. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. Intelligent Design Generation Model 15 ・DCGANとConditional GANから成る ・Generator  入力:100次元分の乱数、4次元(Female、Male、Formal、Casual) の商品ラベルに関するone hot encodingの連結 ⁃ 特徴を沢山持つのは稀だから ⁃ ユーザーは1~2個のスタイルを選ぶことが多い  出力:画像を生成 Generator Discriminator 実装 ・Discriminator  入力:本物の画像、Discriminatorの出力  出力:0~1の実数値(本物か偽物かを判定) ・収束するまで交互に学習
  • 16. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. Intelligent Design Generation Model 16 ・ GeneratorとDiscriminatorを交互に更新  Generatorを固定、 Discriminatorを2回更新  Discriminatorを固定、 Generatorを1回更新 ・batch size=32 ・1 epochごとに320回学習。100epoch学習 ・ GeneratorとDiscriminatorのパラメータ:正規分布(平均0, 標準偏差0.02) ・Adamによりパラメータ更新 ・ Discriminatorの活性化関数:Leaky ReLU 学習時の詳細設定 学習時間に応じて、高品質な画像を生成 1 epoch 10 epoch 100 epoch
  • 17. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. Intelligent Design Generation Model 17 ・右図は不適なサンプルも入っている ・イメージをもとに靴を生成できる ・生成された2000枚の画像のうち、不適なサンプルの割合は4.1%ほどあった  プロのデザイナーの知見に基づいて評価 定性的な評価 100epochでの生成結果 不適なサンプルが生成された理由 ・靴の色が複雑なものがある ・靴紐が細いものがある  靴紐と本体の繋がりがわかりにくい
  • 18. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. Intelligent Design Generation Model 18 ・アンケート実施  生成された商品がイメージと合致しているか検証するため ・工業デザイン学科の大学院生・教員20名が被検者  23歳から40歳までの男性7名、女性13名 ・320枚のサンプルを作成  4.1%の不適なサンプルを除去。各イメージごとに25枚選択(合計100枚) ・被検者は、1枚のサンプルごとにイメージを選択  各自の経験をもとに選択  「Male Casual」、「Male Formal」 、「Female Casual」、「Female Formal」、 「non-conformance(どれにも適さない)」から選択 定量的な評価 16人以上(8割以上)の被検者が正しい選択をした場合 その生成サンプルはイメージ通り(True)と判断
  • 19. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. Intelligent Design Generation Model 19 定量的な評価 誤ったパターンについて 結果 (例)Female Casual ・約半数のみがFemale Casualを選択したサンプルが2枚  Female Casual以外では、多くの人がnon-conformanceを選択 ・ non-conformanceを選択したうちの一人は、 Neutral Casual と判断した
  • 20. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. 考察 20 ・ファッション以外でも、他分野の商品イメージに対して適応可能 Intelligent Design Generation Modelの応用 (例)自動車  必要な準備 ⁃ 自動車画像の用意 ⁃ ユーザーによる、イメージ評価(「モダン-レトロ」、「流行り-伝統的」な ど)をしてもらう (例)人間への支援  デザイナー ⁃ 生成された画像を参考に、改善が可能(労働時間削減、作業効率向上)  ユーザー ⁃ 生成された画像をもとに、自分の好みの理解につながる(外観の形成) ・現段階での課題:労力がかかる  画像は同じ視点から撮影  人手により行われるラベル付け  上記2つを満たしたラベル付き画像が大量にある 教師なし学習による商品イメージ認識を検討
  • 21. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. 結論 21 ・消費者の抱くイメージとファッション商品のマッチングを目的 ・Product Image Recognition modelは、ユーザーとデザイナーの認識の一 致のため ・Intelligent Design Generation Modelは、革新的な商品を生成できる ・今回は、靴の画像に照準を絞る ・実験結果から、提案手法の実現可能性と有効性が示せた