Enviar búsqueda
Cargar
180204 Attention-aware Deep Reinforcement Learning for Video Face Recognition
•
2 recomendaciones
•
2,195 vistas
Takanori Ogata
Seguir
Attention-awareDeep Reinforcement Learning for Video Face Recognition, ICCV 2017
Leer menos
Leer más
Tecnología
Denunciar
Compartir
Denunciar
Compartir
1 de 32
Recomendados
Unsupervised learning of object landmarks by factorized spatial embeddings
Unsupervised learning of object landmarks by factorized spatial embeddings
Takanori Ogata
Annotating object instances with a polygon rnn
Annotating object instances with a polygon rnn
Takanori Ogata
Training object class detectors with click supervision
Training object class detectors with click supervision
Takanori Ogata
pytech
pytech
Kanta Kato
Invariant Information Clustering for Unsupervised Image Classification and Se...
Invariant Information Clustering for Unsupervised Image Classification and Se...
harmonylab
【Dll171201】深層学習利活用の紹介 掲載用
【Dll171201】深層学習利活用の紹介 掲載用
Hirono Jumpei
BERT の解剖学: interpret-text による自然言語処理 (NLP) モデル解釈
BERT の解剖学: interpret-text による自然言語処理 (NLP) モデル解釈
順也 山口
G Suite勉強会資料(20200326)
G Suite勉強会資料(20200326)
Keiichi Hirose
Recomendados
Unsupervised learning of object landmarks by factorized spatial embeddings
Unsupervised learning of object landmarks by factorized spatial embeddings
Takanori Ogata
Annotating object instances with a polygon rnn
Annotating object instances with a polygon rnn
Takanori Ogata
Training object class detectors with click supervision
Training object class detectors with click supervision
Takanori Ogata
pytech
pytech
Kanta Kato
Invariant Information Clustering for Unsupervised Image Classification and Se...
Invariant Information Clustering for Unsupervised Image Classification and Se...
harmonylab
【Dll171201】深層学習利活用の紹介 掲載用
【Dll171201】深層学習利活用の紹介 掲載用
Hirono Jumpei
BERT の解剖学: interpret-text による自然言語処理 (NLP) モデル解釈
BERT の解剖学: interpret-text による自然言語処理 (NLP) モデル解釈
順也 山口
G Suite勉強会資料(20200326)
G Suite勉強会資料(20200326)
Keiichi Hirose
【メタサーベイ】Face, Gesture, and Body Pose
【メタサーベイ】Face, Gesture, and Body Pose
cvpaper. challenge
NeurIPS2021読み会 Fairness in Ranking under Uncertainty
NeurIPS2021読み会 Fairness in Ranking under Uncertainty
Tatsuya Shirakawa
失敗から学ぶ機械学習応用
失敗から学ぶ機械学習応用
Hiroyuki Masuda
いまさら聞けない機械学習の評価指標
いまさら聞けない機械学習の評価指標
圭輔 大曽根
CVPR 2020報告
CVPR 2020報告
日本ディープラーニング協会(JDLA)
2021 10-07 kdd2021読み会 uc phrase
2021 10-07 kdd2021読み会 uc phrase
Tatsuya Shirakawa
[クリエイティブハント2018]LT 道場破りしたらできちゃった/// #ゴーハント
[クリエイティブハント2018]LT 道場破りしたらできちゃった/// #ゴーハント
Hiroyuki Ishikawa
Microsoft AI Solution Update / DLL community Update
Microsoft AI Solution Update / DLL community Update
Hirono Jumpei
いまさら学ぶオブジェクト指向
いまさら学ぶオブジェクト指向
Daisuke Hirayama
Tracking emerges by colorizing videosの紹介
Tracking emerges by colorizing videosの紹介
Hitoshi Nishimura
アクセス解析ではなぜ「何が問題かわからない」のか @さぶみっと!セミナー in 東京 2015年4月
アクセス解析ではなぜ「何が問題かわからない」のか @さぶみっと!セミナー in 東京 2015年4月
Popinsight
CV勉強会CVPR2019読み会: Video Action Transformer Network
CV勉強会CVPR2019読み会: Video Action Transformer Network
Toshiki Sakai
Why prototype ? / なぜプロトタイプが必要か?
Why prototype ? / なぜプロトタイプが必要か?
Shunsuke Kawai
ノンプログラミングで始める AR 開発入門
ノンプログラミングで始める AR 開発入門
Takashi Yoshinaga
Google Apps Script 活用ミートアップ#4 発表資料
Google Apps Script 活用ミートアップ#4 発表資料
Takayoshi Sakaino
組織と個人が内発的動機により継続的に成長するための施策
組織と個人が内発的動機により継続的に成長するための施策
Yusuke Kojima
Xpfes2009 Kushida
Xpfes2009 Kushida
Yukie Kushida
InVision勉強会資料
InVision勉強会資料
TakuyaTakemoto
データプロダクト開発を成功に導くには
データプロダクト開発を成功に導くには
Recruit Lifestyle Co., Ltd.
事業会社で働くエンジニアのマインドセット - DevLOVE関西
事業会社で働くエンジニアのマインドセット - DevLOVE関西
Tomoyuki Sugita
リーンキャンバス
リーンキャンバス
Tarumoto Tetsuya
Decentralized identity
Decentralized identity
Takao Tetsuro
Más contenido relacionado
La actualidad más candente
【メタサーベイ】Face, Gesture, and Body Pose
【メタサーベイ】Face, Gesture, and Body Pose
cvpaper. challenge
NeurIPS2021読み会 Fairness in Ranking under Uncertainty
NeurIPS2021読み会 Fairness in Ranking under Uncertainty
Tatsuya Shirakawa
失敗から学ぶ機械学習応用
失敗から学ぶ機械学習応用
Hiroyuki Masuda
いまさら聞けない機械学習の評価指標
いまさら聞けない機械学習の評価指標
圭輔 大曽根
CVPR 2020報告
CVPR 2020報告
日本ディープラーニング協会(JDLA)
2021 10-07 kdd2021読み会 uc phrase
2021 10-07 kdd2021読み会 uc phrase
Tatsuya Shirakawa
[クリエイティブハント2018]LT 道場破りしたらできちゃった/// #ゴーハント
[クリエイティブハント2018]LT 道場破りしたらできちゃった/// #ゴーハント
Hiroyuki Ishikawa
Microsoft AI Solution Update / DLL community Update
Microsoft AI Solution Update / DLL community Update
Hirono Jumpei
いまさら学ぶオブジェクト指向
いまさら学ぶオブジェクト指向
Daisuke Hirayama
La actualidad más candente
(9)
【メタサーベイ】Face, Gesture, and Body Pose
【メタサーベイ】Face, Gesture, and Body Pose
NeurIPS2021読み会 Fairness in Ranking under Uncertainty
NeurIPS2021読み会 Fairness in Ranking under Uncertainty
失敗から学ぶ機械学習応用
失敗から学ぶ機械学習応用
いまさら聞けない機械学習の評価指標
いまさら聞けない機械学習の評価指標
CVPR 2020報告
CVPR 2020報告
2021 10-07 kdd2021読み会 uc phrase
2021 10-07 kdd2021読み会 uc phrase
[クリエイティブハント2018]LT 道場破りしたらできちゃった/// #ゴーハント
[クリエイティブハント2018]LT 道場破りしたらできちゃった/// #ゴーハント
Microsoft AI Solution Update / DLL community Update
Microsoft AI Solution Update / DLL community Update
いまさら学ぶオブジェクト指向
いまさら学ぶオブジェクト指向
Similar a 180204 Attention-aware Deep Reinforcement Learning for Video Face Recognition
Tracking emerges by colorizing videosの紹介
Tracking emerges by colorizing videosの紹介
Hitoshi Nishimura
アクセス解析ではなぜ「何が問題かわからない」のか @さぶみっと!セミナー in 東京 2015年4月
アクセス解析ではなぜ「何が問題かわからない」のか @さぶみっと!セミナー in 東京 2015年4月
Popinsight
CV勉強会CVPR2019読み会: Video Action Transformer Network
CV勉強会CVPR2019読み会: Video Action Transformer Network
Toshiki Sakai
Why prototype ? / なぜプロトタイプが必要か?
Why prototype ? / なぜプロトタイプが必要か?
Shunsuke Kawai
ノンプログラミングで始める AR 開発入門
ノンプログラミングで始める AR 開発入門
Takashi Yoshinaga
Google Apps Script 活用ミートアップ#4 発表資料
Google Apps Script 活用ミートアップ#4 発表資料
Takayoshi Sakaino
組織と個人が内発的動機により継続的に成長するための施策
組織と個人が内発的動機により継続的に成長するための施策
Yusuke Kojima
Xpfes2009 Kushida
Xpfes2009 Kushida
Yukie Kushida
InVision勉強会資料
InVision勉強会資料
TakuyaTakemoto
データプロダクト開発を成功に導くには
データプロダクト開発を成功に導くには
Recruit Lifestyle Co., Ltd.
事業会社で働くエンジニアのマインドセット - DevLOVE関西
事業会社で働くエンジニアのマインドセット - DevLOVE関西
Tomoyuki Sugita
リーンキャンバス
リーンキャンバス
Tarumoto Tetsuya
Decentralized identity
Decentralized identity
Takao Tetsuro
組織にテストコードを書く文化を 根付かせるためにやってきたこと
組織にテストコードを書く文化を 根付かせるためにやってきたこと
Suguru Shirai
Oculus riftとペンタブレットを利用した作品作りについて
Oculus riftとペンタブレットを利用した作品作りについて
Haruhisa Hasegawa
20170420_Prott User Meetup Vol.19_ビズリーチ_事業会社と高速プロトタイピング
20170420_Prott User Meetup Vol.19_ビズリーチ_事業会社と高速プロトタイピング
Mari Komatsuzaki
0108ゲーミフィケーションインタレストレポート
0108ゲーミフィケーションインタレストレポート
Yuri Nakayama
メンタルモデル・ダイアグラムで学ぶ定性(質的)分析・親和図法 :2015年1月31日 ワイワイCAFE BITTER
メンタルモデル・ダイアグラムで学ぶ定性(質的)分析・親和図法 :2015年1月31日 ワイワイCAFE BITTER
Yoshiki Hayama
WordPressプラグイン開発で学ぶ継続インテグレーション(CI)
WordPressプラグイン開発で学ぶ継続インテグレーション(CI)
Seto Takahiro
徹底比較Unreal engine4&unity5
徹底比較Unreal engine4&unity5
Seiki Okude
Similar a 180204 Attention-aware Deep Reinforcement Learning for Video Face Recognition
(20)
Tracking emerges by colorizing videosの紹介
Tracking emerges by colorizing videosの紹介
アクセス解析ではなぜ「何が問題かわからない」のか @さぶみっと!セミナー in 東京 2015年4月
アクセス解析ではなぜ「何が問題かわからない」のか @さぶみっと!セミナー in 東京 2015年4月
CV勉強会CVPR2019読み会: Video Action Transformer Network
CV勉強会CVPR2019読み会: Video Action Transformer Network
Why prototype ? / なぜプロトタイプが必要か?
Why prototype ? / なぜプロトタイプが必要か?
ノンプログラミングで始める AR 開発入門
ノンプログラミングで始める AR 開発入門
Google Apps Script 活用ミートアップ#4 発表資料
Google Apps Script 活用ミートアップ#4 発表資料
組織と個人が内発的動機により継続的に成長するための施策
組織と個人が内発的動機により継続的に成長するための施策
Xpfes2009 Kushida
Xpfes2009 Kushida
InVision勉強会資料
InVision勉強会資料
データプロダクト開発を成功に導くには
データプロダクト開発を成功に導くには
事業会社で働くエンジニアのマインドセット - DevLOVE関西
事業会社で働くエンジニアのマインドセット - DevLOVE関西
リーンキャンバス
リーンキャンバス
Decentralized identity
Decentralized identity
組織にテストコードを書く文化を 根付かせるためにやってきたこと
組織にテストコードを書く文化を 根付かせるためにやってきたこと
Oculus riftとペンタブレットを利用した作品作りについて
Oculus riftとペンタブレットを利用した作品作りについて
20170420_Prott User Meetup Vol.19_ビズリーチ_事業会社と高速プロトタイピング
20170420_Prott User Meetup Vol.19_ビズリーチ_事業会社と高速プロトタイピング
0108ゲーミフィケーションインタレストレポート
0108ゲーミフィケーションインタレストレポート
メンタルモデル・ダイアグラムで学ぶ定性(質的)分析・親和図法 :2015年1月31日 ワイワイCAFE BITTER
メンタルモデル・ダイアグラムで学ぶ定性(質的)分析・親和図法 :2015年1月31日 ワイワイCAFE BITTER
WordPressプラグイン開発で学ぶ継続インテグレーション(CI)
WordPressプラグイン開発で学ぶ継続インテグレーション(CI)
徹底比較Unreal engine4&unity5
徹底比較Unreal engine4&unity5
Más de Takanori Ogata
20210108 Tread: Circuits
20210108 Tread: Circuits
Takanori Ogata
20200704 Deep Snake for Real-Time Instance Segmentation
20200704 Deep Snake for Real-Time Instance Segmentation
Takanori Ogata
CVPR2019読み会@関東CV
CVPR2019読み会@関東CV
Takanori Ogata
190412 Annotation Survey@関東CV勉強会
190412 Annotation Survey@関東CV勉強会
Takanori Ogata
190410 ML@LOFT
190410 ML@LOFT
Takanori Ogata
SSD: Single Shot MultiBox Detector (ECCV2016)
SSD: Single Shot MultiBox Detector (ECCV2016)
Takanori Ogata
160924 Deep Learning Tuningathon
160924 Deep Learning Tuningathon
Takanori Ogata
Convolutional Pose Machines
Convolutional Pose Machines
Takanori Ogata
Deep Learningライブラリ 色々つかってみた感想まとめ
Deep Learningライブラリ 色々つかってみた感想まとめ
Takanori Ogata
Cv20160205
Cv20160205
Takanori Ogata
10分でわかる主成分分析(PCA)
10分でわかる主成分分析(PCA)
Takanori Ogata
DeepAKB
DeepAKB
Takanori Ogata
Más de Takanori Ogata
(12)
20210108 Tread: Circuits
20210108 Tread: Circuits
20200704 Deep Snake for Real-Time Instance Segmentation
20200704 Deep Snake for Real-Time Instance Segmentation
CVPR2019読み会@関東CV
CVPR2019読み会@関東CV
190412 Annotation Survey@関東CV勉強会
190412 Annotation Survey@関東CV勉強会
190410 ML@LOFT
190410 ML@LOFT
SSD: Single Shot MultiBox Detector (ECCV2016)
SSD: Single Shot MultiBox Detector (ECCV2016)
160924 Deep Learning Tuningathon
160924 Deep Learning Tuningathon
Convolutional Pose Machines
Convolutional Pose Machines
Deep Learningライブラリ 色々つかってみた感想まとめ
Deep Learningライブラリ 色々つかってみた感想まとめ
Cv20160205
Cv20160205
10分でわかる主成分分析(PCA)
10分でわかる主成分分析(PCA)
DeepAKB
DeepAKB
Último
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
FumieNakayama
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
Yuki Kikuchi
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
UEHARA, Tetsutaro
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察 ~Text-to-MusicとText-To-ImageかつImage-to-Music...
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察 ~Text-to-MusicとText-To-ImageかつImage-to-Music...
博三 太田
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案
sugiuralab
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
Hiroshi Tomioka
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
FumieNakayama
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
akihisamiyanaga1
Último
(8)
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察 ~Text-to-MusicとText-To-ImageかつImage-to-Music...
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察 ~Text-to-MusicとText-To-ImageかつImage-to-Music...
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
180204 Attention-aware Deep Reinforcement Learning for Video Face Recognition
1.
Attention-aware Deep Reinforcement Learning for
Video Face Recognition Takanori Ogata
2.
Self Introduction 緒方 貴紀
(@conta_) Co-Founder / Chief Research Officer @ABEJA, Inc. 基礎研究から、プロダクト開発、クラウドからGPUマシンの組み立てまで なんでもやります。
3.
Videoに写った人の顔認証の精度を上げる論文 同一人物の1連の顔画像シーケンスから、顔認証 に使うと良さそうな画像をピックアップして異な る動画に写った同一人物の認証精度を上げる Attentionを見つける過程をMarkov decision processでモデリングすることで、 強化学習(Q- learning)の枠組みに入れ学習できる 提案手法では、人物ID以外の追加の教師データ なしに学習させることが可能 概要
4.
■静止画の顔認証 1枚の画像に写った1人の顔画像を比較して、同じかどうかを判定 ■動画の顔認証 1本の動画に写った1人の顔のシーケンス画像を、同じかどうかを判定 動画像の顔認証 Same or not Same
or not
5.
• 人の移動によりブラーがおこる • 画像の輝度が時系列で変わる •
顔の向きが変わる Þ1人の顔画像でも特徴に分散が出てしまう 見分けやすい顔だけ使っていきたい! クオリティーの低そうな顔画像だけを取り除けないか? 動画像の顔認証の難しさ
6.
顔認証に利用する顔画像をState、取り除く画像を選択することをAction として、取り除いた後の報酬を最大化するような報酬を学習させる (ざっくり) 提案手法
7.
前準備が多いです わかりにくいプレゼンになると思いますので適時質問 してください
8.
提案手法のフロー 顔認証の特徴抽出 時系列の特徴表現 強化学習で適切な画像をピックアップ
9.
フレーム間の特徴の関係は顔認証する上で重要なヒントになりうる =>動画フレームから取り出した特徴をbi-directional LSTMを利用して時 系列に計算しtemporal-poolingを行う Temporal Representation
Learning 動画AがN^Aフレームの顔画像 C_1: CNN(顔認証の特徴抽出機) bi-directional LSTM Temporal Representation (隣接するr個のみの特徴を計算)
10.
(前置き) 2つの動画の顔を比較するときの距離の定義は下記の通り Attention-aware Deep
Reinforcement Learning 𝑋" , 𝑋$ : シーケンス顔画像 a_i のことをこの論文ではAttention(hard attention)と呼んでいる
11.
多くの先行研究では、Attentionのweightを計算す る際にfeature vectorの関係を利用している しかしながら、一般的に顔認証の特徴抽出アルゴリ ズムはpose /
illumination / expressionなどに不 変な特徴として学習させている => 顔の特徴空間だけでなく、顔画像から直接 Attentionを計算するようなアルゴリズムが良いの ではないか? Attention-aware Deep Reinforcement Learning [Yang+, CVPR2017]
12.
今回の提案手法として、特徴空間からだけでなく、画像から直接 Attentionを計算出来るようにしたいので、強化学習させる際に、報酬を出 力するネットワークC_2を考えたい Attention-aware Deep Reinforcement
Learning I_i: 画像空間からくる情報 M_i: 特徴空間からくる情報 C_2(I, M)を追加の教師データ無しに学習させるために、 エキスパートとして顔認証CNNである、C_1(x)の認識精度を活用する
13.
画像シーケンスから適切な画像をピックアップするには、2つの戦略が考えら れる (1) frame情報からダイレクトにクオリティーを計測し、高いものを持ってくる (2) クオリティーの低いものをStep
by Stepで取り除いていく Þ(1)の戦略は教師データがないと厳しい、、、 (2)では、認証精度の増減を見るだけで良いので、ラベルなしでも出来る! 今回の手法では(2)の方法を取る 顔認証にベストな画像を探すには?
14.
認証に利用する顔画像の組み合わせをStateとして、1枚ずつ画像を減ら していき、減らしたときの精度を計算 Þ精度が上がるような(落ちないような)組み合わせを求める 前の状態からの差分どうなったかの問題に落ちるので、Markov decision processに出来る ->
強化学習で解ける 基本的な戦略
15.
強化学習のフロー(expertの作り方) 2つの動画の認証に 使う画像リスト(State)
16.
強化学習のフロー 2つの動画の認証精度を計測 2つの動画の認証に 使う画像リスト(State)
17.
強化学習のフロー 2つの動画の認証に 使う画像リスト(State) 2つの動画の認証精度を計測 Actionを計算
18.
強化学習のフロー 2つの動画の認証に 使う画像リスト(State) 2つの動画の認証精度を計測 報酬の計算(精度がどう変わったか?)Actionを計算
19.
強化学習のフロー 2つの動画の認証に 使う画像リスト(State) 2つの動画の認証精度を計測 報酬の計算(精度がどう変わったか?)Actionを計算 報酬が終了条件を満たしたらend
20.
強化学習のフロー 2つの動画の認証に 使う画像リスト(State) 2つの動画の認証精度を計測 報酬の計算(精度がどう変わったか?)Actionを計算 報酬が終了条件を満たしたらend この情報を用いてStudent(C_2, Q-network)を学習させる
21.
Q関数はどう設計するのか 今回の手法ではQ関数の実装にNNを用いるが、その際2パターンの設計が考えられる • (1)Stateをinputにしてすべての取りうるactionに対するQ-valueを出力(DQN的なもの) • (2)Stateとactionを入れて、単一のQ-valueを出力 今回の場合、Stateが変わるたびにAction(Dropする場所)が変わってしまうので、(1)のパ ターンは難しい =>
よって今回は(2)のパターンを利用する
22.
画像xと特徴空間から計算されたvを入力として、Qを出力 するようなネットワーク v_iは4つのpartsからなる(2つの統計量をA,Bの動画から それぞれ出力、合計4つ) Q関数の実装 Drop前後での特徴の変化 State tのときに、aによってDropしたfeature h_aを引いたもの (これ合ってるの?
p^Aの定義と合わない気がするけど) そしてこれを最適化する Dropした後の特徴量の分散
23.
アルゴリズム(学習)
24.
学習させたQ関数を用いて、逐次的に Dropさせ、A, Bそれぞれ含まれるフ レーム数がthreshold以下になるまで 繰り返す。 アルゴリズム(識別)
25.
下記のデータセットで実験 • YouTube Face
dataset (YTF) • Point- and-Shoot Challenge (PaSC) • Youtube celebrities dataset (YTC) BaseとなるCNNは論文中[40](Center Loss)を利用 Experiments [Wen+, ECCV2016]
26.
■SOTAの比較 deep FR以外には勝ってる Results on
YouTube Face Dataset (deep FRは正面画像をきれいに 選んだりTriplet Lossの学習の際 にデータ選択を工夫しまくってる から負けてるだけなんだからね! こっちの実装のほうが簡単なんだ からねっ! By 著者)
27.
■Attentionの効果の比較 NANというAttention baseの手 法と比較 Temporal Ansamble(TR)と ADRLは効果がある(と言ってい る) Results
on YouTube Face Dataset NAN [Yang+, CVPR2017] (彼らは自分らよりパワフルな ネットワーク使ってるけどな!By 著者)
28.
Analysis on temporal
representation learning Temporal Representationの周 辺の値と、Drop時のしきい値を変 えたときの実験結果 (縦軸は多分正答率、positive 250 + negative 250 = 500)
29.
その他実験
30.
Qでソートした結果の定性評価 Analysis on deep
reinforcement learning
31.
動画の顔認証の精度を上げるために最適な画像を選択する方法の提案 認証に利用する顔画像の選択方法をMarkov decision processに落とす ことで強化学習の枠組みを適用できた 顔画像の良し悪しを、顔認証精度の比較問題に落とすことでexpertを作り、 追加ラベル無しでQ学習の枠組みに落とした 大体SOTAの精度がでた まとめ
32.
We are finding
awesome researchers! Please contact us! Mail: recruit@abeja.asia https://www.wantedly.com/companies/abeja