SlideShare a Scribd company logo
Enviar búsqueda
Cargar
Iniciar sesión
Registrarse
RAPiD
Denunciar
harmonylab
Seguir
1 de Dec de 2021
•
0 recomendaciones
•
976 vistas
1
de
31
RAPiD
1 de Dec de 2021
•
0 recomendaciones
•
976 vistas
Descargar ahora
Descargar para leer sin conexión
Denunciar
Tecnología
RAPiD
harmonylab
Seguir
Recomendados
【DL輪読会】Visual Classification via Description from Large Language Models (ICLR...
Deep Learning JP
1.8K vistas
•
16 diapositivas
How Much Position Information Do Convolutional Neural Networks Encode?
Kazuyuki Miyazawa
2.3K vistas
•
22 diapositivas
【DL輪読会】Patches Are All You Need? (ConvMixer)
Deep Learning JP
2K vistas
•
16 diapositivas
【メタサーベイ】数式ドリブン教師あり学習
cvpaper. challenge
5.3K vistas
•
33 diapositivas
【DL輪読会】ViT + Self Supervised Learningまとめ
Deep Learning JP
3.7K vistas
•
52 diapositivas
Data-Centric AIの紹介
Kazuyuki Miyazawa
3.7K vistas
•
39 diapositivas
Más contenido relacionado
La actualidad más candente
最近のDeep Learning (NLP) 界隈におけるAttention事情
Yuta Kikuchi
72.1K vistas
•
76 diapositivas
SSII2020 [OS2-02] 教師あり事前学習を凌駕する「弱」教師あり事前学習
SSII
4.2K vistas
•
22 diapositivas
[DL輪読会]data2vec: A General Framework for Self-supervised Learning in Speech,...
Deep Learning JP
2.4K vistas
•
15 diapositivas
[DL輪読会]An Image is Worth 16x16 Words: Transformers for Image Recognition at S...
Deep Learning JP
29.4K vistas
•
30 diapositivas
最適輸送の解き方
joisino
20.6K vistas
•
270 diapositivas
【DL輪読会】Flamingo: a Visual Language Model for Few-Shot Learning 画像×言語の大規模基盤モ...
Deep Learning JP
2K vistas
•
27 diapositivas
La actualidad más candente
(20)
最近のDeep Learning (NLP) 界隈におけるAttention事情
Yuta Kikuchi
•
72.1K vistas
SSII2020 [OS2-02] 教師あり事前学習を凌駕する「弱」教師あり事前学習
SSII
•
4.2K vistas
[DL輪読会]data2vec: A General Framework for Self-supervised Learning in Speech,...
Deep Learning JP
•
2.4K vistas
[DL輪読会]An Image is Worth 16x16 Words: Transformers for Image Recognition at S...
Deep Learning JP
•
29.4K vistas
最適輸送の解き方
joisino
•
20.6K vistas
【DL輪読会】Flamingo: a Visual Language Model for Few-Shot Learning 画像×言語の大規模基盤モ...
Deep Learning JP
•
2K vistas
機械学習で泣かないためのコード設計 2018
Takahiro Kubo
•
27.8K vistas
SSII2021 [OS2-02] 深層学習におけるデータ拡張の原理と最新動向
SSII
•
2K vistas
【DL輪読会】Visual ChatGPT: Talking, Drawing and Editing with Visual Foundation Mo...
Deep Learning JP
•
753 vistas
[DL輪読会]Vision Transformer with Deformable Attention (Deformable Attention Tra...
Deep Learning JP
•
7.7K vistas
U-Net: Convolutional Networks for Biomedical Image Segmentationの紹介
KCS Keio Computer Society
•
49.9K vistas
SSII2021 [SS1] Transformer x Computer Visionの 実活用可能性と展望 〜 TransformerのCompute...
SSII
•
2.8K vistas
ドメイン適応の原理と応用
Yoshitaka Ushiku
•
5.2K vistas
SSII2022 [SS2] 少ないデータやラベルを効率的に活用する機械学習技術 〜 足りない情報をどのように補うか?〜
SSII
•
3.6K vistas
【DL輪読会】High-Resolution Image Synthesis with Latent Diffusion Models
Deep Learning JP
•
2.4K vistas
SSII2020TS: Event-Based Camera の基礎と ニューラルネットワークによる信号処理 〜 生き物のように「変化」を捉えるビジョンセ...
SSII
•
4.5K vistas
【DL輪読会】How Much Can CLIP Benefit Vision-and-Language Tasks?
Deep Learning JP
•
991 vistas
【メタサーベイ】Vision and Language のトップ研究室/研究者
cvpaper. challenge
•
1.7K vistas
Attentionの基礎からTransformerの入門まで
AGIRobots
•
36.4K vistas
【DL輪読会】ViTPose: Simple Vision Transformer Baselines for Human Pose Estimation
Deep Learning JP
•
1.3K vistas
Similar a RAPiD
You Only Learn One Representation: Unified Network for Multiple Tasks
harmonylab
1.2K vistas
•
23 diapositivas
MLP-Mixer: An all-MLP Architecture for Vision
harmonylab
627 vistas
•
25 diapositivas
Feature Erasing and Diffusion Network for Occluded Person Re-Identification
harmonylab
623 vistas
•
19 diapositivas
Semi-Supervised Neural Architecture Search
harmonylab
955 vistas
•
15 diapositivas
A Study on Generation of Deformed Route Maps using Octilinear Grid
harmonylab
409 vistas
•
43 diapositivas
ロードヒーティング制御における深層学習を用いた路面画像認識に関する研究
harmonylab
789 vistas
•
28 diapositivas
Similar a RAPiD
(20)
You Only Learn One Representation: Unified Network for Multiple Tasks
harmonylab
•
1.2K vistas
MLP-Mixer: An all-MLP Architecture for Vision
harmonylab
•
627 vistas
Feature Erasing and Diffusion Network for Occluded Person Re-Identification
harmonylab
•
623 vistas
Semi-Supervised Neural Architecture Search
harmonylab
•
955 vistas
A Study on Generation of Deformed Route Maps using Octilinear Grid
harmonylab
•
409 vistas
ロードヒーティング制御における深層学習を用いた路面画像認識に関する研究
harmonylab
•
789 vistas
ArcFace: Additive Angular Margin Loss for Deep Face Recognition
harmonylab
•
758 vistas
SegFormer: Simple and Efficient Design for Semantic Segmentation with Transfo...
harmonylab
•
830 vistas
A Generalist Agent
harmonylab
•
815 vistas
Efficient Deep Reinforcement Learning with Imitative Expert Priors for Autono...
harmonylab
•
474 vistas
形態素解析を用いた帝国議会議事速記録の変遷に関する研究
harmonylab
•
281 vistas
ZeroCap: Zero-Shot Image-to-Text Generation for Visual-Semantic Arithmetic
harmonylab
•
411 vistas
Fine Grained Fashion Similarity Prediction by Attribute Specific Embedding Le...
harmonylab
•
327 vistas
Self-supervised Learning of Adversarial Example:Towards Good Generalizations...
harmonylab
•
453 vistas
A Study on Estimation of Household Kerosene Consumption for Optimization of D...
harmonylab
•
280 vistas
MASTERING ATARI WITH DISCRETE WORLD MODELS (DreamerV2)
harmonylab
•
2.4K vistas
修士論文
harmonylab
•
673 vistas
深層学習を用いたバス乗客画像の属性推定 に関する研究
harmonylab
•
415 vistas
DLゼミ: ViTPose: Simple Vision Transformer Baselines for Human Pose Estimation
harmonylab
•
490 vistas
All That’s ‘Human’ Is Not Gold Evaluating Human Evaluation of Generated Text
harmonylab
•
364 vistas
Más de harmonylab
Voyager: An Open-Ended Embodied Agent with Large Language Models
harmonylab
356 vistas
•
44 diapositivas
DLゼミ: Ego-Body Pose Estimation via Ego-Head Pose Estimation
harmonylab
610 vistas
•
36 diapositivas
ReAct: Synergizing Reasoning and Acting in Language Models
harmonylab
658 vistas
•
50 diapositivas
【卒業論文】深層生成モデルを用いたユーザ意図に基づく衣服画像の生成に関する研究
harmonylab
365 vistas
•
28 diapositivas
灯油タンク内の液面高計測を用いた灯油残量推定システムに関する研究
harmonylab
271 vistas
•
25 diapositivas
深層自己回帰モデルを用いた俳句の生成と評価に関する研究
harmonylab
385 vistas
•
35 diapositivas
Más de harmonylab
(19)
Voyager: An Open-Ended Embodied Agent with Large Language Models
harmonylab
•
356 vistas
DLゼミ: Ego-Body Pose Estimation via Ego-Head Pose Estimation
harmonylab
•
610 vistas
ReAct: Synergizing Reasoning and Acting in Language Models
harmonylab
•
658 vistas
【卒業論文】深層生成モデルを用いたユーザ意図に基づく衣服画像の生成に関する研究
harmonylab
•
365 vistas
灯油タンク内の液面高計測を用いた灯油残量推定システムに関する研究
harmonylab
•
271 vistas
深層自己回帰モデルを用いた俳句の生成と評価に関する研究
harmonylab
•
385 vistas
競輪におけるレーティングシステムを用いた予想記事生成に関する研究
harmonylab
•
875 vistas
【卒業論文】B2Bオークションにおけるユーザ別 入札行動予測に関する研究
harmonylab
•
387 vistas
マルチエージェント深層強化学習による自動運転車両の追越行動の獲得に関する研究
harmonylab
•
338 vistas
A Study on the Generation of Clothing Captions Highlighting the Differences b...
harmonylab
•
477 vistas
A Study on Clothing Recommendation Information Presentation System Based on C...
harmonylab
•
386 vistas
Emotionally Intelligent Fashion Design Using CNN and GAN
harmonylab
•
575 vistas
Towards Total Recall in Industrial Anomaly Detection
harmonylab
•
1.1K vistas
DeBERTaV3: Improving DeBERTa using ELECTRA-Style Pre-Training with Gradient-D...
harmonylab
•
980 vistas
2022年度調和系工学研究室配属説明会資料
harmonylab
•
208 vistas
CKL_about_panf2022.pdf
harmonylab
•
131 vistas
Outracing champion Gran Turismo drivers with deep reinforcement learning
harmonylab
•
502 vistas
Solving Quantitative Reasoning Problems with Language Models
harmonylab
•
470 vistas
MAUVE: Measuring the Gap Between Neural Text and Human Text using Divergence ...
harmonylab
•
470 vistas
Último
IGDA Japan SIG Audio #20-1 室内・野外でのマイク収録と整音.pdf
IGDA Japan SIG-Audio
115 vistas
•
31 diapositivas
GraphQLはどんな時に使うか
Yutaka Tachibana
14 vistas
•
37 diapositivas
CCoE実践者コミュニティ#1_CCoEが進めるセキュリティカイゼンの旅.pptx
Tomoaki Tada
57 vistas
•
20 diapositivas
MLOps Course Slides_JP(配布用).pdf
Yuya Yamamoto
118 vistas
•
31 diapositivas
磁石内臓イヤリングによる磁力変化を利用したジェスチャ識別
sugiuralab
7 vistas
•
1 diapositiva
ヒアラブルデバイスにおける音漏れ信号を用いた空中ジェスチャ認識
sugiuralab
5 vistas
•
1 diapositiva
Último
(14)
IGDA Japan SIG Audio #20-1 室内・野外でのマイク収録と整音.pdf
IGDA Japan SIG-Audio
•
115 vistas
GraphQLはどんな時に使うか
Yutaka Tachibana
•
14 vistas
CCoE実践者コミュニティ#1_CCoEが進めるセキュリティカイゼンの旅.pptx
Tomoaki Tada
•
57 vistas
MLOps Course Slides_JP(配布用).pdf
Yuya Yamamoto
•
118 vistas
磁石内臓イヤリングによる磁力変化を利用したジェスチャ識別
sugiuralab
•
7 vistas
ヒアラブルデバイスにおける音漏れ信号を用いた空中ジェスチャ認識
sugiuralab
•
5 vistas
20230921_IoTLT_vol103_kitazaki_v1.pdf
Ayachika Kitazaki
•
164 vistas
インフラチームとCCoEの関係.pptx
ssuser5c7ee4
•
20 vistas
2023情報処理学会関西支部大会-G12.pdf
KoseiShimoda1
•
7 vistas
CatBoost on GPU のひみつ
Takuji Tahara
•
548 vistas
画像生成AIの問題点
iPride Co., Ltd.
•
10 vistas
遠隔お酌IoTLT2309.pptx
Yoshiaki Ito
•
145 vistas
テスト自動化.pdf
ssuserf8ea02
•
29 vistas
拡散する画像生成.pdf
NTTDOCOMO-ServiceInnovation
•
44 vistas
RAPiD
1.
Copyright © 2020
調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. RAPiD: Rotation-Aware People Detection in Overhead Fisheye Images 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 調和系工学研究室 西浦 翼
2.
Copyright © 2020
調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. Copyright © 2020 Laboratory of Harmonious Systems Engineering Research Group of Synergetic Information Engineering Division of Computer Science and Information Technology Faculty of Information Science and Technology Hokkaido University – All rights reserved. 論文情報 2 著者 ・Zhihao Duan (Boston University) ・M. Ozan Tezcan (Boston University) ・Hayato Nakamura (Boston University) 発表 ・CVPR 2020 概要 ・天井視点の魚眼画像における人物検出でSoTA ・様々な人物の姿勢に対応できるように矩形の角度を学習するための 損失関数を提案 ・天井視点の魚眼画像のデータセットを新たに作成 リンク ・論文 https://arxiv.org/abs/2005.11623 ・Git https://github.com/duanzhiihao/RAPiD
3.
Copyright © 2020
調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. 研究背景 スマートビルディングの開発 →Occupancy sensing (占有率検知?) が重要 ・省エネ ・空間のマネジメント ・セキュリティ (火事、アクティブシューター) 3
4.
Copyright © 2020
調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. 研究背景 人数カウント × CV ・広角カメラ →複数台必要、かさばる ・魚眼カメラ →物体検出アルゴリズムが横視点・広角用 4 天井視点・魚眼用のアルゴリズムの開発
5.
Copyright © 2020
調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. 従来手法 5 (a) YOLOのみ、上下が合ってる人しか検出できない (b) 15°ずつ回してYOLO(2019)、立ってる人しか検出できない (c) 提案手法、様々な姿勢を検出できる
6.
Copyright © 2020
調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. 提案手法 RAPiD 6
7.
Copyright © 2020
調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. Backbone Network 7 ・特徴抽出器 ・P1:高解像度 → P3:低解像度 ・種々のレベルの情報を抽出する
8.
Copyright © 2020
調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. FPN 8 ・物体検出に関わる特徴を抽出する ・P1FPN:小さい物体 → P3FPN:大きい物体
9.
Copyright © 2020
調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. Detection Head 9 ・ は の4次元配列 1次元:アンカーボックスの数 2,3次元:グリッド ( s はストライド) 4次元:グリッドセル毎の推論矩形
10.
Copyright © 2020
調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. Detection Head 10 ・ = の範囲
11.
Copyright © 2020
調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. Angle-Aware Loss Function 11 YOLOv3を参考に提案 BCE:Binary Cross Entropy 真値は右の式参照 ←new
12.
Copyright © 2020
調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. 角度θを損失関数に導入 従来手法 L1, L2距離 角度の周期性を無視 12 ・周期性のある損失関数を提案 ・パラメータを変更
13.
Copyright © 2020
調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. Periodic Loss 13 矩形は 回転しても同じはずなので、以下を満たす 提案手法 Periodic Loss f()は L1, L2ノルムのような関数 なので、微分すると
14.
Copyright © 2020
調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. Periodic Loss 14
15.
Copyright © 2020
調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. パラメータの変更 従来手法 θの範囲 で矩形が網羅できる width, height によって 15
16.
Copyright © 2020
調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. パラメータの変更 しかし、 この表現の対称性がコストにつながるらしい? 16
17.
Copyright © 2020
調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. アノテーションに以下の条件を設ける ・幅より高さの方が長い ・その代わり角度の範囲を の パラメータの変更 17 の範囲
18.
Copyright © 2020
調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. パラメータの変更 問題発生 のとき 18 < 0 を大きくするように重みを更新してしまい、 から更に乖離する
19.
Copyright © 2020
調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. → は より + に近づけるべき パラメータの変更 19 → + ≤ ≤ −
20.
Copyright © 2020
調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. パラメータの変更 まとめ 1. ground truth の範囲 2. periodic angle loss を使う 3. predicted angle の範囲 20
21.
Copyright © 2020
調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. 実験 データセット 21 MW-R HABBOF ・CEPDOFを作った ・ReID用にIDも振った ・より混雑した状況 ・様々な体勢 ・暗い画像をも入れた
22.
Copyright © 2020
調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. 22 CEPDOF
23.
Copyright © 2020
調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. 23 実験 • MSCOCO2017で100,000イテレーション学習 • SGDでstep size0.001、momentum0.9、 weight decay0.0005 • 3つのデータセットの一部で6,000イテレー ションファインチューニング • 回転、左右反転、リサイズ、color augmentationも使用 • 3つのデータセットでクロスバリデーション
24.
Copyright © 2020
調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. 24 実験 • ‘P’recision, ‘R’ecall, ‘F’-measure • P, R, Fは各動画の平均なのでFがPとRの調和平 均になってない • FPSはCEPDOFの”Edge cases”で Nvidia GTX 1650 GPUを使用
25.
Copyright © 2020
調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. 実験 25 上段:easy 下段:challenge 緑:TP 赤:FP 黄:FN
26.
Copyright © 2020
調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. 厳しくね① 26 スクリーンに 人が写ってる
27.
Copyright © 2020
調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. 厳しくね② 27 見えない & 影が映ってる
28.
Copyright © 2020
調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. アブレーションスタディ 28 • BaselineはTamura et al[27](広角画像のみ) • Multi-classからSingle-classにするとAPは下がるが FPSは上がった • 魚眼画像でFine-tuningしてAPが大幅向上 • 損失関数と角度のルールを導入してAPが大幅向上
29.
Copyright © 2020
調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. アブレーションスタディ 損失関数の比較 Periodic lossが1番いい 29
30.
Copyright © 2020
調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. アスペクト比の分布 30 推論した矩形のアスペクト比の分布 を学習している
31.
Copyright © 2020
調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. まとめ • 新しい Loss を提案 • 魚眼用人物検出モデルRAPiDを提案 • 新しいデータセットを作成 • 3つのデータセットでSoTA • 暗い画像では精度が下がるという課題あり 角度の推論が必要な魚眼画像において、周期性 を取り込んだ損失関数の定式化が上手だった 31