Enviar búsqueda
Cargar
論文輪読: Instance-sensitive Fully Convolutional Networks
•
5 recomendaciones
•
4,572 vistas
M
mmisono
Seguir
Instance-sensitive Fully Convolutional Networks http://arxiv.org/abs/1603.08678
Leer menos
Leer más
Tecnología
Denunciar
Compartir
Denunciar
Compartir
1 de 25
Descargar ahora
Descargar para leer sin conexión
Recomendados
DRAW: Deep Recurrent Attentive Writer
DRAW: Deep Recurrent Attentive Writer
Mark Chang
論文紹介 Hyperkernel: Push-Button Verification of an OS Kernel (SOSP’17)
論文紹介 Hyperkernel: Push-Button Verification of an OS Kernel (SOSP’17)
mmisono
論文輪読: Coordinated and Efficient Huge Page Management with Ingens
論文輪読: Coordinated and Efficient Huge Page Management with Ingens
mmisono
論文輪読: Order-Embeddings of Images and Language
論文輪読: Order-Embeddings of Images and Language
mmisono
論文輪読: Generative Adversarial Text to Image Synthesis
論文輪読: Generative Adversarial Text to Image Synthesis
mmisono
論文輪読: Data-Dependent Initializations of Convolutional Neural Networks / All Y...
論文輪読: Data-Dependent Initializations of Convolutional Neural Networks / All Y...
mmisono
論文輪読: Deep neural networks are easily fooled: High confidence predictions for...
論文輪読: Deep neural networks are easily fooled: High confidence predictions for...
mmisono
2024 State of Marketing Report – by Hubspot
2024 State of Marketing Report – by Hubspot
Marius Sescu
Recomendados
DRAW: Deep Recurrent Attentive Writer
DRAW: Deep Recurrent Attentive Writer
Mark Chang
論文紹介 Hyperkernel: Push-Button Verification of an OS Kernel (SOSP’17)
論文紹介 Hyperkernel: Push-Button Verification of an OS Kernel (SOSP’17)
mmisono
論文輪読: Coordinated and Efficient Huge Page Management with Ingens
論文輪読: Coordinated and Efficient Huge Page Management with Ingens
mmisono
論文輪読: Order-Embeddings of Images and Language
論文輪読: Order-Embeddings of Images and Language
mmisono
論文輪読: Generative Adversarial Text to Image Synthesis
論文輪読: Generative Adversarial Text to Image Synthesis
mmisono
論文輪読: Data-Dependent Initializations of Convolutional Neural Networks / All Y...
論文輪読: Data-Dependent Initializations of Convolutional Neural Networks / All Y...
mmisono
論文輪読: Deep neural networks are easily fooled: High confidence predictions for...
論文輪読: Deep neural networks are easily fooled: High confidence predictions for...
mmisono
2024 State of Marketing Report – by Hubspot
2024 State of Marketing Report – by Hubspot
Marius Sescu
論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding
論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding
Toru Tamaki
論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games
論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games
atsushi061452
新人研修 後半 2024/04/26の勉強会で発表されたものです。
新人研修 後半 2024/04/26の勉強会で発表されたものです。
iPride Co., Ltd.
論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...
論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...
Toru Tamaki
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
CRI Japan, Inc.
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
iPride Co., Ltd.
知識ゼロの営業マンでもできた!超速で初心者を脱する、悪魔的学習ステップ3選.pptx
知識ゼロの営業マンでもできた!超速で初心者を脱する、悪魔的学習ステップ3選.pptx
sn679259
Utilizing Ballerina for Cloud Native Integrations
Utilizing Ballerina for Cloud Native Integrations
WSO2
LoRaWANスマート距離検出センサー DS20L カタログ LiDARデバイス
LoRaWANスマート距離検出センサー DS20L カタログ LiDARデバイス
CRI Japan, Inc.
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
iPride Co., Ltd.
Everything You Need To Know About ChatGPT
Everything You Need To Know About ChatGPT
Expeed Software
Product Design Trends in 2024 | Teenage Engineerings
Product Design Trends in 2024 | Teenage Engineerings
Pixeldarts
How Race, Age and Gender Shape Attitudes Towards Mental Health
How Race, Age and Gender Shape Attitudes Towards Mental Health
ThinkNow
AI Trends in Creative Operations 2024 by Artwork Flow.pdf
AI Trends in Creative Operations 2024 by Artwork Flow.pdf
marketingartwork
Skeleton Culture Code
Skeleton Culture Code
Skeleton Technologies
PEPSICO Presentation to CAGNY Conference Feb 2024
PEPSICO Presentation to CAGNY Conference Feb 2024
Neil Kimberley
Content Methodology: A Best Practices Report (Webinar)
Content Methodology: A Best Practices Report (Webinar)
contently
How to Prepare For a Successful Job Search for 2024
How to Prepare For a Successful Job Search for 2024
Albert Qian
Social Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie Insights
Kurio // The Social Media Age(ncy)
Trends In Paid Search: Navigating The Digital Landscape In 2024
Trends In Paid Search: Navigating The Digital Landscape In 2024
Search Engine Journal
5 Public speaking tips from TED - Visualized summary
5 Public speaking tips from TED - Visualized summary
SpeakerHub
ChatGPT and the Future of Work - Clark Boyd
ChatGPT and the Future of Work - Clark Boyd
Clark Boyd
Más contenido relacionado
Último
論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding
論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding
Toru Tamaki
論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games
論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games
atsushi061452
新人研修 後半 2024/04/26の勉強会で発表されたものです。
新人研修 後半 2024/04/26の勉強会で発表されたものです。
iPride Co., Ltd.
論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...
論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...
Toru Tamaki
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
CRI Japan, Inc.
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
iPride Co., Ltd.
知識ゼロの営業マンでもできた!超速で初心者を脱する、悪魔的学習ステップ3選.pptx
知識ゼロの営業マンでもできた!超速で初心者を脱する、悪魔的学習ステップ3選.pptx
sn679259
Utilizing Ballerina for Cloud Native Integrations
Utilizing Ballerina for Cloud Native Integrations
WSO2
LoRaWANスマート距離検出センサー DS20L カタログ LiDARデバイス
LoRaWANスマート距離検出センサー DS20L カタログ LiDARデバイス
CRI Japan, Inc.
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
iPride Co., Ltd.
Último
(10)
論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding
論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding
論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games
論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games
新人研修 後半 2024/04/26の勉強会で発表されたものです。
新人研修 後半 2024/04/26の勉強会で発表されたものです。
論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...
論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
知識ゼロの営業マンでもできた!超速で初心者を脱する、悪魔的学習ステップ3選.pptx
知識ゼロの営業マンでもできた!超速で初心者を脱する、悪魔的学習ステップ3選.pptx
Utilizing Ballerina for Cloud Native Integrations
Utilizing Ballerina for Cloud Native Integrations
LoRaWANスマート距離検出センサー DS20L カタログ LiDARデバイス
LoRaWANスマート距離検出センサー DS20L カタログ LiDARデバイス
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
Destacado
Everything You Need To Know About ChatGPT
Everything You Need To Know About ChatGPT
Expeed Software
Product Design Trends in 2024 | Teenage Engineerings
Product Design Trends in 2024 | Teenage Engineerings
Pixeldarts
How Race, Age and Gender Shape Attitudes Towards Mental Health
How Race, Age and Gender Shape Attitudes Towards Mental Health
ThinkNow
AI Trends in Creative Operations 2024 by Artwork Flow.pdf
AI Trends in Creative Operations 2024 by Artwork Flow.pdf
marketingartwork
Skeleton Culture Code
Skeleton Culture Code
Skeleton Technologies
PEPSICO Presentation to CAGNY Conference Feb 2024
PEPSICO Presentation to CAGNY Conference Feb 2024
Neil Kimberley
Content Methodology: A Best Practices Report (Webinar)
Content Methodology: A Best Practices Report (Webinar)
contently
How to Prepare For a Successful Job Search for 2024
How to Prepare For a Successful Job Search for 2024
Albert Qian
Social Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie Insights
Kurio // The Social Media Age(ncy)
Trends In Paid Search: Navigating The Digital Landscape In 2024
Trends In Paid Search: Navigating The Digital Landscape In 2024
Search Engine Journal
5 Public speaking tips from TED - Visualized summary
5 Public speaking tips from TED - Visualized summary
SpeakerHub
ChatGPT and the Future of Work - Clark Boyd
ChatGPT and the Future of Work - Clark Boyd
Clark Boyd
Getting into the tech field. what next
Getting into the tech field. what next
Tessa Mero
Google's Just Not That Into You: Understanding Core Updates & Search Intent
Google's Just Not That Into You: Understanding Core Updates & Search Intent
Lily Ray
How to have difficult conversations
How to have difficult conversations
Rajiv Jayarajah, MAppComm, ACC
Introduction to Data Science
Introduction to Data Science
Christy Abraham Joy
Time Management & Productivity - Best Practices
Time Management & Productivity - Best Practices
Vit Horky
The six step guide to practical project management
The six step guide to practical project management
MindGenius
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
RachelPearson36
Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...
Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...
Applitools
Destacado
(20)
Everything You Need To Know About ChatGPT
Everything You Need To Know About ChatGPT
Product Design Trends in 2024 | Teenage Engineerings
Product Design Trends in 2024 | Teenage Engineerings
How Race, Age and Gender Shape Attitudes Towards Mental Health
How Race, Age and Gender Shape Attitudes Towards Mental Health
AI Trends in Creative Operations 2024 by Artwork Flow.pdf
AI Trends in Creative Operations 2024 by Artwork Flow.pdf
Skeleton Culture Code
Skeleton Culture Code
PEPSICO Presentation to CAGNY Conference Feb 2024
PEPSICO Presentation to CAGNY Conference Feb 2024
Content Methodology: A Best Practices Report (Webinar)
Content Methodology: A Best Practices Report (Webinar)
How to Prepare For a Successful Job Search for 2024
How to Prepare For a Successful Job Search for 2024
Social Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie Insights
Trends In Paid Search: Navigating The Digital Landscape In 2024
Trends In Paid Search: Navigating The Digital Landscape In 2024
5 Public speaking tips from TED - Visualized summary
5 Public speaking tips from TED - Visualized summary
ChatGPT and the Future of Work - Clark Boyd
ChatGPT and the Future of Work - Clark Boyd
Getting into the tech field. what next
Getting into the tech field. what next
Google's Just Not That Into You: Understanding Core Updates & Search Intent
Google's Just Not That Into You: Understanding Core Updates & Search Intent
How to have difficult conversations
How to have difficult conversations
Introduction to Data Science
Introduction to Data Science
Time Management & Productivity - Best Practices
Time Management & Productivity - Best Practices
The six step guide to practical project management
The six step guide to practical project management
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...
Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...
論文輪読: Instance-sensitive Fully Convolutional Networks
1.
論文輪読: Instance-sensi,ve Fully Convolu,onal Networks Jifeng Dai , Kaiming He , Yi Li , Shaoqing Ren , Jian Sun hFp://arxiv.org/abs/1603.08678
2.
この論文について • What – FCNを用いたInstance proposal手法の提案 –
おそらくFCNによるinstance proposalは初 • How – Instance-sensi,ve score map with FCN • Contribu,on – Fast & Accurate proposals • Experiment – PASCAL VOC 2012 & MS COCO segmenta,on – state of the art results
3.
MS COCO val (赤線+白で塗りつぶしされている領域はmissed ground truth)
4.
書誌情報 • Title: Instance-sensi,ve Fully Convolu,onal Networks • Author: Jifeng Dai , Kaiming He , Yi Li , Shaoqing Ren , Jian Sun –
MSRA, 清華大学, 中国科学技術大学 • hFp://arxiv.org/abs/1603.08678 (29 Mar 2016, Technical Report)
5.
書誌情報 • 著者の最近の研究 今回紹介する手法は Proposalに関しては これより概ね性能が良い
6.
(余談) CVPR’16 面白そうなの • CNN-RNN: A Unified Framework for Mul,-label Image Classifica,on – hFps://arxiv.org/abs/1604.04573 •
Mul,-Oriented Text Detec,on with Fully Convolu,onal Networks – hFps://arxiv.org/abs/1604.04018 • ProNet: Learning to Propose Object-specific Boxes for Cascaded Neural Networks – hFps://arxiv.org/abs/1511.03776 FCN 利用
7.
Classifica,on Detec,on Seman,c Segmenta,on Instance Object Proposals AlexNet VGG GoogLeNet 2012 2013 2014 2015 2016 OverFeat R-CNN Fast R-CNN Faster R-CNN FCN FCN+CRF (DeepLab etc..) DeepMask CaffeNet Residual (BatchNormaliza,on) Object Proposals (Selec,ve Search) 2011 (BING) (GOP) (MCG) (MCG) (EdgeBoxes) (RIGOR) (DPM) InstanceFCN [今回紹介する手法] ※独断と偏見で作成(適当) 空白 ≠ 研究がない
8.
Classifica,on vs Detec,on • Detec,on = What + Where Classifica,on Detec,on Person Motorbike Person Motorbike
9.
Seman,c Segmenta,on vs Instance Segment Proposals • Seman,c Segmenta,on = Pixel-wise labeling • Instance Segmenta,on = インスタンスを区別する •
Instance Segment Proposals : 物体領域候補を抽出 – 各領域が何であるかを識別するのは別の問題 – 基本的にRecallの方が重要 Original Seman,c Segmenta,on Instance Segmenta,on
10.
Fully Convolu,onal Networks (FCN) • No fully connect layer • Last layer: per-pixel sommax •
Seman,c Segmenta,onでは本質的に重なる同一物体を区別 できない
11.
FCNの応用 • Seman,c Segmenta,on • Contour Detec,on •
Denoising • Image Super Resolu,on • Image Enhancement • Region Proposal Network (RPN) – Faster R-CNN 基本的にはピクセルごとの分類問題に適用できる
12.
DeepMask (NIPS 2015) • Facebook AI Research • CNNに入力した画像の中心のピクセルが属している 物体部分のマスクだけ出力するように学習
13.
提案手法: InstanceFCN • FCNをinstance segmenta,onするように拡張
14.
from FCN to InstanceFCN • インスタンスが1つ => FCNでOK • インスタンスが2つ以上の場合: –
左のインスタンスから見ると,右のインスタンスが区別で きれば良い
15.
InstanceFCN • FCNの出力として各ピクセルは相対位置にあるインスタンス に自分自身も含まれるかどうかを出力する – 出力マップ数はk^2 •
最終的出力: m × m のスライディングウィンドウに対してm/k × m/k のサブ ウィンドウごとに出力マップをコピー
16.
DeepMaskとの比較 DeepMaskはm^2の層から マスクを生成する InstanceFCNの場合 全結合層がなく FCNからマスクを生成する
17.
InstanceFCNの利点 • 各ピクセルでのスコアは再利用できる
18.
ネットワーク構造の詳細 - VGG16ベース - 2つの分岐 - セグメンテーション - インスタンススコア - インスタンススコアを計算したのち,ウィン ドウごとにassemblingをおこなう
19.
訓練 / テスト 方法 • 訓練時: スライディングウィンドウを適当に動かして,各スラ イディングウィンドウごとに評価 –
損失関数 – SGDで訓練 • テスト時: 端から端までスライディングウィンドウを動かして, 各評価を合計する – 1枚あたり約1.5s - pi* = 1 (posi,ve sampleの場合) - Si* : ground truth segment instance - L: logis,c regression
20.
実験: 定性的結果 k=3
21.
実験: DeepMaskとの比較 • DeepMaskよりも良い精度が得られている – AR@N: Average Recall, Nはproposalの数 –
~DeepMaskは著者らによる実装 – crop 224x224というのは訓練時の画像サイズをDeepMask と同じにしたもの PASCAL VOC 2012 val kを変えた場合: k=5
22.
実験: 他のInstance Segment Proposals手法との比較 PASCAL VOC 2012 val MNCも同一著者 によるもの (CVPR’16)
23.
実験: 他のInstance Segment Proposals手法との比較 MS COCOC val
24.
実験: Seman,c Instance Segmenta,on • proposal部分にInstanceFCNを使用 PASCAL VOC 2012 val
25.
Result DeepMaskとの比較
Descargar ahora