SlideShare una empresa de Scribd logo
1 de 25
Descargar para leer sin conexión
論文輪読:	
	Instance-sensi,ve	Fully	
Convolu,onal	Networks	
	
Jifeng	Dai	,	Kaiming	He	,	Yi	Li	,	Shaoqing	Ren	,	Jian	Sun	
hFp://arxiv.org/abs/1603.08678
この論文について	
•  What	
–  	FCNを用いたInstance	proposal手法の提案	
–  おそらくFCNによるinstance	proposalは初	
•  How	
–  Instance-sensi,ve	score	map	with	FCN	
		
•  Contribu,on	
–  Fast	&	Accurate	proposals	
	
•  Experiment	
–  PASCAL	VOC	2012	&	MS	COCO	segmenta,on	
–  state	of	the	art	results
MS	COCO	val	(赤線+白で塗りつぶしされている領域はmissed	ground	truth)
書誌情報	
•  Title:	Instance-sensi,ve	Fully	Convolu,onal	Networks	
•  Author:	Jifeng	Dai	,	Kaiming	He	,	Yi	Li	,	Shaoqing	Ren	,	
Jian	Sun	
–  MSRA, 清華大学,	中国科学技術大学	
•  hFp://arxiv.org/abs/1603.08678	 (29	Mar	2016,	Technical	Report)
書誌情報	
•  著者の最近の研究	
今回紹介する手法は	
Proposalに関しては	
これより概ね性能が良い
(余談)	CVPR’16	面白そうなの	
•  CNN-RNN:	A	Unified	Framework	for	Mul,-label	Image	Classifica,on	
–  hFps://arxiv.org/abs/1604.04573	
	
•  Mul,-Oriented	Text	Detec,on	with	Fully	Convolu,onal	Networks	
–  hFps://arxiv.org/abs/1604.04018	
	
•  ProNet:	Learning	to	Propose	Object-specific	Boxes	for	Cascaded	Neural	
Networks	
–  hFps://arxiv.org/abs/1511.03776	
	
	
FCN	
利用
Classifica,on	 Detec,on	
Seman,c		
Segmenta,on	
Instance	
	Object	
Proposals	
AlexNet	
VGG	
GoogLeNet	
2012	
2013	
2014	
2015	
2016	
OverFeat	
R-CNN	
Fast	R-CNN	
Faster	R-CNN	
FCN	
FCN+CRF	
(DeepLab	etc..)	
DeepMask	
CaffeNet	
Residual	
(BatchNormaliza,on)	
Object	
Proposals	
(Selec,ve	Search)	
2011	
(BING)	
(GOP)	
(MCG)	(MCG)	
(EdgeBoxes)	
(RIGOR)	
(DPM)	
InstanceFCN
[今回紹介する手法]
※独断と偏見で作成(適当)	
空白	≠	研究がない
Classifica,on	vs	Detec,on	
•  Detec,on	=	What	+	Where	
Classifica,on	 Detec,on	
Person	
Motorbike	
Person	
Motorbike
Seman,c	Segmenta,on	vs	
Instance	Segment	Proposals	
•  Seman,c	Segmenta,on	=	Pixel-wise	labeling	
•  Instance	Segmenta,on	=	インスタンスを区別する	
•  Instance	Segment	Proposals	:	物体領域候補を抽出	
–  各領域が何であるかを識別するのは別の問題	
–  基本的にRecallの方が重要	
	
Original	 Seman,c	Segmenta,on	 Instance	Segmenta,on
Fully	Convolu,onal	Networks	(FCN)	
•  No	fully	connect	layer	
•  Last	layer:	per-pixel	sommax	
	
	
	
	
	
	
	
	
	
•  Seman,c	Segmenta,onでは本質的に重なる同一物体を区別
できない
FCNの応用	
•  Seman,c	Segmenta,on	
	
•  Contour	Detec,on	
	
•  Denoising	
	
•  Image	Super	Resolu,on	
•  Image	Enhancement	
	
•  Region	Proposal	Network	(RPN)	
–  Faster	R-CNN	
基本的にはピクセルごとの分類問題に適用できる
DeepMask	(NIPS	2015)	
•  Facebook	AI	Research	
•  CNNに入力した画像の中心のピクセルが属している
物体部分のマスクだけ出力するように学習
提案手法:	InstanceFCN	
•  FCNをinstance	segmenta,onするように拡張
from	FCN	to	InstanceFCN	
•  インスタンスが1つ	=>	FCNでOK	
•  インスタンスが2つ以上の場合:	
	
	
	
	
	
	
	
–  左のインスタンスから見ると,右のインスタンスが区別で
きれば良い
InstanceFCN	
•  FCNの出力として各ピクセルは相対位置にあるインスタンス
に自分自身も含まれるかどうかを出力する	
–  出力マップ数はk^2	
	
	
	
	
	
	
	
	
	
	
	
	
	
•  最終的出力:	m	×	m	のスライディングウィンドウに対してm/k	×	m/k	のサブ
ウィンドウごとに出力マップをコピー
DeepMaskとの比較	
DeepMaskはm^2の層から	
マスクを生成する	
InstanceFCNの場合	
全結合層がなく	
FCNからマスクを生成する
InstanceFCNの利点	
•  各ピクセルでのスコアは再利用できる
ネットワーク構造の詳細	
-	VGG16ベース	
-	2つの分岐	
			-	セグメンテーション	
			-	インスタンススコア	
-	インスタンススコアを計算したのち,ウィン
ドウごとにassemblingをおこなう
訓練	/	テスト 方法	
•  訓練時:		
スライディングウィンドウを適当に動かして,各スラ
イディングウィンドウごとに評価	
–  損失関数	
	
	
–  SGDで訓練	
	
•  テスト時:		
端から端までスライディングウィンドウを動かして,
各評価を合計する		
–  1枚あたり約1.5s	
-	pi*	=	1	(posi,ve	sampleの場合)	
-	Si*	:	ground	truth	segment	instance	
-	L:	logis,c	regression
実験:	定性的結果	 k=3
実験:	DeepMaskとの比較	
	
	
•  DeepMaskよりも良い精度が得られている	
–  AR@N:	Average	Recall,		Nはproposalの数	
–  ~DeepMaskは著者らによる実装	
–  crop	224x224というのは訓練時の画像サイズをDeepMask
と同じにしたもの	
PASCAL	VOC	2012	val	
kを変えた場合:		
k=5
実験:	他のInstance	Segment	Proposals手法との比較	
	
	
	
	
	
	
PASCAL	VOC	2012	val	
MNCも同一著者	
によるもの	(CVPR’16)
実験:	他のInstance	Segment	Proposals手法との比較	
	
	
	
	
	
	
MS	COCOC	val
実験:	Seman,c	Instance	Segmenta,on	
•  proposal部分にInstanceFCNを使用	
PASCAL	VOC	2012	val
Result	
DeepMaskとの比較

Más contenido relacionado

Último

論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding
論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding
論文紹介:Selective Structured State-Spaces for Long-Form Video UnderstandingToru Tamaki
 
論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games
論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games
論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Gamesatsushi061452
 
新人研修 後半 2024/04/26の勉強会で発表されたものです。
新人研修 後半        2024/04/26の勉強会で発表されたものです。新人研修 後半        2024/04/26の勉強会で発表されたものです。
新人研修 後半 2024/04/26の勉強会で発表されたものです。iPride Co., Ltd.
 
論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...
論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...
論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...Toru Tamaki
 
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアルLoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアルCRI Japan, Inc.
 
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。iPride Co., Ltd.
 
知識ゼロの営業マンでもできた!超速で初心者を脱する、悪魔的学習ステップ3選.pptx
知識ゼロの営業マンでもできた!超速で初心者を脱する、悪魔的学習ステップ3選.pptx知識ゼロの営業マンでもできた!超速で初心者を脱する、悪魔的学習ステップ3選.pptx
知識ゼロの営業マンでもできた!超速で初心者を脱する、悪魔的学習ステップ3選.pptxsn679259
 
Utilizing Ballerina for Cloud Native Integrations
Utilizing Ballerina for Cloud Native IntegrationsUtilizing Ballerina for Cloud Native Integrations
Utilizing Ballerina for Cloud Native IntegrationsWSO2
 
LoRaWANスマート距離検出センサー DS20L カタログ LiDARデバイス
LoRaWANスマート距離検出センサー  DS20L  カタログ  LiDARデバイスLoRaWANスマート距離検出センサー  DS20L  カタログ  LiDARデバイス
LoRaWANスマート距離検出センサー DS20L カタログ LiDARデバイスCRI Japan, Inc.
 
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。iPride Co., Ltd.
 

Último (10)

論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding
論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding
論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding
 
論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games
論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games
論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games
 
新人研修 後半 2024/04/26の勉強会で発表されたものです。
新人研修 後半        2024/04/26の勉強会で発表されたものです。新人研修 後半        2024/04/26の勉強会で発表されたものです。
新人研修 後半 2024/04/26の勉強会で発表されたものです。
 
論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...
論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...
論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...
 
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアルLoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
 
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
 
知識ゼロの営業マンでもできた!超速で初心者を脱する、悪魔的学習ステップ3選.pptx
知識ゼロの営業マンでもできた!超速で初心者を脱する、悪魔的学習ステップ3選.pptx知識ゼロの営業マンでもできた!超速で初心者を脱する、悪魔的学習ステップ3選.pptx
知識ゼロの営業マンでもできた!超速で初心者を脱する、悪魔的学習ステップ3選.pptx
 
Utilizing Ballerina for Cloud Native Integrations
Utilizing Ballerina for Cloud Native IntegrationsUtilizing Ballerina for Cloud Native Integrations
Utilizing Ballerina for Cloud Native Integrations
 
LoRaWANスマート距離検出センサー DS20L カタログ LiDARデバイス
LoRaWANスマート距離検出センサー  DS20L  カタログ  LiDARデバイスLoRaWANスマート距離検出センサー  DS20L  カタログ  LiDARデバイス
LoRaWANスマート距離検出センサー DS20L カタログ LiDARデバイス
 
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
 

Destacado

Everything You Need To Know About ChatGPT
Everything You Need To Know About ChatGPTEverything You Need To Know About ChatGPT
Everything You Need To Know About ChatGPTExpeed Software
 
Product Design Trends in 2024 | Teenage Engineerings
Product Design Trends in 2024 | Teenage EngineeringsProduct Design Trends in 2024 | Teenage Engineerings
Product Design Trends in 2024 | Teenage EngineeringsPixeldarts
 
How Race, Age and Gender Shape Attitudes Towards Mental Health
How Race, Age and Gender Shape Attitudes Towards Mental HealthHow Race, Age and Gender Shape Attitudes Towards Mental Health
How Race, Age and Gender Shape Attitudes Towards Mental HealthThinkNow
 
AI Trends in Creative Operations 2024 by Artwork Flow.pdf
AI Trends in Creative Operations 2024 by Artwork Flow.pdfAI Trends in Creative Operations 2024 by Artwork Flow.pdf
AI Trends in Creative Operations 2024 by Artwork Flow.pdfmarketingartwork
 
PEPSICO Presentation to CAGNY Conference Feb 2024
PEPSICO Presentation to CAGNY Conference Feb 2024PEPSICO Presentation to CAGNY Conference Feb 2024
PEPSICO Presentation to CAGNY Conference Feb 2024Neil Kimberley
 
Content Methodology: A Best Practices Report (Webinar)
Content Methodology: A Best Practices Report (Webinar)Content Methodology: A Best Practices Report (Webinar)
Content Methodology: A Best Practices Report (Webinar)contently
 
How to Prepare For a Successful Job Search for 2024
How to Prepare For a Successful Job Search for 2024How to Prepare For a Successful Job Search for 2024
How to Prepare For a Successful Job Search for 2024Albert Qian
 
Social Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie InsightsSocial Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie InsightsKurio // The Social Media Age(ncy)
 
Trends In Paid Search: Navigating The Digital Landscape In 2024
Trends In Paid Search: Navigating The Digital Landscape In 2024Trends In Paid Search: Navigating The Digital Landscape In 2024
Trends In Paid Search: Navigating The Digital Landscape In 2024Search Engine Journal
 
5 Public speaking tips from TED - Visualized summary
5 Public speaking tips from TED - Visualized summary5 Public speaking tips from TED - Visualized summary
5 Public speaking tips from TED - Visualized summarySpeakerHub
 
ChatGPT and the Future of Work - Clark Boyd
ChatGPT and the Future of Work - Clark Boyd ChatGPT and the Future of Work - Clark Boyd
ChatGPT and the Future of Work - Clark Boyd Clark Boyd
 
Getting into the tech field. what next
Getting into the tech field. what next Getting into the tech field. what next
Getting into the tech field. what next Tessa Mero
 
Google's Just Not That Into You: Understanding Core Updates & Search Intent
Google's Just Not That Into You: Understanding Core Updates & Search IntentGoogle's Just Not That Into You: Understanding Core Updates & Search Intent
Google's Just Not That Into You: Understanding Core Updates & Search IntentLily Ray
 
Time Management & Productivity - Best Practices
Time Management & Productivity -  Best PracticesTime Management & Productivity -  Best Practices
Time Management & Productivity - Best PracticesVit Horky
 
The six step guide to practical project management
The six step guide to practical project managementThe six step guide to practical project management
The six step guide to practical project managementMindGenius
 
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...RachelPearson36
 
Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...
Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...
Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...Applitools
 

Destacado (20)

Everything You Need To Know About ChatGPT
Everything You Need To Know About ChatGPTEverything You Need To Know About ChatGPT
Everything You Need To Know About ChatGPT
 
Product Design Trends in 2024 | Teenage Engineerings
Product Design Trends in 2024 | Teenage EngineeringsProduct Design Trends in 2024 | Teenage Engineerings
Product Design Trends in 2024 | Teenage Engineerings
 
How Race, Age and Gender Shape Attitudes Towards Mental Health
How Race, Age and Gender Shape Attitudes Towards Mental HealthHow Race, Age and Gender Shape Attitudes Towards Mental Health
How Race, Age and Gender Shape Attitudes Towards Mental Health
 
AI Trends in Creative Operations 2024 by Artwork Flow.pdf
AI Trends in Creative Operations 2024 by Artwork Flow.pdfAI Trends in Creative Operations 2024 by Artwork Flow.pdf
AI Trends in Creative Operations 2024 by Artwork Flow.pdf
 
Skeleton Culture Code
Skeleton Culture CodeSkeleton Culture Code
Skeleton Culture Code
 
PEPSICO Presentation to CAGNY Conference Feb 2024
PEPSICO Presentation to CAGNY Conference Feb 2024PEPSICO Presentation to CAGNY Conference Feb 2024
PEPSICO Presentation to CAGNY Conference Feb 2024
 
Content Methodology: A Best Practices Report (Webinar)
Content Methodology: A Best Practices Report (Webinar)Content Methodology: A Best Practices Report (Webinar)
Content Methodology: A Best Practices Report (Webinar)
 
How to Prepare For a Successful Job Search for 2024
How to Prepare For a Successful Job Search for 2024How to Prepare For a Successful Job Search for 2024
How to Prepare For a Successful Job Search for 2024
 
Social Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie InsightsSocial Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie Insights
 
Trends In Paid Search: Navigating The Digital Landscape In 2024
Trends In Paid Search: Navigating The Digital Landscape In 2024Trends In Paid Search: Navigating The Digital Landscape In 2024
Trends In Paid Search: Navigating The Digital Landscape In 2024
 
5 Public speaking tips from TED - Visualized summary
5 Public speaking tips from TED - Visualized summary5 Public speaking tips from TED - Visualized summary
5 Public speaking tips from TED - Visualized summary
 
ChatGPT and the Future of Work - Clark Boyd
ChatGPT and the Future of Work - Clark Boyd ChatGPT and the Future of Work - Clark Boyd
ChatGPT and the Future of Work - Clark Boyd
 
Getting into the tech field. what next
Getting into the tech field. what next Getting into the tech field. what next
Getting into the tech field. what next
 
Google's Just Not That Into You: Understanding Core Updates & Search Intent
Google's Just Not That Into You: Understanding Core Updates & Search IntentGoogle's Just Not That Into You: Understanding Core Updates & Search Intent
Google's Just Not That Into You: Understanding Core Updates & Search Intent
 
How to have difficult conversations
How to have difficult conversations How to have difficult conversations
How to have difficult conversations
 
Introduction to Data Science
Introduction to Data ScienceIntroduction to Data Science
Introduction to Data Science
 
Time Management & Productivity - Best Practices
Time Management & Productivity -  Best PracticesTime Management & Productivity -  Best Practices
Time Management & Productivity - Best Practices
 
The six step guide to practical project management
The six step guide to practical project managementThe six step guide to practical project management
The six step guide to practical project management
 
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
 
Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...
Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...
Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...
 

論文輪読: Instance-sensitive Fully Convolutional Networks