SlideShare una empresa de Scribd logo
1 de 29
Descargar para leer sin conexión
平滑化処理の繰り返しによる
画像セグメンテーションのための
グラフカット
†中部大学大学院 工学研究科情報工学専攻
‡カーネギーメロン大学 ロボティクス工学研究所
永橋知行†, 藤吉弘亘†, 金出武雄‡
画像セグメンテーション
画像中から対象領域の抽出
グラフカットセグメンテーション 1
 Interactive Graph Cuts Segmentation [Y. Boykov et al,ICCV2001]
– ユーザが物体・背景の正解ラベル(seed)を入力
– Graph Cuts Algorithm によりエネルギーを最小化
物体の正解ラベル
背景の正解ラベル
各ピクセルの性質 ピクセル間の関係
グラフカットセグメンテーション 2
 Lazy Snapping [Y. Li et al , SIGGRAPH2004]
– 機能的なUI
– スーパーピクセルを用いた高速化
 GrabCut [C. Rother et al , SIGGRAPH2004]
– 繰り返し処理により色分布を再学習
グラフカットによるセグメンテーションの問題点
 グラフカットのパラメータλを変化させてもエッジが複雑な
画像では正確なセグメンテーションが困難
入力画像
lが大きい場合 lが小さい場合
 元画像でのセグメンテーション
 平滑化画像でのセグメンテーション
大域的なセグメンテーションから局所的なセグメンテーション
大まかなセグメンテーション
大域的情報
細かなセグメンテーション
局所的情報
→大域的情報から徐々に局所的な情報へ変化
段階的に変化
提案手法:平滑化と繰り返し処理によるグラフカット
 平滑化画像を変化させながら繰り返し処理
→ 大域的なセグメンテーションから局所的なセグメンテーション
入力画像 出力結果
平滑化 Graph Cuts
sの更新
seed
物体・背景の空間的確率
物体・背景の色分布確率
の更新
グラフカットによるセグメンテーション
 物体と背景のラベリング問題
 エネルギー関数 の最小化
t-link n-link
:ピクセル
:近傍ピクセル
: のペナルティ関数
:近接ノード の相互関係
:ラベル(前景,背景)
Step1. ピクセル間のエッジコスト(n-link)の計算
Step2. {s,p}, {t, p}間のエッジコスト(t-link)の計算
Step3. min-cut / max-flow algorithmによりグラフを分割
グラフの作成(n-link)
n-links
n-links
s 物体
t 背景
グラフの作成(t-link)
Step1. ピクセル間のエッジコスト(n-link)の計算
Step2. {s,p}, {t, p}間のエッジコスト(t-link)の計算
Step3. min-cut / max-flow algorithmによりグラフを分割
グラフの作成(t-link)
n-links
s 物体
t 背景
Step1. ピクセル間のエッジコスト(n-link)の計算
Step2. {s,p}, {t, p}間のエッジコスト(t-link)の計算
Step3. min-cut / max-flow algorithmによりグラフを分割
n-links
s 物体
t 背景
グラフの分割
cut
Step1. ピクセル間のエッジコスト(n-link)の計算
Step2. {s,p}, {t, p}間のエッジコスト(t-link)の計算
Step3. min-cut / max-flow algorithmによりグラフを分割
従来法の問題点
 設定パラメータlの影響
– λが大きい:色情報に依存した突発的な誤検出
→ n-linkの影響を大きくする必要
入力画像 lが大きい場合
各ピクセルの性質(t-link) ピクセル間の関係(n-link)
従来法の問題点
 設定パラメータlの影響
– λが小さい:エッジの影響が大きくなる
→ 局所的なエッジを越えることが困難
lが小さい場合入力画像
各ピクセルの性質(t-link) ピクセル間の関係(n-link)
 元画像でのセグメンテーション
 平滑化画像でのセグメンテーション
平滑化とn-linkの関係
入力画像
出力結果入力画像
出力結果
低
高
n-link
n-link
低
高
提案手法の流れ
Step1. seedの入力
Step2. sの初期値計算
Step3. 画像の平滑化
Step4. Graph Cuts
Step5. セグメンテーション結果から事後確率の計算
Step6. s < 1でセグメンテーション結果が変化しなくなるか,s=0となったら終了
それ以外ならばs = a・s (0 < a < 1)と更新しStep 3へ
入力画像 出力結果
平滑化 Graph Cuts
sの更新
seed
物体・背景の空間的確率
物体・背景の色分布確率
の更新
ガウシアンフィルタによる平滑化
s=4
s=8
・・・
s=2s=1
ダウン
サンプリング
・・・
平滑化
(s=2)
平滑化
(s=1)
平滑化
(s=2)
平滑化
(s=1)
 sの連続性を保持した平滑化
物体・背景の空間的確率と色分布確率の更新
1回前の
セグメンテーション結果
物体領域
背景領域
背景の色分布
距離変換
物体の色分布
距離変換
Gaussian Mixture Model による色分布確率距離変換からの空間的確率
セグメンテーション例(バナナと薔薇)
s=16 s=8 s=4 出力結果
セグメンテーション例(魚)
s=16 s=8 s=4 出力結果
従来法との比較
 GrabCut Database
(http://research.microsoft.com/vision/
cambridge/i3l/segmentation/GrabCut.htm)
 画像と正解マスク画像
 人,風景,動物等 50枚
 比較対象
– Interactive Graph Cuts
[Y. Boykov et al, “Interactive Graph Cuts for Optimal Boundary & Region
Segmentation of Objects in N-D Images”, ICCV2001]
– GrabCut
[C. Rother et al , “GrabCut: Interactive Foreground Extraction using Iterated Graph
Cuts. ”SIGGRAPH2004]
比較例
入力画像 Interactive Graph Cuts GrabCut 提案手法
定量的比較 1
 誤検出率により評価
約2.1% セグメンテーション精度を向上
定量的比較 1
 Interactive Graph Cuts と比較して誤検出率が約2.1%の向上
入力画像 Interactive Graph Cuts 提案手法
err:2.53% err:1.14%
→ 1.39%の精度向上
定量的比較 2
 Interactive Graph Cuts の誤検出率
– 2%以下 → 成功画像
– 2%以上 → 失敗画像
成功画像 → 従来法と同程度
失敗画像 → 約4.7% セグメンテーション精度向上
λ の設定値による影響
 lに影響を受けない安定したセグメンテーションが可能
提案手法
Interactive Graph Cuts
入力画像
l=0.005 l=1 l=50
各ピクセルの性質(t-link) ピクセル間の関係(n-link)
動画像に対するセグメンテーション例 (人)
seed (1frame) 20 frame 40 frame30 frame
動画像に対するセグメンテーション例 (車両)
seed (1frame) 20 frame 40 frame30 frame
まとめ:平滑化処理の繰り返しによるグラフカット
 平滑化を用いた大域的なセグメンテーションから局所的な
セグメンテーション
– 空間的確率と色分布確率を用いたt-link
– 従来法で失敗した画像に対して,約4.7% セグメンテーション精度向上
– λの設定値に影響を受けない安定したセグメンテーション
– 動画像への拡張が可能

Más contenido relacionado

La actualidad más candente

La actualidad más candente (20)

これからの Vision & Language ~ Acadexit した4つの理由
これからの Vision & Language ~ Acadexit した4つの理由これからの Vision & Language ~ Acadexit した4つの理由
これからの Vision & Language ~ Acadexit した4つの理由
 
Point net
Point netPoint net
Point net
 
動的輪郭モデル
動的輪郭モデル動的輪郭モデル
動的輪郭モデル
 
MIRU2016 チュートリアル
MIRU2016 チュートリアルMIRU2016 チュートリアル
MIRU2016 チュートリアル
 
信号処理・画像処理における凸最適化
信号処理・画像処理における凸最適化信号処理・画像処理における凸最適化
信号処理・画像処理における凸最適化
 
グラフニューラルネットワーク入門
グラフニューラルネットワーク入門グラフニューラルネットワーク入門
グラフニューラルネットワーク入門
 
画像生成・生成モデル メタサーベイ
画像生成・生成モデル メタサーベイ画像生成・生成モデル メタサーベイ
画像生成・生成モデル メタサーベイ
 
SSII2022 [TS1] Transformerの最前線〜 畳込みニューラルネットワークの先へ 〜
SSII2022 [TS1] Transformerの最前線〜 畳込みニューラルネットワークの先へ 〜SSII2022 [TS1] Transformerの最前線〜 畳込みニューラルネットワークの先へ 〜
SSII2022 [TS1] Transformerの最前線〜 畳込みニューラルネットワークの先へ 〜
 
【DL輪読会】AUTOGT: AUTOMATED GRAPH TRANSFORMER ARCHITECTURE SEARCH
【DL輪読会】AUTOGT: AUTOMATED GRAPH TRANSFORMER ARCHITECTURE SEARCH【DL輪読会】AUTOGT: AUTOMATED GRAPH TRANSFORMER ARCHITECTURE SEARCH
【DL輪読会】AUTOGT: AUTOMATED GRAPH TRANSFORMER ARCHITECTURE SEARCH
 
20090924 姿勢推定と回転行列
20090924 姿勢推定と回転行列20090924 姿勢推定と回転行列
20090924 姿勢推定と回転行列
 
楽しい研究のために今からできること 〜新しく研究を始める皆さんへ〜
楽しい研究のために今からできること 〜新しく研究を始める皆さんへ〜楽しい研究のために今からできること 〜新しく研究を始める皆さんへ〜
楽しい研究のために今からできること 〜新しく研究を始める皆さんへ〜
 
言語と画像の表現学習
言語と画像の表現学習言語と画像の表現学習
言語と画像の表現学習
 
【メタサーベイ】Neural Fields
【メタサーベイ】Neural Fields【メタサーベイ】Neural Fields
【メタサーベイ】Neural Fields
 
機械学習モデルのハイパパラメータ最適化
機械学習モデルのハイパパラメータ最適化機械学習モデルのハイパパラメータ最適化
機械学習モデルのハイパパラメータ最適化
 
SSII2021 [TS1] Visual SLAM ~カメラ幾何の基礎から最近の技術動向まで~
SSII2021 [TS1] Visual SLAM ~カメラ幾何の基礎から最近の技術動向まで~SSII2021 [TS1] Visual SLAM ~カメラ幾何の基礎から最近の技術動向まで~
SSII2021 [TS1] Visual SLAM ~カメラ幾何の基礎から最近の技術動向まで~
 
SSII2021 [SS1] Transformer x Computer Visionの 実活用可能性と展望 〜 TransformerのCompute...
SSII2021 [SS1] Transformer x Computer Visionの 実活用可能性と展望 〜 TransformerのCompute...SSII2021 [SS1] Transformer x Computer Visionの 実活用可能性と展望 〜 TransformerのCompute...
SSII2021 [SS1] Transformer x Computer Visionの 実活用可能性と展望 〜 TransformerのCompute...
 
ICML2021の連合学習の論文
ICML2021の連合学習の論文ICML2021の連合学習の論文
ICML2021の連合学習の論文
 
20190825 vins mono
20190825 vins mono20190825 vins mono
20190825 vins mono
 
[第2回3D勉強会 研究紹介] Neural 3D Mesh Renderer (CVPR 2018)
[第2回3D勉強会 研究紹介] Neural 3D Mesh Renderer (CVPR 2018)[第2回3D勉強会 研究紹介] Neural 3D Mesh Renderer (CVPR 2018)
[第2回3D勉強会 研究紹介] Neural 3D Mesh Renderer (CVPR 2018)
 
[DL輪読会]Graph R-CNN for Scene Graph Generation
[DL輪読会]Graph R-CNN for Scene Graph Generation[DL輪読会]Graph R-CNN for Scene Graph Generation
[DL輪読会]Graph R-CNN for Scene Graph Generation
 

Destacado

OpenCVをAndroidで動かしてみた
OpenCVをAndroidで動かしてみたOpenCVをAndroidで動かしてみた
OpenCVをAndroidで動かしてみた
徹 上野山
 
距離情報に基づく局所特徴量によるリアルタイム人検出
距離情報に基づく局所特徴量によるリアルタイム人検出距離情報に基づく局所特徴量によるリアルタイム人検出
距離情報に基づく局所特徴量によるリアルタイム人検出
MPRG_Chubu_University
 
進化する物体認識技術 一般物体認識とは
進化する物体認識技術 一般物体認識とは進化する物体認識技術 一般物体認識とは
進化する物体認識技術 一般物体認識とは
MPRG_Chubu_University
 

Destacado (20)

実践コンピュータビジョン 9章 画像の領域分割
実践コンピュータビジョン 9章 画像の領域分割実践コンピュータビジョン 9章 画像の領域分割
実践コンピュータビジョン 9章 画像の領域分割
 
実践コンピュータビジョン 3章 画像間の写像
実践コンピュータビジョン 3章 画像間の写像実践コンピュータビジョン 3章 画像間の写像
実践コンピュータビジョン 3章 画像間の写像
 
画像処理ライブラリ OpenCV で 出来ること・出来ないこと
画像処理ライブラリ OpenCV で 出来ること・出来ないこと画像処理ライブラリ OpenCV で 出来ること・出来ないこと
画像処理ライブラリ OpenCV で 出来ること・出来ないこと
 
コンピュータビジョン7章資料_20140830読書会
コンピュータビジョン7章資料_20140830読書会コンピュータビジョン7章資料_20140830読書会
コンピュータビジョン7章資料_20140830読書会
 
OpenCVの基礎
OpenCVの基礎OpenCVの基礎
OpenCVの基礎
 
OpenCVをAndroidで動かしてみた
OpenCVをAndroidで動かしてみたOpenCVをAndroidで動かしてみた
OpenCVをAndroidで動かしてみた
 
10分でわかる主成分分析(PCA)
10分でわかる主成分分析(PCA)10分でわかる主成分分析(PCA)
10分でわかる主成分分析(PCA)
 
はじめよう多変量解析~主成分分析編~
はじめよう多変量解析~主成分分析編~はじめよう多変量解析~主成分分析編~
はじめよう多変量解析~主成分分析編~
 
OpenCV 3.0 on iOS
OpenCV 3.0 on iOSOpenCV 3.0 on iOS
OpenCV 3.0 on iOS
 
Kansai cvprml 20141004
Kansai cvprml 20141004Kansai cvprml 20141004
Kansai cvprml 20141004
 
画像処理(二値化)
画像処理(二値化)画像処理(二値化)
画像処理(二値化)
 
距離情報に基づく局所特徴量によるリアルタイム人検出
距離情報に基づく局所特徴量によるリアルタイム人検出距離情報に基づく局所特徴量によるリアルタイム人検出
距離情報に基づく局所特徴量によるリアルタイム人検出
 
Optim インターンシップ 機械学習による画像の領域分割
Optim インターンシップ 機械学習による画像の領域分割Optim インターンシップ 機械学習による画像の領域分割
Optim インターンシップ 機械学習による画像の領域分割
 
劣モジュラ最適化と機械学習1章
劣モジュラ最適化と機械学習1章劣モジュラ最適化と機械学習1章
劣モジュラ最適化と機械学習1章
 
進化する物体認識技術 一般物体認識とは
進化する物体認識技術 一般物体認識とは進化する物体認識技術 一般物体認識とは
進化する物体認識技術 一般物体認識とは
 
-SSIIの技術マップ- 過去•現在, そして未来 [領域]認識
-SSIIの技術マップ- 過去•現在, そして未来 [領域]認識-SSIIの技術マップ- 過去•現在, そして未来 [領域]認識
-SSIIの技術マップ- 過去•現在, そして未来 [領域]認識
 
Pythonで画像処理をやってみよう! 第1回 - ヒストグラムと濃度変換 -
Pythonで画像処理をやってみよう! 第1回 - ヒストグラムと濃度変換 -Pythonで画像処理をやってみよう! 第1回 - ヒストグラムと濃度変換 -
Pythonで画像処理をやってみよう! 第1回 - ヒストグラムと濃度変換 -
 
グラフネットワーク〜フロー&カット〜
グラフネットワーク〜フロー&カット〜グラフネットワーク〜フロー&カット〜
グラフネットワーク〜フロー&カット〜
 
クラシックな機械学習の入門  8. クラスタリング
クラシックな機械学習の入門  8. クラスタリングクラシックな機械学習の入門  8. クラスタリング
クラシックな機械学習の入門  8. クラスタリング
 
ROSを核としたロボティクス教育(中部大学ロボット理工学科の紹介)
ROSを核としたロボティクス教育(中部大学ロボット理工学科の紹介)ROSを核としたロボティクス教育(中部大学ロボット理工学科の紹介)
ROSを核としたロボティクス教育(中部大学ロボット理工学科の紹介)
 

Similar a 平滑化処理の繰り返しによる画像セグメンテーションのためのグラフカット

光源方向推定のための構造色パターンマッチング
光源方向推定のための構造色パターンマッチング光源方向推定のための構造色パターンマッチング
光源方向推定のための構造色パターンマッチング
uranishi
 

Similar a 平滑化処理の繰り返しによる画像セグメンテーションのためのグラフカット (7)

CycleGANによる異種モダリティ画像生成を用いた股関節MRIの筋骨格セグメンテーション
CycleGANによる異種モダリティ画像生成を用いた股関節MRIの筋骨格セグメンテーションCycleGANによる異種モダリティ画像生成を用いた股関節MRIの筋骨格セグメンテーション
CycleGANによる異種モダリティ画像生成を用いた股関節MRIの筋骨格セグメンテーション
 
光源方向推定のための構造色パターンマッチング
光源方向推定のための構造色パターンマッチング光源方向推定のための構造色パターンマッチング
光源方向推定のための構造色パターンマッチング
 
第28回コンピュータビジョン勉強会@関東(kanejaki担当分)
第28回コンピュータビジョン勉強会@関東(kanejaki担当分)第28回コンピュータビジョン勉強会@関東(kanejaki担当分)
第28回コンピュータビジョン勉強会@関東(kanejaki担当分)
 
20150803.山口大学講演
20150803.山口大学講演20150803.山口大学講演
20150803.山口大学講演
 
論文紹介:Using the Forest to See the Trees: A Graphical. Model Relating Features,...
論文紹介:Using the Forest to See the Trees: A Graphical. Model Relating Features,...論文紹介:Using the Forest to See the Trees: A Graphical. Model Relating Features,...
論文紹介:Using the Forest to See the Trees: A Graphical. Model Relating Features,...
 
Inside-Outカメラからの3次元Scan Pathとシーン構造の復元
Inside-Outカメラからの3次元Scan Pathとシーン構造の復元Inside-Outカメラからの3次元Scan Pathとシーン構造の復元
Inside-Outカメラからの3次元Scan Pathとシーン構造の復元
 
3Dマップを活用したVisual Localization
3Dマップを活用したVisual Localization3Dマップを活用したVisual Localization
3Dマップを活用したVisual Localization
 

Más de MPRG_Chubu_University

アピアランスと時空間特徴の共起に基づく人検出
 アピアランスと時空間特徴の共起に基づく人検出 アピアランスと時空間特徴の共起に基づく人検出
アピアランスと時空間特徴の共起に基づく人検出
MPRG_Chubu_University
 
統計的学習手法による人検出
統計的学習手法による人検出統計的学習手法による人検出
統計的学習手法による人検出
MPRG_Chubu_University
 
色の類似性に基づいた形状特徴量CS-HOGの提案
色の類似性に基づいた形状特徴量CS-HOGの提案色の類似性に基づいた形状特徴量CS-HOGの提案
色の類似性に基づいた形状特徴量CS-HOGの提案
MPRG_Chubu_University
 
複数パスを考慮したRegression Forestsによるカメラのヨー角の推定
複数パスを考慮したRegression Forestsによるカメラのヨー角の推定複数パスを考慮したRegression Forestsによるカメラのヨー角の推定
複数パスを考慮したRegression Forestsによるカメラのヨー角の推定
MPRG_Chubu_University
 
キーフレーム間の物体追跡結果に基づく
キーフレーム間の物体追跡結果に基づくキーフレーム間の物体追跡結果に基づく
キーフレーム間の物体追跡結果に基づく
MPRG_Chubu_University
 
Relational Binarized HOG特徴量とReal AdaBoostによるバイナリ選択を用いた物体検出
Relational Binarized HOG特徴量とReal AdaBoostによるバイナリ選択を用いた物体検出Relational Binarized HOG特徴量とReal AdaBoostによるバイナリ選択を用いた物体検出
Relational Binarized HOG特徴量とReal AdaBoostによるバイナリ選択を用いた物体検出
MPRG_Chubu_University
 
Cascaded FASTによるキーポイント検出
Cascaded FASTによるキーポイント検出Cascaded FASTによるキーポイント検出
Cascaded FASTによるキーポイント検出
MPRG_Chubu_University
 
アプリケーション展開におけるキーポイント

アプリケーション展開におけるキーポイント
アプリケーション展開におけるキーポイント

アプリケーション展開におけるキーポイント

MPRG_Chubu_University
 
局所特徴量と統計学習手法による物体検出
局所特徴量と統計学習手法による物体検出局所特徴量と統計学習手法による物体検出
局所特徴量と統計学習手法による物体検出
MPRG_Chubu_University
 
画像局所特徴量と特定物体認識 - SIFTと最近のアプローチ -
画像局所特徴量と特定物体認識 - SIFTと最近のアプローチ -画像局所特徴量と特定物体認識 - SIFTと最近のアプローチ -
画像局所特徴量と特定物体認識 - SIFTと最近のアプローチ -
MPRG_Chubu_University
 

Más de MPRG_Chubu_University (13)

Hough forestを用いた物体検出
Hough forestを用いた物体検出Hough forestを用いた物体検出
Hough forestを用いた物体検出
 
アピアランスと時空間特徴の共起に基づく人検出
 アピアランスと時空間特徴の共起に基づく人検出 アピアランスと時空間特徴の共起に基づく人検出
アピアランスと時空間特徴の共起に基づく人検出
 
統計的学習手法による人検出
統計的学習手法による人検出統計的学習手法による人検出
統計的学習手法による人検出
 
色の類似性に基づいた形状特徴量CS-HOGの提案
色の類似性に基づいた形状特徴量CS-HOGの提案色の類似性に基づいた形状特徴量CS-HOGの提案
色の類似性に基づいた形状特徴量CS-HOGの提案
 
複数パスを考慮したRegression Forestsによるカメラのヨー角の推定
複数パスを考慮したRegression Forestsによるカメラのヨー角の推定複数パスを考慮したRegression Forestsによるカメラのヨー角の推定
複数パスを考慮したRegression Forestsによるカメラのヨー角の推定
 
Binary code-based Human Detection
Binary code-based Human DetectionBinary code-based Human Detection
Binary code-based Human Detection
 
キーフレーム間の物体追跡結果に基づく
キーフレーム間の物体追跡結果に基づくキーフレーム間の物体追跡結果に基づく
キーフレーム間の物体追跡結果に基づく
 
Relational Binarized HOG特徴量とReal AdaBoostによるバイナリ選択を用いた物体検出
Relational Binarized HOG特徴量とReal AdaBoostによるバイナリ選択を用いた物体検出Relational Binarized HOG特徴量とReal AdaBoostによるバイナリ選択を用いた物体検出
Relational Binarized HOG特徴量とReal AdaBoostによるバイナリ選択を用いた物体検出
 
Cascaded FASTによるキーポイント検出
Cascaded FASTによるキーポイント検出Cascaded FASTによるキーポイント検出
Cascaded FASTによるキーポイント検出
 
Random Forestsとその応用
Random Forestsとその応用Random Forestsとその応用
Random Forestsとその応用
 
アプリケーション展開におけるキーポイント

アプリケーション展開におけるキーポイント
アプリケーション展開におけるキーポイント

アプリケーション展開におけるキーポイント

 
局所特徴量と統計学習手法による物体検出
局所特徴量と統計学習手法による物体検出局所特徴量と統計学習手法による物体検出
局所特徴量と統計学習手法による物体検出
 
画像局所特徴量と特定物体認識 - SIFTと最近のアプローチ -
画像局所特徴量と特定物体認識 - SIFTと最近のアプローチ -画像局所特徴量と特定物体認識 - SIFTと最近のアプローチ -
画像局所特徴量と特定物体認識 - SIFTと最近のアプローチ -
 

平滑化処理の繰り返しによる画像セグメンテーションのためのグラフカット