SlideShare una empresa de Scribd logo
1 de 12
Descargar para leer sin conexión
 Study

Slide 2013.12.5
K-means Tracker とは
K-means クラスタリング法とは

色と空間的配置による特徴表現
K-means tracker のアルゴリズム
•

•

画像上の追跡対象と非対象に対して複数のクラスタ
中心を割り当て、K-meansクラスタリングによって
サーチェリア内の各画素をターゲットと非ターゲッ
トに分けながら追跡を行う
追跡対象の領域に混入した背景画素を効果的に排除
ながら追跡を断続できる
画
像

追跡
対象
非
対象

複数クラスタ
ターゲット

K-means
Clustering

非
ターゲット

追跡する

…
①
②
③

④

各点にランダムにクラスタを割り当てる
クラスタの重心を計算する
点のクラスタを,一番近い重心のクラスタに変更
する
変化がなければ終了.変化がある限りは ② に戻る
①初期状態

④再度、重心を計算する

http://tech.nitoyon.com/ja/blog/2009/04/09/kmeans-visualise/

②重心を計算する

③一番近い重心の色に変わる
⑤再度、色を置き換える

⑨変化がなくなった
⑧またまた色を置き換える

http://tech.nitoyon.com/ja/blog/2009/04/09/kmeans-visualise/

⑥また重心を計算する

⑦また色を置き換える
色と空間的配置による特徴表現
追 跡 対 象 を 構 成 す る 各 画 素 の 特 徴 を 3 次 元
( 𝑘 = [𝑌, 𝑈, 𝑉] 𝑇 ) 属 性 と 2 次 元 空 間 配 配 置 属 性
(𝑝 = [𝑥, 𝑦] 𝑇)からなる5次元ベクトル(f = [𝑘, 𝑝] 𝑇)として扱う




クラスタリングの際に必要となる二つの画素a,bの特徴ベ
クトル𝑓 𝑎, 𝑓 𝑏 間の距離は、色属性間の距離と空間配置間の距
離を重み𝛼を用いて線形結合して計算する
𝑑(𝑓 𝑎 , 𝑓 𝑏 ) =

𝑘 𝑓𝑎 – 𝑘 𝑓 𝑏

2

+ 𝛼 𝑝 𝑓𝑎 – 𝑝 𝑓 𝑏

2

ただし,0 < 𝛼 < 0.5

高速追従型2眼能動カメラシステム (High-Speed Object Tracking System using Active Camera )
Hiroshi OIKE, Haiyuan WU, Chunsheng HUA, and Toshikazu WADA
Transactions of the Institute of Systems, Control and Information Engineers 20(3), 114-121, 2007-03-15
K-means tracker のアルゴリズム
Step 1
初期フレーム(𝑡 = 0)に,追跡対象の色の数に合わせ
た数個(𝑛)のターゲットクラスタ中心を手動で画像上
に指定し,背景上の1点bを指定する
 指定されたターゲットクラスタ中心の重心𝑐を中心と
し、 𝑐 − 𝑏 を半径とした円を初期フレームに可変楕
円として追跡を開始する


高速追従型2眼能動カメラシステム (High-Speed Object Tracking System using Active Camera )
Hiroshi OIKE, Haiyuan WU, Chunsheng HUA, and Toshikazu WADA
Transactions of the Institute of Systems, Control and Information Engineers 20(3), 114-121, 2007-03-15
K-means tracker のアルゴリズム
Step 2



𝑡フレームに,サーチエリア(可変楕円)内のある画素𝑓 𝑢 に
対して,5次元特徴空間内にターゲットクラス中𝑓 𝑇 𝑖 ∗
と非ターゲットクラスタ中心𝑓 𝑇 𝑗 ∗ の最短距離
𝐷 𝑇 (𝑓 𝑢 ) = min {𝑑(𝑓 𝑢 , 𝑓 𝑇 𝑖 ∗ )
𝑖=1~𝑛

𝐷 𝑁 (𝑓 𝑢 ) = min {𝑑(𝑓 𝑢 , 𝑓 𝑇 𝑗 ∗ )
𝑖=1~𝑚

𝐷 𝑇 𝑓 𝑢 < 𝐷 𝑁 (𝑓 𝑢 ) : その画素ターゲット点
𝐷 𝑇 𝑓 𝑢 > 𝐷 𝑁 (𝑓 𝑢 ) : 非ターゲット点クラスタリング
を行う
 サーチエリア内のすべての画素に対してこの処理を
行って,ターゲットクラスタiにクラスタリングされた
画素を𝑓 𝑇 𝑖 、𝐹 𝑇 𝑖 の総数を𝑁 𝑖 とし, 𝑓 𝑇 𝑖 = [𝑘 𝑇 𝑖 ∗ , 𝑝 𝑇 𝑖 ∗ ] を更
新する
高速追従型2眼能動カメラシステム (High-Speed Object Tracking System using Active Camera )
Hiroshi OIKE, Haiyuan WU, Chunsheng HUA, and Toshikazu WADA
Transactions of the Institute of Systems, Control and Information Engineers 20(3), 114-121, 2007-03-15
K-means tracker のアルゴリズム
Step 2


サーチエリア内のすべての画素に対してこの処理を行っ
て,ターゲットクラスタiにクラスタリングされた画素を
𝑓 𝑇 𝑖 、𝐹 𝑇 𝑖 の総数を𝑁 𝑖 とし,𝑓 𝑇 𝑖 ∗ = [𝑘 𝑇 𝑖 ∗ , 𝑝 𝑇 𝑖 ∗ ] を更新する
1
∗
𝑘 𝑇𝑖 = 𝛽
𝑘 𝑇 𝑖 + (1 − 𝛽)𝑘 𝑇 𝑖 ∗𝑡−1
𝑁𝑖
𝑓 𝑇 𝑖 ∈𝐹 𝑇 𝑖

𝑝 𝑇𝑖

∗

1
=
𝑁𝑖

𝑝 𝑇𝑖
𝑓 𝑇 𝑖 ∈𝐹 𝑇 𝑖

𝑘 𝑇 𝑖 ∗𝑡−1 :1フレームマ前のターゲットクラスタ中心のお色、
𝛽:ー次遅れ系でターゲットクラスタ中心の色を更新するための係数
高速追従型2眼能動カメラシステム (High-Speed Object Tracking System using Active Camera )
Hiroshi OIKE, Haiyuan WU, Chunsheng HUA, and Toshikazu WADA
Transactions of the Institute of Systems, Control and Information Engineers 20(3), 114-121, 2007-03-15
K-means tracker のアルゴリズム
Step 3
検出されてターゲット点の分布を合わせて楕円のパラ
メータを決定する
 次のフレームにおける可変楕円を更新する際,サーチ
エリアの中にターゲットを含む
 また,楕円の中心座標は式(2)より求める.
1
c=
𝑦
𝑒


𝑦∈𝑆

S:現フレームにおける可変楕円内のターゲット点の集合
e:可変楕円内のターゲット点の数
y = [y 𝑥 , y 𝑦 ] 𝑇 : ターゲット点
c : 次のフレームにおける可変楕円モデルの中心座標
高速追従型2眼能動カメラシステム (High-Speed Object Tracking System using Active Camera )
Hiroshi OIKE, Haiyuan WU, Chunsheng HUA, and Toshikazu WADA
Transactions of the Institute of Systems, Control and Information Engineers 20(3), 114-121, 2007-03-15
K-means tracker のアルゴリズム
Step 4
更新された可変楕円の輪郭上の画素からm等分の点を
選んで新しい非ターゲットクラスタ中心とする
 更新後の非ターゲットクラスタ中心点の画素に位置
(x,y)と色(Y,U,V)より各非ターゲットクラスタ中心の特
徴ベクトルを更新する
 t = t + 1として,Step2に進む


高速追従型2眼能動カメラシステム (High-Speed Object Tracking System using Active Camera )
Hiroshi OIKE, Haiyuan WU, Chunsheng HUA, and Toshikazu WADA
Transactions of the Institute of Systems, Control and Information Engineers 20(3), 114-121, 2007-03-15

Más contenido relacionado

La actualidad más candente

深層学習の数理
深層学習の数理深層学習の数理
深層学習の数理Taiji Suzuki
 
Taking a Deeper Look at the Inverse Compositional Algorithm
Taking a Deeper Look at the Inverse Compositional AlgorithmTaking a Deeper Look at the Inverse Compositional Algorithm
Taking a Deeper Look at the Inverse Compositional AlgorithmMai Nishimura
 
[DL輪読会] Learning Finite State Representations of Recurrent Policy Networks (I...
[DL輪読会] Learning Finite State Representations of Recurrent Policy Networks (I...[DL輪読会] Learning Finite State Representations of Recurrent Policy Networks (I...
[DL輪読会] Learning Finite State Representations of Recurrent Policy Networks (I...Deep Learning JP
 
0から理解するニューラルネットアーキテクチャサーチ(NAS)
0から理解するニューラルネットアーキテクチャサーチ(NAS)0から理解するニューラルネットアーキテクチャサーチ(NAS)
0から理解するニューラルネットアーキテクチャサーチ(NAS)MasanoriSuganuma
 
(公開版)FPGAエクストリームコンピューティング2017
(公開版)FPGAエクストリームコンピューティング2017 (公開版)FPGAエクストリームコンピューティング2017
(公開版)FPGAエクストリームコンピューティング2017 Hiroki Nakahara
 
北大調和系 DLゼミ A3C
北大調和系 DLゼミ A3C北大調和系 DLゼミ A3C
北大調和系 DLゼミ A3CTomoya Oda
 
Mastering Atari, Go, Chess and Shogi by Planning with a Learned Model (MuZero)
Mastering Atari, Go, Chess and Shogi by Planning with a Learned Model (MuZero)Mastering Atari, Go, Chess and Shogi by Planning with a Learned Model (MuZero)
Mastering Atari, Go, Chess and Shogi by Planning with a Learned Model (MuZero)harmonylab
 
Akihiro Aritoshi Bachelor Thesis
Akihiro Aritoshi Bachelor ThesisAkihiro Aritoshi Bachelor Thesis
Akihiro Aritoshi Bachelor Thesispflab
 
【CVPR 2019】Second-order Attention Network for Single Image Super-Resolution
【CVPR 2019】Second-order Attention Network for Single Image Super-Resolution【CVPR 2019】Second-order Attention Network for Single Image Super-Resolution
【CVPR 2019】Second-order Attention Network for Single Image Super-Resolutioncvpaper. challenge
 
【CVPR 2019】Learning spatio temporal representation with local and global diff...
【CVPR 2019】Learning spatio temporal representation with local and global diff...【CVPR 2019】Learning spatio temporal representation with local and global diff...
【CVPR 2019】Learning spatio temporal representation with local and global diff...cvpaper. challenge
 
論文紹介 Pixel Recurrent Neural Networks
論文紹介 Pixel Recurrent Neural Networks論文紹介 Pixel Recurrent Neural Networks
論文紹介 Pixel Recurrent Neural NetworksSeiya Tokui
 
FPGAX2016 ドキュンなFPGA
FPGAX2016 ドキュンなFPGAFPGAX2016 ドキュンなFPGA
FPGAX2016 ドキュンなFPGAHiroki Nakahara
 
第41回関東CV勉強会 CNN-SLAM
第41回関東CV勉強会 CNN-SLAM第41回関東CV勉強会 CNN-SLAM
第41回関東CV勉強会 CNN-SLAM邦洋 長谷川
 
Section11 clustering
Section11 clusteringSection11 clustering
Section11 clusteringHiroyukiKosho
 
Image net classification with deep convolutional neural network
Image net classification with deep convolutional neural networkImage net classification with deep convolutional neural network
Image net classification with deep convolutional neural networkga sin
 
Reducing the Dimensionality of Data with Neural Networks
Reducing the Dimensionality of Data with Neural NetworksReducing the Dimensionality of Data with Neural Networks
Reducing the Dimensionality of Data with Neural NetworksNagayoshi Yamashita
 
Shogo Yamazaki Bachelor Thesis
Shogo Yamazaki Bachelor ThesisShogo Yamazaki Bachelor Thesis
Shogo Yamazaki Bachelor Thesispflab
 
NDTスキャンマッチング 第1回3D勉強会@PFN 2018年5月27日
NDTスキャンマッチング 第1回3D勉強会@PFN 2018年5月27日NDTスキャンマッチング 第1回3D勉強会@PFN 2018年5月27日
NDTスキャンマッチング 第1回3D勉強会@PFN 2018年5月27日Kitsukawa Yuki
 
Visual SLAM: Why Bundle Adjust?の解説(第4回3D勉強会@関東)
Visual SLAM: Why Bundle Adjust?の解説(第4回3D勉強会@関東)Visual SLAM: Why Bundle Adjust?の解説(第4回3D勉強会@関東)
Visual SLAM: Why Bundle Adjust?の解説(第4回3D勉強会@関東)Masaya Kaneko
 
Yoshio Kato Bachelor Thesis
Yoshio Kato Bachelor Thesis Yoshio Kato Bachelor Thesis
Yoshio Kato Bachelor Thesis pflab
 

La actualidad más candente (20)

深層学習の数理
深層学習の数理深層学習の数理
深層学習の数理
 
Taking a Deeper Look at the Inverse Compositional Algorithm
Taking a Deeper Look at the Inverse Compositional AlgorithmTaking a Deeper Look at the Inverse Compositional Algorithm
Taking a Deeper Look at the Inverse Compositional Algorithm
 
[DL輪読会] Learning Finite State Representations of Recurrent Policy Networks (I...
[DL輪読会] Learning Finite State Representations of Recurrent Policy Networks (I...[DL輪読会] Learning Finite State Representations of Recurrent Policy Networks (I...
[DL輪読会] Learning Finite State Representations of Recurrent Policy Networks (I...
 
0から理解するニューラルネットアーキテクチャサーチ(NAS)
0から理解するニューラルネットアーキテクチャサーチ(NAS)0から理解するニューラルネットアーキテクチャサーチ(NAS)
0から理解するニューラルネットアーキテクチャサーチ(NAS)
 
(公開版)FPGAエクストリームコンピューティング2017
(公開版)FPGAエクストリームコンピューティング2017 (公開版)FPGAエクストリームコンピューティング2017
(公開版)FPGAエクストリームコンピューティング2017
 
北大調和系 DLゼミ A3C
北大調和系 DLゼミ A3C北大調和系 DLゼミ A3C
北大調和系 DLゼミ A3C
 
Mastering Atari, Go, Chess and Shogi by Planning with a Learned Model (MuZero)
Mastering Atari, Go, Chess and Shogi by Planning with a Learned Model (MuZero)Mastering Atari, Go, Chess and Shogi by Planning with a Learned Model (MuZero)
Mastering Atari, Go, Chess and Shogi by Planning with a Learned Model (MuZero)
 
Akihiro Aritoshi Bachelor Thesis
Akihiro Aritoshi Bachelor ThesisAkihiro Aritoshi Bachelor Thesis
Akihiro Aritoshi Bachelor Thesis
 
【CVPR 2019】Second-order Attention Network for Single Image Super-Resolution
【CVPR 2019】Second-order Attention Network for Single Image Super-Resolution【CVPR 2019】Second-order Attention Network for Single Image Super-Resolution
【CVPR 2019】Second-order Attention Network for Single Image Super-Resolution
 
【CVPR 2019】Learning spatio temporal representation with local and global diff...
【CVPR 2019】Learning spatio temporal representation with local and global diff...【CVPR 2019】Learning spatio temporal representation with local and global diff...
【CVPR 2019】Learning spatio temporal representation with local and global diff...
 
論文紹介 Pixel Recurrent Neural Networks
論文紹介 Pixel Recurrent Neural Networks論文紹介 Pixel Recurrent Neural Networks
論文紹介 Pixel Recurrent Neural Networks
 
FPGAX2016 ドキュンなFPGA
FPGAX2016 ドキュンなFPGAFPGAX2016 ドキュンなFPGA
FPGAX2016 ドキュンなFPGA
 
第41回関東CV勉強会 CNN-SLAM
第41回関東CV勉強会 CNN-SLAM第41回関東CV勉強会 CNN-SLAM
第41回関東CV勉強会 CNN-SLAM
 
Section11 clustering
Section11 clusteringSection11 clustering
Section11 clustering
 
Image net classification with deep convolutional neural network
Image net classification with deep convolutional neural networkImage net classification with deep convolutional neural network
Image net classification with deep convolutional neural network
 
Reducing the Dimensionality of Data with Neural Networks
Reducing the Dimensionality of Data with Neural NetworksReducing the Dimensionality of Data with Neural Networks
Reducing the Dimensionality of Data with Neural Networks
 
Shogo Yamazaki Bachelor Thesis
Shogo Yamazaki Bachelor ThesisShogo Yamazaki Bachelor Thesis
Shogo Yamazaki Bachelor Thesis
 
NDTスキャンマッチング 第1回3D勉強会@PFN 2018年5月27日
NDTスキャンマッチング 第1回3D勉強会@PFN 2018年5月27日NDTスキャンマッチング 第1回3D勉強会@PFN 2018年5月27日
NDTスキャンマッチング 第1回3D勉強会@PFN 2018年5月27日
 
Visual SLAM: Why Bundle Adjust?の解説(第4回3D勉強会@関東)
Visual SLAM: Why Bundle Adjust?の解説(第4回3D勉強会@関東)Visual SLAM: Why Bundle Adjust?の解説(第4回3D勉強会@関東)
Visual SLAM: Why Bundle Adjust?の解説(第4回3D勉強会@関東)
 
Yoshio Kato Bachelor Thesis
Yoshio Kato Bachelor Thesis Yoshio Kato Bachelor Thesis
Yoshio Kato Bachelor Thesis
 

Similar a K means tracker study

畳み込みニューラルネットワークの研究動向
畳み込みニューラルネットワークの研究動向畳み込みニューラルネットワークの研究動向
畳み込みニューラルネットワークの研究動向Yusuke Uchida
 
[DL輪読会]Depth Prediction Without the Sensors: Leveraging Structure for Unsuper...
[DL輪読会]Depth Prediction Without the Sensors: Leveraging Structure for Unsuper...[DL輪読会]Depth Prediction Without the Sensors: Leveraging Structure for Unsuper...
[DL輪読会]Depth Prediction Without the Sensors: Leveraging Structure for Unsuper...Deep Learning JP
 
物体検知(Meta Study Group 発表資料)
物体検知(Meta Study Group 発表資料)物体検知(Meta Study Group 発表資料)
物体検知(Meta Study Group 発表資料)cvpaper. challenge
 
点群深層学習 Meta-study
点群深層学習 Meta-study点群深層学習 Meta-study
点群深層学習 Meta-studyNaoya Chiba
 
20110109第8回CV勉強会(ミーンシフトの原理と応用:6章・7章)shirasy)
20110109第8回CV勉強会(ミーンシフトの原理と応用:6章・7章)shirasy)20110109第8回CV勉強会(ミーンシフトの原理と応用:6章・7章)shirasy)
20110109第8回CV勉強会(ミーンシフトの原理と応用:6章・7章)shirasy)Yoichi Shirasawa
 
Icml2019 kyoto ohno_ver20190805
Icml2019 kyoto ohno_ver20190805Icml2019 kyoto ohno_ver20190805
Icml2019 kyoto ohno_ver20190805Shuntaro Ohno
 
[読会]P qk means-_ billion-scale clustering for product-quantized codes
[読会]P qk means-_ billion-scale clustering for product-quantized codes[読会]P qk means-_ billion-scale clustering for product-quantized codes
[読会]P qk means-_ billion-scale clustering for product-quantized codesshima o
 
論文紹介:Revealing the unseen: Benchmarking video action recognition under occlusion
論文紹介:Revealing the unseen: Benchmarking video action recognition under occlusion論文紹介:Revealing the unseen: Benchmarking video action recognition under occlusion
論文紹介:Revealing the unseen: Benchmarking video action recognition under occlusionToru Tamaki
 
LUT-Network ~本物のリアルタイムコンピューティングを目指して~
LUT-Network ~本物のリアルタイムコンピューティングを目指して~LUT-Network ~本物のリアルタイムコンピューティングを目指して~
LUT-Network ~本物のリアルタイムコンピューティングを目指して~ryuz88
 
Sigir2013 勉強会資料
Sigir2013 勉強会資料Sigir2013 勉強会資料
Sigir2013 勉強会資料Mitsuo Yamamoto
 
CVPR2016読み会 "Inside-Outside Net: Detecting Objects in Context with Skip Pooli...
CVPR2016読み会 "Inside-Outside Net: Detecting Objects in Context with Skip Pooli...CVPR2016読み会 "Inside-Outside Net: Detecting Objects in Context with Skip Pooli...
CVPR2016読み会 "Inside-Outside Net: Detecting Objects in Context with Skip Pooli...The University of Tokyo
 
PyTorch, PixyzによるGenerative Query Networkの実装
PyTorch, PixyzによるGenerative Query Networkの実装PyTorch, PixyzによるGenerative Query Networkの実装
PyTorch, PixyzによるGenerative Query Networkの実装Shohei Taniguchi
 

Similar a K means tracker study (12)

畳み込みニューラルネットワークの研究動向
畳み込みニューラルネットワークの研究動向畳み込みニューラルネットワークの研究動向
畳み込みニューラルネットワークの研究動向
 
[DL輪読会]Depth Prediction Without the Sensors: Leveraging Structure for Unsuper...
[DL輪読会]Depth Prediction Without the Sensors: Leveraging Structure for Unsuper...[DL輪読会]Depth Prediction Without the Sensors: Leveraging Structure for Unsuper...
[DL輪読会]Depth Prediction Without the Sensors: Leveraging Structure for Unsuper...
 
物体検知(Meta Study Group 発表資料)
物体検知(Meta Study Group 発表資料)物体検知(Meta Study Group 発表資料)
物体検知(Meta Study Group 発表資料)
 
点群深層学習 Meta-study
点群深層学習 Meta-study点群深層学習 Meta-study
点群深層学習 Meta-study
 
20110109第8回CV勉強会(ミーンシフトの原理と応用:6章・7章)shirasy)
20110109第8回CV勉強会(ミーンシフトの原理と応用:6章・7章)shirasy)20110109第8回CV勉強会(ミーンシフトの原理と応用:6章・7章)shirasy)
20110109第8回CV勉強会(ミーンシフトの原理と応用:6章・7章)shirasy)
 
Icml2019 kyoto ohno_ver20190805
Icml2019 kyoto ohno_ver20190805Icml2019 kyoto ohno_ver20190805
Icml2019 kyoto ohno_ver20190805
 
[読会]P qk means-_ billion-scale clustering for product-quantized codes
[読会]P qk means-_ billion-scale clustering for product-quantized codes[読会]P qk means-_ billion-scale clustering for product-quantized codes
[読会]P qk means-_ billion-scale clustering for product-quantized codes
 
論文紹介:Revealing the unseen: Benchmarking video action recognition under occlusion
論文紹介:Revealing the unseen: Benchmarking video action recognition under occlusion論文紹介:Revealing the unseen: Benchmarking video action recognition under occlusion
論文紹介:Revealing the unseen: Benchmarking video action recognition under occlusion
 
LUT-Network ~本物のリアルタイムコンピューティングを目指して~
LUT-Network ~本物のリアルタイムコンピューティングを目指して~LUT-Network ~本物のリアルタイムコンピューティングを目指して~
LUT-Network ~本物のリアルタイムコンピューティングを目指して~
 
Sigir2013 勉強会資料
Sigir2013 勉強会資料Sigir2013 勉強会資料
Sigir2013 勉強会資料
 
CVPR2016読み会 "Inside-Outside Net: Detecting Objects in Context with Skip Pooli...
CVPR2016読み会 "Inside-Outside Net: Detecting Objects in Context with Skip Pooli...CVPR2016読み会 "Inside-Outside Net: Detecting Objects in Context with Skip Pooli...
CVPR2016読み会 "Inside-Outside Net: Detecting Objects in Context with Skip Pooli...
 
PyTorch, PixyzによるGenerative Query Networkの実装
PyTorch, PixyzによるGenerative Query Networkの実装PyTorch, PixyzによるGenerative Query Networkの実装
PyTorch, PixyzによるGenerative Query Networkの実装
 

K means tracker study