SlideShare una empresa de Scribd logo
1 de 57
OpenCVのOpenCL実装oclMat
関東GPGPU勉強会#2
2013/6/1
@dandelion1124
自己紹介(1/3)
Twitter:@dandelion1124
• 学生時代は画像処理の研究に従事。
• 現在は都内勤務エンジニア。
• 研究室向けOpenCVのTipsサイトを作っていたら
OpenCV関連の書籍を書くことになり今に至る。
blog: http://www.atinfinity.info/blog/
wiki: http://www.atinfinity.info/wiki/
自己紹介(2/3)
• 書籍執筆
– OpenCVプログラミングブック
• 和訳本の原稿チェック
– 詳解 OpenCV
– 実践 コンピュータビジョン
• 雑誌関連
– 日経ソフトウェア(2011年3月号)
特集記事担当
自己紹介(3/3)
• メインで活動している勉強会
– 関東コンピュータビジョン勉強会 #cvsaisentan
http://sites.google.com/site/cvsaisentan/
というわけで
ステマはここまで
本日のアジェンダ
• OpenCLとは?
• OpenCVとは?
• OpenCVのデータ構造
• oclMatとは?
• oclMatを使うには
• oclMatの内部処理
• oclMat性能評価
本日のメイン
本題に入る前の前準備
OpenCLとは?
• Open Computing Languageの略称。
• ヘテロジーニアスな環境でプロセッサ(GPU, DSP,
Cell/B.E., CPU )の違いを吸収した共通API等を用いて
並列処理を記述するためのフレームワーク。Apple社
にて提案後、Khronos Groupが仕様策定。
• C99ベースの「OpenCL C言語」でデバイス向けのプロ
グラム開発を行うことができる。
http://www.khronos.org/opencl/
OpenCVとは?
Intelが開発・公開したOpen SourceのComputer Vision
ライブラリ。現在はWillow Garageが開発を行って
いる。
• 公式サポートOS
– Windows/Linux/Mac OS/Android/iOS
• 公式サポート言語
– C/C++/Python/Java
※有志による非公式ラッパーは以下のサイトにまとめています。
http://www.atinfinity.info/wiki/index.php?OpenCV%2FOpenCV%20wrapper%20list
OpenCVのデータ構造
OpenCVで画像を格納するために使うデータ構造は
おおまかに以下の3つ。
• cv::Mat 画像データの入れ物(CPU版)
• gpu::GpuMat 画像データの入れ物(CUDA版)
• ocl::oclMat 画像データの入れ物(OpenCL版)
今日のお話はこの部分がメイン
oclMatとは?
• OpenCLデバイス上で画像処理を行うために用い
るデータ構造
• cv::Matとほぼ同じようにコーディングできる
→学習コストが少なくて済む
• CUDA版のgpu::GpuMatも基本的に使い方が同じ
※GpuMatの方がoclMatより対応関数が多い
本題に入る前に
ちょっと脱線します
oclMatをtwitterで検索すると・・・
oclMatをtwitterで検索すると・・・
oclMatをtwitterで検索すると・・・
自分しかいない\(^o^)/
布教しよう!(今回の主目的)
oclMatをtwitterで検索すると・・・
1週間前は凄い悲壮感が
というか色々ひどい・・・
というわけで
本題に戻ります
oclMatを使うには
■CMake
CMakeで以下の手順を行うことで
ソリューションファイルが生成される
①「WITH_OPENCL」にチェックを入れる
②「Configure」ボタンを押す
③「Generate」ボタンを押す
■OpenCL環境導入
PCにOpenCLのSDKをインストールして
おく必要がある
詳細なAPIは以下を参照。
http://docs.opencv.org/modules/ocl/doc/ocl.html
サンプルコード(グレースケール化)
#include <opencv2/core/utility.hpp>
#include <opencv2/core/core.hpp>
#include <opencv2/imgproc/imgproc.hpp>
#include <opencv2/highgui.hpp>
#include <opencv2/ocl/ocl.hpp>
using namespace cv;
int main(int argc, char** argv)
{
std::vector<ocl::Info> oclinfo;
int devnums =
ocl::getDevice(oclinfo, ocl::CVCL_DEVICE_TYPE_GPU);
Mat src = imread("lena.jpg", IMREAD_UNCHANGED);
Mat dst;
ocl::oclMat oclsrc(src), ocldst;
ocl::cvtColor(oclsrc, ocldst, COLOR_BGR2GRAY);
ocldst.download(dst);
imwrite(“output.jpg", dst);
return 0;
}
グレースケール化
①ヘッダ読み込み
②oclMat初期化
③画像読み込み
④oclMat処理
⑤画像書き込み
サンプルコード(グレースケール化)
#include <opencv2/core/utility.hpp>
#include <opencv2/core/core.hpp>
#include <opencv2/imgproc/imgproc.hpp>
#include <opencv2/highgui.hpp>
#include <opencv2/ocl/ocl.hpp>
using namespace cv;
int main(int argc, char** argv)
{
std::vector<ocl::Info> oclinfo;
int devnums =
ocl::getDevice(oclinfo, ocl::CVCL_DEVICE_TYPE_GPU);
Mat src = imread("lena.jpg", IMREAD_UNCHANGED);
Mat dst;
ocl::oclMat oclsrc(src), ocldst;
ocl::cvtColor(oclsrc, ocldst, COLOR_BGR2GRAY);
ocldst.download(dst);
imwrite(“output.jpg", dst);
return 0;
}
②oclMat初期化
③画像読み込み
④oclMat処理
⑤画像書き込み
oclMatを使うにはocl.hppの
インクルードが必要
①ヘッダ読み込み
OpenCVのヘッダをインクルード
サンプルコード(グレースケール化)
#include <opencv2/core/utility.hpp>
#include <opencv2/core/core.hpp>
#include <opencv2/imgproc/imgproc.hpp>
#include <opencv2/highgui.hpp>
#include <opencv2/ocl/ocl.hpp>
using namespace cv;
int main(int argc, char** argv)
{
std::vector<ocl::Info> oclinfo;
int devnums =
ocl::getDevice(oclinfo, ocl::CVCL_DEVICE_TYPE_GPU);
Mat src = imread("lena.jpg", IMREAD_UNCHANGED);
Mat dst;
ocl::oclMat oclsrc(src), ocldst;
ocl::cvtColor(oclsrc, ocldst, COLOR_BGR2GRAY);
ocldst.download(dst);
imwrite(“output.jpg", dst);
return 0;
}
③画像読み込み
④oclMat処理
⑤画像書き込み
OpenCLデバイスリストの取得
(※ここではGPUのみを取得)
以下のような指定も可能。
CVCL_DEVICE_TYPE_ALL
OpenCLデバイスを全て取得
CVCL_DEVICE_TYPE_CPU
CPUのみを取得
etc...
注意点
oclMatを使う前にocl::getDeviceを
必ず呼ばないといけない点に注意。
②oclMat初期化
サンプルコード(グレースケール化)
#include <opencv2/core/utility.hpp>
#include <opencv2/core/core.hpp>
#include <opencv2/imgproc/imgproc.hpp>
#include <opencv2/highgui.hpp>
#include <opencv2/ocl/ocl.hpp>
using namespace cv;
int main(int argc, char** argv)
{
std::vector<ocl::Info> oclinfo;
int devnums =
ocl::getDevice(oclinfo, ocl::CVCL_DEVICE_TYPE_GPU);
Mat src = imread("lena.jpg", IMREAD_UNCHANGED);
Mat dst;
ocl::oclMat oclsrc(src), ocldst;
ocl::cvtColor(oclsrc, ocldst, COLOR_BGR2GRAY);
ocldst.download(dst);
imwrite(“output.jpg", dst);
return 0;
}
④oclMat処理
⑤画像書き込み
画像ファイルを読みこんで
cv::Mat形式で格納する。
③画像読み込み
サンプルコード(グレースケール化)
#include <opencv2/core/utility.hpp>
#include <opencv2/core/core.hpp>
#include <opencv2/imgproc/imgproc.hpp>
#include <opencv2/highgui.hpp>
#include <opencv2/ocl/ocl.hpp>
using namespace cv;
int main(int argc, char** argv)
{
std::vector<ocl::Info> oclinfo;
int devnums =
ocl::getDevice(oclinfo, ocl::CVCL_DEVICE_TYPE_GPU);
Mat src = imread("lena.jpg", IMREAD_UNCHANGED);
Mat dst;
ocl::oclMat oclsrc(src), ocldst;
ocl::cvtColor(oclsrc, ocldst, COLOR_BGR2GRAY);
ocldst.download(dst);
imwrite(“output.jpg", dst);
return 0;
}
⑤画像書き込み
oclMatのコンストラクタを生成して、
cv::Matの画像データをOpenCL
デバイスに転送する
④oclMat処理
oclMatの画像データに対して
グレースケール化を行う
グレースケールにした結果を
ホスト側に転送する
サンプルコード(グレースケール化)
#include <opencv2/core/utility.hpp>
#include <opencv2/core/core.hpp>
#include <opencv2/imgproc/imgproc.hpp>
#include <opencv2/highgui.hpp>
#include <opencv2/ocl/ocl.hpp>
using namespace cv;
int main(int argc, char** argv)
{
std::vector<ocl::Info> oclinfo;
int devnums =
ocl::getDevice(oclinfo, ocl::CVCL_DEVICE_TYPE_GPU);
Mat src = imread("lena.jpg", IMREAD_UNCHANGED);
Mat dst;
ocl::oclMat oclsrc(src), ocldst;
ocl::cvtColor(oclsrc, ocldst, COLOR_BGR2GRAY);
ocldst.download(dst);
imwrite(“output.jpg", dst);
return 0;
}
⑤画像書き込み
グレースケール化した画像を
ファイルに書き込む
ねっ、簡単でしょう?
使う分には簡単なのは
わかったけど
内部でどんな処理が
動いてるんだろう?
oclMatの内部処理(初回実行)
OpenCLデバイス
カーネルバイナリ
(Map形式でキャッシュ)
OpenCL
ランタイムライブラリ
oclMatの画像処理関数
カーネル
ソース
①カーネル読み込み
②カーネルコンパイル
③キャッシュ
④カーネル実行
oclMatの内部処理(2回目以降)
OpenCLデバイス
カーネルバイナリ
(Map形式でキャッシュ)
OpenCL
ランタイムライブラリ
oclMatの画像処理関数
①キャッシュから必要なカーネルを探す
③カーネル実行
②カーネル
読み込み
カーネルコンパイルが
不要!
oclMatの内部処理(補足)
• OpenCL 1.1以上でないと使えない
• 2.4.5時点では同一環境に複数OpenCLデバイ
スがあっても同時に使えない
→Titan 2枚刺しフルに使えない\(^o^)/
• oclMatはbuffer objectとして処理される
( image objectではない)
http://docs.opencv.org/modules/ocl/doc/introduction.html
oclMatの内部処理(まとめ)
• 初回実行時はカーネルコンパイルが走る(の
でその分時間がかかる)
• 2回目以降はキャッシュから引っ張れるので
カーネルコンパイルは不要
• 良く使うカーネルは事前に(主にプログラムの
はじめ)にダミーとして呼んでおくと良い
oclMat性能評価
■計測方法
対応するMat、oclMatの関数を5回処理した処理時間
を計測。 oclMatはダミー処理を事前に呼んでおいて
計測。※ホスト、デバイスの転送時間は含まない。
oclMat性能評価
■計測関数
1. cvtColor
2. threshold
3. absdiff
4. Laplacian
5. matchTemplate
6. bilateralFilter
■入力画像
1~4、6:
512x512[pixel]
5:
探索画像:748x576[pixel]
テンプレート画像: 52x93[pixel]
Intel OpenCL編
oclMat性能評価(Intel OpenCL編)
■計測環境
CPU:Intel Core i7-3930K@3.20GHz (6コア)
メモリ:32.0GB
GPU:NVIDIA GeForce GTX 680
コンパイラ:Visual Studio 2010 Professional
■OpenCL
Intel OpenCL SDK 3.0
0
0.5
1
1.5
2
2.5
3
cvtColor threshold absdiff Laplacian
処理時間[ms]
計測結果(1)
Mat
oclMat
oclMat性能評価(Intel OpenCL編)
OpenCL(CPU版)
oclMat性能評価(Intel OpenCL編)
0
1000
2000
3000
4000
5000
6000
7000
matchTemplate bilateralFilter
処理時間[ms]
計測結果(2)
Mat
ocMat
OpenCL(CPU版)
oclMat性能評価(Intel OpenCL編)
0
0.5
1
1.5
2
2.5
3
cvtColor threshold absdiff Laplacian
処理時間[ms]
計測結果(1)
Mat
oclMat
OpenCL(GPU版)
oclMat性能評価(Intel OpenCL編)
0
1000
2000
3000
4000
5000
6000
7000
matchTemplate bilateralFilter
処理時間[ms]
計測結果(2)
Mat
oclMat
OpenCL(GPU版)
GpuMat編(おまけ)
GpuMat性能評価
■計測環境
CPU:Intel Core i7-3930K@3.20GHz (6コア)
メモリ:32.0GB
GPU:NVIDIA GeForce GTX 680
コンパイラ:Visual Studio 2010 Professional
■CUDA
NVIDIA CUDA5
GpuMat性能評価
0
0.5
1
1.5
2
2.5
3
cvtColor threshold absdiff Laplacian
処理時間[ms]
計測結果(1)
Mat
GpuMat
GpuMat性能評価
0
1000
2000
3000
4000
5000
6000
7000
matchTemplate bilateralFilter
処理時間[ms]
計測結果(2)
Mat
GpuMat
性能比較
性能比較
0
0.5
1
1.5
2
2.5
3
cvtColor threshold absdiff Laplacian
処理時間[ms]
計測結果(1)
Mat
oclMat(CPU)
oclMat(GPU)
gpuMat
性能比較
0
1000
2000
3000
4000
5000
6000
7000
matchTemplate bilateralFilter
処理時間[ms]
計測結果(2)
Mat
oclMat(CPU)
oclMat(GPU)
gpuMat
Titan+NVIDIA OpenCL編
(おまけ)
oclMat性能評価(Titan編)
■計測環境
CPU:Intel Xeon CPU E5-2630L@2GHz
(/proc/cpuinfoによると24コア?)
メモリ:32.0GB
GPU:NVIDIA GeForce GTX Titan
コンパイラ:gcc 4.4.7
■OpenCL
NVIDIA OpenCL(CUDA 5)
oclMat性能評価(Titan編)
0
0.5
1
1.5
2
2.5
3
cvtColor threshold absdiff Laplacian
処理時間[ms]
計測結果(1)
Mat
oclMat
oclMat性能評価(Titan編)
0
1000
2000
3000
4000
5000
6000
7000
8000
9000
10000
matchTemplate bilateralFilter
処理時間[ms]
計測結果(2)
Mat
ocMat
性能比較
(発表からの追加分)
oclMat性能評価(追加評価)
■計測関数
1. cvtColor
2. threshold
3. absdiff
4. Laplacian
5. matchTemplate
6. bilateralFilter
■入力画像
1~4、6:
2560x2560[pixel]
5:
探索画像:3840x2880[pixel]
テンプレート画像: 260x465[pixel]
最初の計測から
画像サイズを5倍にしてみると
Matとの速度差に違いが出る?
oclMat性能評価(Intel OpenCL編)
OpenCL(CPU版)
0
5
10
15
20
25
30
35
40
45
cvtColor threshold absdiff Laplacian
処理時間[ms]
計測結果(1)
Mat
oclMat
oclMat性能評価(Intel OpenCL編)
OpenCL(CPU版)
0
50000
100000
150000
200000
250000
matchTemplate bilateralFilter
処理時間[ms]
計測結果(2)
Mat
ocMat
oclMat性能評価(Intel OpenCL編)
OpenCL(GPU版)
0
5
10
15
20
25
30
35
40
45
cvtColor threshold absdiff Laplacian
処理時間[ms]
計測結果(1)
Mat
oclMat
oclMat性能評価(Intel OpenCL編)
OpenCL(GPU版)
0
50000
100000
150000
200000
250000
matchTemplate bilateralFilter
処理時間[ms]
計測結果(2)
Mat
ocMat
まとめ
• 自力でゴリゴリOpenCLカーネルを書かなくてもお手軽に
メニーコアの恩恵が得られる
• 既存のMatで書いていた処理をoclMatに置き換えるだ
けで簡単に高速化できる可能性がある(関数や画像サ
イズはMatより遅くなるものもあるので事前に確認した
方が良い)
• GPUで思ったより速くならないのはGPU向けに特化した
チューニング実装が足りないせい?(ただし、最近
oclMat関連のコミットが活発なので今後改善される可能
性あり)
おわり

Más contenido relacionado

La actualidad más candente

ARM CPUにおけるSIMDを用いた高速計算入門
ARM CPUにおけるSIMDを用いた高速計算入門ARM CPUにおけるSIMDを用いた高速計算入門
ARM CPUにおけるSIMDを用いた高速計算入門Fixstars Corporation
 
冬のLock free祭り safe
冬のLock free祭り safe冬のLock free祭り safe
冬のLock free祭り safeKumazaki Hiroki
 
高速な倍精度指数関数expの実装
高速な倍精度指数関数expの実装高速な倍精度指数関数expの実装
高速な倍精度指数関数expの実装MITSUNARI Shigeo
 
TensorFlow Lite Delegateとは?
TensorFlow Lite Delegateとは?TensorFlow Lite Delegateとは?
TensorFlow Lite Delegateとは?Mr. Vengineer
 
1076: CUDAデバッグ・プロファイリング入門
1076: CUDAデバッグ・プロファイリング入門1076: CUDAデバッグ・プロファイリング入門
1076: CUDAデバッグ・プロファイリング入門NVIDIA Japan
 
「NVIDIA プロファイラを用いたPyTorch学習最適化手法のご紹介(修正版)」
「NVIDIA プロファイラを用いたPyTorch学習最適化手法のご紹介(修正版)」「NVIDIA プロファイラを用いたPyTorch学習最適化手法のご紹介(修正版)」
「NVIDIA プロファイラを用いたPyTorch学習最適化手法のご紹介(修正版)」ManaMurakami1
 
浮動小数点(IEEE754)を圧縮したい@dsirnlp#4
浮動小数点(IEEE754)を圧縮したい@dsirnlp#4浮動小数点(IEEE754)を圧縮したい@dsirnlp#4
浮動小数点(IEEE754)を圧縮したい@dsirnlp#4Takeshi Yamamuro
 
新しい並列for構文のご提案
新しい並列for構文のご提案新しい並列for構文のご提案
新しい並列for構文のご提案yohhoy
 
KiCadで雑に基板を作る チュートリアル
KiCadで雑に基板を作る チュートリアルKiCadで雑に基板を作る チュートリアル
KiCadで雑に基板を作る チュートリアル裕士 常田
 
画像認識モデルを作るための鉄板レシピ
画像認識モデルを作るための鉄板レシピ画像認識モデルを作るための鉄板レシピ
画像認識モデルを作るための鉄板レシピTakahiro Kubo
 
コンテナの作り方「Dockerは裏方で何をしているのか?」
コンテナの作り方「Dockerは裏方で何をしているのか?」コンテナの作り方「Dockerは裏方で何をしているのか?」
コンテナの作り方「Dockerは裏方で何をしているのか?」Masahito Zembutsu
 
【2000行弱!】x86用自作カーネルの紹介
【2000行弱!】x86用自作カーネルの紹介【2000行弱!】x86用自作カーネルの紹介
【2000行弱!】x86用自作カーネルの紹介Yuma Ohgami
 
ZynqMPのブートとパワーマネージメント : (ZynqMP Boot and Power Management)
ZynqMPのブートとパワーマネージメント : (ZynqMP Boot and Power Management)ZynqMPのブートとパワーマネージメント : (ZynqMP Boot and Power Management)
ZynqMPのブートとパワーマネージメント : (ZynqMP Boot and Power Management)Mr. Vengineer
 
モデルアーキテクチャ観点からのDeep Neural Network高速化
モデルアーキテクチャ観点からのDeep Neural Network高速化モデルアーキテクチャ観点からのDeep Neural Network高速化
モデルアーキテクチャ観点からのDeep Neural Network高速化Yusuke Uchida
 
Dockerからcontainerdへの移行
Dockerからcontainerdへの移行Dockerからcontainerdへの移行
Dockerからcontainerdへの移行Kohei Tokunaga
 
非同期処理の基礎
非同期処理の基礎非同期処理の基礎
非同期処理の基礎信之 岩永
 
Yoctoで綺麗なkernel configを作る
Yoctoで綺麗なkernel configを作るYoctoで綺麗なkernel configを作る
Yoctoで綺麗なkernel configを作るshimadah
 
バイナリニューラルネットとハードウェアの関係
バイナリニューラルネットとハードウェアの関係バイナリニューラルネットとハードウェアの関係
バイナリニューラルネットとハードウェアの関係Kento Tajiri
 
いまさら聞けないarmを使ったNEONの基礎と活用事例
いまさら聞けないarmを使ったNEONの基礎と活用事例いまさら聞けないarmを使ったNEONの基礎と活用事例
いまさら聞けないarmを使ったNEONの基礎と活用事例Fixstars Corporation
 

La actualidad más candente (20)

ARM CPUにおけるSIMDを用いた高速計算入門
ARM CPUにおけるSIMDを用いた高速計算入門ARM CPUにおけるSIMDを用いた高速計算入門
ARM CPUにおけるSIMDを用いた高速計算入門
 
冬のLock free祭り safe
冬のLock free祭り safe冬のLock free祭り safe
冬のLock free祭り safe
 
高速な倍精度指数関数expの実装
高速な倍精度指数関数expの実装高速な倍精度指数関数expの実装
高速な倍精度指数関数expの実装
 
TensorFlow Lite Delegateとは?
TensorFlow Lite Delegateとは?TensorFlow Lite Delegateとは?
TensorFlow Lite Delegateとは?
 
1076: CUDAデバッグ・プロファイリング入門
1076: CUDAデバッグ・プロファイリング入門1076: CUDAデバッグ・プロファイリング入門
1076: CUDAデバッグ・プロファイリング入門
 
「NVIDIA プロファイラを用いたPyTorch学習最適化手法のご紹介(修正版)」
「NVIDIA プロファイラを用いたPyTorch学習最適化手法のご紹介(修正版)」「NVIDIA プロファイラを用いたPyTorch学習最適化手法のご紹介(修正版)」
「NVIDIA プロファイラを用いたPyTorch学習最適化手法のご紹介(修正版)」
 
浮動小数点(IEEE754)を圧縮したい@dsirnlp#4
浮動小数点(IEEE754)を圧縮したい@dsirnlp#4浮動小数点(IEEE754)を圧縮したい@dsirnlp#4
浮動小数点(IEEE754)を圧縮したい@dsirnlp#4
 
新しい並列for構文のご提案
新しい並列for構文のご提案新しい並列for構文のご提案
新しい並列for構文のご提案
 
KiCadで雑に基板を作る チュートリアル
KiCadで雑に基板を作る チュートリアルKiCadで雑に基板を作る チュートリアル
KiCadで雑に基板を作る チュートリアル
 
画像認識モデルを作るための鉄板レシピ
画像認識モデルを作るための鉄板レシピ画像認識モデルを作るための鉄板レシピ
画像認識モデルを作るための鉄板レシピ
 
コンテナの作り方「Dockerは裏方で何をしているのか?」
コンテナの作り方「Dockerは裏方で何をしているのか?」コンテナの作り方「Dockerは裏方で何をしているのか?」
コンテナの作り方「Dockerは裏方で何をしているのか?」
 
【2000行弱!】x86用自作カーネルの紹介
【2000行弱!】x86用自作カーネルの紹介【2000行弱!】x86用自作カーネルの紹介
【2000行弱!】x86用自作カーネルの紹介
 
ZynqMPのブートとパワーマネージメント : (ZynqMP Boot and Power Management)
ZynqMPのブートとパワーマネージメント : (ZynqMP Boot and Power Management)ZynqMPのブートとパワーマネージメント : (ZynqMP Boot and Power Management)
ZynqMPのブートとパワーマネージメント : (ZynqMP Boot and Power Management)
 
モデルアーキテクチャ観点からのDeep Neural Network高速化
モデルアーキテクチャ観点からのDeep Neural Network高速化モデルアーキテクチャ観点からのDeep Neural Network高速化
モデルアーキテクチャ観点からのDeep Neural Network高速化
 
Dockerからcontainerdへの移行
Dockerからcontainerdへの移行Dockerからcontainerdへの移行
Dockerからcontainerdへの移行
 
プログラムを高速化する話
プログラムを高速化する話プログラムを高速化する話
プログラムを高速化する話
 
非同期処理の基礎
非同期処理の基礎非同期処理の基礎
非同期処理の基礎
 
Yoctoで綺麗なkernel configを作る
Yoctoで綺麗なkernel configを作るYoctoで綺麗なkernel configを作る
Yoctoで綺麗なkernel configを作る
 
バイナリニューラルネットとハードウェアの関係
バイナリニューラルネットとハードウェアの関係バイナリニューラルネットとハードウェアの関係
バイナリニューラルネットとハードウェアの関係
 
いまさら聞けないarmを使ったNEONの基礎と活用事例
いまさら聞けないarmを使ったNEONの基礎と活用事例いまさら聞けないarmを使ったNEONの基礎と活用事例
いまさら聞けないarmを使ったNEONの基礎と活用事例
 

Similar a 【関東GPGPU勉強会#2】OpenCVのOpenCL実装oclMat

【第27回コンピュータビジョン勉強会@関東】OpenCV 便利Tips紹介
【第27回コンピュータビジョン勉強会@関東】OpenCV 便利Tips紹介【第27回コンピュータビジョン勉強会@関東】OpenCV 便利Tips紹介
【第27回コンピュータビジョン勉強会@関東】OpenCV 便利Tips紹介Yasuhiro Yoshimura
 
20160728 hyperscale #03
20160728 hyperscale #0320160728 hyperscale #03
20160728 hyperscale #03ManaMurakami1
 
画像処理でのPythonの利用
画像処理でのPythonの利用画像処理でのPythonの利用
画像処理でのPythonの利用Yasutomo Kawanishi
 
オープンソースで作るスマホ文字認識アプリ
オープンソースで作るスマホ文字認識アプリオープンソースで作るスマホ文字認識アプリ
オープンソースで作るスマホ文字認識アプリ陽平 山口
 
2012 kanemotolablecture1
2012 kanemotolablecture12012 kanemotolablecture1
2012 kanemotolablecture1ytanno
 
20150227 イタンジプログラミング講座テキスト第4回
20150227 イタンジプログラミング講座テキスト第4回20150227 イタンジプログラミング講座テキスト第4回
20150227 イタンジプログラミング講座テキスト第4回Yusuke Yokozawa
 
2012 kanemotolablecture2
2012 kanemotolablecture22012 kanemotolablecture2
2012 kanemotolablecture2ytanno
 
はてなにおける継続的デプロイメントの現状と Docker の導入
はてなにおける継続的デプロイメントの現状と Docker の導入はてなにおける継続的デプロイメントの現状と Docker の導入
はてなにおける継続的デプロイメントの現状と Docker の導入Yu Nobuoka
 
Nodejuku01 ohtsu
Nodejuku01 ohtsuNodejuku01 ohtsu
Nodejuku01 ohtsuNanha Park
 
[AI05] 目指せ、最先端 AI 技術の実活用!Deep Learning フレームワーク 「Microsoft Cognitive Toolkit 」...
[AI05] 目指せ、最先端 AI 技術の実活用!Deep Learning フレームワーク 「Microsoft Cognitive Toolkit 」...[AI05] 目指せ、最先端 AI 技術の実活用!Deep Learning フレームワーク 「Microsoft Cognitive Toolkit 」...
[AI05] 目指せ、最先端 AI 技術の実活用!Deep Learning フレームワーク 「Microsoft Cognitive Toolkit 」...de:code 2017
 
OCaml でデータ分析
OCaml でデータ分析OCaml でデータ分析
OCaml でデータ分析Akinori Abe
 
GiNZAで始める日本語依存構造解析 〜CaboCha, UDPipe, Stanford NLPとの比較〜
GiNZAで始める日本語依存構造解析 〜CaboCha, UDPipe, Stanford NLPとの比較〜GiNZAで始める日本語依存構造解析 〜CaboCha, UDPipe, Stanford NLPとの比較〜
GiNZAで始める日本語依存構造解析 〜CaboCha, UDPipe, Stanford NLPとの比較〜Megagon Labs
 
オープン・ソースで構築するARMマイコン開発環境 ―― GCC,Eclipse,OpenOCDで統合開発環境,JTAGデバッグもできる!
オープン・ソースで構築するARMマイコン開発環境 ―― GCC,Eclipse,OpenOCDで統合開発環境,JTAGデバッグもできる!オープン・ソースで構築するARMマイコン開発環境 ―― GCC,Eclipse,OpenOCDで統合開発環境,JTAGデバッグもできる!
オープン・ソースで構築するARMマイコン開発環境 ―― GCC,Eclipse,OpenOCDで統合開発環境,JTAGデバッグもできる!Masaki Muranaka
 
130710 02
130710 02130710 02
130710 02openrtm
 
Nodeにしましょう
NodeにしましょうNodeにしましょう
NodeにしましょうYuzo Hebishima
 
OpenCVをAndroidで動かしてみた
OpenCVをAndroidで動かしてみたOpenCVをAndroidで動かしてみた
OpenCVをAndroidで動かしてみた徹 上野山
 
OpenCLに触れてみよう
OpenCLに触れてみようOpenCLに触れてみよう
OpenCLに触れてみようYou&I
 
ちゃんとWeb会議スライド『Coffee script』
ちゃんとWeb会議スライド『Coffee script』ちゃんとWeb会議スライド『Coffee script』
ちゃんとWeb会議スライド『Coffee script』H2O Space. Co., Ltd.
 

Similar a 【関東GPGPU勉強会#2】OpenCVのOpenCL実装oclMat (20)

【第27回コンピュータビジョン勉強会@関東】OpenCV 便利Tips紹介
【第27回コンピュータビジョン勉強会@関東】OpenCV 便利Tips紹介【第27回コンピュータビジョン勉強会@関東】OpenCV 便利Tips紹介
【第27回コンピュータビジョン勉強会@関東】OpenCV 便利Tips紹介
 
20160728 hyperscale #03
20160728 hyperscale #0320160728 hyperscale #03
20160728 hyperscale #03
 
画像処理でのPythonの利用
画像処理でのPythonの利用画像処理でのPythonの利用
画像処理でのPythonの利用
 
Open modeler
Open modelerOpen modeler
Open modeler
 
オープンソースで作るスマホ文字認識アプリ
オープンソースで作るスマホ文字認識アプリオープンソースで作るスマホ文字認識アプリ
オープンソースで作るスマホ文字認識アプリ
 
2012 kanemotolablecture1
2012 kanemotolablecture12012 kanemotolablecture1
2012 kanemotolablecture1
 
20150227 イタンジプログラミング講座テキスト第4回
20150227 イタンジプログラミング講座テキスト第4回20150227 イタンジプログラミング講座テキスト第4回
20150227 イタンジプログラミング講座テキスト第4回
 
2012 kanemotolablecture2
2012 kanemotolablecture22012 kanemotolablecture2
2012 kanemotolablecture2
 
はてなにおける継続的デプロイメントの現状と Docker の導入
はてなにおける継続的デプロイメントの現状と Docker の導入はてなにおける継続的デプロイメントの現状と Docker の導入
はてなにおける継続的デプロイメントの現状と Docker の導入
 
Openshift 20191121
Openshift 20191121Openshift 20191121
Openshift 20191121
 
Nodejuku01 ohtsu
Nodejuku01 ohtsuNodejuku01 ohtsu
Nodejuku01 ohtsu
 
[AI05] 目指せ、最先端 AI 技術の実活用!Deep Learning フレームワーク 「Microsoft Cognitive Toolkit 」...
[AI05] 目指せ、最先端 AI 技術の実活用!Deep Learning フレームワーク 「Microsoft Cognitive Toolkit 」...[AI05] 目指せ、最先端 AI 技術の実活用!Deep Learning フレームワーク 「Microsoft Cognitive Toolkit 」...
[AI05] 目指せ、最先端 AI 技術の実活用!Deep Learning フレームワーク 「Microsoft Cognitive Toolkit 」...
 
OCaml でデータ分析
OCaml でデータ分析OCaml でデータ分析
OCaml でデータ分析
 
GiNZAで始める日本語依存構造解析 〜CaboCha, UDPipe, Stanford NLPとの比較〜
GiNZAで始める日本語依存構造解析 〜CaboCha, UDPipe, Stanford NLPとの比較〜GiNZAで始める日本語依存構造解析 〜CaboCha, UDPipe, Stanford NLPとの比較〜
GiNZAで始める日本語依存構造解析 〜CaboCha, UDPipe, Stanford NLPとの比較〜
 
オープン・ソースで構築するARMマイコン開発環境 ―― GCC,Eclipse,OpenOCDで統合開発環境,JTAGデバッグもできる!
オープン・ソースで構築するARMマイコン開発環境 ―― GCC,Eclipse,OpenOCDで統合開発環境,JTAGデバッグもできる!オープン・ソースで構築するARMマイコン開発環境 ―― GCC,Eclipse,OpenOCDで統合開発環境,JTAGデバッグもできる!
オープン・ソースで構築するARMマイコン開発環境 ―― GCC,Eclipse,OpenOCDで統合開発環境,JTAGデバッグもできる!
 
130710 02
130710 02130710 02
130710 02
 
Nodeにしましょう
NodeにしましょうNodeにしましょう
Nodeにしましょう
 
OpenCVをAndroidで動かしてみた
OpenCVをAndroidで動かしてみたOpenCVをAndroidで動かしてみた
OpenCVをAndroidで動かしてみた
 
OpenCLに触れてみよう
OpenCLに触れてみようOpenCLに触れてみよう
OpenCLに触れてみよう
 
ちゃんとWeb会議スライド『Coffee script』
ちゃんとWeb会議スライド『Coffee script』ちゃんとWeb会議スライド『Coffee script』
ちゃんとWeb会議スライド『Coffee script』
 

Último

【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)Hiroki Ichikura
 
[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略
[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略
[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略Ryo Sasaki
 
論文紹介:Automated Classification of Model Errors on ImageNet
論文紹介:Automated Classification of Model Errors on ImageNet論文紹介:Automated Classification of Model Errors on ImageNet
論文紹介:Automated Classification of Model Errors on ImageNetToru Tamaki
 
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介Yuma Ohgami
 
スマートフォンを用いた新生児あやし動作の教示システム
スマートフォンを用いた新生児あやし動作の教示システムスマートフォンを用いた新生児あやし動作の教示システム
スマートフォンを用いた新生児あやし動作の教示システムsugiuralab
 
SOPを理解する 2024/04/19 の勉強会で発表されたものです
SOPを理解する       2024/04/19 の勉強会で発表されたものですSOPを理解する       2024/04/19 の勉強会で発表されたものです
SOPを理解する 2024/04/19 の勉強会で発表されたものですiPride Co., Ltd.
 
論文紹介:Semantic segmentation using Vision Transformers: A survey
論文紹介:Semantic segmentation using Vision Transformers: A survey論文紹介:Semantic segmentation using Vision Transformers: A survey
論文紹介:Semantic segmentation using Vision Transformers: A surveyToru Tamaki
 
論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...
論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...
論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...Toru Tamaki
 
TSAL operation mechanism and circuit diagram.pdf
TSAL operation mechanism and circuit diagram.pdfTSAL operation mechanism and circuit diagram.pdf
TSAL operation mechanism and circuit diagram.pdftaisei2219
 

Último (9)

【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
 
[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略
[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略
[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略
 
論文紹介:Automated Classification of Model Errors on ImageNet
論文紹介:Automated Classification of Model Errors on ImageNet論文紹介:Automated Classification of Model Errors on ImageNet
論文紹介:Automated Classification of Model Errors on ImageNet
 
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介
 
スマートフォンを用いた新生児あやし動作の教示システム
スマートフォンを用いた新生児あやし動作の教示システムスマートフォンを用いた新生児あやし動作の教示システム
スマートフォンを用いた新生児あやし動作の教示システム
 
SOPを理解する 2024/04/19 の勉強会で発表されたものです
SOPを理解する       2024/04/19 の勉強会で発表されたものですSOPを理解する       2024/04/19 の勉強会で発表されたものです
SOPを理解する 2024/04/19 の勉強会で発表されたものです
 
論文紹介:Semantic segmentation using Vision Transformers: A survey
論文紹介:Semantic segmentation using Vision Transformers: A survey論文紹介:Semantic segmentation using Vision Transformers: A survey
論文紹介:Semantic segmentation using Vision Transformers: A survey
 
論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...
論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...
論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...
 
TSAL operation mechanism and circuit diagram.pdf
TSAL operation mechanism and circuit diagram.pdfTSAL operation mechanism and circuit diagram.pdf
TSAL operation mechanism and circuit diagram.pdf
 

【関東GPGPU勉強会#2】OpenCVのOpenCL実装oclMat