CNN でテニス選手の動きを解析する
- 14. NN のデモ
• MNIST
– 手書き数字認識
• Cifar10
– 画像を10種類に分類するデモ
• YOLO
– 画像から物体認識(Object Detection)
• Dorefanet
– 画像の分類(Classfication)
- 18. BNN(*1) の MNIST
BNN の MNIST
情報がフラット
画像としての縦横を
放棄(?)
*1 あくまで Xilinx が提供している BNN の
MNIST の話。CNN の MNIST もある。
- 19. YOLO のCNN(1層目)
G
R
B
0.1 0.1 0.1
0.4 0.5 0.6
0.7 0.8 0.9
0.2 0.2 0.2
0.4 0.5 0.6
0.7 0.8 0.9
0.3 0.3 0.3
0.4 0.5 0.6
0.7 0.8 0.9
0.4 0.4 0.4
0.4 0.5 0.6
0.7 0.8 0.9
重み
バイアス
- 21. YOLO の一部
任意の画像(例:768x576)
416x416 に正規化された画像
1) 入力画像の各画素を浮動小
数点数に正規化
2) numpy 用に重みとバイアスを変形
重み バイアス
3) numpy の matmul を使って計算
0.123456789
0.012345678
0.345689088
0.457898989
0101010110
1110010000
1110001010
0010110101
4) 3bit の情報に変換
- 24. 結果
Tinier YOLO
• Predicted in 0.73 sec.
• car: 95%
• dog: 74%
• bicycle: 56%
YOLO v3
• data/dog.jpg: Predicted in 22.6 sec.
• bicycle: 99%
• truck: 92%
• dog: 100%
- 25. 何をしたか?
> git clone https://github.com/pjreddie/darknet
> cd darknet
> make
> wget https://pjreddie.com/media/files/yolov3.weights
> ./darknet detect cfg/yolov3.cfg yolov3.weights data/dog.jpg
- 26. Darknet
• NN 用のフレームワーク
– YOLO はその一部
• 簡単にオレオレ NN 作成可能
– 分かった気になれる(危険!)
• 数式をたどろう!
• 論文読もう
• ソースを読もう
• 意味を考えよう
データが問題。
学習はどうする?
誰かの作った
ありもので
いけたりする