Más contenido relacionado La actualidad más candente (20) Similar a Tensor flow usergroup 2016 (公開版) (20) Más de Hiroki Nakahara (11) Tensor flow usergroup 2016 (公開版)2. ⾃⼰紹介
• Hiroki Nakahara (中原 啓貴)
• 36歳 (若⼿…︖)
• JK@⽇本⼀モテない⼤学の教員
• FPGA/ディープラーニングは⽣活の糧
• FPGAは専⾨ではありません
(HDLを書くようになったのは学位を
取ってから, ⾼位合成を始めたのは去年)
• 多値論理と論理関数の複雑度が専⾨
2
8. FPGAの基本的な構造
8
SB SB SB SB
SB SB SB SB
SB SB SB SB
SB SB SB SB
LUT LUT LUT
LUT LUT LUT
LUT LUT LUT
IO IO IO IO IO IO
IO IO IO IO IO IO
IO
IO
IO
IO
IO
IO
IO
IO
IO
IO
IO
IO
Look-Up
Table (LUT)
I/O Block
Channels
Switch Blocks
9. LUTを使った論理ゲートの実現
x0 x1 x2 y
0 0 0 0
0 0 1 0
0 1 0 0
0 1 1 0
1 0 0 0
1 0 1 0
1 1 0 0
1 1 1 1
x0 x1 x2 y
0 0 0 0
0 0 1 1
0 1 0 1
0 1 1 1
1 0 0 1
1 0 1 1
1 1 0 1
1 1 1 1
LUTの出⼒を書き換えて様々な論理ゲートを実現
11. Programmable=メモリ書き換え
11
SB SB SB SB
SB SB SB SB
SB SB SB SB
SB SB SB SB
LUT LUT LUT
LUT LUT LUT
LUT LUT LUT
IO IO IO IO IO IO
IO IO IO IO IO IO
IO
IO
IO
IO
IO
IO
IO
IO
IO
IO
IO
IO
30. Deep Convolutional
Neural NetworkのHLS実装
• 依存性のない7重ループの最適化
→⾼位合成でも最適化しやすい
...
...
120 nodes
10 nodes
16 F. maps
5x5
16 F. maps
10x10
6 F. maps
14x14
6 Feature maps
28x28
Gray scale
image
32x32
5x5
2x2
5x5
2x2 5x5
1 2 1
2 4 2
1 2 1
①
②
③
④
⑤
⑥
⑦
34. Artificial Neuron (AN)
+
x0=1
x1
x2
xN
... w0 (Bias)
w1
w2
wN
f(u)
u y
xi: Input signal
wi: Weight
u: Internal state
f(u): Activation function
(Sigmoid, ReLU, etc.)
y: Output signal
y f (u)
u wi xi
i0
N
34
積和演算を
何とかしたい…
39. 2値化CNN on FPGA
• Raspberry Pi3 Model B
• ARMv8@1.2GHz quad-core
• 1GB RAM
• Mnist CNNの処理速度: 85.81 msec/image
(Cソースに変換後, gccを⽤いてコンパイル, 1コア動作)
• 消費電⼒: 2Watt
• Digilent社 Nexys4 DDR
• FPGA Xilinx社Artix-7100T@100MHz
• 2880 Kb BRAM
• Mnist CNNの処理速度: 1.56 msec/image
• 消費電⼒: 1Watt未満(ワットチェッカーでは測定不能でした…)
39
41. Deep Q-learning Network
• 全部の⼿を試すのは不可能
• 報酬を最⼤にする⾏動をDeep Neural Network
で予測
Deep Neural Network
+
Q-learning
↓
Deep Q-learning Network (DQN)
41
45. On-going Work
• 特定FPGAボード向けのプラットフォームを開発中
• TensorFlowで設計したCNNを直接Pythonでたたける
(もちろんハードウェアも)
Arduinoを乗せたり、ARMでLinuxを⾛らせたりして…
• ボードを取り寄せ中
45
Terasic社
DE0-nano-SoC Kit
(Atlas-SoC Kit)
$99 (academic $90)
※ARM搭載
Terasic社
DE10-Lite Board
$85 (academic $55)
Digilent社
PYNQ-Z1 Board
$229 (academic $65?)
※ARM搭載
Digilent社
Arty Board
$99