Más contenido relacionado La actualidad más candente (20) Similar a コンピュータアーキテクチャ研究の最新動向〜ISCA2015参加報告〜 @FPGAエクストリーム・コンピューティング 第7回 (#fpgax #7) (20) Más de Shinya Takamaeda-Y (13) コンピュータアーキテクチャ研究の最新動向〜ISCA2015参加報告〜 @FPGAエクストリーム・コンピューティング 第7回 (#fpgax #7)3. IEEE/ACM ISCA (International Conference on
Computer Architecture)
n コンピュータアーキテクチャのトップ国際会議
l 今年は米国ポートランドでPLDIやHPDC等と同時開催 (FCRC)
l MICRO, ASPLOS, HPCAを全部通すとグランドスラムらしい
n 今年の採択率: 19.0%(FPGA系よりもかなり難しい)
l 投稿数: 305
l 採択論文数: 58
n 10のチュートリアル・13のワークショップ
l 今後流行るテーマは本会議よりもワークショップに多い
n FCRC全体で数千人の参加者・ISCA単体で1000名近い
l 企業展示がないCS系国際会議の中では結構大きいのでは?
l 日本からはISCAには10名強の参加(少ない・・・)
FPGAX#7 Shinya T-Y, NAIST 3
6. 注目のワークショップ
n ASBD: 5th WS on Architectures and Systems for Big data
l ニアデータ処理 (NDP) の発表が多数
• ビッグなデータは動かすだけで電力を馬鹿食いする
n CAMEL: 1st WS on Computer Architecture for Machine
Learning
l 機械学習のためのアーキテクチャに関するWS
n CARL: 4th WS on the Intersections of Computer
Architecture and Reconfigurable Logic
l FPGAシステムに関するWS
• 今年はIntel, Convey, IBM, MSRの企業のプレイヤーによる発表
n NeuroArch: 2nd WS on Neuromorphic Architectures
l 楽しみにしていたのにキャンセルされた・・・
FPGAX#7 Shinya T-Y, NAIST 6
8. CARL2015
n メジャープレイヤーによる講演
l Intel: Xeon+FPGA
• 詳しくは: http://qiita.com/kazunori279/items/3731e51c2987acb860ff
l Convey/Micron: Memcached and Imagemagick
• Automata processing: FPGAのLUTをもっと賢くした感じ
l IBM: Text Analysis
• Power+FPGA via CAPI
l Microsoft: Machine learning
• Catapult
FPGAX#7 Shinya T-Y, NAIST 8
9. 本会議のテーマ(一部)(1)
n データセンターアーキテクチャ
l Machine learning as a service
l リソース管理
n 並列アーキテクチャ
l 競合検出・一貫性管理
n 性能解析
l ハードウェアトランザクショナルメモリの性能解析
n GPUアーキテクチャ
l Warp management
n アクセラレータ
l In-memory processing
l データフローアーキテクチャ
FPGAX#7 Shinya T-Y, NAIST 9
11. プロセッサアーキテクチャ
n シングルのコアアーキテクチャの研究が元気!
l 少し前はマルチコア・メニーコアばかりだった
• マルチコアもメニーコアも良いコアを並べたものなので結局
コアアーキテクチャの改良に行き着く
n LaZy Superscalar [Asilioglu+, ISCA'15]
l 演算結果が必要になるまで計算しないスーパースカラ
n Branch Vanguard [McFarlin+, ISCA'15]
l In-orderプロセッサで分岐命令を予測と解決に分解
コンパイラとの協調で高性能化(In-orderコアは電力効率高)
n DynaSpAM [Liu+, ISCA'15]
l OoOコアの命令スケジューリング結果を使って密結合データフ
ローアクセラレータに命令配置・効率的実行
FPGAX#7 Shinya T-Y, NAIST 11
12. DynaSpAM [Liu+, ISCA'15]
n OoOコアの命令スケジューリング結果を使って密結合
データフローアクセラレータに命令配置・効率的実行
n OoOコアの命令スケジューリング等に要する電力を削減
l 8-issue OoOと比較して1.42倍高速・23.9%消費電力を削減
FPGAX#7 Shinya T-Y, NAIST 12
13. ニア(メモリ・データ)プロセッシング
n 半導体プロセス微細化によって、演算に要する電力より
もデータの移動に要する消費電力が相対的に増加
n ニアデータプロセッシング
l SSDやメモリの近くで計算
n インメモリプロセッシング
l メモリの「中」で計算する
FPGAX#7 Shinya T-Y, NAIST 13
Off-chip Memory
(DRAM, etc.)
Memory Controller
NoC/LLC
L2 Cache
L1 Cache
Core
L0 Cache
NDP Core
一般的なコア
○キャッシュでの
データ囲い込みで
高性能・高電力効率
キャッシュミス時の
レイテンシ大・消費電力大
NDPコア
○キャッシュミス時の
レイテンシ小・省電力
キャッシュによる
データ囲い込みは不向き
データ移動距離大
データ移動距離小
[1] M. Anders,et.al.”High-Performance Energy-Efficient NoC Fabrics:
Evolution and Future Challenges”, NOCS 2014
15. PIM-Enabled Instructions [Ahn+, ISCA'15]
n プロセッシングインメモリのためのISA・アーキ
l メモリ側で計算することで
性能と電力効率が改善する
n もちろん
プログラミングが難しい
l 次はプログラミングモデル
がアツい!?
FPGAX#7 Shinya T-Y, NAIST 15