POWER8ここだけの話

POWER8 ここだけの話
日本アイ・ビー・エム株式会社

なんで、今、
POWERなの？
© 2014 International Business Machines Corporation

© 2014 IBM Corporation
POWER プロセッサー仕様比較
POWER5 POWER6 POWER7 POWER7+ POWER8
テクノロジー130nm 65nm 45nm 32nm 22nm
ダイサイズ389 mm2 341 mm2 567 mm2 567 mm2 648 mm2
トランジスタ数276 M 790 M 1.2 B 2.1 B ～5 B
コア数2 2 8 8 12
クロック（GHｚ） 1.65 4 - 5 3 – 4 3.6 – 4.4+ 3.02 – 4.15
SMT レベル2 2 4 4 8
L2 キャッシュ1.9MB 共有4MB / コア256 KB / コア256 KB / コア512 KB / コア
L3 キャッシュ36MB 外付32MB 外部4MB / コア10MB / コア8MB / コア
L4 キャッシュ- - - - 128MB 外付
メモリバンド幅15 GB/s 30 68 68 230
I/O バンド幅6 GB/s 20 40 40 192
命令実行Out of Order In Order Out of Order Out of Order Out of Order
最大LPAR 数10 / コア10 / コア10 / コア20 / コア20 / コア

マルチ・スレッド技術によるスループット向上
第一世代
第四世代
スレッド実行なしスレッド0 実行中スレッド1 実行中
FX0
FX1
FP0
FP1
LS0
LS1
BRX
CRL
シングル・スレッドHW マルチ・スレッドPOWER5 2 Way SMT
FX0
FX1
FP0
FP1
LS0
LS1
BRX
CRL
POWER7 4 Way SMT
スレッド2 実行中スレッド3 実行中
第三世代
第二世代
＋ Intelligent Threads ：
ワークロードに合わせて、
自動ないし手動で稼動
スレッド数を最適化
POWER8 8 Way SMT
1.0 2.0
8 Way
4 Way
2 Way
1 Way

POWER8 搭載マシンと他社最速機との比較（24 コア構成）
46% 高速
パフォーマンス比較: SPECint_Rate2006 （整数演算）
Power S824 24 コア
(POWER8 3.5GHz)
1750
Dell PowerEdge R920 24 コア
(Intel Xeon E7-8893 v2, 3.4GHz) 1200
0 500 1000 1500 2000
Power S824 パフォーマンスはIBM 社内測定値より
他社機情報は2014/05/07 付けhttp://www.spec.org/cgi-bin/osgresults?conf=rint2006;op=dump;format=csvdump より

パフォーマンス比較: SPECfp_Rate2006 （浮動小数演算）
29% 高速
(POWER8 3.5GHz)
1370
Dell PowerEdge R920 24 コア
(Intel Xeon E7-8893 v2, 3.4GHz) 1060
0 500 1000 1500
Power S824 パフォーマンスはIBM 社内測定値より
他社機情報は2014/05/07 付けhttp://www.spec.org/cgi-bin/osgresults?conf=rfp2006;op=dump;format=csvdump より

パフォーマンス比較: SPECjEnt2010 （JAVA トランザクション）
100% 高速
(POWER8 3.5GHz)
Oracle Sun Server X4-2 24 コア
(Intel Xeon E5-2697 v2, 2.7GHz) 11260
22543
0 10000 20000 30000
2014/05/07 付けhttp://www.spec.org/cgi-bin/osgresults?conf=jent2010;op=dump;format=csvdump より
(EjOPS)

107% 高速
パフォーマンス比較: SAP SD （商用トランザクション）
(POWER8 3.5GHz)
Fujitsu Primergy RX300 S8 24 コア
(Intel Xeon E5-2697 v2, 2.7GHz) 56030
115870
0 50000 100000 150000
2014/05/07 付けhttp://global.sap.com/solutions/benchmark/sd2tier.epx より
(SAPS)

POWER8 のCAPI 接続によるフラッシュ最適化例
• Read / Write コマンド発行時に実行される命令数が97% 削減される
POWER8
Coherence Bus
CAPI
POWER8 CAPI
500 命令以下
アプリケーション
Posix Async
I/O Style API
ユーザー・ライブラリ
Shared
Memory
Work Queue
aio_read()
aio_write()
CAPI : Coherent Accelerator Processor Interface
アプリケーション
Read/Write
Syscall
ファイル・システム
strategy() iodone()
strategy() iodone()
Pin buffers,
Translate,
Map DMA,
Start I/O
LVM
Disk & Adapter DD
Interrupt,
unmap,
unpin,Iodone
scheduling
CAPI 無し
20,000 命令以上
CAPP
カスタム
HW アプリ
ケーション
PSL
FPGA or ASIC

サポートされるディストリビューション
Linux Release Endian Dedicated
LPAR
PowerVM
Guest
PowerKVM
Guest
Redhat 6.5 Big ○ ○ ○
SUSE 11 SP3 Big ○ ○ ○
Ubuntu 14.04 Little × × ○
• 上記は2014 年4 月28 日現在
• Ubuntu のみPOWER8 ネイティブ・モード（SMT8）で稼動
• 他のディストリビューションはPOWER7 互換モードで稼動
• 同一サーバーのPowerKVM 上でBig Endian とLittle Endian を混在
させる事はできません

POWER8 プロセッサにより強化されるLinux on Power
 x86 と互換のリトル・エンディアン（LE）サポートにより、移行
作業効率が大幅向上
– 従来のPOWER はビッグ・エンディアン（BE）
– POWER8、64 ビット・モードのみ
– PowerVM とPowerKVM 上でサポート
– UbuntuServer で実装いずれRedhat、SuSe に拡大予定
ビッグ・エンド
リトル・エンド
 エンディアンとは
エンディアンについて
– データをメモリに配置する方式で、ビッグ・エンディアン
（BE）とリトル・エンディアン（LE）とがある
 BE はデータ上位桁を若いメモリ・アドレスに配置する方式
– 人間の直感に合う
 LE はデータ下位桁を若いメモリ・アドレスに配置する方式
– コンピュータにとっては処理しやすい
– 最も若いアドレスのデータ（最下位桁）から計算を開始
すれば良い
 x01020304 （32 ビット/ 4 バイト・データ）の場合
– 16 ビットBE 方式の並び： 0102 0304
– 16 ビットLE 方式の並び： 0304 0102
アドレス増加
スウィフト著ガリバー旅行記におけるLilliput
国住人の小人が、卵を食べる際にどちらの端
から割るべきかで対立していた事に由来
• 大きい端から割る= ビッグ・エンディアン
• 小さい端から割る= リトル・エンディアン

まとめ：
POWER8の価値とは？

性能

オープン性

未来のテクノロジーを
見据えて開発された
プロセッサー

いまのIT環境は
理想的でしょうか？

POWER8ここだけの話

Recomendados

Recomendados

Más contenido relacionado

La actualidad más candente

La actualidad más candente (19)

Destacado

Destacado (16)

Similar a POWER8ここだけの話

Similar a POWER8ここだけの話 (20)

Más de IBM Systems @ IBM Japan, Ltd.

Más de IBM Systems @ IBM Japan, Ltd. (6)

POWER8ここだけの話