Más contenido relacionado
La actualidad más candente (19)
Similar a POWER8ここだけの話 (20)
Más de IBM Systems @ IBM Japan, Ltd. (6)
POWER8ここだけの話
- 3. © 2014 IBM Corporation
POWER プロセッサー仕様比較
POWER5 POWER6 POWER7 POWER7+ POWER8
テクノロジー130nm 65nm 45nm 32nm 22nm
ダイサイズ389 mm2 341 mm2 567 mm2 567 mm2 648 mm2
トランジスタ数276 M 790 M 1.2 B 2.1 B ~5 B
コア数2 2 8 8 12
クロック(GHz) 1.65 4 - 5 3 – 4 3.6 – 4.4+ 3.02 – 4.15
SMT レベル2 2 4 4 8
L2 キャッシュ1.9MB 共有4MB / コア256 KB / コア256 KB / コア512 KB / コア
L3 キャッシュ36MB 外付32MB 外部4MB / コア10MB / コア8MB / コア
L4 キャッシュ- - - - 128MB 外付
メモリバンド幅15 GB/s 30 68 68 230
I/O バンド幅6 GB/s 20 40 40 192
命令実行Out of Order In Order Out of Order Out of Order Out of Order
最大LPAR 数10 / コア10 / コア10 / コア20 / コア20 / コア
- 4. © 2014 IBM Corporation
マルチ・スレッド技術によるスループット向上
第一世代
第四世代
スレッド実行なしスレッド0 実行中スレッド1 実行中
FX0
FX1
FP0
FP1
LS0
LS1
BRX
CRL
シングル・スレッドHW マルチ・スレッドPOWER5 2 Way SMT
FX0
FX1
FP0
FP1
LS0
LS1
BRX
CRL
POWER7 4 Way SMT
スレッド2 実行中スレッド3 実行中
第三世代
第二世代
+ Intelligent Threads :
ワークロードに合わせて、
自動ないし手動で稼動
スレッド数を最適化
POWER8 8 Way SMT
1.0 2.0
8 Way
4 Way
2 Way
1 Way
- 5. © 2014 IBM Corporation
POWER プロセッサー仕様比較
POWER5 POWER6 POWER7 POWER7+ POWER8
テクノロジー130nm 65nm 45nm 32nm 22nm
ダイサイズ389 mm2 341 mm2 567 mm2 567 mm2 648 mm2
トランジスタ数276 M 790 M 1.2 B 2.1 B ~5 B
コア数2 2 8 8 12
クロック(GHz) 1.65 4 - 5 3 – 4 3.6 – 4.4+ 3.02 – 4.15
SMT レベル2 2 4 4 8
L2 キャッシュ1.9MB 共有4MB / コア256 KB / コア256 KB / コア512 KB / コア
L3 キャッシュ36MB 外付32MB 外部4MB / コア10MB / コア8MB / コア
L4 キャッシュ- - - - 128MB 外付
メモリバンド幅15 GB/s 30 68 68 230
I/O バンド幅6 GB/s 20 40 40 192
命令実行Out of Order In Order Out of Order Out of Order Out of Order
最大LPAR 数10 / コア10 / コア10 / コア20 / コア20 / コア
- 6. POWER8 搭載マシンと他社最速機との比較(24 コア構成)
46% 高速
© 2014 IBM Corporation
パフォーマンス比較: SPECint_Rate2006 (整数演算)
Power S824 24 コア
(POWER8 3.5GHz)
1750
Dell PowerEdge R920 24 コア
(Intel Xeon E7-8893 v2, 3.4GHz) 1200
0 500 1000 1500 2000
Power S824 パフォーマンスはIBM 社内測定値より
他社機情報は2014/05/07 付けhttp://www.spec.org/cgi-bin/osgresults?conf=rint2006;op=dump;format=csvdump より
- 7. パフォーマンス比較: SPECfp_Rate2006 (浮動小数演算)
POWER8 搭載マシンと他社最速機との比較(24 コア構成)
29% 高速
© 2014 IBM Corporation
Power S824 24 コア
(POWER8 3.5GHz)
1370
Dell PowerEdge R920 24 コア
(Intel Xeon E7-8893 v2, 3.4GHz) 1060
0 500 1000 1500
Power S824 パフォーマンスはIBM 社内測定値より
他社機情報は2014/05/07 付けhttp://www.spec.org/cgi-bin/osgresults?conf=rfp2006;op=dump;format=csvdump より
- 8. パフォーマンス比較: SPECjEnt2010 (JAVA トランザクション)
POWER8 搭載マシンと他社最速機との比較(24 コア構成)
100% 高速
© 2014 IBM Corporation
Power S824 24 コア
(POWER8 3.5GHz)
Oracle Sun Server X4-2 24 コア
(Intel Xeon E5-2697 v2, 2.7GHz) 11260
22543
0 10000 20000 30000
2014/05/07 付けhttp://www.spec.org/cgi-bin/osgresults?conf=jent2010;op=dump;format=csvdump より
(EjOPS)
- 9. POWER8 搭載マシンと他社最速機との比較(24 コア構成)
107% 高速
© 2014 IBM Corporation
パフォーマンス比較: SAP SD (商用トランザクション)
Power S824 24 コア
(POWER8 3.5GHz)
Fujitsu Primergy RX300 S8 24 コア
(Intel Xeon E5-2697 v2, 2.7GHz) 56030
115870
0 50000 100000 150000
2014/05/07 付けhttp://global.sap.com/solutions/benchmark/sd2tier.epx より
(SAPS)
- 10. POWER8 のCAPI 接続によるフラッシュ最適化例
• Read / Write コマンド発行時に実行される命令数が97% 削減される
POWER8
Coherence Bus
CAPI
© 2014 IBM Corporation
POWER8 CAPI
500 命令以下
アプリケーション
Posix Async
I/O Style API
ユーザー・ライブラリ
Shared
Memory
Work Queue
aio_read()
aio_write()
CAPI : Coherent Accelerator Processor Interface
アプリケーション
Read/Write
Syscall
ファイル・システム
strategy() iodone()
strategy() iodone()
Pin buffers,
Translate,
Map DMA,
Start I/O
LVM
Disk & Adapter DD
Interrupt,
unmap,
unpin,Iodone
scheduling
CAPI 無し
20,000 命令以上
CAPP
カスタム
HW アプリ
ケーション
PSL
FPGA or ASIC
- 11. © 2014 IBM Corporation
サポートされるディストリビューション
Linux Release Endian Dedicated
LPAR
PowerVM
Guest
PowerKVM
Guest
Redhat 6.5 Big ○ ○ ○
SUSE 11 SP3 Big ○ ○ ○
Ubuntu 14.04 Little × × ○
• 上記は2014 年4 月28 日現在
• Ubuntu のみPOWER8 ネイティブ・モード(SMT8)で稼動
• 他のディストリビューションはPOWER7 互換モードで稼動
• 同一サーバーのPowerKVM 上でBig Endian とLittle Endian を混在
させる事はできません
- 12. POWER8 プロセッサにより強化されるLinux on Power
x86 と互換のリトル・エンディアン(LE)サポートにより、移行
作業効率が大幅向上
© 2014 IBM Corporation
– 従来のPOWER はビッグ・エンディアン(BE)
– POWER8、64 ビット・モードのみ
– PowerVM とPowerKVM 上でサポート
– UbuntuServer で実装いずれRedhat、SuSe に拡大予定
ビッグ・エンド
リトル・エンド
エンディアンとは
エンディアンについて
– データをメモリに配置する方式で、ビッグ・エンディアン
(BE)とリトル・エンディアン(LE)とがある
BE はデータ上位桁を若いメモリ・アドレスに配置する方式
– 人間の直感に合う
LE はデータ下位桁を若いメモリ・アドレスに配置する方式
– コンピュータにとっては処理しやすい
– 最も若いアドレスのデータ(最下位桁)から計算を開始
すれば良い
x01020304 (32 ビット/ 4 バイト・データ)の場合
– 16 ビットBE 方式の並び: 0102 0304
– 16 ビットLE 方式の並び: 0304 0102
アドレス増加
スウィフト著ガリバー旅行記におけるLilliput
国住人の小人が、卵を食べる際にどちらの端
から割るべきかで対立していた事に由来
• 大きい端から割る= ビッグ・エンディアン
• 小さい端から割る= リトル・エンディアン
- 16. © 2014 IBM Corporation
未来のテクノロジーを
見据えて開発された
プロセッサー