SlideShare una empresa de Scribd logo
1 de 34
Descargar para leer sin conexión
スーパーコンピューターとクラウドゲーム 
Shinra Technologies, Inc. 
Senior vice president 
Tetsuji Iwasaki 
10/22/2014 © 2014 Shinra Technologies, Inc. All Rights Reserved. 1
自己紹介 
岩崎哲史(いわさきてつじ) 
趣味:ビール 
明治大学経済学部経済学科卒 
1994年株式会社スクウェア入社 
主要ゲームタイトル 
FFT/FFXI/Crysis 
2011年株式会社スクウェア・エニックス・ホールディングス 
社長付技術企画担当(現職) 
2012年Eidosモントリオールディベロップメントディレクター(現職) 
2014年Shinra Technologies, Inc. シニアバイスプレジデント(現職) 
10/22/2014 © 2014 Shinra Technologies, Inc. All Rights Reserved. 2
クラウドゲーミングとは 
Controller Input 
Internet 
Streaming Video 
Data center 
「Mini Ninjas」 
© 2009 Eidos Interactive Ltd. Co-published by Eidos, Inc. and Warner Bros. Interactive Entertainment, 
a division of Warner Bros. Home Entertainment Inc. 
10/22/2014 © 2014 Shinra Technologies, Inc. All Rights Reserved. 3
スーパーコンピューターとは 
特に明確な定義があるわけではありません(汗 
法令で設定された性能がありますが、すぐに時代遅れになってしまいます 
10/22/2014 © 2014 Shinra Technologies, Inc. All Rights Reserved. 4
皆様どんなイメージでしょうか 
http://jp.fujitsu.com/about/tech/k/ スーパーコンピュータ「京」より転載2014/9/17閲覧 
10/22/2014 © 2014 Shinra Technologies, Inc. All Rights Reserved. 5
それではTOP10を見てみましょう 
http://www.top500.org/ 
1 Tianhe-2 (MilkyWay-2) TH-IVB-FEP Cluster, Intel Xeon E5-2692 12C 2.200GHz, TH 
Express-2, Intel Xeon Phi 31S1P 
NUDT China 
2 Titan Cray XK7 , Opteron 6274 16C 2.200GHz, Cray Gemini 
interconnect, NVIDIA K20x 
Cray Inc. United States 
3 Sequoia BlueGene/Q, Power BQC 16C 1.60 GHz, Custom IBM United States 
4 K computer SPARC64 VIIIfx 2.0GHz, Tofu interconnect Fujitsu Japan 
5 Mira BlueGene/Q, Power BQC 16C 1.60GHz, Custom IBM United States 
6 Piz Daint Cray XC30, Xeon E5-2670 8C 2.600GHz, Aries interconnect 
, NVIDIA K20x 
Cray Inc. Switzerland 
7 Stampede PowerEdge C8220, Xeon E5-2680 8C 2.700GHz, Infiniband 
FDR, Intel Xeon Phi SE10P 
Dell United States 
8 JUQUEEN BlueGene/Q, Power BQC 16C 1.600GHz, Custom 
Interconnect 
IBM Germany 
9 Vulcan BlueGene/Q, Power BQC 16C 1.600GHz, Custom 
Interconnect 
IBM United States 
10 
Cray XC30, Intel Xeon E5-2697v2 12C 2.7GHz, Aries 
interconnect Cray Inc. United States 
10/22/2014 © 2014 Shinra Technologies, Inc. All Rights Reserved. 6
Intel® Xeon® 
1 Tianhe-2 (MilkyWay-2) TH-IVB-FEP Cluster, Intel Xeon E5-2692 12C 2.200GHz, TH 
Express-2, Intel Xeon Phi 31S1P 
NUDT China 
2 Titan Cray XK7 , Opteron 6274 16C 2.200GHz, Cray Gemini 
interconnect, NVIDIA K20x 
Cray Inc. United States 
3 Sequoia BlueGene/Q, Power BQC 16C 1.60 GHz, Custom IBM United States 
4 K computer SPARC64 VIIIfx 2.0GHz, Tofu interconnect Fujitsu Japan 
5 Mira BlueGene/Q, Power BQC 16C 1.60GHz, Custom IBM United States 
6 Piz Daint Cray XC30, Xeon E5-2670 8C 2.600GHz, Aries interconnect 
, NVIDIA K20x 
Cray Inc. Switzerland 
7 Stampede PowerEdge C8220, Xeon E5-2680 8C 2.700GHz, Infiniband 
FDR, Intel Xeon Phi SE10P 
Dell United States 
8 JUQUEEN BlueGene/Q, Power BQC 16C 1.600GHz, Custom 
Interconnect 
IBM Germany 
9 Vulcan BlueGene/Q, Power BQC 16C 1.600GHz, Custom 
Interconnect 
IBM United States 
10 
Cray XC30, Intel Xeon E5-2697v2 12C 2.7GHz, Aries 
interconnect Cray Inc. United States 
10/22/2014 © 2014 Shinra Technologies, Inc. All Rights Reserved. 7
IBM® Power® BQC 
1 Tianhe-2 (MilkyWay-2) TH-IVB-FEP Cluster, Intel Xeon E5-2692 12C 2.200GHz, TH 
Express-2, Intel Xeon Phi 31S1P 
NUDT China 
2 Titan Cray XK7 , Opteron 6274 16C 2.200GHz, Cray Gemini 
interconnect, NVIDIA K20x 
Cray Inc. United States 
3 Sequoia BlueGene/Q, Power BQC 16C 1.60 GHz, Custom IBM United States 
4 K computer SPARC64 VIIIfx 2.0GHz, Tofu interconnect Fujitsu Japan 
5 Mira BlueGene/Q, Power BQC 16C 1.60GHz, Custom IBM United States 
6 Piz Daint Cray XC30, Xeon E5-2670 8C 2.600GHz, Aries interconnect 
, NVIDIA K20x 
Cray Inc. Switzerland 
7 Stampede PowerEdge C8220, Xeon E5-2680 8C 2.700GHz, Infiniband 
FDR, Intel Xeon Phi SE10P 
Dell United States 
8 JUQUEEN BlueGene/Q, Power BQC 16C 1.600GHz, Custom 
Interconnect 
IBM Germany 
9 Vulcan BlueGene/Q, Power BQC 16C 1.600GHz, Custom 
Interconnect 
IBM United States 
10 
Cray XC30, Intel Xeon E5-2697v2 12C 2.7GHz, Aries 
interconnect Cray Inc. United States 
10/22/2014 © 2014 Shinra Technologies, Inc. All Rights Reserved. 8
Fujitsu® SPARC®64 Villfx 
1 Tianhe-2 (MilkyWay-2) TH-IVB-FEP Cluster, Intel Xeon E5-2692 12C 2.200GHz, TH 
Express-2, Intel Xeon Phi 31S1P 
NUDT China 
2 Titan Cray XK7 , Opteron 6274 16C 2.200GHz, Cray Gemini 
interconnect, NVIDIA K20x 
Cray Inc. United States 
3 Sequoia BlueGene/Q, Power BQC 16C 1.60 GHz, Custom IBM United States 
4 K computer SPARC64 VIIIfx 2.0GHz, Tofu interconnect Fujitsu Japan 
5 Mira BlueGene/Q, Power BQC 16C 1.60GHz, Custom IBM United States 
6 Piz Daint Cray XC30, Xeon E5-2670 8C 2.600GHz, Aries interconnect 
, NVIDIA K20x 
Cray Inc. Switzerland 
7 Stampede PowerEdge C8220, Xeon E5-2680 8C 2.700GHz, Infiniband 
FDR, Intel Xeon Phi SE10P 
Dell United States 
8 JUQUEEN BlueGene/Q, Power BQC 16C 1.600GHz, Custom 
Interconnect 
IBM Germany 
9 Vulcan BlueGene/Q, Power BQC 16C 1.600GHz, Custom 
Interconnect 
IBM United States 
10 
Cray XC30, Intel Xeon E5-2697v2 12C 2.7GHz, Aries 
interconnect Cray Inc. United States 
10/22/2014 © 2014 Shinra Technologies, Inc. All Rights Reserved. 9
NVIDIA® tesla®/Intel® phi 
1 Tianhe-2 (MilkyWay-2) TH-IVB-FEP Cluster, Intel Xeon E5-2692 12C 2.200GHz, TH 
Express-2, Intel Xeon Phi 31S1P 
NUDT China 
2 Titan Cray XK7 , Opteron 6274 16C 2.200GHz, Cray Gemini 
interconnect, NVIDIA K20x 
Cray Inc. United States 
3 Sequoia BlueGene/Q, Power BQC 16C 1.60 GHz, Custom IBM United States 
4 K computer SPARC64 VIIIfx 2.0GHz, Tofu interconnect Fujitsu Japan 
5 Mira BlueGene/Q, Power BQC 16C 1.60GHz, Custom IBM United States 
6 Piz Daint Cray XC30, Xeon E5-2670 8C 2.600GHz, Aries interconnect 
, NVIDIA K20x 
Cray Inc. Switzerland 
7 Stampede PowerEdge C8220, Xeon E5-2680 8C 2.700GHz, Infiniband 
FDR, Intel Xeon Phi SE10P 
Dell United States 
8 JUQUEEN BlueGene/Q, Power BQC 16C 1.600GHz, Custom 
Interconnect 
IBM Germany 
9 Vulcan BlueGene/Q, Power BQC 16C 1.600GHz, Custom 
Interconnect 
IBM United States 
10 
Cray XC30, Intel Xeon E5-2697v2 12C 2.7GHz, Aries 
interconnect Cray Inc. United States 
10/22/2014 © 2014 Shinra Technologies, Inc. All Rights Reserved. 10
最近の傾向 
汎用プロセッサ 
TOP500のうち85.4%がIntel …数えてないけと多分ほとんどXeon 
Amazon EC2は76位 
Amazon EC2 C3 Instance cluster Intel Xeon E5-2680v2 10C 2.800GHz, 10G Ethernet 
10/22/2014 © 2014 Shinra Technologies, Inc. All Rights Reserved. 11
スーパーコンピューターとGPU 
TESLA GPU ACCELERATORS FOR SERVERS http://www.nvidia.com/object/tesla-servers.html 
2014-9-17閲覧 
NVIDIA® Tesla® 
Intel® Xeon Phi™ Coprocessor 
インテル® Xeon Phi™ コプロセッサー製品仕様 
http://www.intel.co.jp/content/www/jp/ja/processors/xeon/xeon-phi-detail.html 2014-9-17閲覧 
10/22/2014 © 2014 Shinra Technologies, Inc. All Rights Reserved. 12
DEGIMAから受けた衝撃 
*Tsuyoshi Hamada, Tetsu Narumi, Rio Yokota, Kenji Yasuoka and Keigo Nitadori. 42 TFlops Hierarchical N-body Simulations on GPUs with Applications in both Astrophysics and Turbulence. 
SC '09 Proceedings of the Conference on High Performance Computing Networking, Storage and Analysis Article No. 62 
10/22/2014 © 2014 Shinra Technologies, Inc. All Rights Reserved. 13
*長崎大学GPUクラスタDEGIMA(DEstination for Gpu Intensive MAchine)の紹介https://www.cps-jp.org/seminar/fy2010/2010-12-01/hamada/pub/20101201_hamada_02.pdf page5 
2014-9-17閲覧 
10/22/2014 © 2014 Shinra Technologies, Inc. All Rights Reserved. 14
念のためご注意 
スーパーコンピューターの価値は一概に 
LinPackの実行速度のみでは語れません 
計算用途や、使いやすさ、保守性などは 
TOP500のランキングでは考慮されません 
でも価格はもうちょっと追求されてもいいような…. 
10/22/2014 © 2014 Shinra Technologies, Inc. All Rights Reserved. 15
表の見方 
1 Tianhe-2 (MilkyWay-2) TH-IVB-FEP Cluster, Intel Xeon E5-2692 12C 
2.200GHz, TH Express-2, Intel Xeon Phi 31S1P 
TH-IVB-FEP Cluster -> システムの名前 
Intel Xeon E5-2692 12C 2.200GHz -> CPUの名前 
TH Express-2 -> インターコネクションの名前 
Intel Xeon Phi 31S1P -> アクセラレーターの名前 
京のInter connection “Tofu” 
6次元メッシュ/トーラス 
スーパーコンピュータの高次元接続技術が「恩賜発明賞」を受賞 
http://pr.fujitsu.com/jp/news/2014/05/29.html 2014-09-17閲覧 
10/22/2014 © 2014 Shinra Technologies, Inc. All Rights Reserved. 16
質問タイム 
10/22/2014 © 2014 Shinra Technologies, Inc. All Rights Reserved. 17
今回お話しする 
Shinra Systemテクノロジコンポーネント 
リモートレンダリングアーキテクチャ 
RDMA/TCP デュアルプロトコルインターコネクション 
ゲームデザインに応じた分散モデル 
10/22/2014 © 2014 Shinra Technologies, Inc. All Rights Reserved. 18
リモートレンダリングアーキテクチャ 
10/22/2014 © 2014 Shinra Technologies, Inc. All Rights Reserved. 19
リモートレンダリングアーキテクチャ 
• レンダリングはGPUサー 
バーで実行 
• DirectX11APIのコールは 
ラップトップで実行されて 
いる 
10/22/2014 © 2014 Shinra Technologies, Inc. All Rights Reserved. 20
リモートレンダリングアーキテクチャ 
Game.exe 
(third-party) 
… 
プロセス環境図 
Fake 
Fake 
… dxgi.dll 
d3d11.dll 
dinput.dll dxgi.dll d3d11.dll 
nvwgf2umx.ws2_32.dll 
dll 
nvlddmkm.sys 
Renderer.exe 
ws2_32.dll dxgi.dll d3d11.dll 
nvwgf2umx.dll 
nvlddmkm.sys 
Network card Network card 
10/22/2014 © 2014 Shinra Technologies, Inc. All Rights Reserved. 21
リモートレンダリングアーキテクチャ 
• Separate CPU & GPU Servers 
• Many users per logical unit 
• Flexible architecture allows 
efficient CPU/GPU usage 
Logical unit of game system 
Physical unit 
CPU GPU GPU 
CPU GPU GPU 
GPU GPU 
GPU GPU 
CPU 
CPU 
CPU CPU 
CPU CPU 
CPU CPU 
CPU CPU 
10/22/2014 © 2014 Shinra Technologies, Inc. All Rights Reserved. 22
GPU 
CPU 
CPU/GPUパフォーマンスミスマッチ 
10/22/2014 © 2014 Shinra Technologies, Inc. All Rights Reserved. 23
y = 1037.3x-0.826 
R² = 0.9055 
0.4 
0.35 
0.3 
0.25 
0.2 
0.15 
0.1 
0.05 
0 
値段とパフォーマンスの関係 
値段2倍=パフォーマンス2倍ではない 
0 20,000 40,000 60,000 80,000 100,000 120,000 140,000 160,000 
10/22/2014 © 2014 Shinra Technologies, Inc. All Rights Reserved. 24
ゲーム60個分を1サーバーでレンダリング 
10/22/2014 © 2014 Shinra Technologies, Inc. All Rights Reserved. 25
RDMA/TCP デュアルプロトコルインターコネクション 
10/22/2014 © 2014 Shinra Technologies, Inc. All Rights Reserved. 26
最近のネットワークカードの性能(TCP) 
Comp01<->GPU01 Effective bandwidth 8.8Gbps loopback(E5-1650@3.2GHz) 
Effective bandwidth 
3.59 Gbps 
Unit size RTT(μsec) Unit size RTT(μsec) 
4 42,09 4 15,080261 
8 41,75 8 14,986181 
16 42,18 16 15,00307 
32 41,86 32 15,097176 
64 42,69 64 15,081717 
128 42,91 128 15,106041 
256 43,35 256 15,17368 
512 44,6 512 15,301775 
1024 46,6 1024 15,67151 
2048 64,19 2048 24,330402 
4096 79,87 4096 30,921734 
8192 140,06 8192 45,846207 
16384 186,85 16384 79,473488 
32768 291,19 32768 129,546127 
65536 497,89 65536 227,030136 
131072 909,93 131072 435,540619 
262144 1800,49 262144 929,645325 
524288 3483,36 524288 1904,819336 
1048576 6841,73 1048576 4009,06958 
10/22/2014 © 2014 Shinra Technologies, Inc. All Rights Reserved. 27
Mellanox Connect X3 
-Etherネットの環境でRDMAが使用可能 
-Tianhe-2 (MilkyWay-2)のインターコネクションは 
RDMAを使用 
-OSを介さず、リモートに直接メモリ間転送が出来る 
http://www.mellanox.com/page/products_dyn?product_family=127 2014-9-17閲覧 
10/22/2014 © 2014 Shinra Technologies, Inc. All Rights Reserved. 28
インターコネクション解説 
Game.exe 
(third-party) 
dinput.dll 
Fake 
Fake 
00100101000 
11101011100 
… dxgi.dll 
d3d11.10011101010 
dll 
nvwgf2umx.dll 
Renderer.exe 
ws2_32.dll dxgi.dll d3d11.dll 
nvwgf2umx.dll 
nvlddmkm.sys 
… 
ws2_32.dll 
Compression (500μs / Ratio 1:8) 
Transmission to the Renderer 
• Using TCP over Gigabit Ethernet (500μs) 
• Using RDMA over Converged Ethernet (50μs) 
Decompression (200μs) 
Delay ≈ 1.2ms 
Video card 
10/22/2014 © 2014 Shinra Technologies, Inc. All Rights Reserved. 29
ゲームに応じた分散モデル 
スタンドアローンアーキテクチャ 
VIRTUAL MMO アーキテクチャ 
MK アーキテクチャ 
10/22/2014 © 2014 Shinra Technologies, Inc. All Rights Reserved. 30
スタンドアローンアーキテクチャ 
Compute Server Rendering Server 
Rendering Commands GPU 
Game.exe Rendering.exe 
Input Video 
internet internet 
GPU 
10/22/2014 © 2014 Shinra Technologies, Inc. All Rights Reserved. 31
VIRTUAL MMO アーキテクチャ 
Compute Server Rendering Server 
Remote Renderer 
Rendering Commands 
Server 
Game 
Game 
Game 
Game 
internet internet 
Input 
GPU 
GPU 
4 x Video Streams 
10/22/2014 © 2014 Shinra Technologies, Inc. All Rights Reserved. 32
MK アーキテクチャ 
Compute Server Rendering Server 
Game GPU 
User 
User 
User 
User 
Rendering Commands 
Remote Renderer 
4 users in a single process… 
internet internet 
GPU 
4 x Video Streams 
Input 
10/22/2014 © 2014 Shinra Technologies, Inc. All Rights Reserved. 33
募集 
ご説明した3アーキテクチャを標準化して提供する予 
定です。 
1)お持ちのIPをShinraプラットフォームに提供 
2)お持ちのIPをクラウドゲーム用にちょっと改造 
3)今までになかったゲーム体験を製作 
4)共同研究 
5)定期交流会 
10/22/2014 © 2014 Shinra Technologies, Inc. All Rights Reserved. 34

Más contenido relacionado

La actualidad más candente

Windowsの節電 .NETラボ勉強会 2011/4/23
Windowsの節電 .NETラボ勉強会 2011/4/23Windowsの節電 .NETラボ勉強会 2011/4/23
Windowsの節電 .NETラボ勉強会 2011/4/23
Tomokazu Kizawa
 
[A34] HDDからインメモリーテクノジーへ by Yusuke Miyake
[A34] HDDからインメモリーテクノジーへ by Yusuke Miyake[A34] HDDからインメモリーテクノジーへ by Yusuke Miyake
[A34] HDDからインメモリーテクノジーへ by Yusuke Miyake
Insight Technology, Inc.
 
無償ライセンス ESXi と 3rd パーティ製バックアップ製品
無償ライセンス ESXi と 3rd パーティ製バックアップ製品無償ライセンス ESXi と 3rd パーティ製バックアップ製品
無償ライセンス ESXi と 3rd パーティ製バックアップ製品
yhanako
 

La actualidad más candente (20)

PCCC20 富士通株式会社「未来を引き寄せる力 スーパーコンピュータ」
PCCC20 富士通株式会社「未来を引き寄せる力 スーパーコンピュータ」PCCC20 富士通株式会社「未来を引き寄せる力 スーパーコンピュータ」
PCCC20 富士通株式会社「未来を引き寄せる力 スーパーコンピュータ」
 
NGC でインフラ環境整備の時間短縮!素早く始めるディープラーニング
NGC でインフラ環境整備の時間短縮!素早く始めるディープラーニングNGC でインフラ環境整備の時間短縮!素早く始めるディープラーニング
NGC でインフラ環境整備の時間短縮!素早く始めるディープラーニング
 
NVIDIA deep learning最新情報in沖縄
NVIDIA deep learning最新情報in沖縄NVIDIA deep learning最新情報in沖縄
NVIDIA deep learning最新情報in沖縄
 
シンラ・テクノロジー第2回クラウドゲーム開発者会議
シンラ・テクノロジー第2回クラウドゲーム開発者会議シンラ・テクノロジー第2回クラウドゲーム開発者会議
シンラ・テクノロジー第2回クラウドゲーム開発者会議
 
Windowsの節電 .NETラボ勉強会 2011/4/23
Windowsの節電 .NETラボ勉強会 2011/4/23Windowsの節電 .NETラボ勉強会 2011/4/23
Windowsの節電 .NETラボ勉強会 2011/4/23
 
TensorRT Inference Serverではじめる、 高性能な推論サーバ構築
TensorRT Inference Serverではじめる、 高性能な推論サーバ構築TensorRT Inference Serverではじめる、 高性能な推論サーバ構築
TensorRT Inference Serverではじめる、 高性能な推論サーバ構築
 
IEEE ITSS Nagoya Chapter NVIDIA
IEEE ITSS Nagoya Chapter NVIDIAIEEE ITSS Nagoya Chapter NVIDIA
IEEE ITSS Nagoya Chapter NVIDIA
 
MII conference177 nvidia
MII conference177 nvidiaMII conference177 nvidia
MII conference177 nvidia
 
Jetson 活用による スタートアップ企業支援
Jetson 活用による スタートアップ企業支援Jetson 活用による スタートアップ企業支援
Jetson 活用による スタートアップ企業支援
 
僕はまだ10%しかIDCFクラウドを理解していなかった
僕はまだ10%しかIDCFクラウドを理解していなかった僕はまだ10%しかIDCFクラウドを理解していなかった
僕はまだ10%しかIDCFクラウドを理解していなかった
 
2020年10月29日 Jetson Nano 2GBで始めるAI x Robotics教育
2020年10月29日 Jetson Nano 2GBで始めるAI x Robotics教育2020年10月29日 Jetson Nano 2GBで始めるAI x Robotics教育
2020年10月29日 Jetson Nano 2GBで始めるAI x Robotics教育
 
GPU クラウド コンピューティング
GPU クラウド コンピューティングGPU クラウド コンピューティング
GPU クラウド コンピューティング
 
本当は恐ろしい分散システムの話
本当は恐ろしい分散システムの話本当は恐ろしい分散システムの話
本当は恐ろしい分散システムの話
 
[A34] HDDからインメモリーテクノジーへ by Yusuke Miyake
[A34] HDDからインメモリーテクノジーへ by Yusuke Miyake[A34] HDDからインメモリーテクノジーへ by Yusuke Miyake
[A34] HDDからインメモリーテクノジーへ by Yusuke Miyake
 
Cell/B.E. プログラミング事始め
Cell/B.E. プログラミング事始めCell/B.E. プログラミング事始め
Cell/B.E. プログラミング事始め
 
無償ライセンス ESXi と 3rd パーティ製バックアップ製品
無償ライセンス ESXi と 3rd パーティ製バックアップ製品無償ライセンス ESXi と 3rd パーティ製バックアップ製品
無償ライセンス ESXi と 3rd パーティ製バックアップ製品
 
PCCC21:SCSK株式会社 「次世代AIアクセラレーター 「GRAPHCORE IPU」」
PCCC21:SCSK株式会社 「次世代AIアクセラレーター 「GRAPHCORE IPU」」PCCC21:SCSK株式会社 「次世代AIアクセラレーター 「GRAPHCORE IPU」」
PCCC21:SCSK株式会社 「次世代AIアクセラレーター 「GRAPHCORE IPU」」
 
NVIDIA GRID が実現する GPU 仮想化テクノロジー
NVIDIA GRID が実現する GPU 仮想化テクノロジーNVIDIA GRID が実現する GPU 仮想化テクノロジー
NVIDIA GRID が実現する GPU 仮想化テクノロジー
 
1018: ディープラーニング最新技術情報~cuDNN 3、DIGITS 2、CUDA 7.5のご紹介~
1018: ディープラーニング最新技術情報~cuDNN 3、DIGITS 2、CUDA 7.5のご紹介~1018: ディープラーニング最新技術情報~cuDNN 3、DIGITS 2、CUDA 7.5のご紹介~
1018: ディープラーニング最新技術情報~cuDNN 3、DIGITS 2、CUDA 7.5のご紹介~
 
GPU スパコン最新情報
GPU スパコン最新情報GPU スパコン最新情報
GPU スパコン最新情報
 

Similar a 「スーパーコンピュータとクラウドゲーム」

45分で理解する 最近のスパコン事情 斉藤之雄
45分で理解する 最近のスパコン事情 斉藤之雄45分で理解する 最近のスパコン事情 斉藤之雄
45分で理解する 最近のスパコン事情 斉藤之雄
Yukio Saito
 
CMSI計算科学技術特論B(15) インテル Xeon Phi コプロセッサー向け最適化、並列化概要 1
CMSI計算科学技術特論B(15) インテル Xeon Phi コプロセッサー向け最適化、並列化概要 1CMSI計算科学技術特論B(15) インテル Xeon Phi コプロセッサー向け最適化、並列化概要 1
CMSI計算科学技術特論B(15) インテル Xeon Phi コプロセッサー向け最適化、並列化概要 1
Computational Materials Science Initiative
 

Similar a 「スーパーコンピュータとクラウドゲーム」 (20)

45分で理解する 最近のスパコン事情 斉藤之雄
45分で理解する 最近のスパコン事情 斉藤之雄45分で理解する 最近のスパコン事情 斉藤之雄
45分で理解する 最近のスパコン事情 斉藤之雄
 
ITpro EXPO 2014: Cisco UCSによる最新VDIソリューションのご紹介
ITpro EXPO 2014: Cisco UCSによる最新VDIソリューションのご紹介ITpro EXPO 2014: Cisco UCSによる最新VDIソリューションのご紹介
ITpro EXPO 2014: Cisco UCSによる最新VDIソリューションのご紹介
 
【たぶん日本初導入!】Azure Stack Hub with GPUの性能と機能紹介
【たぶん日本初導入!】Azure Stack Hub with GPUの性能と機能紹介【たぶん日本初導入!】Azure Stack Hub with GPUの性能と機能紹介
【たぶん日本初導入!】Azure Stack Hub with GPUの性能と機能紹介
 
Aerospike on IDCF Cloud
Aerospike on IDCF CloudAerospike on IDCF Cloud
Aerospike on IDCF Cloud
 
GPU Container as a Service を実現するための最新OSS徹底比較
GPU Container as a Service を実現するための最新OSS徹底比較GPU Container as a Service を実現するための最新OSS徹底比較
GPU Container as a Service を実現するための最新OSS徹底比較
 
インフラ野郎AzureチームProX
インフラ野郎AzureチームProXインフラ野郎AzureチームProX
インフラ野郎AzureチームProX
 
CMSI計算科学技術特論B(15) インテル Xeon Phi コプロセッサー向け最適化、並列化概要 1
CMSI計算科学技術特論B(15) インテル Xeon Phi コプロセッサー向け最適化、並列化概要 1CMSI計算科学技術特論B(15) インテル Xeon Phi コプロセッサー向け最適化、並列化概要 1
CMSI計算科学技術特論B(15) インテル Xeon Phi コプロセッサー向け最適化、並列化概要 1
 
NUCで始めるVMware Tanzu
NUCで始めるVMware TanzuNUCで始めるVMware Tanzu
NUCで始めるVMware Tanzu
 
Intel OpenVINO、 NVIDIA Deepstream対応開発キットから、 エッジサーバー、Azure Data Box Edgeまで、 Az...
Intel OpenVINO、 NVIDIA Deepstream対応開発キットから、 エッジサーバー、Azure Data Box Edgeまで、 Az...Intel OpenVINO、 NVIDIA Deepstream対応開発キットから、 エッジサーバー、Azure Data Box Edgeまで、 Az...
Intel OpenVINO、 NVIDIA Deepstream対応開発キットから、 エッジサーバー、Azure Data Box Edgeまで、 Az...
 
CUDAプログラミング入門
CUDAプログラミング入門CUDAプログラミング入門
CUDAプログラミング入門
 
Cmc cmd slim
Cmc cmd slimCmc cmd slim
Cmc cmd slim
 
CMD2021 f01 xilinx_20210921_r1.1
CMD2021 f01 xilinx_20210921_r1.1CMD2021 f01 xilinx_20210921_r1.1
CMD2021 f01 xilinx_20210921_r1.1
 
20170726 py data.tokyo
20170726 py data.tokyo20170726 py data.tokyo
20170726 py data.tokyo
 
JETSON 最新情報 & 自動外観検査事例紹介
JETSON 最新情報 & 自動外観検査事例紹介JETSON 最新情報 & 自動外観検査事例紹介
JETSON 最新情報 & 自動外観検査事例紹介
 
PFNのML/DL基盤を支えるKubernetesにおける自動化 / DevOpsDays Tokyo 2021
PFNのML/DL基盤を支えるKubernetesにおける自動化 / DevOpsDays Tokyo 2021PFNのML/DL基盤を支えるKubernetesにおける自動化 / DevOpsDays Tokyo 2021
PFNのML/DL基盤を支えるKubernetesにおける自動化 / DevOpsDays Tokyo 2021
 
2016年11月19日 AITCシニア技術者勉強会 第1回「Arduinoを使ってみる」
2016年11月19日 AITCシニア技術者勉強会 第1回「Arduinoを使ってみる」 2016年11月19日 AITCシニア技術者勉強会 第1回「Arduinoを使ってみる」
2016年11月19日 AITCシニア技術者勉強会 第1回「Arduinoを使ってみる」
 
仮想化技術の基本の基本
仮想化技術の基本の基本仮想化技術の基本の基本
仮想化技術の基本の基本
 
Dell emc highperformancevirtualinfracommunitymeetup_20180621publish
Dell emc highperformancevirtualinfracommunitymeetup_20180621publishDell emc highperformancevirtualinfracommunitymeetup_20180621publish
Dell emc highperformancevirtualinfracommunitymeetup_20180621publish
 
オススメのJavaログ管理手法 ~コンテナ編~(Open Source Conference 2022 Online/Spring 発表資料)
オススメのJavaログ管理手法 ~コンテナ編~(Open Source Conference 2022 Online/Spring 発表資料)オススメのJavaログ管理手法 ~コンテナ編~(Open Source Conference 2022 Online/Spring 発表資料)
オススメのJavaログ管理手法 ~コンテナ編~(Open Source Conference 2022 Online/Spring 発表資料)
 
[db tech showcase Tokyo 2016] D13: NVMeフラッシュストレージを用いた高性能高拡張高可用なデータベースシステムの実現方...
[db tech showcase Tokyo 2016] D13: NVMeフラッシュストレージを用いた高性能高拡張高可用なデータベースシステムの実現方...[db tech showcase Tokyo 2016] D13: NVMeフラッシュストレージを用いた高性能高拡張高可用なデータベースシステムの実現方...
[db tech showcase Tokyo 2016] D13: NVMeフラッシュストレージを用いた高性能高拡張高可用なデータベースシステムの実現方...
 

Último

Último (10)

知識ゼロの営業マンでもできた!超速で初心者を脱する、悪魔的学習ステップ3選.pptx
知識ゼロの営業マンでもできた!超速で初心者を脱する、悪魔的学習ステップ3選.pptx知識ゼロの営業マンでもできた!超速で初心者を脱する、悪魔的学習ステップ3選.pptx
知識ゼロの営業マンでもできた!超速で初心者を脱する、悪魔的学習ステップ3選.pptx
 
新人研修 後半 2024/04/26の勉強会で発表されたものです。
新人研修 後半        2024/04/26の勉強会で発表されたものです。新人研修 後半        2024/04/26の勉強会で発表されたものです。
新人研修 後半 2024/04/26の勉強会で発表されたものです。
 
Utilizing Ballerina for Cloud Native Integrations
Utilizing Ballerina for Cloud Native IntegrationsUtilizing Ballerina for Cloud Native Integrations
Utilizing Ballerina for Cloud Native Integrations
 
論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding
論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding
論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding
 
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
 
LoRaWANスマート距離検出センサー DS20L カタログ LiDARデバイス
LoRaWANスマート距離検出センサー  DS20L  カタログ  LiDARデバイスLoRaWANスマート距離検出センサー  DS20L  カタログ  LiDARデバイス
LoRaWANスマート距離検出センサー DS20L カタログ LiDARデバイス
 
論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games
論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games
論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games
 
論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...
論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...
論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...
 
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアルLoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
 
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
 

「スーパーコンピュータとクラウドゲーム」

  • 1. スーパーコンピューターとクラウドゲーム Shinra Technologies, Inc. Senior vice president Tetsuji Iwasaki 10/22/2014 © 2014 Shinra Technologies, Inc. All Rights Reserved. 1
  • 2. 自己紹介 岩崎哲史(いわさきてつじ) 趣味:ビール 明治大学経済学部経済学科卒 1994年株式会社スクウェア入社 主要ゲームタイトル FFT/FFXI/Crysis 2011年株式会社スクウェア・エニックス・ホールディングス 社長付技術企画担当(現職) 2012年Eidosモントリオールディベロップメントディレクター(現職) 2014年Shinra Technologies, Inc. シニアバイスプレジデント(現職) 10/22/2014 © 2014 Shinra Technologies, Inc. All Rights Reserved. 2
  • 3. クラウドゲーミングとは Controller Input Internet Streaming Video Data center 「Mini Ninjas」 © 2009 Eidos Interactive Ltd. Co-published by Eidos, Inc. and Warner Bros. Interactive Entertainment, a division of Warner Bros. Home Entertainment Inc. 10/22/2014 © 2014 Shinra Technologies, Inc. All Rights Reserved. 3
  • 6. それではTOP10を見てみましょう http://www.top500.org/ 1 Tianhe-2 (MilkyWay-2) TH-IVB-FEP Cluster, Intel Xeon E5-2692 12C 2.200GHz, TH Express-2, Intel Xeon Phi 31S1P NUDT China 2 Titan Cray XK7 , Opteron 6274 16C 2.200GHz, Cray Gemini interconnect, NVIDIA K20x Cray Inc. United States 3 Sequoia BlueGene/Q, Power BQC 16C 1.60 GHz, Custom IBM United States 4 K computer SPARC64 VIIIfx 2.0GHz, Tofu interconnect Fujitsu Japan 5 Mira BlueGene/Q, Power BQC 16C 1.60GHz, Custom IBM United States 6 Piz Daint Cray XC30, Xeon E5-2670 8C 2.600GHz, Aries interconnect , NVIDIA K20x Cray Inc. Switzerland 7 Stampede PowerEdge C8220, Xeon E5-2680 8C 2.700GHz, Infiniband FDR, Intel Xeon Phi SE10P Dell United States 8 JUQUEEN BlueGene/Q, Power BQC 16C 1.600GHz, Custom Interconnect IBM Germany 9 Vulcan BlueGene/Q, Power BQC 16C 1.600GHz, Custom Interconnect IBM United States 10 Cray XC30, Intel Xeon E5-2697v2 12C 2.7GHz, Aries interconnect Cray Inc. United States 10/22/2014 © 2014 Shinra Technologies, Inc. All Rights Reserved. 6
  • 7. Intel® Xeon® 1 Tianhe-2 (MilkyWay-2) TH-IVB-FEP Cluster, Intel Xeon E5-2692 12C 2.200GHz, TH Express-2, Intel Xeon Phi 31S1P NUDT China 2 Titan Cray XK7 , Opteron 6274 16C 2.200GHz, Cray Gemini interconnect, NVIDIA K20x Cray Inc. United States 3 Sequoia BlueGene/Q, Power BQC 16C 1.60 GHz, Custom IBM United States 4 K computer SPARC64 VIIIfx 2.0GHz, Tofu interconnect Fujitsu Japan 5 Mira BlueGene/Q, Power BQC 16C 1.60GHz, Custom IBM United States 6 Piz Daint Cray XC30, Xeon E5-2670 8C 2.600GHz, Aries interconnect , NVIDIA K20x Cray Inc. Switzerland 7 Stampede PowerEdge C8220, Xeon E5-2680 8C 2.700GHz, Infiniband FDR, Intel Xeon Phi SE10P Dell United States 8 JUQUEEN BlueGene/Q, Power BQC 16C 1.600GHz, Custom Interconnect IBM Germany 9 Vulcan BlueGene/Q, Power BQC 16C 1.600GHz, Custom Interconnect IBM United States 10 Cray XC30, Intel Xeon E5-2697v2 12C 2.7GHz, Aries interconnect Cray Inc. United States 10/22/2014 © 2014 Shinra Technologies, Inc. All Rights Reserved. 7
  • 8. IBM® Power® BQC 1 Tianhe-2 (MilkyWay-2) TH-IVB-FEP Cluster, Intel Xeon E5-2692 12C 2.200GHz, TH Express-2, Intel Xeon Phi 31S1P NUDT China 2 Titan Cray XK7 , Opteron 6274 16C 2.200GHz, Cray Gemini interconnect, NVIDIA K20x Cray Inc. United States 3 Sequoia BlueGene/Q, Power BQC 16C 1.60 GHz, Custom IBM United States 4 K computer SPARC64 VIIIfx 2.0GHz, Tofu interconnect Fujitsu Japan 5 Mira BlueGene/Q, Power BQC 16C 1.60GHz, Custom IBM United States 6 Piz Daint Cray XC30, Xeon E5-2670 8C 2.600GHz, Aries interconnect , NVIDIA K20x Cray Inc. Switzerland 7 Stampede PowerEdge C8220, Xeon E5-2680 8C 2.700GHz, Infiniband FDR, Intel Xeon Phi SE10P Dell United States 8 JUQUEEN BlueGene/Q, Power BQC 16C 1.600GHz, Custom Interconnect IBM Germany 9 Vulcan BlueGene/Q, Power BQC 16C 1.600GHz, Custom Interconnect IBM United States 10 Cray XC30, Intel Xeon E5-2697v2 12C 2.7GHz, Aries interconnect Cray Inc. United States 10/22/2014 © 2014 Shinra Technologies, Inc. All Rights Reserved. 8
  • 9. Fujitsu® SPARC®64 Villfx 1 Tianhe-2 (MilkyWay-2) TH-IVB-FEP Cluster, Intel Xeon E5-2692 12C 2.200GHz, TH Express-2, Intel Xeon Phi 31S1P NUDT China 2 Titan Cray XK7 , Opteron 6274 16C 2.200GHz, Cray Gemini interconnect, NVIDIA K20x Cray Inc. United States 3 Sequoia BlueGene/Q, Power BQC 16C 1.60 GHz, Custom IBM United States 4 K computer SPARC64 VIIIfx 2.0GHz, Tofu interconnect Fujitsu Japan 5 Mira BlueGene/Q, Power BQC 16C 1.60GHz, Custom IBM United States 6 Piz Daint Cray XC30, Xeon E5-2670 8C 2.600GHz, Aries interconnect , NVIDIA K20x Cray Inc. Switzerland 7 Stampede PowerEdge C8220, Xeon E5-2680 8C 2.700GHz, Infiniband FDR, Intel Xeon Phi SE10P Dell United States 8 JUQUEEN BlueGene/Q, Power BQC 16C 1.600GHz, Custom Interconnect IBM Germany 9 Vulcan BlueGene/Q, Power BQC 16C 1.600GHz, Custom Interconnect IBM United States 10 Cray XC30, Intel Xeon E5-2697v2 12C 2.7GHz, Aries interconnect Cray Inc. United States 10/22/2014 © 2014 Shinra Technologies, Inc. All Rights Reserved. 9
  • 10. NVIDIA® tesla®/Intel® phi 1 Tianhe-2 (MilkyWay-2) TH-IVB-FEP Cluster, Intel Xeon E5-2692 12C 2.200GHz, TH Express-2, Intel Xeon Phi 31S1P NUDT China 2 Titan Cray XK7 , Opteron 6274 16C 2.200GHz, Cray Gemini interconnect, NVIDIA K20x Cray Inc. United States 3 Sequoia BlueGene/Q, Power BQC 16C 1.60 GHz, Custom IBM United States 4 K computer SPARC64 VIIIfx 2.0GHz, Tofu interconnect Fujitsu Japan 5 Mira BlueGene/Q, Power BQC 16C 1.60GHz, Custom IBM United States 6 Piz Daint Cray XC30, Xeon E5-2670 8C 2.600GHz, Aries interconnect , NVIDIA K20x Cray Inc. Switzerland 7 Stampede PowerEdge C8220, Xeon E5-2680 8C 2.700GHz, Infiniband FDR, Intel Xeon Phi SE10P Dell United States 8 JUQUEEN BlueGene/Q, Power BQC 16C 1.600GHz, Custom Interconnect IBM Germany 9 Vulcan BlueGene/Q, Power BQC 16C 1.600GHz, Custom Interconnect IBM United States 10 Cray XC30, Intel Xeon E5-2697v2 12C 2.7GHz, Aries interconnect Cray Inc. United States 10/22/2014 © 2014 Shinra Technologies, Inc. All Rights Reserved. 10
  • 11. 最近の傾向 汎用プロセッサ TOP500のうち85.4%がIntel …数えてないけと多分ほとんどXeon Amazon EC2は76位 Amazon EC2 C3 Instance cluster Intel Xeon E5-2680v2 10C 2.800GHz, 10G Ethernet 10/22/2014 © 2014 Shinra Technologies, Inc. All Rights Reserved. 11
  • 12. スーパーコンピューターとGPU TESLA GPU ACCELERATORS FOR SERVERS http://www.nvidia.com/object/tesla-servers.html 2014-9-17閲覧 NVIDIA® Tesla® Intel® Xeon Phi™ Coprocessor インテル® Xeon Phi™ コプロセッサー製品仕様 http://www.intel.co.jp/content/www/jp/ja/processors/xeon/xeon-phi-detail.html 2014-9-17閲覧 10/22/2014 © 2014 Shinra Technologies, Inc. All Rights Reserved. 12
  • 13. DEGIMAから受けた衝撃 *Tsuyoshi Hamada, Tetsu Narumi, Rio Yokota, Kenji Yasuoka and Keigo Nitadori. 42 TFlops Hierarchical N-body Simulations on GPUs with Applications in both Astrophysics and Turbulence. SC '09 Proceedings of the Conference on High Performance Computing Networking, Storage and Analysis Article No. 62 10/22/2014 © 2014 Shinra Technologies, Inc. All Rights Reserved. 13
  • 14. *長崎大学GPUクラスタDEGIMA(DEstination for Gpu Intensive MAchine)の紹介https://www.cps-jp.org/seminar/fy2010/2010-12-01/hamada/pub/20101201_hamada_02.pdf page5 2014-9-17閲覧 10/22/2014 © 2014 Shinra Technologies, Inc. All Rights Reserved. 14
  • 15. 念のためご注意 スーパーコンピューターの価値は一概に LinPackの実行速度のみでは語れません 計算用途や、使いやすさ、保守性などは TOP500のランキングでは考慮されません でも価格はもうちょっと追求されてもいいような…. 10/22/2014 © 2014 Shinra Technologies, Inc. All Rights Reserved. 15
  • 16. 表の見方 1 Tianhe-2 (MilkyWay-2) TH-IVB-FEP Cluster, Intel Xeon E5-2692 12C 2.200GHz, TH Express-2, Intel Xeon Phi 31S1P TH-IVB-FEP Cluster -> システムの名前 Intel Xeon E5-2692 12C 2.200GHz -> CPUの名前 TH Express-2 -> インターコネクションの名前 Intel Xeon Phi 31S1P -> アクセラレーターの名前 京のInter connection “Tofu” 6次元メッシュ/トーラス スーパーコンピュータの高次元接続技術が「恩賜発明賞」を受賞 http://pr.fujitsu.com/jp/news/2014/05/29.html 2014-09-17閲覧 10/22/2014 © 2014 Shinra Technologies, Inc. All Rights Reserved. 16
  • 17. 質問タイム 10/22/2014 © 2014 Shinra Technologies, Inc. All Rights Reserved. 17
  • 18. 今回お話しする Shinra Systemテクノロジコンポーネント リモートレンダリングアーキテクチャ RDMA/TCP デュアルプロトコルインターコネクション ゲームデザインに応じた分散モデル 10/22/2014 © 2014 Shinra Technologies, Inc. All Rights Reserved. 18
  • 19. リモートレンダリングアーキテクチャ 10/22/2014 © 2014 Shinra Technologies, Inc. All Rights Reserved. 19
  • 20. リモートレンダリングアーキテクチャ • レンダリングはGPUサー バーで実行 • DirectX11APIのコールは ラップトップで実行されて いる 10/22/2014 © 2014 Shinra Technologies, Inc. All Rights Reserved. 20
  • 21. リモートレンダリングアーキテクチャ Game.exe (third-party) … プロセス環境図 Fake Fake … dxgi.dll d3d11.dll dinput.dll dxgi.dll d3d11.dll nvwgf2umx.ws2_32.dll dll nvlddmkm.sys Renderer.exe ws2_32.dll dxgi.dll d3d11.dll nvwgf2umx.dll nvlddmkm.sys Network card Network card 10/22/2014 © 2014 Shinra Technologies, Inc. All Rights Reserved. 21
  • 22. リモートレンダリングアーキテクチャ • Separate CPU & GPU Servers • Many users per logical unit • Flexible architecture allows efficient CPU/GPU usage Logical unit of game system Physical unit CPU GPU GPU CPU GPU GPU GPU GPU GPU GPU CPU CPU CPU CPU CPU CPU CPU CPU CPU CPU 10/22/2014 © 2014 Shinra Technologies, Inc. All Rights Reserved. 22
  • 23. GPU CPU CPU/GPUパフォーマンスミスマッチ 10/22/2014 © 2014 Shinra Technologies, Inc. All Rights Reserved. 23
  • 24. y = 1037.3x-0.826 R² = 0.9055 0.4 0.35 0.3 0.25 0.2 0.15 0.1 0.05 0 値段とパフォーマンスの関係 値段2倍=パフォーマンス2倍ではない 0 20,000 40,000 60,000 80,000 100,000 120,000 140,000 160,000 10/22/2014 © 2014 Shinra Technologies, Inc. All Rights Reserved. 24
  • 25. ゲーム60個分を1サーバーでレンダリング 10/22/2014 © 2014 Shinra Technologies, Inc. All Rights Reserved. 25
  • 26. RDMA/TCP デュアルプロトコルインターコネクション 10/22/2014 © 2014 Shinra Technologies, Inc. All Rights Reserved. 26
  • 27. 最近のネットワークカードの性能(TCP) Comp01<->GPU01 Effective bandwidth 8.8Gbps loopback(E5-1650@3.2GHz) Effective bandwidth 3.59 Gbps Unit size RTT(μsec) Unit size RTT(μsec) 4 42,09 4 15,080261 8 41,75 8 14,986181 16 42,18 16 15,00307 32 41,86 32 15,097176 64 42,69 64 15,081717 128 42,91 128 15,106041 256 43,35 256 15,17368 512 44,6 512 15,301775 1024 46,6 1024 15,67151 2048 64,19 2048 24,330402 4096 79,87 4096 30,921734 8192 140,06 8192 45,846207 16384 186,85 16384 79,473488 32768 291,19 32768 129,546127 65536 497,89 65536 227,030136 131072 909,93 131072 435,540619 262144 1800,49 262144 929,645325 524288 3483,36 524288 1904,819336 1048576 6841,73 1048576 4009,06958 10/22/2014 © 2014 Shinra Technologies, Inc. All Rights Reserved. 27
  • 28. Mellanox Connect X3 -Etherネットの環境でRDMAが使用可能 -Tianhe-2 (MilkyWay-2)のインターコネクションは RDMAを使用 -OSを介さず、リモートに直接メモリ間転送が出来る http://www.mellanox.com/page/products_dyn?product_family=127 2014-9-17閲覧 10/22/2014 © 2014 Shinra Technologies, Inc. All Rights Reserved. 28
  • 29. インターコネクション解説 Game.exe (third-party) dinput.dll Fake Fake 00100101000 11101011100 … dxgi.dll d3d11.10011101010 dll nvwgf2umx.dll Renderer.exe ws2_32.dll dxgi.dll d3d11.dll nvwgf2umx.dll nvlddmkm.sys … ws2_32.dll Compression (500μs / Ratio 1:8) Transmission to the Renderer • Using TCP over Gigabit Ethernet (500μs) • Using RDMA over Converged Ethernet (50μs) Decompression (200μs) Delay ≈ 1.2ms Video card 10/22/2014 © 2014 Shinra Technologies, Inc. All Rights Reserved. 29
  • 30. ゲームに応じた分散モデル スタンドアローンアーキテクチャ VIRTUAL MMO アーキテクチャ MK アーキテクチャ 10/22/2014 © 2014 Shinra Technologies, Inc. All Rights Reserved. 30
  • 31. スタンドアローンアーキテクチャ Compute Server Rendering Server Rendering Commands GPU Game.exe Rendering.exe Input Video internet internet GPU 10/22/2014 © 2014 Shinra Technologies, Inc. All Rights Reserved. 31
  • 32. VIRTUAL MMO アーキテクチャ Compute Server Rendering Server Remote Renderer Rendering Commands Server Game Game Game Game internet internet Input GPU GPU 4 x Video Streams 10/22/2014 © 2014 Shinra Technologies, Inc. All Rights Reserved. 32
  • 33. MK アーキテクチャ Compute Server Rendering Server Game GPU User User User User Rendering Commands Remote Renderer 4 users in a single process… internet internet GPU 4 x Video Streams Input 10/22/2014 © 2014 Shinra Technologies, Inc. All Rights Reserved. 33
  • 34. 募集 ご説明した3アーキテクチャを標準化して提供する予 定です。 1)お持ちのIPをShinraプラットフォームに提供 2)お持ちのIPをクラウドゲーム用にちょっと改造 3)今までになかったゲーム体験を製作 4)共同研究 5)定期交流会 10/22/2014 © 2014 Shinra Technologies, Inc. All Rights Reserved. 34