SlideShare una empresa de Scribd logo
1 de 13
Descargar para leer sin conexión
Microsoft Azure上でのタンパク質間相互作用
予測システムの並列計算と性能評価
1 東京工業大学 情報理工学院 情報工学系
2 東京工業大学 情報生命博士教育院
情報処理学会 第49回バイオ情報学研究会 (4)
2017年3月23日(木) 於 北陸先端科学技術大学院大学
大上 雅史1 山本 悠生1,2 秋山 泰1,2
• パブリッククラウド
– 利点
• 利用料金を払えば誰でも利用可能、運用はアウトソース
• 環境や資源を共有するしくみが充実
• 計算資源の増減が簡単
パブリッククラウドの普及
2017/3/23 49 (4)第 回バイオ情報学研究会 大上雅史 2
パブリッククラウド上での並列計算の例
2017/3/23 49 (4)第 回バイオ情報学研究会 大上雅史
• タンパク質の類似構造検索タスク。
• Searcher role 6台まで、ほぼリニアに高速化。
• Searcher role 8台超で性能低下するも、
18台でも約89%の効率。
Searcher roleの数
Speedup
Mrozek D, et al. Cloud4Psi: cloud computing for 3D protein structure
similarity searching. Bioinformatics 2014, 30: 2822-2825.
Fig. 1
Fig. 2(a)
3
仮想マシン
(VM)
タンパク質間相互作用予測ソフトウェア MEGADOCK
• MEGADOCK
– 入力された2つのタンパク質立体構造に対し、相互作用の有無を予測
– 剛体モデルを組合せて評価値の良い複合体構造をサンプリングし、
それらの評価値に基づいて予測
– 計算の大部分(約80%)はFFT (高速フーリエ変換)
2017/3/23 49 (4)第 回バイオ情報学研究会 大上雅史
0.2%
0.1%
6.9%
37.5%
14.7%
38.4%
2.2%
Receptor ボクセル化
Receptor FFT
Ligand ボクセル化
Ligand FFT
複素畳込み
逆FFT
その他
4
Ohue M, et al. Bioinformatics, 30 (2014), Ohue M, et al. Prot Pept Lett, 21 (2014)
MEGADOCKのコアの部分
2017/3/23 49 (4)第 回バイオ情報学研究会 大上雅史
タンパク質が結合したときの評価値を高速に評価
5
Katzhalski-Katzir E, et al. Proc Natl Acad Sci (1992), 89(6): 2195–2199.
本研究の目的
• Microsoft Azure上でMEGADOCKの並列計算を実施
– Azure上の複数のVMを用い、MPIによって計算を並列実行
– 数十VM規模での性能を計測
– 特に、GPU付きVMに注目
2017/3/23 49 (4)第 回バイオ情報学研究会 大上雅史 6
Instance CPU GPU(*) RAM Network 価格
NC24 24コア Tesla K80 x 4 1,440 GB 440.65円/h
NC24r 24コア Tesla K80 x 4 1,440 GB RDMA (InfiniBand) 484.71円/h
DS14 16コア なし 112 GB 141.48円/h
A9 16コア なし 112 GB RDMA (InfiniBand) 197.06円/h
H16 16コア なし 112 GB 178.50円/h
H16r 16コア なし 112 GB RDMA (InfiniBand) 195.84円/h
Azureの代表的なインスタンス(VMの種類)
(*)ただし、物理的にはK80が2枚。
(K80は1枚の中に2つのGPUチップを含む)
• MEGADOCKは既にGPUクラスタ向け並列化が実装済
– プロセス単位でMasterとWorkerに資源を割り当て
– Masterがタンパク質ペアをWorkerに渡し、Workerが計算
– GPUはWorkerが使用
マルチGPUノード並列
2017/3/23 49 (4)第 回バイオ情報学研究会 大上雅史
Ohue M, Shimoda T, Suzuki S, Ishida T, Akiyama Y. Bioinformatics, 30(22): 2014.
7
Azureへの実装
2017/3/23 49 (4)第 回バイオ情報学研究会 大上雅史
Azure上のシステム構成
概要
• Masterプロセス(1つ)が
タンパク質ペアをWorkerに割り当て。
• 各VMのWorkerプロセスが
割り当てられたペアの予測計算を実施。
8
並列化粒度
2017/3/23 49 (4)第 回バイオ情報学研究会 大上雅史
VM 1 VM 2 VM 3 VM n
9
• プロセス並列とスレッド並列の粒度を決める
– これまでのクラスタ上での実装の場合、
主にメモリ制限のため、各ノード・1プロセスとしていた。
– 最近のクラウドのVMはメモリが豊富。
– (今回対象の)GPUインスタンスはGPUチップが4枚/VM
→ 本研究では、各VM 4プロセスずつ割り当てた。
評価実験
• データセット
– ZDOCK Docking Benchmark 1.0 の
59タンパク質ペアの相手を入れ替えた全組み合わせ
→ 59×59 = 3,481件の予測計算
• 使用インスタンス
• VM内の実行プロセス
– 各VMに4プロセス
– Masterを1つ立てる
– Worker: 6 CPUコア+1 GPU
2017/3/23 49 (4)第 回バイオ情報学研究会 大上雅史
Instance CPU GPU(*) RAM Network 価格
NC24 24コア Tesla K80 x 4 1,440 GB 440.65円/h
NC24r 24コア Tesla K80 x 4 1,440 GB RDMA (InfiniBand) 484.71円/h
(Chen R, Proteins 47, 2002)
(*)ただし、物理的にはK80が2枚。
(K80は1枚の中に2つのGPUチップを含む)
10
GPUインスタンスでの測定結果
2017/3/23 49 (4)第 回バイオ情報学研究会 大上雅史
0
50
100
150
200
250
300
350
Speedup(#pair/min)
NC24r 測定値
NC24 測定値
0 5 10 15 20 25
0 120 240 360 480 600
0 20 40 60 80 100
#Virtual Machines
#CPU cores
#Tesla K80 GPUs
NC24 CPUのみ
NC24r CPUのみ
●
●
3.8倍の高速化
Strong scaling = 89%
(対#VM=5値)
#VM=22
#VM=20
#VM=10
#VM=5
(NC24 CPU→GPU)
11
※マイクロソフトのクオータコア制限のため、最大22VMまで測定。
・89%の並列化効率(強スケーリング)を達成
・GPUを使わずに計算した場合に比べて3.8倍高速
GPUの効果
• GPUインスタンスの費用対効果
2017/3/23 49 (4)第 回バイオ情報学研究会 大上雅史
Instance CPU GPU Network 価格
NC24 E5-2690v3 24コア Tesla K80 x 4 440.65円/h
NC24r E5-2690v3 24コア Tesla K80 x 4 RDMA (InfiniBand) 484.71円/h
A9 E5-2670 16コア なし RDMA (InfiniBand) 197.06円/h
NC24rとA9を比較
・A9を1.5倍して、24コア→295.59円/hと見積もり。
・NC24r 484.71円/h ÷ 295.59円/h ≒ 1.64
→GPUによる高速化率が1.64倍以上ならば、GPUインスタンスが
得。
今回の場合、GPU利用時で3.8倍高速だったので、
MEGADOCKにおいてはGPUインスタンスの利用が推奨される。
12
まとめ
• MEGADOCKをAzure上に移植、AzureのGPUインスタンス
を用いた並列実行を実施し、その性能を評価した。
– 89%の並列化効率 (NC24, 5 VM → 22 VM)
– GPUによる3.8倍の高速化 (NC24, CPU → CPU+GPU)
– InfiniBandはMEGADOCKの計算にはほとんど寄与しない
– クオータコア制限が41 VMまで緩和されたので、今後測定を実施
– コンテナ型仮想化技術を用いた場合の検証も今後の課題
• 謝辞
– JSPS科研費 (24240044, 15K16081)
– JST CREST (Extreme Big Dataプロジェクト)
– JSTリサーチコンプレックス推進プログラム 川崎市殿町拠点
– Microsoft Business Investment Funding
– ㈱リバネス 第30回リバネス研究費 (日本マイクロソフト賞)
2017/3/23 49 (4)第 回バイオ情報学研究会 大上雅史 13
(3) 15:50-16:15
コンテナ型仮想化による分散計算環境におけるタンパク質間相互作用予測システムの性能評価
青山 健人、山本 悠生、大上 雅史、秋山 泰

Más contenido relacionado

La actualidad más candente

自作プライベートクラウド研究会 OpenStackアップデート
自作プライベートクラウド研究会 OpenStackアップデート自作プライベートクラウド研究会 OpenStackアップデート
自作プライベートクラウド研究会 OpenStackアップデートMasanori Itoh
 
Awamoto master thesis
Awamoto master thesisAwamoto master thesis
Awamoto master thesispflab
 
[DL Hacks] Objects as Points
[DL Hacks] Objects as Points[DL Hacks] Objects as Points
[DL Hacks] Objects as PointsDeep Learning JP
 
OpenStack Summit Vancouver 2018 Nova最新動向
OpenStack Summit Vancouver 2018 Nova最新動向OpenStack Summit Vancouver 2018 Nova最新動向
OpenStack Summit Vancouver 2018 Nova最新動向Takashi Natsume
 
WebDB Forum 2016 gunosy
WebDB Forum 2016 gunosyWebDB Forum 2016 gunosy
WebDB Forum 2016 gunosyHiroaki Kudo
 
Osc2012 TokyoSpring OpenStack Abstract
Osc2012 TokyoSpring OpenStack AbstractOsc2012 TokyoSpring OpenStack Abstract
Osc2012 TokyoSpring OpenStack AbstractAyumi Oka
 
バッチ高速化のあゆみ
バッチ高速化のあゆみバッチ高速化のあゆみ
バッチ高速化のあゆみdcubeio
 
OpenStack概要(オープンクラウド最新動向)
OpenStack概要(オープンクラウド最新動向)OpenStack概要(オープンクラウド最新動向)
OpenStack概要(オープンクラウド最新動向)Akira Yoshiyama
 
Jubakit の紹介
Jubakit の紹介Jubakit の紹介
Jubakit の紹介kmaehashi
 
Ubuntu Offline Meeting 2013.05 Tokyo
Ubuntu Offline Meeting 2013.05 TokyoUbuntu Offline Meeting 2013.05 Tokyo
Ubuntu Offline Meeting 2013.05 TokyoMasanori Itoh
 
輪読資料 Xception: Deep Learning with Depthwise Separable Convolutions
輪読資料 Xception: Deep Learning with Depthwise Separable Convolutions輪読資料 Xception: Deep Learning with Depthwise Separable Convolutions
輪読資料 Xception: Deep Learning with Depthwise Separable ConvolutionsKotaro Asami
 
“速度情報を組み込んだロードマップの提案 ”を読んで
“速度情報を組み込んだロードマップの提案 ”を読んで“速度情報を組み込んだロードマップの提案 ”を読んで
“速度情報を組み込んだロードマップの提案 ”を読んでAdachi (OEI)
 
OpenStack Abstract @osc2012kyoto
OpenStack Abstract @osc2012kyotoOpenStack Abstract @osc2012kyoto
OpenStack Abstract @osc2012kyotoAyumi Oka
 
SIGMOD'10勉強会 -Session 8-
SIGMOD'10勉強会 -Session 8-SIGMOD'10勉強会 -Session 8-
SIGMOD'10勉強会 -Session 8-Takeshi Yamamuro
 
RDOで体験! OpenStackの基本機能
RDOで体験! OpenStackの基本機能RDOで体験! OpenStackの基本機能
RDOで体験! OpenStackの基本機能Etsuji Nakai
 
ChainerMNについて
ChainerMNについてChainerMNについて
ChainerMNについてShuji Suzuki
 

La actualidad más candente (20)

自作プライベートクラウド研究会 OpenStackアップデート
自作プライベートクラウド研究会 OpenStackアップデート自作プライベートクラウド研究会 OpenStackアップデート
自作プライベートクラウド研究会 OpenStackアップデート
 
Awamoto master thesis
Awamoto master thesisAwamoto master thesis
Awamoto master thesis
 
[DL Hacks] Objects as Points
[DL Hacks] Objects as Points[DL Hacks] Objects as Points
[DL Hacks] Objects as Points
 
OpenStack Summit Vancouver 2018 Nova最新動向
OpenStack Summit Vancouver 2018 Nova最新動向OpenStack Summit Vancouver 2018 Nova最新動向
OpenStack Summit Vancouver 2018 Nova最新動向
 
WebDB Forum 2016 gunosy
WebDB Forum 2016 gunosyWebDB Forum 2016 gunosy
WebDB Forum 2016 gunosy
 
Iugonet 20100916
Iugonet 20100916Iugonet 20100916
Iugonet 20100916
 
Osc2012 TokyoSpring OpenStack Abstract
Osc2012 TokyoSpring OpenStack AbstractOsc2012 TokyoSpring OpenStack Abstract
Osc2012 TokyoSpring OpenStack Abstract
 
MateriApps: OpenMXを利用した第一原理計算の簡単な実習
MateriApps: OpenMXを利用した第一原理計算の簡単な実習MateriApps: OpenMXを利用した第一原理計算の簡単な実習
MateriApps: OpenMXを利用した第一原理計算の簡単な実習
 
バッチ高速化のあゆみ
バッチ高速化のあゆみバッチ高速化のあゆみ
バッチ高速化のあゆみ
 
OpenStack概要(オープンクラウド最新動向)
OpenStack概要(オープンクラウド最新動向)OpenStack概要(オープンクラウド最新動向)
OpenStack概要(オープンクラウド最新動向)
 
Jubakit の紹介
Jubakit の紹介Jubakit の紹介
Jubakit の紹介
 
Ubuntu Offline Meeting 2013.05 Tokyo
Ubuntu Offline Meeting 2013.05 TokyoUbuntu Offline Meeting 2013.05 Tokyo
Ubuntu Offline Meeting 2013.05 Tokyo
 
輪読資料 Xception: Deep Learning with Depthwise Separable Convolutions
輪読資料 Xception: Deep Learning with Depthwise Separable Convolutions輪読資料 Xception: Deep Learning with Depthwise Separable Convolutions
輪読資料 Xception: Deep Learning with Depthwise Separable Convolutions
 
“速度情報を組み込んだロードマップの提案 ”を読んで
“速度情報を組み込んだロードマップの提案 ”を読んで“速度情報を組み込んだロードマップの提案 ”を読んで
“速度情報を組み込んだロードマップの提案 ”を読んで
 
OpenStack Abstract @osc2012kyoto
OpenStack Abstract @osc2012kyotoOpenStack Abstract @osc2012kyoto
OpenStack Abstract @osc2012kyoto
 
SIGMOD'10勉強会 -Session 8-
SIGMOD'10勉強会 -Session 8-SIGMOD'10勉強会 -Session 8-
SIGMOD'10勉強会 -Session 8-
 
Jubaanomalyについて
JubaanomalyについてJubaanomalyについて
Jubaanomalyについて
 
Jubatus 1.0 の紹介
Jubatus 1.0 の紹介Jubatus 1.0 の紹介
Jubatus 1.0 の紹介
 
RDOで体験! OpenStackの基本機能
RDOで体験! OpenStackの基本機能RDOで体験! OpenStackの基本機能
RDOで体験! OpenStackの基本機能
 
ChainerMNについて
ChainerMNについてChainerMNについて
ChainerMNについて
 

Destacado

学振特別研究員になるために~2018年度申請版
学振特別研究員になるために~2018年度申請版学振特別研究員になるために~2018年度申請版
学振特別研究員になるために~2018年度申請版Masahito Ohue
 
目バーチャルスクリーニング
目バーチャルスクリーニング目バーチャルスクリーニング
目バーチャルスクリーニングMasahito Ohue
 
学振特別研究員になるために~知っておくべき10のTips~
学振特別研究員になるために~知っておくべき10のTips~学振特別研究員になるために~知っておくべき10のTips~
学振特別研究員になるために~知っておくべき10のTips~Masahito Ohue
 
学振特別研究員になるために~知っておくべき10のTips~[平成29年度申請版]
学振特別研究員になるために~知っておくべき10のTips~[平成29年度申請版]学振特別研究員になるために~知っておくべき10のTips~[平成29年度申請版]
学振特別研究員になるために~知っておくべき10のTips~[平成29年度申請版]Masahito Ohue
 
計算で明らかにするタンパク質の出会いとネットワーク(FIT2016 助教が吼えるセッション)
計算で明らかにするタンパク質の出会いとネットワーク(FIT2016 助教が吼えるセッション)計算で明らかにするタンパク質の出会いとネットワーク(FIT2016 助教が吼えるセッション)
計算で明らかにするタンパク質の出会いとネットワーク(FIT2016 助教が吼えるセッション)Masahito Ohue
 
Wielding the Hard and Soft Science of Service Design
Wielding the Hard and Soft Science of Service DesignWielding the Hard and Soft Science of Service Design
Wielding the Hard and Soft Science of Service Designbrandonschauer
 
Eva Peron Evita,Libro De Lectura Para 1er Grado Inferior
Eva Peron   Evita,Libro De Lectura Para 1er Grado InferiorEva Peron   Evita,Libro De Lectura Para 1er Grado Inferior
Eva Peron Evita,Libro De Lectura Para 1er Grado Inferiorcristiandadypatria
 
Influence of Magnetic Flux Controllers on Induction Heating Systems
Influence of Magnetic Flux Controllers on Induction Heating SystemsInfluence of Magnetic Flux Controllers on Induction Heating Systems
Influence of Magnetic Flux Controllers on Induction Heating SystemsFluxtrol Inc.
 
Deep Learning による視覚×言語融合の最前線
Deep Learning による視覚×言語融合の最前線Deep Learning による視覚×言語融合の最前線
Deep Learning による視覚×言語融合の最前線Yoshitaka Ushiku
 
Portrait of a lady
Portrait of a ladyPortrait of a lady
Portrait of a ladyMakala (D)
 
結果を出すチームビルディング術
結果を出すチームビルディング術結果を出すチームビルディング術
結果を出すチームビルディング術Mao Ohnishi
 
HPC Top 5 Stories: March 22, 2017
HPC Top 5 Stories: March 22, 2017HPC Top 5 Stories: March 22, 2017
HPC Top 5 Stories: March 22, 2017NVIDIA
 
Pythonの処理系はどのように実装され,どのように動いているのか? 我々はその実態を調査すべくアマゾンへと飛んだ.
Pythonの処理系はどのように実装され,どのように動いているのか? 我々はその実態を調査すべくアマゾンへと飛んだ.Pythonの処理系はどのように実装され,どのように動いているのか? 我々はその実態を調査すべくアマゾンへと飛んだ.
Pythonの処理系はどのように実装され,どのように動いているのか? 我々はその実態を調査すべくアマゾンへと飛んだ.kiki utagawa
 
Problemas De La Globalización
Problemas De La GlobalizaciónProblemas De La Globalización
Problemas De La GlobalizaciónMpps :)
 
見やすいプレゼン資料の作り方 - リニューアル増量版
見やすいプレゼン資料の作り方 - リニューアル増量版見やすいプレゼン資料の作り方 - リニューアル増量版
見やすいプレゼン資料の作り方 - リニューアル増量版MOCKS | Yuta Morishige
 
Payments Trends 2017
Payments Trends 2017Payments Trends 2017
Payments Trends 2017Capgemini
 
Infographic: Medicare Marketing: Direct Mail: Still The #1 Influencer For Tho...
Infographic: Medicare Marketing: Direct Mail: Still The #1 Influencer For Tho...Infographic: Medicare Marketing: Direct Mail: Still The #1 Influencer For Tho...
Infographic: Medicare Marketing: Direct Mail: Still The #1 Influencer For Tho...Scott Levine
 
The Marketer's Guide To Customer Interviews
The Marketer's Guide To Customer InterviewsThe Marketer's Guide To Customer Interviews
The Marketer's Guide To Customer InterviewsGood Funnel
 
The Be-All, End-All List of Small Business Tax Deductions
The Be-All, End-All List of Small Business Tax DeductionsThe Be-All, End-All List of Small Business Tax Deductions
The Be-All, End-All List of Small Business Tax DeductionsWagepoint
 

Destacado (20)

学振特別研究員になるために~2018年度申請版
学振特別研究員になるために~2018年度申請版学振特別研究員になるために~2018年度申請版
学振特別研究員になるために~2018年度申請版
 
目バーチャルスクリーニング
目バーチャルスクリーニング目バーチャルスクリーニング
目バーチャルスクリーニング
 
学振特別研究員になるために~知っておくべき10のTips~
学振特別研究員になるために~知っておくべき10のTips~学振特別研究員になるために~知っておくべき10のTips~
学振特別研究員になるために~知っておくべき10のTips~
 
学振特別研究員になるために~知っておくべき10のTips~[平成29年度申請版]
学振特別研究員になるために~知っておくべき10のTips~[平成29年度申請版]学振特別研究員になるために~知っておくべき10のTips~[平成29年度申請版]
学振特別研究員になるために~知っておくべき10のTips~[平成29年度申請版]
 
計算で明らかにするタンパク質の出会いとネットワーク(FIT2016 助教が吼えるセッション)
計算で明らかにするタンパク質の出会いとネットワーク(FIT2016 助教が吼えるセッション)計算で明らかにするタンパク質の出会いとネットワーク(FIT2016 助教が吼えるセッション)
計算で明らかにするタンパク質の出会いとネットワーク(FIT2016 助教が吼えるセッション)
 
Sistema educativo indígena propio seip La Guajira
Sistema educativo indígena propio seip La GuajiraSistema educativo indígena propio seip La Guajira
Sistema educativo indígena propio seip La Guajira
 
Wielding the Hard and Soft Science of Service Design
Wielding the Hard and Soft Science of Service DesignWielding the Hard and Soft Science of Service Design
Wielding the Hard and Soft Science of Service Design
 
Eva Peron Evita,Libro De Lectura Para 1er Grado Inferior
Eva Peron   Evita,Libro De Lectura Para 1er Grado InferiorEva Peron   Evita,Libro De Lectura Para 1er Grado Inferior
Eva Peron Evita,Libro De Lectura Para 1er Grado Inferior
 
Influence of Magnetic Flux Controllers on Induction Heating Systems
Influence of Magnetic Flux Controllers on Induction Heating SystemsInfluence of Magnetic Flux Controllers on Induction Heating Systems
Influence of Magnetic Flux Controllers on Induction Heating Systems
 
Deep Learning による視覚×言語融合の最前線
Deep Learning による視覚×言語融合の最前線Deep Learning による視覚×言語融合の最前線
Deep Learning による視覚×言語融合の最前線
 
Portrait of a lady
Portrait of a ladyPortrait of a lady
Portrait of a lady
 
結果を出すチームビルディング術
結果を出すチームビルディング術結果を出すチームビルディング術
結果を出すチームビルディング術
 
HPC Top 5 Stories: March 22, 2017
HPC Top 5 Stories: March 22, 2017HPC Top 5 Stories: March 22, 2017
HPC Top 5 Stories: March 22, 2017
 
Pythonの処理系はどのように実装され,どのように動いているのか? 我々はその実態を調査すべくアマゾンへと飛んだ.
Pythonの処理系はどのように実装され,どのように動いているのか? 我々はその実態を調査すべくアマゾンへと飛んだ.Pythonの処理系はどのように実装され,どのように動いているのか? 我々はその実態を調査すべくアマゾンへと飛んだ.
Pythonの処理系はどのように実装され,どのように動いているのか? 我々はその実態を調査すべくアマゾンへと飛んだ.
 
Problemas De La Globalización
Problemas De La GlobalizaciónProblemas De La Globalización
Problemas De La Globalización
 
見やすいプレゼン資料の作り方 - リニューアル増量版
見やすいプレゼン資料の作り方 - リニューアル増量版見やすいプレゼン資料の作り方 - リニューアル増量版
見やすいプレゼン資料の作り方 - リニューアル増量版
 
Payments Trends 2017
Payments Trends 2017Payments Trends 2017
Payments Trends 2017
 
Infographic: Medicare Marketing: Direct Mail: Still The #1 Influencer For Tho...
Infographic: Medicare Marketing: Direct Mail: Still The #1 Influencer For Tho...Infographic: Medicare Marketing: Direct Mail: Still The #1 Influencer For Tho...
Infographic: Medicare Marketing: Direct Mail: Still The #1 Influencer For Tho...
 
The Marketer's Guide To Customer Interviews
The Marketer's Guide To Customer InterviewsThe Marketer's Guide To Customer Interviews
The Marketer's Guide To Customer Interviews
 
The Be-All, End-All List of Small Business Tax Deductions
The Be-All, End-All List of Small Business Tax DeductionsThe Be-All, End-All List of Small Business Tax Deductions
The Be-All, End-All List of Small Business Tax Deductions
 

Similar a Microsoft Azure上でのタンパク質間相互作用予測システムの並列計算と性能評価

電子動力学アプリケーションの最適化2
電子動力学アプリケーションの最適化2電子動力学アプリケーションの最適化2
電子動力学アプリケーションの最適化2RCCSRENKEI
 
Trainable Calibration Measures for Neural Networks from Kernel Mean Embeddings
Trainable Calibration Measures for Neural Networks from Kernel Mean EmbeddingsTrainable Calibration Measures for Neural Networks from Kernel Mean Embeddings
Trainable Calibration Measures for Neural Networks from Kernel Mean Embeddingsharmonylab
 
CNNの構造最適化手法(第3回3D勉強会)
CNNの構造最適化手法(第3回3D勉強会)CNNの構造最適化手法(第3回3D勉強会)
CNNの構造最適化手法(第3回3D勉強会)MasanoriSuganuma
 
Matlantis™のニューラルネットワークポテンシャルPFPの適用範囲拡張
Matlantis™のニューラルネットワークポテンシャルPFPの適用範囲拡張Matlantis™のニューラルネットワークポテンシャルPFPの適用範囲拡張
Matlantis™のニューラルネットワークポテンシャルPFPの適用範囲拡張Preferred Networks
 
Top-K Off-Policy Correction for a REINFORCE Recommender System
Top-K Off-Policy Correction for a REINFORCE Recommender SystemTop-K Off-Policy Correction for a REINFORCE Recommender System
Top-K Off-Policy Correction for a REINFORCE Recommender Systemharmonylab
 
20180723 PFNの研究基盤 / PFN research system infrastructure
20180723 PFNの研究基盤 / PFN research system infrastructure20180723 PFNの研究基盤 / PFN research system infrastructure
20180723 PFNの研究基盤 / PFN research system infrastructurePreferred Networks
 
SIGBIO54: 生命情報解析分野におけるコンテナ型仮想化技術の動向と性能検証
SIGBIO54: 生命情報解析分野におけるコンテナ型仮想化技術の動向と性能検証SIGBIO54: 生命情報解析分野におけるコンテナ型仮想化技術の動向と性能検証
SIGBIO54: 生命情報解析分野におけるコンテナ型仮想化技術の動向と性能検証Kento Aoyama
 
[DDBJ Challenge 2016] 遺伝研スーパーコンピュータのビッグデータ解析環境
[DDBJ Challenge 2016] 遺伝研スーパーコンピュータのビッグデータ解析環境[DDBJ Challenge 2016] 遺伝研スーパーコンピュータのビッグデータ解析環境
[DDBJ Challenge 2016] 遺伝研スーパーコンピュータのビッグデータ解析環境DNA Data Bank of Japan center
 
FastDepth: Fast Monocular Depth Estimation on Embedded Systems
FastDepth: Fast Monocular Depth Estimation on Embedded SystemsFastDepth: Fast Monocular Depth Estimation on Embedded Systems
FastDepth: Fast Monocular Depth Estimation on Embedded Systemsharmonylab
 
20180729 Preferred Networksの機械学習クラスタを支える技術
20180729 Preferred Networksの機械学習クラスタを支える技術20180729 Preferred Networksの機械学習クラスタを支える技術
20180729 Preferred Networksの機械学習クラスタを支える技術Preferred Networks
 
ChainerMNが即座に使える環境を提供するXTREME DNA HPC Cloud
ChainerMNが即座に使える環境を提供するXTREME DNA HPC CloudChainerMNが即座に使える環境を提供するXTREME DNA HPC Cloud
ChainerMNが即座に使える環境を提供するXTREME DNA HPC CloudHirono Jumpei
 
20171128分散深層学習とChainerMNについて
20171128分散深層学習とChainerMNについて20171128分散深層学習とChainerMNについて
20171128分散深層学習とChainerMNについてPreferred Networks
 
[2016-12-01] DDBJデータ解析チャレンジ報告:機械学習コンペティションのタスク設計とルール設定
[2016-12-01] DDBJデータ解析チャレンジ報告:機械学習コンペティションのタスク設計とルール設定[2016-12-01] DDBJデータ解析チャレンジ報告:機械学習コンペティションのタスク設計とルール設定
[2016-12-01] DDBJデータ解析チャレンジ報告:機械学習コンペティションのタスク設計とルール設定Eli Kaminuma
 
VLDB'10勉強会 -Session 2-
VLDB'10勉強会 -Session 2-VLDB'10勉強会 -Session 2-
VLDB'10勉強会 -Session 2-Takeshi Yamamuro
 
[2016-06-06] CrowdR&D:クラウド協働評価のための参加型R&Dプロジェクト情報統合基盤
[2016-06-06] CrowdR&D:クラウド協働評価のための参加型R&Dプロジェクト情報統合基盤[2016-06-06] CrowdR&D:クラウド協働評価のための参加型R&Dプロジェクト情報統合基盤
[2016-06-06] CrowdR&D:クラウド協働評価のための参加型R&Dプロジェクト情報統合基盤Eli Kaminuma
 
論文紹介:Tracking Anything with Decoupled Video Segmentation
論文紹介:Tracking Anything with Decoupled Video Segmentation論文紹介:Tracking Anything with Decoupled Video Segmentation
論文紹介:Tracking Anything with Decoupled Video SegmentationToru Tamaki
 
深層学習 環境構築 Azure
深層学習 環境構築 Azure深層学習 環境構築 Azure
深層学習 環境構築 AzureYuki Hattori
 

Similar a Microsoft Azure上でのタンパク質間相互作用予測システムの並列計算と性能評価 (20)

SoCC12報告
SoCC12報告SoCC12報告
SoCC12報告
 
電子動力学アプリケーションの最適化2
電子動力学アプリケーションの最適化2電子動力学アプリケーションの最適化2
電子動力学アプリケーションの最適化2
 
Trainable Calibration Measures for Neural Networks from Kernel Mean Embeddings
Trainable Calibration Measures for Neural Networks from Kernel Mean EmbeddingsTrainable Calibration Measures for Neural Networks from Kernel Mean Embeddings
Trainable Calibration Measures for Neural Networks from Kernel Mean Embeddings
 
CNNの構造最適化手法(第3回3D勉強会)
CNNの構造最適化手法(第3回3D勉強会)CNNの構造最適化手法(第3回3D勉強会)
CNNの構造最適化手法(第3回3D勉強会)
 
Matlantis™のニューラルネットワークポテンシャルPFPの適用範囲拡張
Matlantis™のニューラルネットワークポテンシャルPFPの適用範囲拡張Matlantis™のニューラルネットワークポテンシャルPFPの適用範囲拡張
Matlantis™のニューラルネットワークポテンシャルPFPの適用範囲拡張
 
Top-K Off-Policy Correction for a REINFORCE Recommender System
Top-K Off-Policy Correction for a REINFORCE Recommender SystemTop-K Off-Policy Correction for a REINFORCE Recommender System
Top-K Off-Policy Correction for a REINFORCE Recommender System
 
20180723 PFNの研究基盤 / PFN research system infrastructure
20180723 PFNの研究基盤 / PFN research system infrastructure20180723 PFNの研究基盤 / PFN research system infrastructure
20180723 PFNの研究基盤 / PFN research system infrastructure
 
SIGBIO54: 生命情報解析分野におけるコンテナ型仮想化技術の動向と性能検証
SIGBIO54: 生命情報解析分野におけるコンテナ型仮想化技術の動向と性能検証SIGBIO54: 生命情報解析分野におけるコンテナ型仮想化技術の動向と性能検証
SIGBIO54: 生命情報解析分野におけるコンテナ型仮想化技術の動向と性能検証
 
[DDBJ Challenge 2016] 遺伝研スーパーコンピュータのビッグデータ解析環境
[DDBJ Challenge 2016] 遺伝研スーパーコンピュータのビッグデータ解析環境[DDBJ Challenge 2016] 遺伝研スーパーコンピュータのビッグデータ解析環境
[DDBJ Challenge 2016] 遺伝研スーパーコンピュータのビッグデータ解析環境
 
FastDepth: Fast Monocular Depth Estimation on Embedded Systems
FastDepth: Fast Monocular Depth Estimation on Embedded SystemsFastDepth: Fast Monocular Depth Estimation on Embedded Systems
FastDepth: Fast Monocular Depth Estimation on Embedded Systems
 
20180729 Preferred Networksの機械学習クラスタを支える技術
20180729 Preferred Networksの機械学習クラスタを支える技術20180729 Preferred Networksの機械学習クラスタを支える技術
20180729 Preferred Networksの機械学習クラスタを支える技術
 
NeurIPS2019参加報告
NeurIPS2019参加報告NeurIPS2019参加報告
NeurIPS2019参加報告
 
ChainerMNが即座に使える環境を提供するXTREME DNA HPC Cloud
ChainerMNが即座に使える環境を提供するXTREME DNA HPC CloudChainerMNが即座に使える環境を提供するXTREME DNA HPC Cloud
ChainerMNが即座に使える環境を提供するXTREME DNA HPC Cloud
 
20171128分散深層学習とChainerMNについて
20171128分散深層学習とChainerMNについて20171128分散深層学習とChainerMNについて
20171128分散深層学習とChainerMNについて
 
[2016-12-01] DDBJデータ解析チャレンジ報告:機械学習コンペティションのタスク設計とルール設定
[2016-12-01] DDBJデータ解析チャレンジ報告:機械学習コンペティションのタスク設計とルール設定[2016-12-01] DDBJデータ解析チャレンジ報告:機械学習コンペティションのタスク設計とルール設定
[2016-12-01] DDBJデータ解析チャレンジ報告:機械学習コンペティションのタスク設計とルール設定
 
VLDB'10勉強会 -Session 2-
VLDB'10勉強会 -Session 2-VLDB'10勉強会 -Session 2-
VLDB'10勉強会 -Session 2-
 
[2016-06-06] CrowdR&D:クラウド協働評価のための参加型R&Dプロジェクト情報統合基盤
[2016-06-06] CrowdR&D:クラウド協働評価のための参加型R&Dプロジェクト情報統合基盤[2016-06-06] CrowdR&D:クラウド協働評価のための参加型R&Dプロジェクト情報統合基盤
[2016-06-06] CrowdR&D:クラウド協働評価のための参加型R&Dプロジェクト情報統合基盤
 
論文紹介:Tracking Anything with Decoupled Video Segmentation
論文紹介:Tracking Anything with Decoupled Video Segmentation論文紹介:Tracking Anything with Decoupled Video Segmentation
論文紹介:Tracking Anything with Decoupled Video Segmentation
 
深層学習 環境構築 Azure
深層学習 環境構築 Azure深層学習 環境構築 Azure
深層学習 環境構築 Azure
 
StreamGraph
StreamGraphStreamGraph
StreamGraph
 

Más de Masahito Ohue

学振特別研究員になるために~2024年度申請版
 学振特別研究員になるために~2024年度申請版 学振特別研究員になるために~2024年度申請版
学振特別研究員になるために~2024年度申請版Masahito Ohue
 
学振特別研究員になるために~2023年度申請版
学振特別研究員になるために~2023年度申請版学振特別研究員になるために~2023年度申請版
学振特別研究員になるために~2023年度申請版Masahito Ohue
 
学振特別研究員になるために~2022年度申請版
学振特別研究員になるために~2022年度申請版学振特別研究員になるために~2022年度申請版
学振特別研究員になるために~2022年度申請版Masahito Ohue
 
第43回分子生物学会年会フォーラム2F-11「インシリコ創薬を支える最先端情報科学」から抜粋したAlphaFold2の話
第43回分子生物学会年会フォーラム2F-11「インシリコ創薬を支える最先端情報科学」から抜粋したAlphaFold2の話第43回分子生物学会年会フォーラム2F-11「インシリコ創薬を支える最先端情報科学」から抜粋したAlphaFold2の話
第43回分子生物学会年会フォーラム2F-11「インシリコ創薬を支える最先端情報科学」から抜粋したAlphaFold2の話Masahito Ohue
 
Learning-to-rank for ligand-based virtual screening
Learning-to-rank for ligand-based virtual screeningLearning-to-rank for ligand-based virtual screening
Learning-to-rank for ligand-based virtual screeningMasahito Ohue
 
Parallelized pipeline for whole genome shotgun metagenomics with GHOSTZ-GPU a...
Parallelized pipeline for whole genome shotgun metagenomics with GHOSTZ-GPU a...Parallelized pipeline for whole genome shotgun metagenomics with GHOSTZ-GPU a...
Parallelized pipeline for whole genome shotgun metagenomics with GHOSTZ-GPU a...Masahito Ohue
 
Molecular Activity Prediction Using Graph Convolutional Deep Neural Network C...
Molecular Activity Prediction Using Graph Convolutional Deep Neural Network C...Molecular Activity Prediction Using Graph Convolutional Deep Neural Network C...
Molecular Activity Prediction Using Graph Convolutional Deep Neural Network C...Masahito Ohue
 
学振特別研究員になるために~2020年度申請版
学振特別研究員になるために~2020年度申請版学振特別研究員になるために~2020年度申請版
学振特別研究員になるために~2020年度申請版Masahito Ohue
 
出会い系タンパク質を探す旅
出会い系タンパク質を探す旅出会い系タンパク質を探す旅
出会い系タンパク質を探す旅Masahito Ohue
 
学振特別研究員になるために~2019年度申請版
学振特別研究員になるために~2019年度申請版学振特別研究員になるために~2019年度申請版
学振特別研究員になるために~2019年度申請版Masahito Ohue
 
Link Mining for Kernel-based Compound-Protein Interaction Predictions Using a...
Link Mining for Kernel-based Compound-Protein Interaction Predictions Using a...Link Mining for Kernel-based Compound-Protein Interaction Predictions Using a...
Link Mining for Kernel-based Compound-Protein Interaction Predictions Using a...Masahito Ohue
 
Finding correct protein–protein docking models using ProQDock (ISMB2016読み会, 大上)
Finding correct protein–protein docking models using ProQDock (ISMB2016読み会, 大上)Finding correct protein–protein docking models using ProQDock (ISMB2016読み会, 大上)
Finding correct protein–protein docking models using ProQDock (ISMB2016読み会, 大上)Masahito Ohue
 
ISMB/ECCB2015読み会:大上
ISMB/ECCB2015読み会:大上ISMB/ECCB2015読み会:大上
ISMB/ECCB2015読み会:大上Masahito Ohue
 
学振特別研究員になるために~知っておくべき10のTips~[平成28年度申請版]
学振特別研究員になるために~知っておくべき10のTips~[平成28年度申請版]学振特別研究員になるために~知っておくべき10のTips~[平成28年度申請版]
学振特別研究員になるために~知っておくべき10のTips~[平成28年度申請版]Masahito Ohue
 
IIBMP2014 Lightning Talk - MEGADOCK 4.0
IIBMP2014 Lightning Talk - MEGADOCK 4.0IIBMP2014 Lightning Talk - MEGADOCK 4.0
IIBMP2014 Lightning Talk - MEGADOCK 4.0Masahito Ohue
 
PrePPI: structure-based protein-protein interaction prediction
PrePPI: structure-based protein-protein interaction predictionPrePPI: structure-based protein-protein interaction prediction
PrePPI: structure-based protein-protein interaction predictionMasahito Ohue
 
Protein-protein docking-based virtual screening
Protein-protein docking-based virtual screeningProtein-protein docking-based virtual screening
Protein-protein docking-based virtual screeningMasahito Ohue
 
Protein-Protein Interaction Prediction Based on Template-Based and de Novo Do...
Protein-Protein Interaction Prediction Based on Template-Based and de Novo Do...Protein-Protein Interaction Prediction Based on Template-Based and de Novo Do...
Protein-Protein Interaction Prediction Based on Template-Based and de Novo Do...Masahito Ohue
 

Más de Masahito Ohue (20)

学振特別研究員になるために~2024年度申請版
 学振特別研究員になるために~2024年度申請版 学振特別研究員になるために~2024年度申請版
学振特別研究員になるために~2024年度申請版
 
学振特別研究員になるために~2023年度申請版
学振特別研究員になるために~2023年度申請版学振特別研究員になるために~2023年度申請版
学振特別研究員になるために~2023年度申請版
 
学振特別研究員になるために~2022年度申請版
学振特別研究員になるために~2022年度申請版学振特別研究員になるために~2022年度申請版
学振特別研究員になるために~2022年度申請版
 
第43回分子生物学会年会フォーラム2F-11「インシリコ創薬を支える最先端情報科学」から抜粋したAlphaFold2の話
第43回分子生物学会年会フォーラム2F-11「インシリコ創薬を支える最先端情報科学」から抜粋したAlphaFold2の話第43回分子生物学会年会フォーラム2F-11「インシリコ創薬を支える最先端情報科学」から抜粋したAlphaFold2の話
第43回分子生物学会年会フォーラム2F-11「インシリコ創薬を支える最先端情報科学」から抜粋したAlphaFold2の話
 
Learning-to-rank for ligand-based virtual screening
Learning-to-rank for ligand-based virtual screeningLearning-to-rank for ligand-based virtual screening
Learning-to-rank for ligand-based virtual screening
 
Parallelized pipeline for whole genome shotgun metagenomics with GHOSTZ-GPU a...
Parallelized pipeline for whole genome shotgun metagenomics with GHOSTZ-GPU a...Parallelized pipeline for whole genome shotgun metagenomics with GHOSTZ-GPU a...
Parallelized pipeline for whole genome shotgun metagenomics with GHOSTZ-GPU a...
 
Molecular Activity Prediction Using Graph Convolutional Deep Neural Network C...
Molecular Activity Prediction Using Graph Convolutional Deep Neural Network C...Molecular Activity Prediction Using Graph Convolutional Deep Neural Network C...
Molecular Activity Prediction Using Graph Convolutional Deep Neural Network C...
 
学振特別研究員になるために~2020年度申請版
学振特別研究員になるために~2020年度申請版学振特別研究員になるために~2020年度申請版
学振特別研究員になるために~2020年度申請版
 
出会い系タンパク質を探す旅
出会い系タンパク質を探す旅出会い系タンパク質を探す旅
出会い系タンパク質を探す旅
 
学振特別研究員になるために~2019年度申請版
学振特別研究員になるために~2019年度申請版学振特別研究員になるために~2019年度申請版
学振特別研究員になるために~2019年度申請版
 
Link Mining for Kernel-based Compound-Protein Interaction Predictions Using a...
Link Mining for Kernel-based Compound-Protein Interaction Predictions Using a...Link Mining for Kernel-based Compound-Protein Interaction Predictions Using a...
Link Mining for Kernel-based Compound-Protein Interaction Predictions Using a...
 
Finding correct protein–protein docking models using ProQDock (ISMB2016読み会, 大上)
Finding correct protein–protein docking models using ProQDock (ISMB2016読み会, 大上)Finding correct protein–protein docking models using ProQDock (ISMB2016読み会, 大上)
Finding correct protein–protein docking models using ProQDock (ISMB2016読み会, 大上)
 
ISMB/ECCB2015読み会:大上
ISMB/ECCB2015読み会:大上ISMB/ECCB2015読み会:大上
ISMB/ECCB2015読み会:大上
 
学振特別研究員になるために~知っておくべき10のTips~[平成28年度申請版]
学振特別研究員になるために~知っておくべき10のTips~[平成28年度申請版]学振特別研究員になるために~知っておくべき10のTips~[平成28年度申請版]
学振特別研究員になるために~知っておくべき10のTips~[平成28年度申請版]
 
IIBMP2014 Lightning Talk - MEGADOCK 4.0
IIBMP2014 Lightning Talk - MEGADOCK 4.0IIBMP2014 Lightning Talk - MEGADOCK 4.0
IIBMP2014 Lightning Talk - MEGADOCK 4.0
 
PrePPI: structure-based protein-protein interaction prediction
PrePPI: structure-based protein-protein interaction predictionPrePPI: structure-based protein-protein interaction prediction
PrePPI: structure-based protein-protein interaction prediction
 
Protein-protein docking-based virtual screening
Protein-protein docking-based virtual screeningProtein-protein docking-based virtual screening
Protein-protein docking-based virtual screening
 
Protein-Protein Interaction Prediction Based on Template-Based and de Novo Do...
Protein-Protein Interaction Prediction Based on Template-Based and de Novo Do...Protein-Protein Interaction Prediction Based on Template-Based and de Novo Do...
Protein-Protein Interaction Prediction Based on Template-Based and de Novo Do...
 
PRML Chapter 14
PRML Chapter 14PRML Chapter 14
PRML Chapter 14
 
W8PRML5.1-5.3
W8PRML5.1-5.3W8PRML5.1-5.3
W8PRML5.1-5.3
 

Microsoft Azure上でのタンパク質間相互作用予測システムの並列計算と性能評価

  • 1. Microsoft Azure上でのタンパク質間相互作用 予測システムの並列計算と性能評価 1 東京工業大学 情報理工学院 情報工学系 2 東京工業大学 情報生命博士教育院 情報処理学会 第49回バイオ情報学研究会 (4) 2017年3月23日(木) 於 北陸先端科学技術大学院大学 大上 雅史1 山本 悠生1,2 秋山 泰1,2
  • 2. • パブリッククラウド – 利点 • 利用料金を払えば誰でも利用可能、運用はアウトソース • 環境や資源を共有するしくみが充実 • 計算資源の増減が簡単 パブリッククラウドの普及 2017/3/23 49 (4)第 回バイオ情報学研究会 大上雅史 2
  • 3. パブリッククラウド上での並列計算の例 2017/3/23 49 (4)第 回バイオ情報学研究会 大上雅史 • タンパク質の類似構造検索タスク。 • Searcher role 6台まで、ほぼリニアに高速化。 • Searcher role 8台超で性能低下するも、 18台でも約89%の効率。 Searcher roleの数 Speedup Mrozek D, et al. Cloud4Psi: cloud computing for 3D protein structure similarity searching. Bioinformatics 2014, 30: 2822-2825. Fig. 1 Fig. 2(a) 3 仮想マシン (VM)
  • 4. タンパク質間相互作用予測ソフトウェア MEGADOCK • MEGADOCK – 入力された2つのタンパク質立体構造に対し、相互作用の有無を予測 – 剛体モデルを組合せて評価値の良い複合体構造をサンプリングし、 それらの評価値に基づいて予測 – 計算の大部分(約80%)はFFT (高速フーリエ変換) 2017/3/23 49 (4)第 回バイオ情報学研究会 大上雅史 0.2% 0.1% 6.9% 37.5% 14.7% 38.4% 2.2% Receptor ボクセル化 Receptor FFT Ligand ボクセル化 Ligand FFT 複素畳込み 逆FFT その他 4 Ohue M, et al. Bioinformatics, 30 (2014), Ohue M, et al. Prot Pept Lett, 21 (2014)
  • 5. MEGADOCKのコアの部分 2017/3/23 49 (4)第 回バイオ情報学研究会 大上雅史 タンパク質が結合したときの評価値を高速に評価 5 Katzhalski-Katzir E, et al. Proc Natl Acad Sci (1992), 89(6): 2195–2199.
  • 6. 本研究の目的 • Microsoft Azure上でMEGADOCKの並列計算を実施 – Azure上の複数のVMを用い、MPIによって計算を並列実行 – 数十VM規模での性能を計測 – 特に、GPU付きVMに注目 2017/3/23 49 (4)第 回バイオ情報学研究会 大上雅史 6 Instance CPU GPU(*) RAM Network 価格 NC24 24コア Tesla K80 x 4 1,440 GB 440.65円/h NC24r 24コア Tesla K80 x 4 1,440 GB RDMA (InfiniBand) 484.71円/h DS14 16コア なし 112 GB 141.48円/h A9 16コア なし 112 GB RDMA (InfiniBand) 197.06円/h H16 16コア なし 112 GB 178.50円/h H16r 16コア なし 112 GB RDMA (InfiniBand) 195.84円/h Azureの代表的なインスタンス(VMの種類) (*)ただし、物理的にはK80が2枚。 (K80は1枚の中に2つのGPUチップを含む)
  • 7. • MEGADOCKは既にGPUクラスタ向け並列化が実装済 – プロセス単位でMasterとWorkerに資源を割り当て – Masterがタンパク質ペアをWorkerに渡し、Workerが計算 – GPUはWorkerが使用 マルチGPUノード並列 2017/3/23 49 (4)第 回バイオ情報学研究会 大上雅史 Ohue M, Shimoda T, Suzuki S, Ishida T, Akiyama Y. Bioinformatics, 30(22): 2014. 7
  • 8. Azureへの実装 2017/3/23 49 (4)第 回バイオ情報学研究会 大上雅史 Azure上のシステム構成 概要 • Masterプロセス(1つ)が タンパク質ペアをWorkerに割り当て。 • 各VMのWorkerプロセスが 割り当てられたペアの予測計算を実施。 8
  • 9. 並列化粒度 2017/3/23 49 (4)第 回バイオ情報学研究会 大上雅史 VM 1 VM 2 VM 3 VM n 9 • プロセス並列とスレッド並列の粒度を決める – これまでのクラスタ上での実装の場合、 主にメモリ制限のため、各ノード・1プロセスとしていた。 – 最近のクラウドのVMはメモリが豊富。 – (今回対象の)GPUインスタンスはGPUチップが4枚/VM → 本研究では、各VM 4プロセスずつ割り当てた。
  • 10. 評価実験 • データセット – ZDOCK Docking Benchmark 1.0 の 59タンパク質ペアの相手を入れ替えた全組み合わせ → 59×59 = 3,481件の予測計算 • 使用インスタンス • VM内の実行プロセス – 各VMに4プロセス – Masterを1つ立てる – Worker: 6 CPUコア+1 GPU 2017/3/23 49 (4)第 回バイオ情報学研究会 大上雅史 Instance CPU GPU(*) RAM Network 価格 NC24 24コア Tesla K80 x 4 1,440 GB 440.65円/h NC24r 24コア Tesla K80 x 4 1,440 GB RDMA (InfiniBand) 484.71円/h (Chen R, Proteins 47, 2002) (*)ただし、物理的にはK80が2枚。 (K80は1枚の中に2つのGPUチップを含む) 10
  • 11. GPUインスタンスでの測定結果 2017/3/23 49 (4)第 回バイオ情報学研究会 大上雅史 0 50 100 150 200 250 300 350 Speedup(#pair/min) NC24r 測定値 NC24 測定値 0 5 10 15 20 25 0 120 240 360 480 600 0 20 40 60 80 100 #Virtual Machines #CPU cores #Tesla K80 GPUs NC24 CPUのみ NC24r CPUのみ ● ● 3.8倍の高速化 Strong scaling = 89% (対#VM=5値) #VM=22 #VM=20 #VM=10 #VM=5 (NC24 CPU→GPU) 11 ※マイクロソフトのクオータコア制限のため、最大22VMまで測定。 ・89%の並列化効率(強スケーリング)を達成 ・GPUを使わずに計算した場合に比べて3.8倍高速
  • 12. GPUの効果 • GPUインスタンスの費用対効果 2017/3/23 49 (4)第 回バイオ情報学研究会 大上雅史 Instance CPU GPU Network 価格 NC24 E5-2690v3 24コア Tesla K80 x 4 440.65円/h NC24r E5-2690v3 24コア Tesla K80 x 4 RDMA (InfiniBand) 484.71円/h A9 E5-2670 16コア なし RDMA (InfiniBand) 197.06円/h NC24rとA9を比較 ・A9を1.5倍して、24コア→295.59円/hと見積もり。 ・NC24r 484.71円/h ÷ 295.59円/h ≒ 1.64 →GPUによる高速化率が1.64倍以上ならば、GPUインスタンスが 得。 今回の場合、GPU利用時で3.8倍高速だったので、 MEGADOCKにおいてはGPUインスタンスの利用が推奨される。 12
  • 13. まとめ • MEGADOCKをAzure上に移植、AzureのGPUインスタンス を用いた並列実行を実施し、その性能を評価した。 – 89%の並列化効率 (NC24, 5 VM → 22 VM) – GPUによる3.8倍の高速化 (NC24, CPU → CPU+GPU) – InfiniBandはMEGADOCKの計算にはほとんど寄与しない – クオータコア制限が41 VMまで緩和されたので、今後測定を実施 – コンテナ型仮想化技術を用いた場合の検証も今後の課題 • 謝辞 – JSPS科研費 (24240044, 15K16081) – JST CREST (Extreme Big Dataプロジェクト) – JSTリサーチコンプレックス推進プログラム 川崎市殿町拠点 – Microsoft Business Investment Funding – ㈱リバネス 第30回リバネス研究費 (日本マイクロソフト賞) 2017/3/23 49 (4)第 回バイオ情報学研究会 大上雅史 13 (3) 15:50-16:15 コンテナ型仮想化による分散計算環境におけるタンパク質間相互作用予測システムの性能評価 青山 健人、山本 悠生、大上 雅史、秋山 泰