SlideShare una empresa de Scribd logo
1 de 19
The architecture of Deep Learning web services
自己紹介
• 長尾 太介 ( Daisuke Nagao )
• 2002 – 2015: Fujixerox, 粉体シミュレータの開発, HPC on AWS の導入/構築
• 2015 - 現在 : NVIDIA, クラウドビジネスデベロップメント
Learning system requires HPC architecture.
Inference system requires Web architecture.
My messages (Deep learning web services)
NVIDIA’s deep learning strategy intends for large-scale data center.
If you want to build the services on a cloud such as AWS, you can have other way.
長尾の個人的見解ですが・・
ここからはNVIDIAが提供する
Deep Learning 環境の説明
For example
container shipmite Motor scooter leopard
画像のタグ付け・・・・
Learning
Neural Network
Structure
Inference
Learning: HPC Architecture Inference: Web Architecture
BIGDATA Labels
Deploy a trained
Network
apple Orange strawberryBanana
Deep Learning web services require two system.
Require real time processRequire Many Core, BIGDATA analysis
API Micro
Service
• マイクロサービスを提供する
• ~250μs response time
• リクエストを常時待ちうけ。
• 数日間、CPU and/or GPUの負荷がほぼ100%で動作する。マル
チノード、マルチGPUに対応
• ジョブを走らせているときのみ計算ノードを利用
Learning
Neural Network
Structure
Inference
Learning: HPC Architecture Inference: Web Architecture
BIGDATA Labels
Deploy a trained
Network
apple Orange strawberryBanana
Deep Learning web services require two system.
Require real time processRequire Many Core, BIGDATA analysis
API Micro
Service
Learningに適したGPU 推論に適したGPU
Learning
Neural Network
Structure
Inference
Learning: HPC Architecture Inference: Web Architecture
BIGDATA Labels
Deploy a trained
Network
apple Orange strawberryBanana
Require real time processRequire Many Core, BIGDATA analysis
API Micro
Service
nvidia-docker
• There are many Deep Learning framework and version.
• Need to deploy the trained network to Inference server.
Neural Network
Structure
Learning: HPC Architecture Inference: Web Architecture
BIGDATA Labels
Deploy a trained
Network
apple Orange strawberryBanana
Require real time processRequire Many Core, BIGDATA analysis
API
Learning Inference
nvidia-docker
• There are many Deep Learning framework and version.
• Need to deploy the trained network to Inference server.
Docker
Registry
PUSH PULL
Micro
Service
Learning
Neural Network
Structure
Inference
Learning: HPC Architecture Inference: Web Architecture
BIGDATA Labels
Deploy a trained
Network
apple Orange strawberryBanana
Require real time processRequire Many Core, BIGDATA analysis
API
GPU Rest Engine is template written by go-lang to launch the micro-service.
This template launch webserver with the port number that is set by admin.
GPU Rest EngineDocker
Registry
https://github.com/NVIDIA/gpu-rest-engine
GPU Rest Engine & Nvidia Docker
Software stack
GPU2 GPU3 GPU4 GPU6 GPU7
NVIDIA CUDA Driver
Docker Engine
GPU0 GPU1 GPU0 GPU1 GPU2 GPU0 GPU1 GPU2
GPU5
GPU Rest Engine
Golang
GPU Rest Engine
Golang
GPU Rest Engine
Golang
Golang
net/http
Golang
net/http
Golang
net/http
Application1 Application2
Application
3
GPU0 GPU1
Docker container1
Host PC
Docker container2 Docker container2
http://qiita.com/daikumatan/items/2efa5dbbf7276e1e017d
Neural Network
Structure
Learning: HPC Architecture Inference: Web Architecture
BIGDATA Labels
Deploy a trained
Network
apple Orange strawberryBanana
Require real time processRequire Many Core, BIGDATA analysis
API
ついに HPC でも Docker が! How deploy your apps?Mesos can give an abstract of datacenter with both HPC and Webserver
Submit Job Daemon
Learning Inference
GPU Rest EngineDocker
Registry
Deep learning services on AWS
もしAWSのみで環境を構築するならば・・・
Neural Network
Structure
Learning: HPC Architecture Inference: Web Architecture
BIGDATA
Labels
Deploy a
trained
Network
apple Orange strawberryBanana
Require real time processRequire Many Core, BIGDATA analysis
API
ついに HPC でも Docker が! How deploy your apps?
Learning Inference
AWS Elastic
Beanstalk
bucket
cfncluster
Amazon
DynamoDB
Amazon
DynamoDB
bucket
Meta Data
Amazon API
Gateway
Submit Job Daemon
HPC on AWS 用ミドルウェア
• HPC Clusterの動的作成・削除・管理
• スケジューリング機能
Neural Network
Structure
Learning: HPC Architecture Inference: Web Architecture
BIGDATA
Labels
Deploy a
trained
Network
apple Orange strawberryBanana
Require real time processRequire Many Core, BIGDATA analysis
API
ついに HPC でも Docker が! How deploy your apps?
Learning Inference
AWS Elastic
Beanstalk
bucket
cfncluster
Amazon
DynamoDB
Amazon
DynamoDB
bucket
Meta Data
Amazon API
Gateway
学習もAPI起動するなら、
ジョブ管理ソフトをキッ
クするよう構成
Submit Job Daemon
Amazon API
Gateway
Cfncluster
• インスタンスの起動・ターミネート、スケージューリングの役目を担う
• これがあることで、多数のリクエストを適切に処理できる。必要なとき
に必要なだけGPUインスタンスを使うことができる
トレーニングデータ
Labels
メタ情報
cfncluster
まとめ
• HPC屋はWebのアーキテクチャー、Web屋はHPCのアーキテクチャーを知る
必要がある
• Deep Learningを行う上で、NVIDIAはキープレイヤーではあるが、データセ
ンター事業者向けアーキと推測。GPUを売る会社なので当然・・・
• AWS上にサービスをすべて乗っける場合など、使用する環境にあった、
アーキを構築すべき

Más contenido relacionado

La actualidad más candente

帰ってきた インフラ野郎 Azureチーム ~Azure データセンターテクノロジー解体新書2018春~ - de:code2018
帰ってきた インフラ野郎 Azureチーム ~Azure データセンターテクノロジー解体新書2018春~ - de:code2018帰ってきた インフラ野郎 Azureチーム ~Azure データセンターテクノロジー解体新書2018春~ - de:code2018
帰ってきた インフラ野郎 Azureチーム ~Azure データセンターテクノロジー解体新書2018春~ - de:code2018
Toru Makabe
 

La actualidad más candente (20)

半日でわかる コンテナー技術 (応用編)
半日でわかる コンテナー技術 (応用編)半日でわかる コンテナー技術 (応用編)
半日でわかる コンテナー技術 (応用編)
 
Dell EMC の Azure Stack と GPU
Dell EMC の Azure Stack と GPUDell EMC の Azure Stack と GPU
Dell EMC の Azure Stack と GPU
 
今改めて学ぶ Microsoft Azure 基礎知識
今改めて学ぶ Microsoft Azure 基礎知識今改めて学ぶ Microsoft Azure 基礎知識
今改めて学ぶ Microsoft Azure 基礎知識
 
20190410 azure stackhci-hybridstrategy
20190410 azure stackhci-hybridstrategy20190410 azure stackhci-hybridstrategy
20190410 azure stackhci-hybridstrategy
 
帰ってきた インフラ野郎 Azureチーム ~Azure データセンターテクノロジー解体新書2018春~ - de:code2018
帰ってきた インフラ野郎 Azureチーム ~Azure データセンターテクノロジー解体新書2018春~ - de:code2018帰ってきた インフラ野郎 Azureチーム ~Azure データセンターテクノロジー解体新書2018春~ - de:code2018
帰ってきた インフラ野郎 Azureチーム ~Azure データセンターテクノロジー解体新書2018春~ - de:code2018
 
俺とHashiCorp
俺とHashiCorp俺とHashiCorp
俺とHashiCorp
 
20190705 mas ken_azure_stack
20190705 mas ken_azure_stack20190705 mas ken_azure_stack
20190705 mas ken_azure_stack
 
No-Ops で大量データ処理基盤を簡単に実現する
No-Ops で大量データ処理基盤を簡単に実現するNo-Ops で大量データ処理基盤を簡単に実現する
No-Ops で大量データ処理基盤を簡単に実現する
 
ついに上陸!PaaS 最新兵器のご紹介
ついに上陸!PaaS 最新兵器のご紹介ついに上陸!PaaS 最新兵器のご紹介
ついに上陸!PaaS 最新兵器のご紹介
 
9/16 Tokyo Apache Drill Meetup - drill vs sparksql
9/16 Tokyo Apache Drill Meetup - drill vs sparksql9/16 Tokyo Apache Drill Meetup - drill vs sparksql
9/16 Tokyo Apache Drill Meetup - drill vs sparksql
 
Open stack活用に求められる人材と育成について2017 0314
Open stack活用に求められる人材と育成について2017 0314Open stack活用に求められる人材と育成について2017 0314
Open stack活用に求められる人材と育成について2017 0314
 
インフラ野郎 Azureチーム at クラウド boost
インフラ野郎 Azureチーム at クラウド boostインフラ野郎 Azureチーム at クラウド boost
インフラ野郎 Azureチーム at クラウド boost
 
15分でお届けする Elastic Stack on Azure 設計・構築ノウハウ
15分でお届けする Elastic Stack on Azure 設計・構築ノウハウ15分でお届けする Elastic Stack on Azure 設計・構築ノウハウ
15分でお届けする Elastic Stack on Azure 設計・構築ノウハウ
 
de:code 2019 Cloud トラック 総まとめ! 完全版
de:code 2019 Cloud トラック 総まとめ! 完全版de:code 2019 Cloud トラック 総まとめ! 完全版
de:code 2019 Cloud トラック 総まとめ! 完全版
 
de:code 2019 Cloud トラック 総まとめ!
de:code 2019 Cloud トラック 総まとめ!de:code 2019 Cloud トラック 総まとめ!
de:code 2019 Cloud トラック 総まとめ!
 
クラウドネイティブガバナンスの実現
クラウドネイティブガバナンスの実現クラウドネイティブガバナンスの実現
クラウドネイティブガバナンスの実現
 
俺的 Ignite update 萌えポイント portal&arm, compute, network -
俺的 Ignite update 萌えポイント   portal&arm, compute, network -俺的 Ignite update 萌えポイント   portal&arm, compute, network -
俺的 Ignite update 萌えポイント portal&arm, compute, network -
 
Japan GPU-Accelerated VDI Community 2016/11/21
Japan GPU-Accelerated VDI Community 2016/11/21Japan GPU-Accelerated VDI Community 2016/11/21
Japan GPU-Accelerated VDI Community 2016/11/21
 
AWS re:Invent 2018 re:Cap
AWS re:Invent 2018 re:CapAWS re:Invent 2018 re:Cap
AWS re:Invent 2018 re:Cap
 
20170902 kixs azure&azure stack
20170902 kixs azure&azure stack20170902 kixs azure&azure stack
20170902 kixs azure&azure stack
 

Destacado

APIを叩くだけでない、Deep Learning on AWS で自分だけの学習モデルを作ろう! by JAWS-UG AI支部
APIを叩くだけでない、Deep Learning on AWS で自分だけの学習モデルを作ろう! by JAWS-UG AI支部APIを叩くだけでない、Deep Learning on AWS で自分だけの学習モデルを作ろう! by JAWS-UG AI支部
APIを叩くだけでない、Deep Learning on AWS で自分だけの学習モデルを作ろう! by JAWS-UG AI支部
Daisuke Nagao
 
Multi-faceted Classification of Big Data Use Cases and Proposed Architecture ...
Multi-faceted Classification of Big Data Use Cases and Proposed Architecture ...Multi-faceted Classification of Big Data Use Cases and Proposed Architecture ...
Multi-faceted Classification of Big Data Use Cases and Proposed Architecture ...
Geoffrey Fox
 
Introducing natural language processing(NLP) with r
Introducing natural language processing(NLP) with rIntroducing natural language processing(NLP) with r
Introducing natural language processing(NLP) with r
Vivian S. Zhang
 

Destacado (20)

APIを叩くだけでない、Deep Learning on AWS で自分だけの学習モデルを作ろう! by JAWS-UG AI支部
APIを叩くだけでない、Deep Learning on AWS で自分だけの学習モデルを作ろう! by JAWS-UG AI支部APIを叩くだけでない、Deep Learning on AWS で自分だけの学習モデルを作ろう! by JAWS-UG AI支部
APIを叩くだけでない、Deep Learning on AWS で自分だけの学習モデルを作ろう! by JAWS-UG AI支部
 
Deploying deep learning models with Docker and Kubernetes
Deploying deep learning models with Docker and KubernetesDeploying deep learning models with Docker and Kubernetes
Deploying deep learning models with Docker and Kubernetes
 
投資会社から見た人工知能(Ai)の事業化トレンド
投資会社から見た人工知能(Ai)の事業化トレンド投資会社から見た人工知能(Ai)の事業化トレンド
投資会社から見た人工知能(Ai)の事業化トレンド
 
[Developers Summit 2017] MicrosoftのAI開発機能/サービス
[Developers Summit 2017] MicrosoftのAI開発機能/サービス[Developers Summit 2017] MicrosoftのAI開発機能/サービス
[Developers Summit 2017] MicrosoftのAI開発機能/サービス
 
サーバーレスの今とこれから
サーバーレスの今とこれからサーバーレスの今とこれから
サーバーレスの今とこれから
 
CarlotaPortfolioX
CarlotaPortfolioXCarlotaPortfolioX
CarlotaPortfolioX
 
CfnClusterを使って10分強でHPC環境を構築する
CfnClusterを使って10分強でHPC環境を構築するCfnClusterを使って10分強でHPC環境を構築する
CfnClusterを使って10分強でHPC環境を構築する
 
Count-Min Tree Sketch : Approximate counting for NLP tasks
Count-Min Tree Sketch : Approximate counting for NLP tasksCount-Min Tree Sketch : Approximate counting for NLP tasks
Count-Min Tree Sketch : Approximate counting for NLP tasks
 
Archi office brochure 2016
Archi office brochure   2016Archi office brochure   2016
Archi office brochure 2016
 
NLP from scratch
NLP from scratch NLP from scratch
NLP from scratch
 
Swapout
SwapoutSwapout
Swapout
 
Layers in Deep Learning & Caffe layers (model architecture )
Layers in Deep Learning&Caffe layers (model architecture )Layers in Deep Learning&Caffe layers (model architecture )
Layers in Deep Learning & Caffe layers (model architecture )
 
Multi-faceted Classification of Big Data Use Cases and Proposed Architecture ...
Multi-faceted Classification of Big Data Use Cases and Proposed Architecture ...Multi-faceted Classification of Big Data Use Cases and Proposed Architecture ...
Multi-faceted Classification of Big Data Use Cases and Proposed Architecture ...
 
ArchiMate® 3.0 - Trick or Treat?
ArchiMate® 3.0 - Trick or Treat?ArchiMate® 3.0 - Trick or Treat?
ArchiMate® 3.0 - Trick or Treat?
 
hands on: Text Mining With R
hands on: Text Mining With Rhands on: Text Mining With R
hands on: Text Mining With R
 
機械の代わりに人間が学習入門
機械の代わりに人間が学習入門機械の代わりに人間が学習入門
機械の代わりに人間が学習入門
 
適度に弱い敵aiの作り方
適度に弱い敵aiの作り方適度に弱い敵aiの作り方
適度に弱い敵aiの作り方
 
セキュリティとAI
 -最後にヘヴィメタルとAI-
セキュリティとAI
 -最後にヘヴィメタルとAI-セキュリティとAI
 -最後にヘヴィメタルとAI-
セキュリティとAI
 -最後にヘヴィメタルとAI-
 
Introducing natural language processing(NLP) with r
Introducing natural language processing(NLP) with rIntroducing natural language processing(NLP) with r
Introducing natural language processing(NLP) with r
 
Natural Language Processing in R (rNLP)
Natural Language Processing in R (rNLP)Natural Language Processing in R (rNLP)
Natural Language Processing in R (rNLP)
 

Similar a 2016 06-30-deep-learning-archi

20130714 July Tech Festa 日本CloudStackユーザー会
20130714 July Tech Festa 日本CloudStackユーザー会20130714 July Tech Festa 日本CloudStackユーザー会
20130714 July Tech Festa 日本CloudStackユーザー会
samemoon
 
Dockerの利用事例
Dockerの利用事例Dockerの利用事例
Dockerの利用事例
maebashi
 
Cloudstack user group meeting in osaka
Cloudstack user group meeting in osakaCloudstack user group meeting in osaka
Cloudstack user group meeting in osaka
Naotaka Jay HOTTA
 
20130803 OSC@Kyoto CloudStackユーザー会
20130803 OSC@Kyoto CloudStackユーザー会20130803 OSC@Kyoto CloudStackユーザー会
20130803 OSC@Kyoto CloudStackユーザー会
samemoon
 

Similar a 2016 06-30-deep-learning-archi (20)

AWSにおけるIaCを活かしたTerraformの使い方2選! ~循環型IaCとマルチクラウドチックなDR環境~ (HashiTalks: Japan 発...
AWSにおけるIaCを活かしたTerraformの使い方2選! ~循環型IaCとマルチクラウドチックなDR環境~ (HashiTalks: Japan 発...AWSにおけるIaCを活かしたTerraformの使い方2選! ~循環型IaCとマルチクラウドチックなDR環境~ (HashiTalks: Japan 発...
AWSにおけるIaCを活かしたTerraformの使い方2選! ~循環型IaCとマルチクラウドチックなDR環境~ (HashiTalks: Japan 発...
 
GPU と PYTHON と、それから最近の NVIDIA
GPU と PYTHON と、それから最近の NVIDIAGPU と PYTHON と、それから最近の NVIDIA
GPU と PYTHON と、それから最近の NVIDIA
 
Singularity Containers for Enterprise Use
Singularity Containers for Enterprise UseSingularity Containers for Enterprise Use
Singularity Containers for Enterprise Use
 
【初心者向け】API を使ってクラウドの管理を自動化しよう
【初心者向け】API を使ってクラウドの管理を自動化しよう【初心者向け】API を使ってクラウドの管理を自動化しよう
【初心者向け】API を使ってクラウドの管理を自動化しよう
 
Watsonをささえる ハイパフォーマンスクラウドで はじめるDeep Learning
Watsonをささえる ハイパフォーマンスクラウドで はじめるDeep LearningWatsonをささえる ハイパフォーマンスクラウドで はじめるDeep Learning
Watsonをささえる ハイパフォーマンスクラウドで はじめるDeep Learning
 
NVIDIA 入門
NVIDIA 入門NVIDIA 入門
NVIDIA 入門
 
20130714 July Tech Festa 日本CloudStackユーザー会
20130714 July Tech Festa 日本CloudStackユーザー会20130714 July Tech Festa 日本CloudStackユーザー会
20130714 July Tech Festa 日本CloudStackユーザー会
 
Open Source x AI
Open Source x AIOpen Source x AI
Open Source x AI
 
Osc fukuoka xAI Meetup
Osc fukuoka xAI MeetupOsc fukuoka xAI Meetup
Osc fukuoka xAI Meetup
 
JAWS目黒 EC2チューニングTips #jawsmeguro #jawsug
JAWS目黒 EC2チューニングTips #jawsmeguro #jawsugJAWS目黒 EC2チューニングTips #jawsmeguro #jawsug
JAWS目黒 EC2チューニングTips #jawsmeguro #jawsug
 
GPU Container as a Service を実現するための最新OSS徹底比較
GPU Container as a Service を実現するための最新OSS徹底比較GPU Container as a Service を実現するための最新OSS徹底比較
GPU Container as a Service を実現するための最新OSS徹底比較
 
Dockerの利用事例
Dockerの利用事例Dockerの利用事例
Dockerの利用事例
 
Cloudstack user group meeting in osaka
Cloudstack user group meeting in osakaCloudstack user group meeting in osaka
Cloudstack user group meeting in osaka
 
Gmo media.inc 第9回西日本ossの普及を考える会
Gmo media.inc 第9回西日本ossの普及を考える会Gmo media.inc 第9回西日本ossの普及を考える会
Gmo media.inc 第9回西日本ossの普及を考える会
 
Hybrid cloud fj-20190704_final
Hybrid cloud fj-20190704_finalHybrid cloud fj-20190704_final
Hybrid cloud fj-20190704_final
 
20130803 OSC@Kyoto CloudStackユーザー会
20130803 OSC@Kyoto CloudStackユーザー会20130803 OSC@Kyoto CloudStackユーザー会
20130803 OSC@Kyoto CloudStackユーザー会
 
MEC (Mobile Edge Computing) + GPUコンピューティングについて
MEC (Mobile Edge Computing) + GPUコンピューティングについてMEC (Mobile Edge Computing) + GPUコンピューティングについて
MEC (Mobile Edge Computing) + GPUコンピューティングについて
 
ゲームのインフラをAwsで実戦tips全て見せます
ゲームのインフラをAwsで実戦tips全て見せますゲームのインフラをAwsで実戦tips全て見せます
ゲームのインフラをAwsで実戦tips全て見せます
 
GPU Container as a Serviceを実現するための最新OSS徹底比較 - OpenStack最新情報セミナー 2017年7月
GPU Container as a Serviceを実現するための最新OSS徹底比較 - OpenStack最新情報セミナー 2017年7月GPU Container as a Serviceを実現するための最新OSS徹底比較 - OpenStack最新情報セミナー 2017年7月
GPU Container as a Serviceを実現するための最新OSS徹底比較 - OpenStack最新情報セミナー 2017年7月
 
10th jan 2013_miyazaki
10th jan 2013_miyazaki10th jan 2013_miyazaki
10th jan 2013_miyazaki
 

2016 06-30-deep-learning-archi

  • 1. The architecture of Deep Learning web services
  • 2. 自己紹介 • 長尾 太介 ( Daisuke Nagao ) • 2002 – 2015: Fujixerox, 粉体シミュレータの開発, HPC on AWS の導入/構築 • 2015 - 現在 : NVIDIA, クラウドビジネスデベロップメント
  • 3. Learning system requires HPC architecture. Inference system requires Web architecture. My messages (Deep learning web services) NVIDIA’s deep learning strategy intends for large-scale data center. If you want to build the services on a cloud such as AWS, you can have other way. 長尾の個人的見解ですが・・
  • 5. For example container shipmite Motor scooter leopard 画像のタグ付け・・・・
  • 6. Learning Neural Network Structure Inference Learning: HPC Architecture Inference: Web Architecture BIGDATA Labels Deploy a trained Network apple Orange strawberryBanana Deep Learning web services require two system. Require real time processRequire Many Core, BIGDATA analysis API Micro Service • マイクロサービスを提供する • ~250μs response time • リクエストを常時待ちうけ。 • 数日間、CPU and/or GPUの負荷がほぼ100%で動作する。マル チノード、マルチGPUに対応 • ジョブを走らせているときのみ計算ノードを利用
  • 7. Learning Neural Network Structure Inference Learning: HPC Architecture Inference: Web Architecture BIGDATA Labels Deploy a trained Network apple Orange strawberryBanana Deep Learning web services require two system. Require real time processRequire Many Core, BIGDATA analysis API Micro Service Learningに適したGPU 推論に適したGPU
  • 8. Learning Neural Network Structure Inference Learning: HPC Architecture Inference: Web Architecture BIGDATA Labels Deploy a trained Network apple Orange strawberryBanana Require real time processRequire Many Core, BIGDATA analysis API Micro Service nvidia-docker • There are many Deep Learning framework and version. • Need to deploy the trained network to Inference server.
  • 9. Neural Network Structure Learning: HPC Architecture Inference: Web Architecture BIGDATA Labels Deploy a trained Network apple Orange strawberryBanana Require real time processRequire Many Core, BIGDATA analysis API Learning Inference nvidia-docker • There are many Deep Learning framework and version. • Need to deploy the trained network to Inference server. Docker Registry PUSH PULL Micro Service
  • 10.
  • 11. Learning Neural Network Structure Inference Learning: HPC Architecture Inference: Web Architecture BIGDATA Labels Deploy a trained Network apple Orange strawberryBanana Require real time processRequire Many Core, BIGDATA analysis API GPU Rest Engine is template written by go-lang to launch the micro-service. This template launch webserver with the port number that is set by admin. GPU Rest EngineDocker Registry https://github.com/NVIDIA/gpu-rest-engine
  • 12. GPU Rest Engine & Nvidia Docker Software stack GPU2 GPU3 GPU4 GPU6 GPU7 NVIDIA CUDA Driver Docker Engine GPU0 GPU1 GPU0 GPU1 GPU2 GPU0 GPU1 GPU2 GPU5 GPU Rest Engine Golang GPU Rest Engine Golang GPU Rest Engine Golang Golang net/http Golang net/http Golang net/http Application1 Application2 Application 3 GPU0 GPU1 Docker container1 Host PC Docker container2 Docker container2
  • 14. Neural Network Structure Learning: HPC Architecture Inference: Web Architecture BIGDATA Labels Deploy a trained Network apple Orange strawberryBanana Require real time processRequire Many Core, BIGDATA analysis API ついに HPC でも Docker が! How deploy your apps?Mesos can give an abstract of datacenter with both HPC and Webserver Submit Job Daemon Learning Inference GPU Rest EngineDocker Registry
  • 15. Deep learning services on AWS もしAWSのみで環境を構築するならば・・・
  • 16. Neural Network Structure Learning: HPC Architecture Inference: Web Architecture BIGDATA Labels Deploy a trained Network apple Orange strawberryBanana Require real time processRequire Many Core, BIGDATA analysis API ついに HPC でも Docker が! How deploy your apps? Learning Inference AWS Elastic Beanstalk bucket cfncluster Amazon DynamoDB Amazon DynamoDB bucket Meta Data Amazon API Gateway Submit Job Daemon HPC on AWS 用ミドルウェア • HPC Clusterの動的作成・削除・管理 • スケジューリング機能
  • 17. Neural Network Structure Learning: HPC Architecture Inference: Web Architecture BIGDATA Labels Deploy a trained Network apple Orange strawberryBanana Require real time processRequire Many Core, BIGDATA analysis API ついに HPC でも Docker が! How deploy your apps? Learning Inference AWS Elastic Beanstalk bucket cfncluster Amazon DynamoDB Amazon DynamoDB bucket Meta Data Amazon API Gateway 学習もAPI起動するなら、 ジョブ管理ソフトをキッ クするよう構成 Submit Job Daemon
  • 18. Amazon API Gateway Cfncluster • インスタンスの起動・ターミネート、スケージューリングの役目を担う • これがあることで、多数のリクエストを適切に処理できる。必要なとき に必要なだけGPUインスタンスを使うことができる トレーニングデータ Labels メタ情報 cfncluster
  • 19. まとめ • HPC屋はWebのアーキテクチャー、Web屋はHPCのアーキテクチャーを知る 必要がある • Deep Learningを行う上で、NVIDIAはキープレイヤーではあるが、データセ ンター事業者向けアーキと推測。GPUを売る会社なので当然・・・ • AWS上にサービスをすべて乗っける場合など、使用する環境にあった、 アーキを構築すべき