SlideShare una empresa de Scribd logo
1 de 26
Descargar para leer sin conexión
最強のマルチプレイ・
ゲームサーバを構築
2016/07/07 Gaming Tech Night
グリー株式会社 開発本部 堀口真司
Docker と ECS と WebSocket で
はじめに
• 技術ブログに書いたのが元ネタです
 「 Docker ECS WebSocket 」でぐぐると元ネタページ出ます
 http://labs.gree.jp/blog/2016/06/16024/
• 今回だけの詳細版
 開発と構築と運用ぜんぶ。
• 自己紹介
 コンソール → ネトゲ → アーケード → ソシャゲ
 先週から33歳
稀によくあるプロジェクト要件 (仮)
• リアルタイム・マルチプレイゲームの案件が浮上
 Photon エンジンとか Monobit エンジンとかもあるけど…
• ざっくり要件
 そんなガチゲーじゃないけど、 20 人ぐらいでプレイ
 マップギミックがある
 NPC もいる
 そもそも WebGL クライアントとか
• 技術選定にて
 WebSocket で十分だろう。となると、 nodejs になる
 ステートレスは難しいので、 RDB/KVS は使わない。オンメモリでやる
 モニタリング、デプロイはありもので何とかならないか
一番最初に浮かんだ案
ロードバランサ
IP Masquerade
API サーバ群
WebSocket
Stateful なので
狙ったプロセスに
アクセスするため
DB を持たず
オンメモリで
すべて処理
WebSocket とそれ以外は
使い分ける。マッチング
等は API サーバでやる
永続的な状態は
一応 API 経由
で更新
WebSocket サーバ群
API サーバ群
WebSocket サーバ群に負担
ロードバランサ
IP Masquerade
問題なし
デプロイ
モニタリング
メモリリーク
NAT 更新
マルチコア対応
ゲームに関係
ない部分…
もんだいだらけの…
• メモリリーク
 ステートフルサーバの場合、状態を内部に持つのでどんどんオブジェクトが溜まっていく。完璧に
対応することもできなくはないが、それをやるコストがかかってしまう。一般的には定期的に再起
動させることで、ある程度のメモリリークを妥協し、効率よく開発する。
• NAT 更新(あるいは案内)
 LB 層での RR や WRR 等は利用できない。各サーバ、全ポート固定で割り振っても良かったが、安
定した内部システムに大量の NAT エントリを作るのはリスクが高かった。できればグローバル IP
直結にし、個別の Firewall が好ましい。いずれにせよ管理コストがふくらむ。
• デプロイ
 ディレクトリスイッチや Apache のリロードのように完璧に近いふるまいができない。 nodejs の
デーモン化ツールは普通のステートレス Web 向けのものがほとんど。となると自前でそれを考慮し
たつくりにしなければならない。
• モニタリング
 プロセスの監視や負荷の監視が要るが、 Apache ではないので何か回収するための仕組みを作らな
いといけない。既存のメトリクス回収システムとのプラグインを作らないといけない。
• マルチコア対応
 nodejs はシングルスレッド・イベントドリブンで安定高速動作するが、マルチコア OS に乗せると
そのサーバの性能を出し切れない。となると、 Prefork 系のアプローチを取ってマルチプロセスで
運用するなど、 NAT の仕組みと競合したり、オーケストレーション層を対応しないといけない。
作るモノが多い問題
• なぜならこの課題に対する世間の需要がほとんどなく OSS が発展してないため。
 わずかなモノも、こちらの要件にマッチすることはほぼない
• たとえば Photon エンジンなら
 ロードバランシング → SPOF だけど、独自のものが用意されてる。
 モニタリング → Windows API で取れる
 マルチコア対応 → どうやら、マルチスレッドで動いてる
 デプロイ → 専用コンソールでボタンをポチポチするだけ
それなりの規模なら作る。
または、買うんだけど
どうしようかな~
nodejs プロセスと TCP Port を
完全にマップしたい
いつもの LAMP じゃだめ
なんか?
デプロイどうしよ
オーケストレーションも
コンテナどう?
デプロイツール幾つかあ
るし、中身は root でどん
なプロセスでも動くし、
TCP Port に直結できる
せや! Amazon ECS にしたろ
コンテナとは
• VM より小さく、プロセスより大きい
 ホスト OS とは違うものが使える。 AmazonLinux 内に Ubuntu とか。
 ミドルウェア類も全部別のバイナリで動作する
 CPU はエミュレートされない。なので高速動作する
 GPU もエミュレートされない。そもそもハードウェア仮想化ではない
 コンテナ毎にリソースの上限が設定できるのもある
 IP アドレス(ネットワーク)はホストと共有される
 コンテナ内のファイルディスクリプタは独立するので、一見すると NAT っぽいふるまい
 コンテナ間で同じものは共有される
 ストレージは設定しないと書き込めない
 設定すればホスト側のボリュームも読み書きできる
 コンテナのエントリポイント(=プロセス)が終了するとコンテナも消える
 コンテナ内は root ユーザで動作する
 “本物のオブジェクト指向”でいう、オブジェクトっぽい立ち位置。
• Google では、あらゆるアプリがコンテナ運用らしい。
ここから構築
と設定
じぶんの PC
ECS Host
Amazon
ECR
Amazon ECS
fetch
build
push
AWS
Lambda
API
Auto Scaling group
ECS Host
Post
room-status
deploy
Container-status
log
pull
社内ネット
Amazon API
Gateway
じぶんの PC
shinji.horiguchi@G-PC-00366540 MINGW64 ~
$ docker run -P -d websocket
75ff4f9b1eee9933d867b628f75dde046467ae7f426a67344ebe6806f407f6d3
shinji.horiguchi@G-PC-00366540 MINGW64 ~
$ docker run -P -d websocket
38bb67d2895d4d3ac03732ce0f5631780118737c70b79c652ba293bb862cf702
shinji.horiguchi@G-PC-00366540 MINGW64 ~
$ docker ps
CONTAINER ID IMAGE COMMAND CREATED STATUS PORTS
NAMES
38bb67d2895d websocket "node /home/app/serve" 4 seconds ago Up 3 seconds
0.0.0.0:32769->3000/tcp nauseous_engelbart
75ff4f9b1eee websocket "node /home/app/serve" 37 seconds ago Up 36 seconds
0.0.0.0:32768->3000/tcp berserk_golick
Windows でも docker tools
入れるだけでオッケー。
開発環境のセットアップに
一時間もかからない
コンテナ操作や管理は
GUI なので、非エンジニア
でも安心の Kitematic
Amazon
ECR
fetch
build
push
docker が使える slave を
追加しておく。古いやつは
ECR 未対応でダメ。
Jenkins ジョブに必要なので作る。超簡単。
US 系リージョン。作った後に案内されるペー
ジの内容にログイン方法やアドレスが書いてあ
るので必ずメモっておく。
でもデフォの latest タグのままはダメ。
ADD app /var/app
WORKDIR /var/app
RUN npm install
RUN npm install -g bower
RUN bower install --allow-root
• WORKDIR – 使える
• ENV – 使える
• ENTRYPOINT – 使える
• EXPOSE – 使えない
• CMD – 使える
• 他 – わからん
Registory API v2
に対応したクライアントが必要
Dockerfile に全部書く。
docker build するまえに、
ゲーム本体も fetch してくる
Dockerfile は別リポジトリ。
どうせ冪等性ないのでビルド
後のハッシュやタグで管理
ECS 側で
設定必須
Amazon
ECR
Amazon ECS
ECS Host
deploy
pull
ECR で案内された URL をそのまま Task 定義に設定すれ
ばオッケー。 Docker Hub のも同じく使えるので、
cAdvisor はそのままデプロイ
cAdvisor はコンテナホスト単位でデプロイする。
Portmap でホスト側のポートを指定すると一台に
一つのコンテナしかデプロイされないので、この
仕組みを活用する。 Prometheus と組み合わせる
と間違いなく最強。時系列
データを行列のまま扱えて
関数と式でグラフを描ける
fluentd はホストで動作させ、
コンテナ内から
localhost:port に流す
ECS でのインスタンス概念
• Task Definition
 コンテナの URL や起動パラメータ、ヴォリュームやポート設定を行う
 コンテナタグをつけかえて、バージョンアップとかできる
• Service
 デプロイ設定。一部を変えると差分を埋めるようにトポロジが維持される
 どの Task definition を、どれだけ
• Cluster
 Service のデプロイ先で、 EC2 によるコンテナホストが複数含まれる
 複数の Service が一つの Cluster に同居できる
• Task
 稼働中のコンテナ。いわゆる docker ps コマンド
ECS Host
Amazon ECS
Auto Scaling group
ECS Host
deploy
Desired:10
Minimum healthy: 100%
Maximum: 120%
新デプロイを設定すると
Max まですぐに増加する
デプロイ時にローリングリスタートされる容
量=Max-Min となり、この設定の場合 20%
分ずつコンテナが入れ替わっていく。
Min 設定を 100% 未満にするとデプロイ時に
いきなり殺されてしまうのでサービスの場合
は 100% 以外に選択肢は無い。
初期値の 50% では半数で障害となる
コンテナホストは AutoScaling と
Userdata のみで運用できる。
ssh すら不要で、 AMI も標準の
ECS Optimized で良い。
Cluster 画面 Task Definition で競合
が無ければ Desired
だけ Task が起動する
テスト用などはそもそも
一つしか起動させていない
ホスト内で競合する場合は、
一台に一つのコンテナしか
起動できない
Rolling 時
類似サービス
• Kubernetes
 クゥーバーネイテス。
 Google 系
 ECS とだいたい同じ機能
• Nomad
 ノマド。
 Hashicorp 系
 だいたい同じ
• Docker 1.12
 だいたい同じ
 オーケストレーション強化
AWS
Lambda
API
Post
room-status
Container-status
いわゆる Tasks で取れるような情
報を管理 API に伝える
ホスト名+ポート番号は必須
コンテナはブラックボック
ス化の原則に則って、
必要な情報は外から与える。
AWS 依存の情報や docker
依存の情報など。
それらの情報に加えて、コ
ンテナのみが保持している
状態を管理 API に伝える
コンテナへの案内やゲー
ムのマッチングを行う。
案内には NAT64/DNS64
対応のため FQDN で行う。
Amazon API
Gateway
最強ポイントまとめ
4つのポイント
書くものが少ない
• タスク一覧を取得し、管理 API に POST する
• コンテナ内に観測情報を set する
• 管理 API に WebSocket サーバの状態をいろいろ POST する
• Dockerfile 書く
• Jenkins ジョブ書く
• 監視やロギングの設定
落ちない
• すべてが分散配置され、 SPOF が無い
 ホストは AZ バランス、コンテナは分散、 Lambda も分散、 API は ELB 配下で完璧
• Rolling または Blue-Green どちらでも対応できて、メンテ停止も不要
• Service 設定を一つ変えるだけで、ロールバックも超簡単
• テスト、一部公開も同じく容易
• モニタリングツールがたくさんある
 これがこの分野で意外と厄介である。
依存が少ない
• 環境依存が少なく、コンテナを手元の PC で建てることもできる
 チョイ確認したいときとか
• nodejs なら、そのまま Windows/Mac で建てても良い
 gulp 等と相性が良く、開発しやすい
• WebSocket で SSL 対応もできる
 将来 HTTPS しか通らなくなっても大丈夫
 socket.io で WebSocket すら通らなくても大丈夫
 シンプルなルーティングなので IPv6 も大丈夫
ロックインしない
• Amazon ECS を利用しているものの、類似サービスが他にもある
 コンテナ関連は情報量も多くなった
 それ以外の部分もだいたい検索すればすぐに解決方法が見つかる
• コンテナやめて、従来型の運用ツール一式に戻っても良い
 当手法にかかるコストが極端に少ないので、手戻りがそもそも少ない
 nodejs 単体で動作するものがあるとして、ビルドからデプロイまで一通りやっても一
週間(40h)もやれば、運用に乗る
ご清聴ありがとうございました

Más contenido relacionado

La actualidad más candente

「黒騎士と白の魔王」gRPCによるHTTP/2 - API, Streamingの実践
「黒騎士と白の魔王」gRPCによるHTTP/2 - API, Streamingの実践「黒騎士と白の魔王」gRPCによるHTTP/2 - API, Streamingの実践
「黒騎士と白の魔王」gRPCによるHTTP/2 - API, Streamingの実践
Yoshifumi Kawai
 

La actualidad más candente (20)

Redisの特徴と活用方法について
Redisの特徴と活用方法についてRedisの特徴と活用方法について
Redisの特徴と活用方法について
 
目grep入門 +解説
目grep入門 +解説目grep入門 +解説
目grep入門 +解説
 
[CEDEC 2021] 運用中タイトルでも怖くない! 『メルクストーリア』におけるハイパフォーマンス・ローコストなリアルタイム通信技術の導入事例
[CEDEC 2021] 運用中タイトルでも怖くない! 『メルクストーリア』におけるハイパフォーマンス・ローコストなリアルタイム通信技術の導入事例[CEDEC 2021] 運用中タイトルでも怖くない! 『メルクストーリア』におけるハイパフォーマンス・ローコストなリアルタイム通信技術の導入事例
[CEDEC 2021] 運用中タイトルでも怖くない! 『メルクストーリア』におけるハイパフォーマンス・ローコストなリアルタイム通信技術の導入事例
 
Dockerからcontainerdへの移行
Dockerからcontainerdへの移行Dockerからcontainerdへの移行
Dockerからcontainerdへの移行
 
マイクロサービス時代の認証と認可 - AWS Dev Day Tokyo 2018 #AWSDevDay
マイクロサービス時代の認証と認可 - AWS Dev Day Tokyo 2018 #AWSDevDayマイクロサービス時代の認証と認可 - AWS Dev Day Tokyo 2018 #AWSDevDay
マイクロサービス時代の認証と認可 - AWS Dev Day Tokyo 2018 #AWSDevDay
 
Nginx Unitを試してみた話
Nginx Unitを試してみた話Nginx Unitを試してみた話
Nginx Unitを試してみた話
 
Building the Game Server both API and Realtime via c#
Building the Game Server both API and Realtime via c#Building the Game Server both API and Realtime via c#
Building the Game Server both API and Realtime via c#
 
HTTP/2 入門
HTTP/2 入門HTTP/2 入門
HTTP/2 入門
 
AWSとオンプレミスを繋ぐときに知っておきたいルーティングの基礎知識(CCSI監修!)
AWSとオンプレミスを繋ぐときに知っておきたいルーティングの基礎知識(CCSI監修!)AWSとオンプレミスを繋ぐときに知っておきたいルーティングの基礎知識(CCSI監修!)
AWSとオンプレミスを繋ぐときに知っておきたいルーティングの基礎知識(CCSI監修!)
 
「黒騎士と白の魔王」gRPCによるHTTP/2 - API, Streamingの実践
「黒騎士と白の魔王」gRPCによるHTTP/2 - API, Streamingの実践「黒騎士と白の魔王」gRPCによるHTTP/2 - API, Streamingの実践
「黒騎士と白の魔王」gRPCによるHTTP/2 - API, Streamingの実践
 
20200212 AWS Black Belt Online Seminar AWS Systems Manager
20200212 AWS Black Belt Online Seminar AWS Systems Manager20200212 AWS Black Belt Online Seminar AWS Systems Manager
20200212 AWS Black Belt Online Seminar AWS Systems Manager
 
Unityによるリアルタイム通信とMagicOnionによるC#大統一理論の実現
Unityによるリアルタイム通信とMagicOnionによるC#大統一理論の実現Unityによるリアルタイム通信とMagicOnionによるC#大統一理論の実現
Unityによるリアルタイム通信とMagicOnionによるC#大統一理論の実現
 
DeNAのサーバー"コード"レスアーキテクチャ
DeNAのサーバー"コード"レスアーキテクチャDeNAのサーバー"コード"レスアーキテクチャ
DeNAのサーバー"コード"レスアーキテクチャ
 
【Unite Tokyo 2019】Unityだったら簡単!マルチプレイ用ゲームサーバ開発 ~実践編~
【Unite Tokyo 2019】Unityだったら簡単!マルチプレイ用ゲームサーバ開発 ~実践編~【Unite Tokyo 2019】Unityだったら簡単!マルチプレイ用ゲームサーバ開発 ~実践編~
【Unite Tokyo 2019】Unityだったら簡単!マルチプレイ用ゲームサーバ開発 ~実践編~
 
例外設計における大罪
例外設計における大罪例外設計における大罪
例外設計における大罪
 
GPU仮想化最前線 - KVMGTとvirtio-gpu -
GPU仮想化最前線 - KVMGTとvirtio-gpu -GPU仮想化最前線 - KVMGTとvirtio-gpu -
GPU仮想化最前線 - KVMGTとvirtio-gpu -
 
Go 製リアルタイムサーバーの Kubernetes での運用について
Go 製リアルタイムサーバーの  Kubernetes での運用についてGo 製リアルタイムサーバーの  Kubernetes での運用について
Go 製リアルタイムサーバーの Kubernetes での運用について
 
SPAセキュリティ入門~PHP Conference Japan 2021
SPAセキュリティ入門~PHP Conference Japan 2021SPAセキュリティ入門~PHP Conference Japan 2021
SPAセキュリティ入門~PHP Conference Japan 2021
 
マイクロにしすぎた結果がこれだよ!
マイクロにしすぎた結果がこれだよ!マイクロにしすぎた結果がこれだよ!
マイクロにしすぎた結果がこれだよ!
 
[Aurora事例祭り]Amazon Aurora を使いこなすためのベストプラクティス
[Aurora事例祭り]Amazon Aurora を使いこなすためのベストプラクティス[Aurora事例祭り]Amazon Aurora を使いこなすためのベストプラクティス
[Aurora事例祭り]Amazon Aurora を使いこなすためのベストプラクティス
 

Similar a Docker と ECS と WebSocket で最強のマルチプレイ・ゲームサーバを構築

Dockerで遊んでみよっかー YAPC::Asia Tokyo 2014
Dockerで遊んでみよっかー YAPC::Asia Tokyo 2014Dockerで遊んでみよっかー YAPC::Asia Tokyo 2014
Dockerで遊んでみよっかー YAPC::Asia Tokyo 2014
Masahiro Nagano
 
パフォーマンス計測Ciサービスを作って得た知見を共有したい
パフォーマンス計測Ciサービスを作って得た知見を共有したいパフォーマンス計測Ciサービスを作って得た知見を共有したい
パフォーマンス計測Ciサービスを作って得た知見を共有したい
zaru sakuraba
 
Docker+CoreOS+GCEで自動スケール分散レイトレ
Docker+CoreOS+GCEで自動スケール分散レイトレDocker+CoreOS+GCEで自動スケール分散レイトレ
Docker+CoreOS+GCEで自動スケール分散レイトレ
peryaudo
 

Similar a Docker と ECS と WebSocket で最強のマルチプレイ・ゲームサーバを構築 (20)

Dockerを使ってみよう
Dockerを使ってみようDockerを使ってみよう
Dockerを使ってみよう
 
Dockerで遊んでみよっかー YAPC::Asia Tokyo 2014
Dockerで遊んでみよっかー YAPC::Asia Tokyo 2014Dockerで遊んでみよっかー YAPC::Asia Tokyo 2014
Dockerで遊んでみよっかー YAPC::Asia Tokyo 2014
 
Play framework+docker+aws ecr+aws beanstalk で楽々デプロイ
Play framework+docker+aws ecr+aws beanstalk で楽々デプロイPlay framework+docker+aws ecr+aws beanstalk で楽々デプロイ
Play framework+docker+aws ecr+aws beanstalk で楽々デプロイ
 
20201127 .NET 5
20201127 .NET 520201127 .NET 5
20201127 .NET 5
 
Native Extensionのビルドどうしてますか?
Native Extensionのビルドどうしてますか?Native Extensionのビルドどうしてますか?
Native Extensionのビルドどうしてますか?
 
いまさら聞けないDocker - 第5回コンテナ型仮想化の情報交換会@大阪
いまさら聞けないDocker - 第5回コンテナ型仮想化の情報交換会@大阪いまさら聞けないDocker - 第5回コンテナ型仮想化の情報交換会@大阪
いまさら聞けないDocker - 第5回コンテナ型仮想化の情報交換会@大阪
 
20150127 jawsug京王線 ec2_config
20150127 jawsug京王線 ec2_config20150127 jawsug京王線 ec2_config
20150127 jawsug京王線 ec2_config
 
パフォーマンス計測Ciサービスを作って得た知見を共有したい
パフォーマンス計測Ciサービスを作って得た知見を共有したいパフォーマンス計測Ciサービスを作って得た知見を共有したい
パフォーマンス計測Ciサービスを作って得た知見を共有したい
 
近頃のDockerネットワーク
近頃のDockerネットワーク近頃のDockerネットワーク
近頃のDockerネットワーク
 
ASP.NET Core のお気に入りの機能たち (docker向け)
ASP.NET Core のお気に入りの機能たち (docker向け)ASP.NET Core のお気に入りの機能たち (docker向け)
ASP.NET Core のお気に入りの機能たち (docker向け)
 
Play framework 2.0のおすすめと1.2からのアップグレード
Play framework 2.0のおすすめと1.2からのアップグレードPlay framework 2.0のおすすめと1.2からのアップグレード
Play framework 2.0のおすすめと1.2からのアップグレード
 
Remote-Containersでnext.js環境を 作った話
Remote-Containersでnext.js環境を作った話Remote-Containersでnext.js環境を作った話
Remote-Containersでnext.js環境を 作った話
 
WSL2+docker+JupyterとVS Codeリモート環境の構築
WSL2+docker+JupyterとVS Codeリモート環境の構築WSL2+docker+JupyterとVS Codeリモート環境の構築
WSL2+docker+JupyterとVS Codeリモート環境の構築
 
Docker+CoreOS+GCEで自動スケール分散レイトレ
Docker+CoreOS+GCEで自動スケール分散レイトレDocker+CoreOS+GCEで自動スケール分散レイトレ
Docker+CoreOS+GCEで自動スケール分散レイトレ
 
VSCodeで始めるAzure Static Web Apps開発
VSCodeで始めるAzure Static Web Apps開発VSCodeで始めるAzure Static Web Apps開発
VSCodeで始めるAzure Static Web Apps開発
 
JAWS-UG コンテナ支部 Docker入門 10分ハンズオン
JAWS-UG コンテナ支部 Docker入門 10分ハンズオンJAWS-UG コンテナ支部 Docker入門 10分ハンズオン
JAWS-UG コンテナ支部 Docker入門 10分ハンズオン
 
今だからこそ知りたい Docker Compose/Swarm 入門
今だからこそ知りたい Docker Compose/Swarm 入門今だからこそ知りたい Docker Compose/Swarm 入門
今だからこそ知りたい Docker Compose/Swarm 入門
 
.NET Coreから概観する.NETのOSSへの取り組み
.NET Coreから概観する.NETのOSSへの取り組み.NET Coreから概観する.NETのOSSへの取り組み
.NET Coreから概観する.NETのOSSへの取り組み
 
A 2-1 gitwebmatrix 2 から使う node.js on windows azure
A 2-1 gitwebmatrix 2 から使う node.js on windows azureA 2-1 gitwebmatrix 2 から使う node.js on windows azure
A 2-1 gitwebmatrix 2 から使う node.js on windows azure
 
Play jjug2012spring
Play jjug2012springPlay jjug2012spring
Play jjug2012spring
 

Más de gree_tech

Más de gree_tech (20)

アナザーエデンPC版リリースへの道のり 〜WFSにおけるマルチプラットフォーム対応の取り組み〜
アナザーエデンPC版リリースへの道のり 〜WFSにおけるマルチプラットフォーム対応の取り組み〜アナザーエデンPC版リリースへの道のり 〜WFSにおけるマルチプラットフォーム対応の取り組み〜
アナザーエデンPC版リリースへの道のり 〜WFSにおけるマルチプラットフォーム対応の取り組み〜
 
GREE VR Studio Laboratory「XR-UX Devプロジェクト」の成果紹介
GREE VR Studio Laboratory「XR-UX Devプロジェクト」の成果紹介GREE VR Studio Laboratory「XR-UX Devプロジェクト」の成果紹介
GREE VR Studio Laboratory「XR-UX Devプロジェクト」の成果紹介
 
REALITYアバターを様々なメタバースで活躍させてみた - GREE VR Studio Laboratory インターン研究成果発表
REALITYアバターを様々なメタバースで活躍させてみた - GREE VR Studio Laboratory インターン研究成果発表REALITYアバターを様々なメタバースで活躍させてみた - GREE VR Studio Laboratory インターン研究成果発表
REALITYアバターを様々なメタバースで活躍させてみた - GREE VR Studio Laboratory インターン研究成果発表
 
アプリ起動時間高速化 ~推測するな、計測せよ~
アプリ起動時間高速化 ~推測するな、計測せよ~アプリ起動時間高速化 ~推測するな、計測せよ~
アプリ起動時間高速化 ~推測するな、計測せよ~
 
長寿なゲーム事業におけるアプリビルドの効率化
長寿なゲーム事業におけるアプリビルドの効率化長寿なゲーム事業におけるアプリビルドの効率化
長寿なゲーム事業におけるアプリビルドの効率化
 
Cloud Spanner をより便利にする運用支援ツールの紹介
Cloud Spanner をより便利にする運用支援ツールの紹介Cloud Spanner をより便利にする運用支援ツールの紹介
Cloud Spanner をより便利にする運用支援ツールの紹介
 
WFSにおけるCloud SpannerとGKEを中心としたGCP導入事例の紹介
WFSにおけるCloud SpannerとGKEを中心としたGCP導入事例の紹介WFSにおけるCloud SpannerとGKEを中心としたGCP導入事例の紹介
WFSにおけるCloud SpannerとGKEを中心としたGCP導入事例の紹介
 
SINoALICE -シノアリス- Google Cloud Firestoreを用いた観戦機能の実現について
SINoALICE -シノアリス- Google Cloud Firestoreを用いた観戦機能の実現についてSINoALICE -シノアリス- Google Cloud Firestoreを用いた観戦機能の実現について
SINoALICE -シノアリス- Google Cloud Firestoreを用いた観戦機能の実現について
 
海外展開と負荷試験
海外展開と負荷試験海外展開と負荷試験
海外展開と負荷試験
 
翻訳QAでのテスト自動化の取り組み
翻訳QAでのテスト自動化の取り組み翻訳QAでのテスト自動化の取り組み
翻訳QAでのテスト自動化の取り組み
 
組み込み開発のテストとゲーム開発のテストの違い
組み込み開発のテストとゲーム開発のテストの違い組み込み開発のテストとゲーム開発のテストの違い
組み込み開発のテストとゲーム開発のテストの違い
 
サーバーフレームワークに潜んでる脆弱性検知ツール紹介
サーバーフレームワークに潜んでる脆弱性検知ツール紹介サーバーフレームワークに潜んでる脆弱性検知ツール紹介
サーバーフレームワークに潜んでる脆弱性検知ツール紹介
 
データエンジニアとアナリストチーム兼務になった件について
データエンジニアとアナリストチーム兼務になった件についてデータエンジニアとアナリストチーム兼務になった件について
データエンジニアとアナリストチーム兼務になった件について
 
シェアドサービスとしてのデータテクノロジー
シェアドサービスとしてのデータテクノロジーシェアドサービスとしてのデータテクノロジー
シェアドサービスとしてのデータテクノロジー
 
「ドキュメント見つからない問題」をなんとかしたい - 横断検索エンジン導入の取り組みについて-
「ドキュメント見つからない問題」をなんとかしたい - 横断検索エンジン導入の取り組みについて-「ドキュメント見つからない問題」をなんとかしたい - 横断検索エンジン導入の取り組みについて-
「ドキュメント見つからない問題」をなんとかしたい - 横断検索エンジン導入の取り組みについて-
 
「Atomic Design × Nuxt.js」コンポーネント毎に責務の範囲を明確にしたら幸せになった話
「Atomic Design × Nuxt.js」コンポーネント毎に責務の範囲を明確にしたら幸せになった話「Atomic Design × Nuxt.js」コンポーネント毎に責務の範囲を明確にしたら幸せになった話
「Atomic Design × Nuxt.js」コンポーネント毎に責務の範囲を明確にしたら幸せになった話
 
比較サイトの検索改善(SPA から SSR に変換)
比較サイトの検索改善(SPA から SSR に変換)比較サイトの検索改善(SPA から SSR に変換)
比較サイトの検索改善(SPA から SSR に変換)
 
コードの自動修正によって実現する、機能開発を止めないフレームワーク移行
コードの自動修正によって実現する、機能開発を止めないフレームワーク移行コードの自動修正によって実現する、機能開発を止めないフレームワーク移行
コードの自動修正によって実現する、機能開発を止めないフレームワーク移行
 
「やんちゃ、足りてる?」〜ヤンマガWebで挑戦を続ける新入りエンジニア〜
「やんちゃ、足りてる?」〜ヤンマガWebで挑戦を続ける新入りエンジニア〜「やんちゃ、足りてる?」〜ヤンマガWebで挑戦を続ける新入りエンジニア〜
「やんちゃ、足りてる?」〜ヤンマガWebで挑戦を続ける新入りエンジニア〜
 
法人向けメタバースプラットフォームの開発の裏側をのぞいてみた(仮)
法人向けメタバースプラットフォームの開発の裏側をのぞいてみた(仮)法人向けメタバースプラットフォームの開発の裏側をのぞいてみた(仮)
法人向けメタバースプラットフォームの開発の裏側をのぞいてみた(仮)
 

Último

Último (11)

Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
 
LoRaWANスマート距離検出センサー DS20L カタログ LiDARデバイス
LoRaWANスマート距離検出センサー  DS20L  カタログ  LiDARデバイスLoRaWANスマート距離検出センサー  DS20L  カタログ  LiDARデバイス
LoRaWANスマート距離検出センサー DS20L カタログ LiDARデバイス
 
論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games
論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games
論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games
 
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)
 
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
 
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアルLoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
 
論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding
論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding
論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding
 
Observabilityは従来型の監視と何が違うのか(キンドリルジャパン社内勉強会:2022年10月27日発表)
Observabilityは従来型の監視と何が違うのか(キンドリルジャパン社内勉強会:2022年10月27日発表)Observabilityは従来型の監視と何が違うのか(キンドリルジャパン社内勉強会:2022年10月27日発表)
Observabilityは従来型の監視と何が違うのか(キンドリルジャパン社内勉強会:2022年10月27日発表)
 
論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...
論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...
論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...
 
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
 
新人研修 後半 2024/04/26の勉強会で発表されたものです。
新人研修 後半        2024/04/26の勉強会で発表されたものです。新人研修 後半        2024/04/26の勉強会で発表されたものです。
新人研修 後半 2024/04/26の勉強会で発表されたものです。
 

Docker と ECS と WebSocket で最強のマルチプレイ・ゲームサーバを構築

  • 1. 最強のマルチプレイ・ ゲームサーバを構築 2016/07/07 Gaming Tech Night グリー株式会社 開発本部 堀口真司 Docker と ECS と WebSocket で
  • 2. はじめに • 技術ブログに書いたのが元ネタです  「 Docker ECS WebSocket 」でぐぐると元ネタページ出ます  http://labs.gree.jp/blog/2016/06/16024/ • 今回だけの詳細版  開発と構築と運用ぜんぶ。 • 自己紹介  コンソール → ネトゲ → アーケード → ソシャゲ  先週から33歳
  • 3. 稀によくあるプロジェクト要件 (仮) • リアルタイム・マルチプレイゲームの案件が浮上  Photon エンジンとか Monobit エンジンとかもあるけど… • ざっくり要件  そんなガチゲーじゃないけど、 20 人ぐらいでプレイ  マップギミックがある  NPC もいる  そもそも WebGL クライアントとか • 技術選定にて  WebSocket で十分だろう。となると、 nodejs になる  ステートレスは難しいので、 RDB/KVS は使わない。オンメモリでやる  モニタリング、デプロイはありもので何とかならないか
  • 4. 一番最初に浮かんだ案 ロードバランサ IP Masquerade API サーバ群 WebSocket Stateful なので 狙ったプロセスに アクセスするため DB を持たず オンメモリで すべて処理 WebSocket とそれ以外は 使い分ける。マッチング 等は API サーバでやる 永続的な状態は 一応 API 経由 で更新
  • 5. WebSocket サーバ群 API サーバ群 WebSocket サーバ群に負担 ロードバランサ IP Masquerade 問題なし デプロイ モニタリング メモリリーク NAT 更新 マルチコア対応 ゲームに関係 ない部分…
  • 6. もんだいだらけの… • メモリリーク  ステートフルサーバの場合、状態を内部に持つのでどんどんオブジェクトが溜まっていく。完璧に 対応することもできなくはないが、それをやるコストがかかってしまう。一般的には定期的に再起 動させることで、ある程度のメモリリークを妥協し、効率よく開発する。 • NAT 更新(あるいは案内)  LB 層での RR や WRR 等は利用できない。各サーバ、全ポート固定で割り振っても良かったが、安 定した内部システムに大量の NAT エントリを作るのはリスクが高かった。できればグローバル IP 直結にし、個別の Firewall が好ましい。いずれにせよ管理コストがふくらむ。 • デプロイ  ディレクトリスイッチや Apache のリロードのように完璧に近いふるまいができない。 nodejs の デーモン化ツールは普通のステートレス Web 向けのものがほとんど。となると自前でそれを考慮し たつくりにしなければならない。 • モニタリング  プロセスの監視や負荷の監視が要るが、 Apache ではないので何か回収するための仕組みを作らな いといけない。既存のメトリクス回収システムとのプラグインを作らないといけない。 • マルチコア対応  nodejs はシングルスレッド・イベントドリブンで安定高速動作するが、マルチコア OS に乗せると そのサーバの性能を出し切れない。となると、 Prefork 系のアプローチを取ってマルチプロセスで 運用するなど、 NAT の仕組みと競合したり、オーケストレーション層を対応しないといけない。
  • 7. 作るモノが多い問題 • なぜならこの課題に対する世間の需要がほとんどなく OSS が発展してないため。  わずかなモノも、こちらの要件にマッチすることはほぼない • たとえば Photon エンジンなら  ロードバランシング → SPOF だけど、独自のものが用意されてる。  モニタリング → Windows API で取れる  マルチコア対応 → どうやら、マルチスレッドで動いてる  デプロイ → 専用コンソールでボタンをポチポチするだけ それなりの規模なら作る。 または、買うんだけど どうしようかな~
  • 8. nodejs プロセスと TCP Port を 完全にマップしたい いつもの LAMP じゃだめ なんか? デプロイどうしよ オーケストレーションも コンテナどう? デプロイツール幾つかあ るし、中身は root でどん なプロセスでも動くし、 TCP Port に直結できる せや! Amazon ECS にしたろ
  • 9. コンテナとは • VM より小さく、プロセスより大きい  ホスト OS とは違うものが使える。 AmazonLinux 内に Ubuntu とか。  ミドルウェア類も全部別のバイナリで動作する  CPU はエミュレートされない。なので高速動作する  GPU もエミュレートされない。そもそもハードウェア仮想化ではない  コンテナ毎にリソースの上限が設定できるのもある  IP アドレス(ネットワーク)はホストと共有される  コンテナ内のファイルディスクリプタは独立するので、一見すると NAT っぽいふるまい  コンテナ間で同じものは共有される  ストレージは設定しないと書き込めない  設定すればホスト側のボリュームも読み書きできる  コンテナのエントリポイント(=プロセス)が終了するとコンテナも消える  コンテナ内は root ユーザで動作する  “本物のオブジェクト指向”でいう、オブジェクトっぽい立ち位置。 • Google では、あらゆるアプリがコンテナ運用らしい。
  • 11. じぶんの PC ECS Host Amazon ECR Amazon ECS fetch build push AWS Lambda API Auto Scaling group ECS Host Post room-status deploy Container-status log pull 社内ネット Amazon API Gateway
  • 12. じぶんの PC shinji.horiguchi@G-PC-00366540 MINGW64 ~ $ docker run -P -d websocket 75ff4f9b1eee9933d867b628f75dde046467ae7f426a67344ebe6806f407f6d3 shinji.horiguchi@G-PC-00366540 MINGW64 ~ $ docker run -P -d websocket 38bb67d2895d4d3ac03732ce0f5631780118737c70b79c652ba293bb862cf702 shinji.horiguchi@G-PC-00366540 MINGW64 ~ $ docker ps CONTAINER ID IMAGE COMMAND CREATED STATUS PORTS NAMES 38bb67d2895d websocket "node /home/app/serve" 4 seconds ago Up 3 seconds 0.0.0.0:32769->3000/tcp nauseous_engelbart 75ff4f9b1eee websocket "node /home/app/serve" 37 seconds ago Up 36 seconds 0.0.0.0:32768->3000/tcp berserk_golick Windows でも docker tools 入れるだけでオッケー。 開発環境のセットアップに 一時間もかからない コンテナ操作や管理は GUI なので、非エンジニア でも安心の Kitematic
  • 13. Amazon ECR fetch build push docker が使える slave を 追加しておく。古いやつは ECR 未対応でダメ。 Jenkins ジョブに必要なので作る。超簡単。 US 系リージョン。作った後に案内されるペー ジの内容にログイン方法やアドレスが書いてあ るので必ずメモっておく。 でもデフォの latest タグのままはダメ。 ADD app /var/app WORKDIR /var/app RUN npm install RUN npm install -g bower RUN bower install --allow-root • WORKDIR – 使える • ENV – 使える • ENTRYPOINT – 使える • EXPOSE – 使えない • CMD – 使える • 他 – わからん Registory API v2 に対応したクライアントが必要 Dockerfile に全部書く。 docker build するまえに、 ゲーム本体も fetch してくる Dockerfile は別リポジトリ。 どうせ冪等性ないのでビルド 後のハッシュやタグで管理 ECS 側で 設定必須
  • 14. Amazon ECR Amazon ECS ECS Host deploy pull ECR で案内された URL をそのまま Task 定義に設定すれ ばオッケー。 Docker Hub のも同じく使えるので、 cAdvisor はそのままデプロイ cAdvisor はコンテナホスト単位でデプロイする。 Portmap でホスト側のポートを指定すると一台に 一つのコンテナしかデプロイされないので、この 仕組みを活用する。 Prometheus と組み合わせる と間違いなく最強。時系列 データを行列のまま扱えて 関数と式でグラフを描ける fluentd はホストで動作させ、 コンテナ内から localhost:port に流す
  • 15. ECS でのインスタンス概念 • Task Definition  コンテナの URL や起動パラメータ、ヴォリュームやポート設定を行う  コンテナタグをつけかえて、バージョンアップとかできる • Service  デプロイ設定。一部を変えると差分を埋めるようにトポロジが維持される  どの Task definition を、どれだけ • Cluster  Service のデプロイ先で、 EC2 によるコンテナホストが複数含まれる  複数の Service が一つの Cluster に同居できる • Task  稼働中のコンテナ。いわゆる docker ps コマンド
  • 16. ECS Host Amazon ECS Auto Scaling group ECS Host deploy Desired:10 Minimum healthy: 100% Maximum: 120% 新デプロイを設定すると Max まですぐに増加する デプロイ時にローリングリスタートされる容 量=Max-Min となり、この設定の場合 20% 分ずつコンテナが入れ替わっていく。 Min 設定を 100% 未満にするとデプロイ時に いきなり殺されてしまうのでサービスの場合 は 100% 以外に選択肢は無い。 初期値の 50% では半数で障害となる コンテナホストは AutoScaling と Userdata のみで運用できる。 ssh すら不要で、 AMI も標準の ECS Optimized で良い。
  • 17. Cluster 画面 Task Definition で競合 が無ければ Desired だけ Task が起動する テスト用などはそもそも 一つしか起動させていない ホスト内で競合する場合は、 一台に一つのコンテナしか 起動できない
  • 19. 類似サービス • Kubernetes  クゥーバーネイテス。  Google 系  ECS とだいたい同じ機能 • Nomad  ノマド。  Hashicorp 系  だいたい同じ • Docker 1.12  だいたい同じ  オーケストレーション強化
  • 20. AWS Lambda API Post room-status Container-status いわゆる Tasks で取れるような情 報を管理 API に伝える ホスト名+ポート番号は必須 コンテナはブラックボック ス化の原則に則って、 必要な情報は外から与える。 AWS 依存の情報や docker 依存の情報など。 それらの情報に加えて、コ ンテナのみが保持している 状態を管理 API に伝える コンテナへの案内やゲー ムのマッチングを行う。 案内には NAT64/DNS64 対応のため FQDN で行う。 Amazon API Gateway
  • 22. 書くものが少ない • タスク一覧を取得し、管理 API に POST する • コンテナ内に観測情報を set する • 管理 API に WebSocket サーバの状態をいろいろ POST する • Dockerfile 書く • Jenkins ジョブ書く • 監視やロギングの設定
  • 23. 落ちない • すべてが分散配置され、 SPOF が無い  ホストは AZ バランス、コンテナは分散、 Lambda も分散、 API は ELB 配下で完璧 • Rolling または Blue-Green どちらでも対応できて、メンテ停止も不要 • Service 設定を一つ変えるだけで、ロールバックも超簡単 • テスト、一部公開も同じく容易 • モニタリングツールがたくさんある  これがこの分野で意外と厄介である。
  • 24. 依存が少ない • 環境依存が少なく、コンテナを手元の PC で建てることもできる  チョイ確認したいときとか • nodejs なら、そのまま Windows/Mac で建てても良い  gulp 等と相性が良く、開発しやすい • WebSocket で SSL 対応もできる  将来 HTTPS しか通らなくなっても大丈夫  socket.io で WebSocket すら通らなくても大丈夫  シンプルなルーティングなので IPv6 も大丈夫
  • 25. ロックインしない • Amazon ECS を利用しているものの、類似サービスが他にもある  コンテナ関連は情報量も多くなった  それ以外の部分もだいたい検索すればすぐに解決方法が見つかる • コンテナやめて、従来型の運用ツール一式に戻っても良い  当手法にかかるコストが極端に少ないので、手戻りがそもそも少ない  nodejs 単体で動作するものがあるとして、ビルドからデプロイまで一通りやっても一 週間(40h)もやれば、運用に乗る