Más contenido relacionado
La actualidad más candente (20)
Similar a 自動運転業界のSRE活動 (20)
自動運転業界のSRE活動
- 5. SRE journey (in Tier IV)
2019.0
9
2019.4
Q
2020.first half
2020.second half
- Baseline approach risk
assessment
- SRE strategy planning
- (Corporate site renewal)
- Security
- Monitoring
- Log menagement
- SRE study group
- Reference
implementation
- Multi tenancy
- Reference implementation
- Technology selection
- Operation verification in
Asia
- (Office relocation)
- (Postmortem)
- Security
- Fix point observation
- SLA
- Multi region
- Operation verification in EU
- Multi cloud
- Low latency
- (Product strategy)
- (Requirement definition)
- ...
- SLI / SLO study group
- Incident management
- On-Call
- Static code analysis
- (Autoware.Online)
5
2021.first half
Tech blog: https://tech.tier4.jp/entry/2021/01/20/160000
- 6. Issues that should have been resolved
Typical Issue Solutions
セキュリティ
AWSマルチアカウントの
認証/認可が煩雑
AWS Organizations / リスクアセスメン
ト / CIS対応
信頼性
バックアップが取れてい
るか不明
AWS Backupでタグベースのバックアッ
プポリシーを適用
パフォーマンス モニタリング未整備 Datadog / Sentryでシステムを統合監視
コスト最適化
開発者があまり気にかけ
ていない
SREがコストに責任を持ち、月次定例で
毎月レポート / 技術選定
運用性
正常に動いているのか不
明
SLI/SLOの制定 / Incident Management
/ On-Call
- 9. 9
Simulator pipeline
● 数百にのぼるシナリオを自動実行
● シミュレーター自体も何をシミュレートするかに
よって複数存在
①Autowareの修正がリポジトリにPush
②WebhookをAPI Gatewayで受け取る
③AWS StepFunctionの動作状態を
Cloudwatch metricsで監視
- ExecutionsStarted
- ExecutionsSucceeded
- ExecutionsFailed
- ExecutionsAborted
Simulation & CI Pipeline
Autonomous driving-specific feature
Tech blog: https://tech.tier4.jp/entry/2020/09/09/160000
- 12. 12
Multi-region (IaC, Deployment)
Future work
Cloud Formation Terraform
複製 Stacksets Provider alias / workspace
CI/CD Codepipeline
Terraform Cloud / GitHub Actions /
etc...
3rd party
resource
CloudFormation レジストリ -
Pros 最新機能への追随が早い
元々Multi-Cloudを扱える / 管理対象
リソースを制御可能
Cons
管理対象リソースを操作で
きない(importが不十分)
最新機能への追随はコミュニティ頼
り
- 17. 17
Follow the sun
● 必要なタイムゾーンに必要な人材を配置
● 夜間・変則的勤務の回避
● 地域によってはネイティブ言語サポートも可能に
内製に限らずあらゆる選択肢を視野に
On-Call & Support
Future work