SlideShare a Scribd company logo
1 of 21
SREcon
2016-08-26
社内勉強会
Tsuyoshi Nakamura
https://www.usenix.org/conference/srecon16
勉強会で初めて知り、各
Sessionの動画、スライドを頑
張って追いかけた
Agenda
1. Learn about other companies of SRE
1. In case of Microsoft Azure SRE
2. In case of New Relic
3. In case of Pinterest
4. In case of Netflix
2. 最後まとめ的な
In case of Microsoft Azure SRE
Caskey L. Dickson and Jake Welch
https://www.usenix.org/sites/default/files/conference/protected-files/srecon16_slides_welch.pdf
https://www.usenix.org/conference/srecon16/program/presentation/dickson
Service Roast
目的:欠点だったり、設計上の考慮漏れ、皆がすでに知ってるプロダクト
の課題を理解し、明確に示す
Devから災害復旧までサービス全体のライフサイクルを把握
改善すべき点をあげ、継続的に改善の為を続ける
Why do?
• Builds relationships and trust between the teams
• SRE learns about the service
• Dramatically speeds up ‘newbie to expert’ process
• 加速度的にproductを成長させる
• Exposes details that otherwise would be difficult (or painful) to learn of
• 秘伝のタレ化の排除
• Creates a shared backlog of improvements
• 課題の共有
Tone
• Not an attack on the service
• Not a judgment of past choices
• Focus on ‘How’ questions not ‘Why’ questions
• Why’s can be seen as judgmental
• Every participant must understand this
• Managing emotions is critical to a safe discussion environment
Tone
• Not an attack on the service
• Not a judgment of past choices
• Focus on ‘How’ questions not ‘Why’ questions
• Why’s can be seen as judgmental
• Every participant must understand this
• Managing emotions is critical to a safe discussion environment
In case of New Relic
Alice Goldfuss
https://www.usenix.org/conference/srecon16/program/presentation/goldfuss
https://www.usenix.org/sites/default/files/conference/protected-files/srecon16_slides_goldfuss_0.pdf
Summary
• 政府や軍のインデント対応プロセスから適用したチーム
• Incident Command Systemの応用
• アメリアだと結構有名らしい
• それぞれの役割が明確に定義
• 全体影響を特に考慮されている
In case of Pinterest
Ernie Souhrada
https://www.usenix.org/conference/srecon16/program/presentation/souhrada
https://www.usenix.org/sites/default/files/conference/protected-files/srecon16_slides_souhrada.pdf
History
• 今となってはAWSに100% hostedしているが、以前はオンプレミス環境
• Cloudサービスが普及する前の話
• 1. Individual servers matter.
• 2. Failure is expensive, so it must be prevented.
• 3. Capacity planning can make or break you.
• 4. Sometimes your destiny is still outside your control.
Operational Materialism
運用物質主義?
Now
• 1. Cloud servers can, and do, fail at any time, for any reason.
• 2. Trying to prevent this server failure is an endless source of suffering
for SREs and DBAs alike.
• Trying to prevent server failure leads only to suffering
• 3. Accepting the impermanence of our servers, we should design
systems that are failure-resilient, not failure-resistant.
• Cloud-based servers can fail at any time, for any reason.
• Automated replacement
• Configuration management tools
• 4. We can break the cycle of suffering and create a better experience for
end users, internal customers, and colleagues
Operational Buddhism
仏のような静かな心で見守り続ける?w
In case of Netflix
Jonah Horowitz
https://www.usenix.org/conference/srecon16/program/presentation/horowitz
https://www.usenix.org/sites/default/files/conference/protected-files/srecon16_slides_horowitz.pdf
topic
• 190カ国でサービス展開しているのにSREは5名!?
• SREs are expensive & hard to find
• Freedom & Responsibility
🏁最後まとめ的な
 まぁ会社によってroleの部分で違いは当然ある
 DevOpsの時でも感じたけど、結局サービスをスピード感もってグロースさせていく上で
どうしてもぽてんヒットが生まれてしまう
 そのぽてんヒットをどうやって拾っていくかに始まってる気がする
 チームを優先して動いていれば自然とSRE的なタスクをこなしている事になると思うけど
 その部分をしっかり評価しましょうとなってSRE的なタグが付いたと思う部分がある
 技術的なものよりもむしろマインド的なものが重要?!
 PM的な要素も色々と入ってる気がする
 “SRE should not be a Servant”
 勉強になる情報
 https://github.com/dastergon/awesome-sre/blob/master/README.md

More Related Content

What's hot

Microsoft Antimalware for Azure による Azure 仮想マシンの簡易的なマルウェア対策
Microsoft Antimalware for Azure による Azure 仮想マシンの簡易的なマルウェア対策Microsoft Antimalware for Azure による Azure 仮想マシンの簡易的なマルウェア対策
Microsoft Antimalware for Azure による Azure 仮想マシンの簡易的なマルウェア対策
wintechq
 

What's hot (20)

Azure vm の可用性を見直そう
Azure vm の可用性を見直そうAzure vm の可用性を見直そう
Azure vm の可用性を見直そう
 
Recap: Windows Server 2019 Failover Clustering
Recap: Windows Server 2019 Failover ClusteringRecap: Windows Server 2019 Failover Clustering
Recap: Windows Server 2019 Failover Clustering
 
Interact2019 - Windows Admin Center 2019年6月のお話
Interact2019 - Windows Admin Center 2019年6月のお話Interact2019 - Windows Admin Center 2019年6月のお話
Interact2019 - Windows Admin Center 2019年6月のお話
 
あなたも「違いが分かる人」になりましょう! ~ Azure, AzureStack, AzureStack HCI ~
あなたも「違いが分かる人」になりましょう! ~ Azure, AzureStack, AzureStack HCI ~あなたも「違いが分かる人」になりましょう! ~ Azure, AzureStack, AzureStack HCI ~
あなたも「違いが分かる人」になりましょう! ~ Azure, AzureStack, AzureStack HCI ~
 
負荷軽減!整合性もバッチリ!Veeamのストレージ連携セミナー!!
負荷軽減!整合性もバッチリ!Veeamのストレージ連携セミナー!!負荷軽減!整合性もバッチリ!Veeamのストレージ連携セミナー!!
負荷軽減!整合性もバッチリ!Veeamのストレージ連携セミナー!!
 
Veeam新機能 徹底解説 Part 6:マルチテナント環境でのバックアップ/リストアを楽々実現! ユーザによるセルフサービスな運用もVeeamで!
Veeam新機能 徹底解説 Part 6:マルチテナント環境でのバックアップ/リストアを楽々実現! ユーザによるセルフサービスな運用もVeeamで!Veeam新機能 徹底解説 Part 6:マルチテナント環境でのバックアップ/リストアを楽々実現! ユーザによるセルフサービスな運用もVeeamで!
Veeam新機能 徹底解説 Part 6:マルチテナント環境でのバックアップ/リストアを楽々実現! ユーザによるセルフサービスな運用もVeeamで!
 
App controllerとwindows azure packで作る大規模プライベートクラウド
App controllerとwindows azure packで作る大規模プライベートクラウドApp controllerとwindows azure packで作る大規模プライベートクラウド
App controllerとwindows azure packで作る大規模プライベートクラウド
 
第1回CloudStack読書会
第1回CloudStack読書会第1回CloudStack読書会
第1回CloudStack読書会
 
Microsoft Antimalware for Azure による Azure 仮想マシンの簡易的なマルウェア対策
Microsoft Antimalware for Azure による Azure 仮想マシンの簡易的なマルウェア対策Microsoft Antimalware for Azure による Azure 仮想マシンの簡易的なマルウェア対策
Microsoft Antimalware for Azure による Azure 仮想マシンの簡易的なマルウェア対策
 
卒業制作 サーバーの脆弱性情報管理システム
卒業制作 サーバーの脆弱性情報管理システム卒業制作 サーバーの脆弱性情報管理システム
卒業制作 サーバーの脆弱性情報管理システム
 
ノベル様講演 OpenStack最新情報セミナー 2014年8月
ノベル様講演 OpenStack最新情報セミナー 2014年8月ノベル様講演 OpenStack最新情報セミナー 2014年8月
ノベル様講演 OpenStack最新情報セミナー 2014年8月
 
July Tech Festa 2020 AKSを活用した内製教育支援プラットフォームをリリースした話
July Tech Festa 2020 AKSを活用した内製教育支援プラットフォームをリリースした話July Tech Festa 2020 AKSを活用した内製教育支援プラットフォームをリリースした話
July Tech Festa 2020 AKSを活用した内製教育支援プラットフォームをリリースした話
 
Azure Network Security Group(NSG) はじめてのDeep Dive
Azure Network Security Group(NSG) はじめてのDeep DiveAzure Network Security Group(NSG) はじめてのDeep Dive
Azure Network Security Group(NSG) はじめてのDeep Dive
 
Service Fabric での高密度配置
 Service Fabric での高密度配置 Service Fabric での高密度配置
Service Fabric での高密度配置
 
0709wordbench新潟
0709wordbench新潟0709wordbench新潟
0709wordbench新潟
 
老朽化したオンプレ環境をクラウドへ移設
老朽化したオンプレ環境をクラウドへ移設老朽化したオンプレ環境をクラウドへ移設
老朽化したオンプレ環境をクラウドへ移設
 
Dev@cloudの実装
Dev@cloudの実装Dev@cloudの実装
Dev@cloudの実装
 
ランサムウェアをサーバー側から対策する
ランサムウェアをサーバー側から対策するランサムウェアをサーバー側から対策する
ランサムウェアをサーバー側から対策する
 
ホワイトペーパー「Veeam ONEによる 仮想環境の最適化への導き方」
ホワイトペーパー「Veeam ONEによる 仮想環境の最適化への導き方」ホワイトペーパー「Veeam ONEによる 仮想環境の最適化への導き方」
ホワイトペーパー「Veeam ONEによる 仮想環境の最適化への導き方」
 
Monitoring あれこれ
Monitoring あれこれMonitoring あれこれ
Monitoring あれこれ
 

Viewers also liked

Abstract - Computational Fluid Dynamics Study of a Hull of an Autonomous Unde...
Abstract - Computational Fluid Dynamics Study of a Hull of an Autonomous Unde...Abstract - Computational Fluid Dynamics Study of a Hull of an Autonomous Unde...
Abstract - Computational Fluid Dynamics Study of a Hull of an Autonomous Unde...
Ruben Martins Pereira
 

Viewers also liked (13)

Test
TestTest
Test
 
Jornal Cidade - Lagoa da Prata - Nº 66 - 20/11/2015
Jornal Cidade - Lagoa da Prata - Nº 66 - 20/11/2015Jornal Cidade - Lagoa da Prata - Nº 66 - 20/11/2015
Jornal Cidade - Lagoa da Prata - Nº 66 - 20/11/2015
 
KATPRO
KATPROKATPRO
KATPRO
 
Public Place
Public PlacePublic Place
Public Place
 
Sistema nervioso
Sistema nerviosoSistema nervioso
Sistema nervioso
 
Medicina
MedicinaMedicina
Medicina
 
SugarSync
SugarSyncSugarSync
SugarSync
 
Esther onyeneke
Esther onyenekeEsther onyeneke
Esther onyeneke
 
Escaleta 2da. edición programa de TV DBD
Escaleta  2da. edición programa de TV DBDEscaleta  2da. edición programa de TV DBD
Escaleta 2da. edición programa de TV DBD
 
Ficha Técnica de la Compañía Graña y Montero SAA
Ficha Técnica de la Compañía Graña y Montero SAAFicha Técnica de la Compañía Graña y Montero SAA
Ficha Técnica de la Compañía Graña y Montero SAA
 
Abstract - Computational Fluid Dynamics Study of a Hull of an Autonomous Unde...
Abstract - Computational Fluid Dynamics Study of a Hull of an Autonomous Unde...Abstract - Computational Fluid Dynamics Study of a Hull of an Autonomous Unde...
Abstract - Computational Fluid Dynamics Study of a Hull of an Autonomous Unde...
 
Escaleta 1a. edición programa de TV DBD
Escaleta  1a. edición programa de TV DBDEscaleta  1a. edición programa de TV DBD
Escaleta 1a. edición programa de TV DBD
 
Optimization of Process Parameters in Turning Operation of AISI-1016 Alloy St...
Optimization of Process Parameters in Turning Operation of AISI-1016 Alloy St...Optimization of Process Parameters in Turning Operation of AISI-1016 Alloy St...
Optimization of Process Parameters in Turning Operation of AISI-1016 Alloy St...
 

Similar to Sr econt

全世界135か国に配信したレーシングゲーム『ACR DRIFT』の制作秘話と技術基盤の構築について
全世界135か国に配信したレーシングゲーム『ACR DRIFT』の制作秘話と技術基盤の構築について全世界135か国に配信したレーシングゲーム『ACR DRIFT』の制作秘話と技術基盤の構築について
全世界135か国に配信したレーシングゲーム『ACR DRIFT』の制作秘話と技術基盤の構築について
CROOZ, inc.
 
Osc spring cloud_stack20130223
Osc spring cloud_stack20130223Osc spring cloud_stack20130223
Osc spring cloud_stack20130223
Noriko Suto
 
OpenStack on OpenStack with CI
OpenStack on OpenStack with CIOpenStack on OpenStack with CI
OpenStack on OpenStack with CI
kanabuchi
 

Similar to Sr econt (20)

エンジニアの気持ちを完全に理解してくれている Cypress Cloud
エンジニアの気持ちを完全に理解してくれている Cypress Cloudエンジニアの気持ちを完全に理解してくれている Cypress Cloud
エンジニアの気持ちを完全に理解してくれている Cypress Cloud
 
クラウド案件の作り方 for azureしなの4周年
クラウド案件の作り方 for azureしなの4周年クラウド案件の作り方 for azureしなの4周年
クラウド案件の作り方 for azureしなの4周年
 
全世界135か国に配信したレーシングゲーム『ACR DRIFT』の制作秘話と技術基盤の構築について
全世界135か国に配信したレーシングゲーム『ACR DRIFT』の制作秘話と技術基盤の構築について全世界135か国に配信したレーシングゲーム『ACR DRIFT』の制作秘話と技術基盤の構築について
全世界135か国に配信したレーシングゲーム『ACR DRIFT』の制作秘話と技術基盤の構築について
 
Essentials of container
Essentials of containerEssentials of container
Essentials of container
 
Eight meets AWS
Eight meets AWSEight meets AWS
Eight meets AWS
 
スカイアーチセミナー:自社アプリをクラウド展開する為の『失敗しない3つの法則
スカイアーチセミナー:自社アプリをクラウド展開する為の『失敗しない3つの法則スカイアーチセミナー:自社アプリをクラウド展開する為の『失敗しない3つの法則
スカイアーチセミナー:自社アプリをクラウド展開する為の『失敗しない3つの法則
 
Osc spring cloud_stack20130223
Osc spring cloud_stack20130223Osc spring cloud_stack20130223
Osc spring cloud_stack20130223
 
UShareSoft_20130425
UShareSoft_20130425UShareSoft_20130425
UShareSoft_20130425
 
UShareSoft_20130425
UShareSoft_20130425UShareSoft_20130425
UShareSoft_20130425
 
JavaOne2017参加報告 Microservices topic & approach #jjug
JavaOne2017参加報告 Microservices topic & approach #jjugJavaOne2017参加報告 Microservices topic & approach #jjug
JavaOne2017参加報告 Microservices topic & approach #jjug
 
vSphere 4の気になる機能を試してみた
vSphere 4の気になる機能を試してみたvSphere 4の気になる機能を試してみた
vSphere 4の気になる機能を試してみた
 
しばちょう先生による特別講義! RMANバックアップの運用と高速化チューニング
しばちょう先生による特別講義! RMANバックアップの運用と高速化チューニングしばちょう先生による特別講義! RMANバックアップの運用と高速化チューニング
しばちょう先生による特別講義! RMANバックアップの運用と高速化チューニング
 
IaC化の3つのポイント
IaC化の3つのポイントIaC化の3つのポイント
IaC化の3つのポイント
 
CaitSith 新しいルールベースのカーネル内アクセス制御
CaitSith 新しいルールベースのカーネル内アクセス制御CaitSith 新しいルールベースのカーネル内アクセス制御
CaitSith 新しいルールベースのカーネル内アクセス制御
 
EMC様講演 OpenStack最新情報セミナー 2014年6月
EMC様講演 OpenStack最新情報セミナー 2014年6月EMC様講演 OpenStack最新情報セミナー 2014年6月
EMC様講演 OpenStack最新情報セミナー 2014年6月
 
DevOps and Compliance and Security
DevOps and Compliance and SecurityDevOps and Compliance and Security
DevOps and Compliance and Security
 
OpenStack on OpenStack with CI
OpenStack on OpenStack with CIOpenStack on OpenStack with CI
OpenStack on OpenStack with CI
 
AZAREA-Clusterセミナー(クラウドEXPO2013春)
AZAREA-Clusterセミナー(クラウドEXPO2013春)AZAREA-Clusterセミナー(クラウドEXPO2013春)
AZAREA-Clusterセミナー(クラウドEXPO2013春)
 
オトナのDocker入門
オトナのDocker入門オトナのDocker入門
オトナのDocker入門
 
はじめての Azure 開発
はじめての Azure 開発はじめての Azure 開発
はじめての Azure 開発
 

Recently uploaded

Recently uploaded (11)

新人研修 後半 2024/04/26の勉強会で発表されたものです。
新人研修 後半        2024/04/26の勉強会で発表されたものです。新人研修 後半        2024/04/26の勉強会で発表されたものです。
新人研修 後半 2024/04/26の勉強会で発表されたものです。
 
論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding
論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding
論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding
 
Utilizing Ballerina for Cloud Native Integrations
Utilizing Ballerina for Cloud Native IntegrationsUtilizing Ballerina for Cloud Native Integrations
Utilizing Ballerina for Cloud Native Integrations
 
知識ゼロの営業マンでもできた!超速で初心者を脱する、悪魔的学習ステップ3選.pptx
知識ゼロの営業マンでもできた!超速で初心者を脱する、悪魔的学習ステップ3選.pptx知識ゼロの営業マンでもできた!超速で初心者を脱する、悪魔的学習ステップ3選.pptx
知識ゼロの営業マンでもできた!超速で初心者を脱する、悪魔的学習ステップ3選.pptx
 
論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games
論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games
論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games
 
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
 
Observabilityは従来型の監視と何が違うのか(キンドリルジャパン社内勉強会:2022年10月27日発表)
Observabilityは従来型の監視と何が違うのか(キンドリルジャパン社内勉強会:2022年10月27日発表)Observabilityは従来型の監視と何が違うのか(キンドリルジャパン社内勉強会:2022年10月27日発表)
Observabilityは従来型の監視と何が違うのか(キンドリルジャパン社内勉強会:2022年10月27日発表)
 
LoRaWANスマート距離検出センサー DS20L カタログ LiDARデバイス
LoRaWANスマート距離検出センサー  DS20L  カタログ  LiDARデバイスLoRaWANスマート距離検出センサー  DS20L  カタログ  LiDARデバイス
LoRaWANスマート距離検出センサー DS20L カタログ LiDARデバイス
 
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアルLoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
 
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
 
論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...
論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...
論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...
 

Sr econt