Weitere ähnliche Inhalte
Ähnlich wie Vom DevOps Mindset zur Real Life Organization (20)
Mehr von OPITZ CONSULTING Deutschland (20)
Vom DevOps Mindset zur Real Life Organization
- 1. © OPITZ CONSULTING 2019
Informationsklassifikation:
Öffentlich
Überraschend mehr Möglichkeiten
© OPITZ CONSULTING 2019
Halil Hancioglu
SRE - Vom DevOps
Mindset zur Real Life
Organization
- 2. © OPITZ CONSULTING 2019
Informationsklassifikation:
Öffentlich
Site Reliability Engineering (SRE) - Vom DevOps Mindset zur Real
Life Organization
Seite 2
Halil Hancioglu
Solution Architect &
DevOps Community Member
Fokussiert auf Architektur, DevOps
& CI/CD, Agile, Lean, Integration,
BPM
Kontakt
halil.hancioglu@opitz-consulting.com
oder
+49-(0)-173 72 79 311
- 3. © OPITZ CONSULTING 2019
Informationsklassifikation:
Öffentlich
Site Reliability Engineering (SRE) - Vom DevOps Mindset zur Real
Life Organization
It‘s DevOps
- 4. © OPITZ CONSULTING 2019
Informationsklassifikation:
Öffentlich
Site Reliability Engineering (SRE) - Vom DevOps Mindset zur Real
Life Organization
Break Down the Walls
- 5. © OPITZ CONSULTING 2019
Informationsklassifikation:
Öffentlich
Site Reliability Engineering (SRE) - Vom DevOps Mindset zur Real
Life Organization
DevOps Values: CALMS
C | Culture
Vertrauenskultur, „Fehlerkultur“
Gemeinsame Verantwortung
A | Automation
Prozessautomatisierung
L | Lean
Prozessoptimierung
Transparenz
M | Measurement
Qualitätssicherung durch Überwachung
S | Sharing
Wissen teilen → „open Innovation“
Voneinander Lernen
Kulturbildung
Automatisierung
Lean
Messung
Teilen
- 6. © OPITZ CONSULTING 2019
Informationsklassifikation:
Öffentlich
Site Reliability Engineering (SRE) - Vom DevOps Mindset zur Real
Life Organization
Lust auf Spielen?
Learning from Failures & Improve Recovery
- 7. © OPITZ CONSULTING 2019
Informationsklassifikation:
Öffentlich
Site Reliability Engineering (SRE) - Vom DevOps Mindset zur Real
Life Organization
Small Batch Sizes -> Minimize Risk
- 8. © OPITZ CONSULTING 2019
Informationsklassifikation:
Öffentlich
Site Reliability Engineering (SRE) - Vom DevOps Mindset zur Real
Life Organization
What is SRE?
- 9. © OPITZ CONSULTING 2019
Informationsklassifikation:
Öffentlich
Site Reliability Engineering (SRE) - Vom DevOps Mindset zur Real
Life Organization
- 10. © OPITZ CONSULTING 2019
Informationsklassifikation:
Öffentlich
Site Reliability Engineering (SRE) - Vom DevOps Mindset zur Real
Life Organization
SRE@Google
SRE ist das, was Sie bekommen,
wenn Sie Operations so
behandeln, als ob es sich um
ein Softwareproblem handelt.
- 11. © OPITZ CONSULTING 2019
Informationsklassifikation:
Öffentlich
Site Reliability Engineering (SRE) - Vom DevOps Mindset zur Real
Life Organization
Organizational Structure
- 12. © OPITZ CONSULTING 2019
Informationsklassifikation:
Öffentlich
Site Reliability Engineering (SRE) - Vom DevOps Mindset zur Real
Life Organization
Organizational Structure
Sysadmin: “Too much changes breaks stuff”
Dev: “Let me do it myself”
Sec: “This is dangerous!”
QA: “It’s not ready”
- 13. © OPITZ CONSULTING 2019
Informationsklassifikation:
Öffentlich
Site Reliability Engineering (SRE) - Vom DevOps Mindset zur Real
Life Organization
Organizational Structure
SRE Organisation ist von der Produktentwicklung getrennt
SRE Teams supporten einen dedizierten Service
SRE haben volle Managementunterstützung
SRE fördert die kooperative Arbeit mit einem Shared Ownership Ansatz
- 14. © OPITZ CONSULTING 2019
Informationsklassifikation:
Öffentlich
Site Reliability Engineering (SRE) - Vom DevOps Mindset zur Real
Life Organization
Shared Ownership
Service
- 15. © OPITZ CONSULTING 2019
Informationsklassifikation:
Öffentlich
Site Reliability Engineering (SRE) - Vom DevOps Mindset zur Real
Life Organization
SLI & SLO
- 16. © OPITZ CONSULTING 2019
Informationsklassifikation:
Öffentlich
Site Reliability Engineering (SRE) - Vom DevOps Mindset zur Real
Life Organization
SLI & SLO
Service Level Indicator (SLI)
Eine Metrik, die für den Benutzern wichtig
ist
Ist quantifizierbar
Repräsentiert ein Attribut eines Services
z.B.:
Verfügbarkeit
Empfehlung als Verhältnis von Anzahl
erfolgreicher Ereignisse / Gesamtzahl der
Ereignisse
z.B.: Anzahl erfolgreichen HTTP-Anfragen /
Gesamtanzahl der HTTP-Anfragen
(Erfolgsrate)
Service Level Objective (SLO)
SLI als spezifisches Ziel in Hinblick auf die
Zuverlässigkeit eines Services
Gemeinsames Commitment, um es zu
erreichen
Eckpfeiler von SRE, was strikt an
Konsequenzen gebunden ist
z.B.:
99.9% Verfügbarkeit
- 17. © OPITZ CONSULTING 2019
Informationsklassifikation:
Öffentlich
Site Reliability Engineering (SRE) - Vom DevOps Mindset zur Real
Life Organization
SLI & SLO
- 18. © OPITZ CONSULTING 2019
Informationsklassifikation:
Öffentlich
Site Reliability Engineering (SRE) - Vom DevOps Mindset zur Real
Life Organization
Error Budget
Liefert eine klare, objektive Metrik, die bestimmt, wie unzuverlässig der
Service innerhalb eines Time Frames sein darf
Diese Kennzahl entfernt die Politik aus den Verhandlungen zwischen den
SREs und den Produktentwicklern, wenn es darum geht, wie viel Risiko
man einzukalkulieren hat.
- 19. © OPITZ CONSULTING 2019
Informationsklassifikation:
Öffentlich
Site Reliability Engineering (SRE) - Vom DevOps Mindset zur Real
Life Organization
Error Budget
Solange noch Budget gegeben ist,
kann Released werden, sonst nicht
Die Konsequenzen werden in einer
Error Budget Policy formalisiert
Persönliche Empfindlichkeiten
werden in ein mathematisches
Problem überführt und führen zu
weniger Reibungen
- 20. © OPITZ CONSULTING 2019
Informationsklassifikation:
Öffentlich
Site Reliability Engineering (SRE) - Vom DevOps Mindset zur Real
Life Organization
SLI, SLO & Error Budget
Ein Beispiel
SLO mit einer Erfolgsquote von 99,9% für HTTP-Anfragen
In einem Zeitfenster von 4 Wochen
3 Millionen Anfragen sind eingegangen
Error Budget von 0,1% -> 3.000 HTTP-Anfragen
Wenn ein Service Ausfall 1.500 verpasste HTTP-Anfragen verursacht,
kostet dies 50% des Error Budgets
Nebeneffekt: Reduce Cost of Failure, weil je schneller das Problem
behoben wird, desto weniger Error Budget kostet es (MTTR)
- 21. © OPITZ CONSULTING 2019
Informationsklassifikation:
Öffentlich
Site Reliability Engineering (SRE) - Vom DevOps Mindset zur Real
Life Organization
SLO Dashboard Example
Trend im
Vergleich
zum letzten
Quartal
Trend im
Vergleich
zum selben
Quartal im
Vorjahr
Erfolgreiche
SLOs von
Gesamt SLOs
- 22. © OPITZ CONSULTING 2019
Informationsklassifikation:
Öffentlich
Site Reliability Engineering (SRE) - Vom DevOps Mindset zur Real
Life Organization
Error Budget Burndown Chart Example
- 23. © OPITZ CONSULTING 2019
Informationsklassifikation:
Öffentlich
Site Reliability Engineering (SRE) - Vom DevOps Mindset zur Real
Life Organization
Toil
- 24. © OPITZ CONSULTING 2019
Informationsklassifikation:
Öffentlich
Site Reliability Engineering (SRE) - Vom DevOps Mindset zur Real
Life Organization
Toil
Mühevolle Arbeit für den Betrieb eines produktiven Services
Häufig manuell, wiederkehrend, automatisierbar & wertlos
Skaliert linear mit dem Wachstum eines Services
Kontinuierliches abbauen ist Verpflichtent
Projetbeginn: Kaum Automatisierung & jede Menge Toil
Je weiter das Projekt schreitet: Sehr spezifische Automatisierung & weniger Toil
Wie kann dies sichergestellt werden?
- 25. © OPITZ CONSULTING 2019
Informationsklassifikation:
Öffentlich
Site Reliability Engineering (SRE) - Vom DevOps Mindset zur Real
Life Organization
Engineering Work
- 26. © OPITZ CONSULTING 2019
Informationsklassifikation:
Öffentlich
Site Reliability Engineering (SRE) - Vom DevOps Mindset zur Real
Life Organization
Engineering Work
SREs gehen die Probleme mit Software-Engineering-Ansätzen an
Definierte % Ansatz an Arbeitszeit für Engineering Work
…betrachten die operative Tätigkeit aus Engineering Perspektive
…und nutzen immer die selben Tools
- 27. © OPITZ CONSULTING 2019
Informationsklassifikation:
Öffentlich
Site Reliability Engineering (SRE) - Vom DevOps Mindset zur Real
Life Organization
Downward spiral is inevitable
Diese Konstellation ist zu meiden!
- 28. © OPITZ CONSULTING 2019
Informationsklassifikation:
Öffentlich
Site Reliability Engineering (SRE) - Vom DevOps Mindset zur Real
Life Organization
Monitoring & Alerting
Essenziell, um den Zustand eines Services zu beurteilen
Umfasst Metriken, Logs, Traces, Ereignisse
Alerts: Nur dann, wenn das Ereignis Aufmerksamkeit erfordert
Analyse von Problemen ist essenziell
Visualisierung + Trendbeobachtung
Systemverhalten vor und nach einer Änderung vergleichen
Real Time, um Error Budget zu schonen
- 29. © OPITZ CONSULTING 2019
Informationsklassifikation:
Öffentlich
Site Reliability Engineering (SRE) - Vom DevOps Mindset zur Real
Life Organization
Evernotes SLO Journey
- 30. © OPITZ CONSULTING 2019
Informationsklassifikation:
Öffentlich
Site Reliability Engineering (SRE) - Vom DevOps Mindset zur Real
Life Organization
Comparison to DevOps
Operationale Exzellenz mit Engineering Skills steht im Vordergrund
Shared Ownership vereinfacht Silos aufzulösen
Datenorientierte Messung (Measurement) ist für Beide wichtig
Vorrausetzung für Beide
No Blame Culture
Mindset before Toolset
- 31. © OPITZ CONSULTING 2019
Informationsklassifikation:
Öffentlich
Site Reliability Engineering (SRE) - Vom DevOps Mindset zur Real
Life Organization
SRE Recap
DevOps greifbarer als Organisationstopologie
Akzeptiert den organisatorischen Zustand mit getrennten Bereichen
Funktioniert im Partnerverhältnis
Selbstregulierend
Fördert die kontinuierliche Verbesserung durch dedizierten Engineering
Work
- 32. © OPITZ CONSULTING 2019
Informationsklassifikation:
Öffentlich
Site Reliability Engineering (SRE) - Vom DevOps Mindset zur Real
Life Organization
Google SRE Books
Look at it:
https://landing.google.com/sre/
- 33. © OPITZ CONSULTING 2019
Informationsklassifikation:
Öffentlich
Überraschend mehr Möglichkeiten
@OC_WIRE
OPITZCONSULTING
opitzconsulting
opitz-consulting-bcb8-1009116
WWW.OPITZ-CONSULTING.COM
Wie zuverlässig ist ihr Service?
Halil Hancioglu
Senior Consultant & Leiter Competence Team DevOps
Lazarettstraße 15
45127 Essen
Halil.Hancioglu@opitz-consulting.com
+49 173 72 79 311
DevOps Service Portfolio Seite 33