Mirá el video de esta presentación! https://youtu.be/ATx-sJYti84
Las métricas, herramientas y buenas prácticas para monitorear tus entornos cloud.
¿Qué aprendimos en este capítulo?
- La importancia de la de excelencia operacional en la nube y cómo abordarla
- Preparación de tu entorno para operar en producción
- Ahorrar problemas y noche de insomnio al equipo de operaciones
- Creación de tu ecosistema de herramientas, métricas y alarmas para obtener un monitoreo proactivo y predictivo en producción
Global Azure Lima 2024 - Integración de Datos con Microsoft Fabric
Excelencia operacional: principios, buenas prácticas y herramientas clave
1.
2. Sobre mí
Juan Ignacio Calle Machado
DevOps Engineer @DinoCloud
juan.calle@dinocloudconsulting.com
/juani-calle-machado/
3. Nuestros servicios:
● Ingeniería y arquitectura cloud
● Servicios DevOps
● Administración de infraestructura
● Monitoreo y soporte
Sobre DinoCloud
4. Agenda
● AWS Well Architected Framework (WAF)
● Excelencia operacional: introducción
● Principios de diseño de la EO
● Buenas prácticas
○ Preparación
○ Operación
○ Evolución
● Principales tools en el mercado
● Vistazo: el framework EO de DinoCloud
● Demo
5. AWS Well Architected Framework
● Aplicar a sistemas en el cloud
● Buenas prácticas arquitectónicas
● Conjunto de preguntas fundacionales
Well Architected Framework
Security
Reliability
Op.Excellence
C.optimization
Performance
7. Excelencia Operacional: ¿Qué es?
“the ability to run and monitor systems to deliver business value and to
continually improve supporting processes and procedures”
Concepto de “workload”
13. EO: Buenas prácticas
… aplicadas a :
● Preparación
● Operación
● Evolución
… del “Modelo Operacional”
14. EO: Buenas prácticas
“Operations teams need to understand their business and customer
needs so they can effectively and efficiently support business outcomes.”
15. Buenas prácticas: Preparación
1. ¿Cómo determinamos cuáles son nuestras prioridades?
2. ¿Cómo diseñamos el workload para que conozcamos su estado?
3. ¿Cómo reducimos defectos, facilitamos la recuperación y
mejoramos la transición a producción?
4. ¿Cómo mitigamos riesgos de despliegues?
5. ¿Cómo sabemos si estamos listos para soportar la operación del
sistema (workload)?
16. Buenas prácticas: Operar
“El éxito de las operaciones se mide con el logro de los objetivos de negocios”
● Tener claros objetivos de negocios
● Determinar cómo vamos a medir el nivel de éxito
● Manejar y responder eventos operacionales
● Definir KPIs (Key Performance Metrics)
○ Workload
○ Operaciones
17. Buenas prácticas: Evolución
Preparación Operación
Evolución
● Iteraciones de
trabajo
dedicadas a la
mejora
● Mejoramiento
incremental de
las operaciones
● Inclusión de
nuevos
requerimientos
19. Key Tools
Las tools que son esenciales para la Excelencia Operacional son Terraform o
AWS Cloudformation.
20. Key Tools
Prepare
● AWS Config y AWS Config rules pueden ser usadas para crear estándares
para los workloads.
21. Key Tools
Operate
● Amazon CloudWatch, Logz.io, DataDog y PagerDuty nos permiten supervisar
el estado operativo de un workload.
22. Key Tools
Evolve
● Amazon Elasticsearch Service y Logz.io nos permite analizar sus datos de
registro para obtener información procesable de forma rápida y segura.
24. ● Proporciona servicios de gestión y análisis de logs. La plataforma
combina ELK como un servicio en la nube y machine learning.
Tools que componen el framework
25. ● Brinda servicio de monitorización para aplicaciones en la nube, que
proporciona monitoreo de servidores, bases de datos, herramientas y
servicios.
26. ● Es una plataforma SaaS de respuesta a incidentes para los
departamentos de IT.
28. It’s DEMO TIME!
Demo 1 : Limpieza de disco automatizada.
● Manipularemos el volumen de una instancia para que se activen las alarmas
de cloudwatch y posteriormente una función Lambda se encargue de
realizar un backup del disco en S3.
29. It’s DEMO TIME!
Demo 2 : Detección, acción y auditoría
● Le cambiaremos las credenciales de acceso a la base de datos a una
app en EKS, se activará la alarma en Logz.io y PagerDuty nos notificará
Notas del editor
metricas aalarmas, dashboards, etc
3 grupos de buenas practicas: aplicarlas durante la preparación, la operación y la evolución