Monitorizando contenedores de forma nativa con menos de

Jorge Salamero Sanz
The Dark Art of
Container
Monitoring

¿Cómo montar un sistema de monitorización?
Aplicaciones
Infrastructura
Health
Checks
JVM/JMX
Custom
metrics
Métricas Procesado Unicornios, arcoiris
y dashboards super bárbaros

% whoami
Jorge Salamero Sanz
<jorge.salamero@sysdig.com> @bencerillo
@sysdig
• Working on OSS last 12 years
• Working on OSS+Cloud last 5 years
• Working on monitoring last 3 years
• Technical Marketing Foo geek @sysdig

Agenda
• Retos de la infraestructura con contenedores
• Problemática de la monitorización tradicional
• Buenas prácticas monitorizando contenedores
• Sysdig, monitorización nativa de contenedores

Rompiendo moldes
El uso de microservicios y contenedores rompe
las metodologías de monitorización y análisis tradicionales

Despliegue tradicional
Full host OS
kernel
systemd
syslogd
App services
MySQL
Nginx
OpenSSL
Java
App A
App B
App C
Ops Devs

Esquema de una aplicación
Base de datos Applicación Caché
backend middleware frontend

Revolución de los contenedores
Servidores
Máquinas
Virtuales
Contenedores
Unidad: máquina
Orquestación: no
Arquitectura:
monolítica
Unidad: máquina
Orquestación:
externa
Arquitectura:
monolítica
Unidad: (micro)servicio
Orquestación:
nativa
Arquitectura:
distribuida

Despliegue en contenedores
Sistema
Operativo
completo
kernel
+
Docker
MySQL App A
Ops DevOps
Nginx + OpenSSL App B
Java 8.0 build XXX App C

… pero en realidad:
Base de datos Aplicación Caché
Nodo de cálculo
Nodo de cálculo Nodo de cálculo
Nodo de cálculo

Nuevos esquemas de organización

Monitorización de contenedores
Nuevos retos:
1. Obtención de las métricas
2. Darle sentido a tanta información
3. Análisis y depuración de fallos
4. Equipos por servicio

1. Obtención de métricas
• We containers, porque:
– son sencillos
– son pequeños
– están aislados
– menos dependencias
• … pero son una caja negra opaca

“Apaños”
Agente en el
contenedor
Docker
Agente en el pod
de Kubernetes
Exponer métricas a un
agente externo
App Agente App Agente
App
Agente
App
App
App
1. Instrumentación compleja (x2 debido a la monitorización)
incluyendo configuración de los servicios
2. Colección de métricas pre-establecido y limitado (Docker API, etc)

Instrumentación en el kernel
Kernel
Docker
Container
1
Container
2
Container
3
App App
rkt LXC
Sysdig
Docker
2. Obtención y análisis
1. Instrumentación
en el kernel

Ventajas
• Una instrumentación/agente por host
– crear o destruir un contenedor no require instrumentación
• Completa visibilidad: todas las llamadas al sistema:
– descubrimiento automático de servicios
– se recogen todas las métricas (sin filtrado previo)
– monitorización a nivel de aplicación sin instrumentación
(decodificando el protocolo)

Recordad… pero en realidad:
Base de datos Aplicación Caché
Nodo de cálculo
Nodo de cálculo

2. Darle sentido a tanta información
• Monitorizar la infraestructura debería ser transparente y
automático (sin instrumentación ni configuración)
• Sólo deberías encargarte de tus propias métricas
• Toda métrica debería ser etiquetada automáticamente
• Métricas deben poder segmentarse basándose en los
servicios

Caso real
https://github.com/kubernetes/kubernetes/issues/1405
1

3. Análisis y depuración de fallos
• Imagina:
strace + wireshark + htop + lsof + iostat + vmstat + *
• No disponibles en un contenedor, no los entienden
• Las métricas y los logs no tienen toda la
información, las llamadas al sistema si
• Infraestructura compleja y volátil

Equipos en la infraestructura
Francesc Zacarias, SRE @ Spotify

4. Equipos por servicio
• Etiquetas de la plataforma de orquestación, en
Kubernetes:
– namespaces (dev, prod)
– services, deployments, RCs, pods
– etiquetas propias
• Privilegios de acceso automáticos (dashboards, alertas,
etc) en escenarios multi-tenant

Sysdig
• 100% software libre
• 1M+ descargas
• Análisis en 1 host
• SaaS y on-prem
• 200+ clientes
• Análisis en n hosts
• Dashboards, alertas,
eventos, equipos

Proyectos complementarios
• Sysdig tracers: trazabilidad de transacciones, APM
sencillo (aunque instrumentado)
• Sysdig Falco: monitorización de seguridad de tus
contenedores

¡Gracias!
@bencerillo
@sysdig
www.sysdig.org
www.sysdig.com

Monitorizando contenedores de forma nativa con menos de

Recomendados

Recomendados

Más contenido relacionado

Destacado

Destacado (18)

Similar a Monitorizando contenedores de forma nativa con menos de

Similar a Monitorizando contenedores de forma nativa con menos de (20)

Más de Sysdig

Más de Sysdig (8)

Último

Último (14)

Monitorizando contenedores de forma nativa con menos de