SlideShare una empresa de Scribd logo
1 de 15
Tomando el pulso
a tu sistema
con Telegraf, InfluxDB y Grafana
t
x
Pulso
● Medición no intrusiva
● Puede dar una idea de salud, estado
emocional, actividad física, etc
● Partiendo de una estado estable
(saludable y en reposo) podría dar
pistas de otras cosas ocurriendo en
el mismo entorno
● No es un número, es cómo cambia
una serie de valores en el tiempo
Series de tiempo
● Métricas asociadas a un momento del tiempo
● Muestra X cambiando en el tiempo, no como X se relaciona con Y
● Muestra datos como una película, no como foto estática
● Cuentan una historia sobre el presente y el pasado
● Permiten ver, explorar y descubrir de forma intuitiva
● Cómo se ve cuando está bien? mal? ahora?
● Umbrales de seguridad
● Correlación con eventos de la “vida real”
● Hacer predicciones
● Patrones
● Tendencias
● Anomalías
● Correlaciones entre métricas
Algunas decisiones de diseño
● No interferencia: Medir no tiene que afectar al sistema medido.
● Frecuencia: Mayor granularidad deja ver cambios repentinos
● Flexible: Cada componente puede reemplazarse o complementarse por
alternativas más adecuadas para lo que se quiere ver.
● Multiplataforma: obtener métricas de muchos sistemas, incluyendo obsoletos.
● Distribuido: La recolección de métricas puede distribuirse.
● Diverso: Métricas de muchos tipos distintos de fuentes
● Abierto: Modificar, inspeccionar, replicar
● Seguro: cada uno define lo que es razonable en esto
Componentes
Colectores
de métricas
Time
Series DB
➢ Telegraf
➢ Prometheus
➢ Beats/Logstash
➢ statsd
➢ Scripts/crons
➢ etc
➢ InfluxDB
➢ Prometheus
➢ Graphite
➢ VictoriaMetrics
➢ ElasticSearch
➢ etc
Dashboards (Grafana)
Detección anomalías
Alertas
● Agente de recolección de métricas genérico
○ Hecho por la misma empresa que hace InfluxDB, pero puede enviar métricas a muchas otras
DBs, actuar como cliente Prometheus y mucho más.
○ toma métricas de 200+ fuentes, incluyendo nativas del equipo (cpu, disco, red, etc), genéricas
de red (snmp, logs, servicios http json, etc) o específicas de plataformas (VMWare, JVM,
Docker, Kubernetes, etc)
● Funcionalidades extra útiles
○ filtros
○ transformaciones
○ agrupaciones
● DB orientada/optimizada para series de tiempo
○ puede guardar/procesar miles de métricas por segundo en hardware modesto
● Lenguaje de consulta parecido a SQL
● Emula interfaces de otras TSDBs populares
○ puede recibir métricas de agentes para graphite, statsd y otros
● Muchos sistemas soportan nativamente enviar métricas a InfluxDB
● Sintaxis de alimentación de datos simple
○ es simple enviar datos desde nuestro propio código o shell scripts
● Políticas de retención y downsampling
○ cuanta historia quiero? necesito la misma granularidad para lo viejo?
● Interfaz web de consulta/visualización de bases de series de tiempo
● Permite hacer dashboards combinando muchas gráficas de métricas, todas
sincronizadas en el tiempo y navegables
● se le pueden configurar alertas y notificaciones
● variables para parametrizar gráficas
● puede recibir y desplegar eventos asociadas a las gráficas
● “Viva”, puede hacer autorefresco de gráficas con frecuencia ajustable
● Fácil e intuitiva para definir gráficas y dashboards, grafana.net tiene plugins y
dashboards ya hechos
● Soporta consultar muchos tipos de fuentes de datos (SQLs, nube, etc)
Telegraf
InfluxDB
Grafana
system,host=miservidor load1=0.55 1422568543702900257
SELECT mean("load1") FROM "system" WHERE "host" = 'miservidor' AND $timeFilter GROUP BY time($interval) fill(null)
métrica
serie
valor
métrica
etiqueta
timestamp (ns)
rango de
tiempo
resolución
Datos de sistema
Integrando distintas medidas/fuentes
Anomalías y alertas
Qué entendemos por sistema?
● “Mi aplicación”
● Computadora donde corre
● Servicios de los que depende
● Red?
● Usuarios?
● Internet?
Todo lo que puede influenciar su funcionamiento correcto y entender porqué se
comporta como lo hace. O el punto donde decidimos dejar de analizar.
Implementación
● Una instalación de InfluxDB en una VM recibe bien variedad de datos de
150+ máquinas cada 30 segundos/1 minuto
● Un Grafana puede manejar varias organizaciones y fuentes de datos
● 1 telegraf por equipo fisico o VM para datos internos (cpu, disco, algunas de
las aplicaciones locales soportadas, etc)
○ Algunos de esos telegraf pueden tomar roles de colectores de métricas de servicios de red
○ Algunos telegraf (con configuraciones alternativas) pueden enviar datos a otros tipos de bases
de datos más adecuados para algunas métricas o analíticas (p/ej logs para Loki o
Elasticsearch)
Implementación (II)
● Algunas aplicaciones pueden enviar métricas (por tiempo o evento)
directamente a Influxdb, o exponerlas en una interfaz REST para Telegraf
● Procesos batch/crons/etc pueden enviar métricas de datos que recolectan o
resultados de ejecución con curl o usando librerías de influxdb.
● Lógica de negocio, deploys en producción, o menciones podrían seguirse y
correlacionarse con otras métricas.
● Dashboards por aplicación, máquina/VM, y por sistema (paneles
representativos de los distintos componentes que hacen el sistema andar).
● En Grafana el uso de variables permite tener un dashboard y aplicarlo a
distintos elementos del mismo tipo

Más contenido relacionado

Similar a Tomando el pulso a tu sistema.pptx

Sistemas Operativos
Sistemas OperativosSistemas Operativos
Sistemas OperativosDaniel
 
Sistemas Operativos 3 E1
Sistemas Operativos 3 E1Sistemas Operativos 3 E1
Sistemas Operativos 3 E1Daniel
 
Sistemas Operativos 3 E1
Sistemas Operativos 3 E1Sistemas Operativos 3 E1
Sistemas Operativos 3 E1Daniel
 
Sy ti 2015-a_datalogger_bohorquez-ludena-ortiz_cv4
Sy ti 2015-a_datalogger_bohorquez-ludena-ortiz_cv4Sy ti 2015-a_datalogger_bohorquez-ludena-ortiz_cv4
Sy ti 2015-a_datalogger_bohorquez-ludena-ortiz_cv4SyTI_2015-A_FLOOJB
 
Arquitectura
ArquitecturaArquitectura
Arquitectura198880917
 
Unidad I
Unidad IUnidad I
Unidad Irey
 
Unidad i
Unidad iUnidad i
Unidad irey
 
C:\Fakepath\Unidad I
C:\Fakepath\Unidad IC:\Fakepath\Unidad I
C:\Fakepath\Unidad Irey
 
Sistemas_ operativos
Sistemas_ operativosSistemas_ operativos
Sistemas_ operativosdobby74
 
Tipos de Sistemas Operativos
Tipos de Sistemas OperativosTipos de Sistemas Operativos
Tipos de Sistemas OperativosPablo Macon
 
Industria 4.0 2017 - Almacenamiento y procesamiento de datos en la nube
Industria 4.0 2017 - Almacenamiento y procesamiento de datos en la nubeIndustria 4.0 2017 - Almacenamiento y procesamiento de datos en la nube
Industria 4.0 2017 - Almacenamiento y procesamiento de datos en la nubeRodrigo Corral
 
Tipos de Sistemas Operativos.pptx
Tipos de Sistemas Operativos.pptxTipos de Sistemas Operativos.pptx
Tipos de Sistemas Operativos.pptxsnoobydoo
 

Similar a Tomando el pulso a tu sistema.pptx (20)

PRTG
PRTGPRTG
PRTG
 
Sistemas operativos 2
Sistemas operativos 2Sistemas operativos 2
Sistemas operativos 2
 
Turbo2
Turbo2Turbo2
Turbo2
 
Sistemas Operativos
Sistemas OperativosSistemas Operativos
Sistemas Operativos
 
Sistemas Operativos 3 E1
Sistemas Operativos 3 E1Sistemas Operativos 3 E1
Sistemas Operativos 3 E1
 
Sistemas Operativos 3 E1
Sistemas Operativos 3 E1Sistemas Operativos 3 E1
Sistemas Operativos 3 E1
 
Sy ti 2015-a_datalogger_bohorquez-ludena-ortiz_cv4
Sy ti 2015-a_datalogger_bohorquez-ludena-ortiz_cv4Sy ti 2015-a_datalogger_bohorquez-ludena-ortiz_cv4
Sy ti 2015-a_datalogger_bohorquez-ludena-ortiz_cv4
 
Arquitectura
ArquitecturaArquitectura
Arquitectura
 
Unidad I
Unidad IUnidad I
Unidad I
 
Unidad i
Unidad iUnidad i
Unidad i
 
C:\Fakepath\Unidad I
C:\Fakepath\Unidad IC:\Fakepath\Unidad I
C:\Fakepath\Unidad I
 
Funciones de un SO
Funciones de un SOFunciones de un SO
Funciones de un SO
 
minds 3
minds 3minds 3
minds 3
 
Sistemas_ operativos
Sistemas_ operativosSistemas_ operativos
Sistemas_ operativos
 
Monitorización con Prometheus
Monitorización con PrometheusMonitorización con Prometheus
Monitorización con Prometheus
 
INTRODUCCION A SISTEMAS OPERATIVOS
INTRODUCCION A SISTEMAS OPERATIVOSINTRODUCCION A SISTEMAS OPERATIVOS
INTRODUCCION A SISTEMAS OPERATIVOS
 
Tipos de Sistemas Operativos
Tipos de Sistemas OperativosTipos de Sistemas Operativos
Tipos de Sistemas Operativos
 
Sistema operativo
Sistema operativoSistema operativo
Sistema operativo
 
Industria 4.0 2017 - Almacenamiento y procesamiento de datos en la nube
Industria 4.0 2017 - Almacenamiento y procesamiento de datos en la nubeIndustria 4.0 2017 - Almacenamiento y procesamiento de datos en la nube
Industria 4.0 2017 - Almacenamiento y procesamiento de datos en la nube
 
Tipos de Sistemas Operativos.pptx
Tipos de Sistemas Operativos.pptxTipos de Sistemas Operativos.pptx
Tipos de Sistemas Operativos.pptx
 

Último

Trabajo Mas Completo De Excel en clase tecnología
Trabajo Mas Completo De Excel en clase tecnologíaTrabajo Mas Completo De Excel en clase tecnología
Trabajo Mas Completo De Excel en clase tecnologíassuserf18419
 
pruebas unitarias unitarias en java con JUNIT
pruebas unitarias unitarias en java con JUNITpruebas unitarias unitarias en java con JUNIT
pruebas unitarias unitarias en java con JUNITMaricarmen Sánchez Ruiz
 
Global Azure Lima 2024 - Integración de Datos con Microsoft Fabric
Global Azure Lima 2024 - Integración de Datos con Microsoft FabricGlobal Azure Lima 2024 - Integración de Datos con Microsoft Fabric
Global Azure Lima 2024 - Integración de Datos con Microsoft FabricKeyla Dolores Méndez
 
9egb-lengua y Literatura.pdf_texto del estudiante
9egb-lengua y Literatura.pdf_texto del estudiante9egb-lengua y Literatura.pdf_texto del estudiante
9egb-lengua y Literatura.pdf_texto del estudianteAndreaHuertas24
 
trabajotecologiaisabella-240424003133-8f126965.pdf
trabajotecologiaisabella-240424003133-8f126965.pdftrabajotecologiaisabella-240424003133-8f126965.pdf
trabajotecologiaisabella-240424003133-8f126965.pdfIsabellaMontaomurill
 
Proyecto integrador. Las TIC en la sociedad S4.pptx
Proyecto integrador. Las TIC en la sociedad S4.pptxProyecto integrador. Las TIC en la sociedad S4.pptx
Proyecto integrador. Las TIC en la sociedad S4.pptx241521559
 
Presentación guía sencilla en Microsoft Excel.pptx
Presentación guía sencilla en Microsoft Excel.pptxPresentación guía sencilla en Microsoft Excel.pptx
Presentación guía sencilla en Microsoft Excel.pptxLolaBunny11
 
EPA-pdf resultado da prova presencial Uninove
EPA-pdf resultado da prova presencial UninoveEPA-pdf resultado da prova presencial Uninove
EPA-pdf resultado da prova presencial UninoveFagnerLisboa3
 
Herramientas de corte de alta velocidad.pptx
Herramientas de corte de alta velocidad.pptxHerramientas de corte de alta velocidad.pptx
Herramientas de corte de alta velocidad.pptxRogerPrieto3
 
International Women's Day Sucre 2024 (IWD)
International Women's Day Sucre 2024 (IWD)International Women's Day Sucre 2024 (IWD)
International Women's Day Sucre 2024 (IWD)GDGSucre
 
Redes direccionamiento y subredes ipv4 2024 .pdf
Redes direccionamiento y subredes ipv4 2024 .pdfRedes direccionamiento y subredes ipv4 2024 .pdf
Redes direccionamiento y subredes ipv4 2024 .pdfsoporteupcology
 
KELA Presentacion Costa Rica 2024 - evento Protégeles
KELA Presentacion Costa Rica 2024 - evento ProtégelesKELA Presentacion Costa Rica 2024 - evento Protégeles
KELA Presentacion Costa Rica 2024 - evento ProtégelesFundación YOD YOD
 
POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...
POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...
POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...silviayucra2
 
CLASE DE TECNOLOGIA E INFORMATICA PRIMARIA
CLASE  DE TECNOLOGIA E INFORMATICA PRIMARIACLASE  DE TECNOLOGIA E INFORMATICA PRIMARIA
CLASE DE TECNOLOGIA E INFORMATICA PRIMARIAWilbisVega
 
guía de registro de slideshare por Brayan Joseph
guía de registro de slideshare por Brayan Josephguía de registro de slideshare por Brayan Joseph
guía de registro de slideshare por Brayan JosephBRAYANJOSEPHPEREZGOM
 

Último (15)

Trabajo Mas Completo De Excel en clase tecnología
Trabajo Mas Completo De Excel en clase tecnologíaTrabajo Mas Completo De Excel en clase tecnología
Trabajo Mas Completo De Excel en clase tecnología
 
pruebas unitarias unitarias en java con JUNIT
pruebas unitarias unitarias en java con JUNITpruebas unitarias unitarias en java con JUNIT
pruebas unitarias unitarias en java con JUNIT
 
Global Azure Lima 2024 - Integración de Datos con Microsoft Fabric
Global Azure Lima 2024 - Integración de Datos con Microsoft FabricGlobal Azure Lima 2024 - Integración de Datos con Microsoft Fabric
Global Azure Lima 2024 - Integración de Datos con Microsoft Fabric
 
9egb-lengua y Literatura.pdf_texto del estudiante
9egb-lengua y Literatura.pdf_texto del estudiante9egb-lengua y Literatura.pdf_texto del estudiante
9egb-lengua y Literatura.pdf_texto del estudiante
 
trabajotecologiaisabella-240424003133-8f126965.pdf
trabajotecologiaisabella-240424003133-8f126965.pdftrabajotecologiaisabella-240424003133-8f126965.pdf
trabajotecologiaisabella-240424003133-8f126965.pdf
 
Proyecto integrador. Las TIC en la sociedad S4.pptx
Proyecto integrador. Las TIC en la sociedad S4.pptxProyecto integrador. Las TIC en la sociedad S4.pptx
Proyecto integrador. Las TIC en la sociedad S4.pptx
 
Presentación guía sencilla en Microsoft Excel.pptx
Presentación guía sencilla en Microsoft Excel.pptxPresentación guía sencilla en Microsoft Excel.pptx
Presentación guía sencilla en Microsoft Excel.pptx
 
EPA-pdf resultado da prova presencial Uninove
EPA-pdf resultado da prova presencial UninoveEPA-pdf resultado da prova presencial Uninove
EPA-pdf resultado da prova presencial Uninove
 
Herramientas de corte de alta velocidad.pptx
Herramientas de corte de alta velocidad.pptxHerramientas de corte de alta velocidad.pptx
Herramientas de corte de alta velocidad.pptx
 
International Women's Day Sucre 2024 (IWD)
International Women's Day Sucre 2024 (IWD)International Women's Day Sucre 2024 (IWD)
International Women's Day Sucre 2024 (IWD)
 
Redes direccionamiento y subredes ipv4 2024 .pdf
Redes direccionamiento y subredes ipv4 2024 .pdfRedes direccionamiento y subredes ipv4 2024 .pdf
Redes direccionamiento y subredes ipv4 2024 .pdf
 
KELA Presentacion Costa Rica 2024 - evento Protégeles
KELA Presentacion Costa Rica 2024 - evento ProtégelesKELA Presentacion Costa Rica 2024 - evento Protégeles
KELA Presentacion Costa Rica 2024 - evento Protégeles
 
POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...
POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...
POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...
 
CLASE DE TECNOLOGIA E INFORMATICA PRIMARIA
CLASE  DE TECNOLOGIA E INFORMATICA PRIMARIACLASE  DE TECNOLOGIA E INFORMATICA PRIMARIA
CLASE DE TECNOLOGIA E INFORMATICA PRIMARIA
 
guía de registro de slideshare por Brayan Joseph
guía de registro de slideshare por Brayan Josephguía de registro de slideshare por Brayan Joseph
guía de registro de slideshare por Brayan Joseph
 

Tomando el pulso a tu sistema.pptx

  • 1. Tomando el pulso a tu sistema con Telegraf, InfluxDB y Grafana t x
  • 2. Pulso ● Medición no intrusiva ● Puede dar una idea de salud, estado emocional, actividad física, etc ● Partiendo de una estado estable (saludable y en reposo) podría dar pistas de otras cosas ocurriendo en el mismo entorno ● No es un número, es cómo cambia una serie de valores en el tiempo
  • 3. Series de tiempo ● Métricas asociadas a un momento del tiempo ● Muestra X cambiando en el tiempo, no como X se relaciona con Y ● Muestra datos como una película, no como foto estática ● Cuentan una historia sobre el presente y el pasado ● Permiten ver, explorar y descubrir de forma intuitiva ● Cómo se ve cuando está bien? mal? ahora? ● Umbrales de seguridad ● Correlación con eventos de la “vida real” ● Hacer predicciones ● Patrones ● Tendencias ● Anomalías ● Correlaciones entre métricas
  • 4. Algunas decisiones de diseño ● No interferencia: Medir no tiene que afectar al sistema medido. ● Frecuencia: Mayor granularidad deja ver cambios repentinos ● Flexible: Cada componente puede reemplazarse o complementarse por alternativas más adecuadas para lo que se quiere ver. ● Multiplataforma: obtener métricas de muchos sistemas, incluyendo obsoletos. ● Distribuido: La recolección de métricas puede distribuirse. ● Diverso: Métricas de muchos tipos distintos de fuentes ● Abierto: Modificar, inspeccionar, replicar ● Seguro: cada uno define lo que es razonable en esto
  • 5. Componentes Colectores de métricas Time Series DB ➢ Telegraf ➢ Prometheus ➢ Beats/Logstash ➢ statsd ➢ Scripts/crons ➢ etc ➢ InfluxDB ➢ Prometheus ➢ Graphite ➢ VictoriaMetrics ➢ ElasticSearch ➢ etc Dashboards (Grafana) Detección anomalías Alertas
  • 6. ● Agente de recolección de métricas genérico ○ Hecho por la misma empresa que hace InfluxDB, pero puede enviar métricas a muchas otras DBs, actuar como cliente Prometheus y mucho más. ○ toma métricas de 200+ fuentes, incluyendo nativas del equipo (cpu, disco, red, etc), genéricas de red (snmp, logs, servicios http json, etc) o específicas de plataformas (VMWare, JVM, Docker, Kubernetes, etc) ● Funcionalidades extra útiles ○ filtros ○ transformaciones ○ agrupaciones
  • 7. ● DB orientada/optimizada para series de tiempo ○ puede guardar/procesar miles de métricas por segundo en hardware modesto ● Lenguaje de consulta parecido a SQL ● Emula interfaces de otras TSDBs populares ○ puede recibir métricas de agentes para graphite, statsd y otros ● Muchos sistemas soportan nativamente enviar métricas a InfluxDB ● Sintaxis de alimentación de datos simple ○ es simple enviar datos desde nuestro propio código o shell scripts ● Políticas de retención y downsampling ○ cuanta historia quiero? necesito la misma granularidad para lo viejo?
  • 8. ● Interfaz web de consulta/visualización de bases de series de tiempo ● Permite hacer dashboards combinando muchas gráficas de métricas, todas sincronizadas en el tiempo y navegables ● se le pueden configurar alertas y notificaciones ● variables para parametrizar gráficas ● puede recibir y desplegar eventos asociadas a las gráficas ● “Viva”, puede hacer autorefresco de gráficas con frecuencia ajustable ● Fácil e intuitiva para definir gráficas y dashboards, grafana.net tiene plugins y dashboards ya hechos ● Soporta consultar muchos tipos de fuentes de datos (SQLs, nube, etc)
  • 9. Telegraf InfluxDB Grafana system,host=miservidor load1=0.55 1422568543702900257 SELECT mean("load1") FROM "system" WHERE "host" = 'miservidor' AND $timeFilter GROUP BY time($interval) fill(null) métrica serie valor métrica etiqueta timestamp (ns) rango de tiempo resolución
  • 13. Qué entendemos por sistema? ● “Mi aplicación” ● Computadora donde corre ● Servicios de los que depende ● Red? ● Usuarios? ● Internet? Todo lo que puede influenciar su funcionamiento correcto y entender porqué se comporta como lo hace. O el punto donde decidimos dejar de analizar.
  • 14. Implementación ● Una instalación de InfluxDB en una VM recibe bien variedad de datos de 150+ máquinas cada 30 segundos/1 minuto ● Un Grafana puede manejar varias organizaciones y fuentes de datos ● 1 telegraf por equipo fisico o VM para datos internos (cpu, disco, algunas de las aplicaciones locales soportadas, etc) ○ Algunos de esos telegraf pueden tomar roles de colectores de métricas de servicios de red ○ Algunos telegraf (con configuraciones alternativas) pueden enviar datos a otros tipos de bases de datos más adecuados para algunas métricas o analíticas (p/ej logs para Loki o Elasticsearch)
  • 15. Implementación (II) ● Algunas aplicaciones pueden enviar métricas (por tiempo o evento) directamente a Influxdb, o exponerlas en una interfaz REST para Telegraf ● Procesos batch/crons/etc pueden enviar métricas de datos que recolectan o resultados de ejecución con curl o usando librerías de influxdb. ● Lógica de negocio, deploys en producción, o menciones podrían seguirse y correlacionarse con otras métricas. ● Dashboards por aplicación, máquina/VM, y por sistema (paneles representativos de los distintos componentes que hacen el sistema andar). ● En Grafana el uso de variables permite tener un dashboard y aplicarlo a distintos elementos del mismo tipo