Osmius es una herramienta de monitoreo de código abierto que permite medir y monitorear cualquier cosa en una red. Permite medir el estado en tiempo real, anticiparse a problemas y extraer información de datos. Monitoriza instancias como sistemas de red, aplicaciones y bases de datos agrupadas en servicios con acuerdos de nivel de servicio. Usa agentes remotos o intrusivos para recopilar datos y notificar sobre eventos críticos a través de correo electrónico, SMS u otros canales.
3. Reinforcement Learning Bots
¿Cualquier cosa?
Introducción::Índice
● Desde el primer momento diseñado para:
● Sistemas y Dispositivos de Red
● Aplicaciones y Bases de Datos
● Acciones de usuario
● Pero también para monitorizar:
● El mundo Industrial: Sensores.
● Consumos de Energía.
● Nivel contaminación en el barrio.
● Acciones en Bolsa.
● Contador de Personas
Osmius 10.07: Professional Monitoring José Luis Marina Morfeo TI+D 2010 3
10. Reinforcement Learning Bots
Conceptos I
Introducción::Índice
Instancia:
Cualquier cosa que queramos monitorizar
Tipo o Clase de la Instancia:
Qué tipo de preguntas le puedo hacer a la instancia
MySQL Database | Linux Server | Exchange Server
Tipo de los Eventos (las preguntas):
Servidor Linux: Uso de CPU, Uptime, ...
MySQL: # Usuarios Conectados, Slow Queries, ...
Parametros: Cada 10 segundos y con éstos umbrales para Warning y Critical
Event 1 :: Database Connections is: 250
Event 2 :: Uptime is : 8h 30'
Event 1 :: Time to load Web is : 15 s
Event 1 :: CPU Load is : 80%
Osmius 10.07: Professional Monitoring José Luis Marina Morfeo TI+D 2010 10
12. Reinforcement Learning Bots
Conceptos II: Servicios
Introducción::Índice
Servicio:
Un grupo de Instancias cualesquiera.
ANS – Acuerdo de Nivel de Servicio (SLA)
Define los objetivos que tiene que cumplir un servicio.
La Intranet no puede caerse más de un 99.999% de tiempo
Horario del Servicio
¿La Intranet presta servicio 24x7? ¿De 9:00 a 18:00?
Los objetivos del servicio son DENTRO del horario
Además: Paradas Planificadas
Queridos usuarios,
El servicio de publicación Wordpress no estará disponible de
15:00 a 17:00 porque actualizaremos la versión para mejorar
su aspecto y sus funcionalidades.
Este tiempo no contará como incumplimiento de ANS.
Osmius 10.07: Professional Monitoring José Luis Marina Morfeo TI+D 2010 12
13. Reinforcement Learning Bots
Conceptos II: Servicios
Introducción::Índice
Propagación
Objetivos o 99.999 Up por reglas 99.999 Up
ANS Oro
Oro 99.900 Ok
Plata
Plata 99.900 Ok
From M to F
Word From 9 to 17 Wiki
Visión Portal 24x7 Word 24x7
Intranet 24x7 Wiki
por Servicio Portal Press Intranet Media
Press Media
Visión
por lnstancia ... Win Intranet Host
Firewall Postgress Apache
(Técnica) Host DB Homer
Eventos
Osmius 10.07: Professional Monitoring José Luis Marina Morfeo TI+D 2010 13
15. Reinforcement Learning Bots
Tipos de Monitorización
Introducción::Índice
Remota:
Accedemos desde fuera (normalmente con usuario/clave)
Se acerca más a la experiencia de usuario
Pruebas y monitorizas la conectividad.
Agente Web
Agente SSH
Intrusiva:
Accedemos desde dentro (agente)
Tenemos acceso a más información (normalmente)
Pruebas y monitorizas la conectividad.
Agente Linux o Agente de Log
Osmius 10.07: Professional Monitoring José Luis Marina Morfeo TI+D 2010 15
16. Reinforcement Learning Bots
Architectura de Osmius
Introducción::Índice
Central Server Agente
Procesos que reciben y AG1 Se especializa en un tipo
correlacionan los eventos SSL de instancia concreto.
MA MySQL, Linux, Web,..
y los que envía tareas.
AGn
Agente Maestro
Base de Datos CS Punto central desde el que
Modelo de Datos abierto monitorizar y desplegar
y documentado. AG1
agentes.
60.000 eventos/minuto MA Desde 1 a N agentes
AGn
MySql
Consola Web
Arquitectura J2EE Instances
Comunicación con DB Lo que queremos
AG1
WebServices J2EE monitorizar.
MA
TomCat AGn
Osmius 10.07: Professional Monitoring José Luis Marina Morfeo TI+D 2010 16
17. Reinforcement Learning Bots
Tecnología
Introducción::Índice
Central Server Agentes
C++ & ACE & MySql API AG1 C++ & ACE
Rapidez y robustez. SSL API (MySql, Curl,etc)
MA Only new code
Multiplataforma.
AGn
Master Agent
DataBase CS C++ & ACE
Normalizada. Multiplatforma
“Explain” de todas Query AG1
Persistent Queues
Procedimientos Alm MA Tolerante a Fallos
AGn
Consola Web MySql
Java J2EE Instances
Springs – Hibernate Preferimos APIs
OpenLayers
AG1
Reutilización de
J2EE
Grails & Groovy MA conexiones.
TomCat AGn
Osmius 10.07: Professional Monitoring José Luis Marina Morfeo TI+D 2010 17
22. Reinforcement Learning Bots
Notificaciones
Introducción::Índice
Notificaciones y Subscripciones
Service Availability
Intranet
Intranet Working time
Changes email
Instance State Change ....
using SMS when Not Working time
Subscribe to Reports
eComm
eComm Jabber
Global Mark Out of office
Con las notificaciones permitimos hacer una monitorización:
Selectiva
Por otros canales (además de la consola de Eventos)
Añadir un retardo (sólo cuando se mantenga el problema)
Osmius 10.07: Professional Monitoring José Luis Marina Morfeo TI+D 2010 22
25. Reinforcement Learning Bots
Almacenamiento
Introducción::Índice
¿Cómo hacemos para almacenar millones de eventos?
● Round Robin Database.
No necesitamos saber la carga exacta de CPU el día 1 de enero de 2008 a las 8:00.
Cuanto más antiguos sean los datos menos detalle necesitamos.
● Capacidades Integradas Data Warehouse
Existen procesos batch que se encargan de los cálculos y agregaciones pesadas.
● Modo Silencioso.
Lo eventos en “silent mode” sólo se envían cuando cambia la criticidad.
“Monitoriza la temperatura cada 5 segundos pero sólo me la envías cuando supere 30 C”
Ahorra recursos de red y previene cuellos de botella.
Osmius 10.07: Professional Monitoring José Luis Marina Morfeo TI+D 2010 25
26. Reinforcement Learning Bots
Rendimiento
Introducción::Índice
Algunos Datos
En una máquina con un Intel Core Duo a 2,5 GHz Osmius es
capaz de:
● Procesar 60.000 eventos por minuto.
● Almacenar millones de eventos.
● Monitorizar miles de instancias.
● Controlar ANS de miles de servicios.
● Desplegar 500 agentes en menos de 3 minutos.
Más:
http://www.osmius.com/osmwiki/doku.php?id=requerimientos:indice#rendimiento
Osmius 10.07: Professional Monitoring José Luis Marina Morfeo TI+D 2010 26
27. Reinforcement Learning Bots
Ventajas
Introducción::Índice
● Gestionar miles de instancias y millones de eventos.
● Integra Gestión de ANS e ITIL.
● Administración Centralizada.
● Herramientas de Business Intelligence.
● Motor de GIS y ampliable mediante Widgets.
● Software Libre: GPL sin “doble” versionado.
● Buena Documentación.
Osmius 10.07: Professional Monitoring José Luis Marina Morfeo TI+D 2010 27
28. Introducción
¿Preguntas?
24
Manuel Guillermo Fraga – César Silgo – José Luis Marina – 2010 para Morfeo Project