SlideShare una empresa de Scribd logo
1 de 42
Descargar para leer sin conexión
Présentation

Alain Ganuchaud
Consultant chez Core IT Project
http://www.coreit.fr
alain@coreit.fr

Agence commerciale Lyon
chris@coreit.fr
Agence commerciale Valence
steph@coreit.fr

1/42

Zabbix Webinar
Optimisation des
Performances Zabbix
Tirez le meilleur de vos serveurs

2/42

Zabbix Webinar
De quoi s’agit-il ?

• Vue d’ensemble des performances Zabbix
• Etape 1. Identifiez et corrigez les problèmes basiques
• Etape 2. Optimisez les paramètres Zabbix
• Etape 3. Et plus encore …
3/42

Zabbix Webinar
Vue d’ensemble
Quels sont les éléments de performance Zabbix?

4/42

Zabbix Webinar
Flux de données standard
Alerter

GUI

Poller

DATA

Escalator

History
syncer

Poller

DATA

DATA
History
syncer

Trapper

Database
Conf
syncer

Conf syncer

OTHER

Trapper

DATA

Serveur Zabbix

Architecture standalone (pas de proxies, non distribuée)
5/42

Zabbix Webinar
Zabbix Server Components
poller
Zabbix server
Configuration
cache

alerter
escalator

ipmi poller
unreachable poller
proxy poller

self-monitoring
History & trends
cache
timer

icmp pinger

history syncer

db watchdog

trapper
http poller
discoverer
node watcher

configuration syncer

housekeeper

java gateway poller

snmp trapper

Database

6/31

Zabbix Webinar
Zabbix Server Components
alerter – envoie les notifications
configuration syncer – gère le cache des configurations
db watchdog - surveille la dispo de la base de données
Discoverer – gère le changement des composants découverts par le
réseau
Escalator – gère les escalades
history syncer – écrit les données mesurées dans la base
http poller processes – déroule les scénarii web
Housekeeper – nettoie périodiquement les données obsoletes de la
base
icmp pinger - icmpping & icmppingpersec items
ipmi poller - IPMI items
node watcher – gère les nodes en architecture distribuée
Self-monitoring – mesure les internes
Poller – collecte les données des agents passifs et snmp
proxy poller – gère les proxies passifs
Timer – gère les fonctions de temps pour les triggers et les périodes de
maintenance
Trapper – gère les connexions entrantes notamment les active agents,
zabbix_sender and active Zabbix proxies
unreachable poller – gère les hosts non dispos

7/42

Zabbix Webinar
Métriques de Performance
Zabbix
• Nombre de valeurs proceessées par seconde (NVPS)
• Evaluation des NVS dans le tableau de bord

NVPS

8/42

Zabbix Webinar
Performances assurées par
Zabbix

Hardware: Quad Core CPU, 6GB, RAID10 BBWC*
Budget: ~ 2K EUR

• Zabbix est capable d’assurer 1 million de valeurs par
minute ( ~15.000 valeurs /s)

• En pratique, ce sera moins. Pourquoi?!
* Battery Backed Write Cache

9/42

Zabbix Webinar
Facteurs impactant les
performances
• Type d’items, types de valeurs, SNMPv3, nombre de
triggers et la nature des triggers

• Paramètrages du Housekeeper et la taille de la
Database

• Nombre d’utilisateurs sur le frontend
• Complexité des triggers
10/42

Zabbix Webinar
Performance versus nombre
d’hôtes
60 items par hôte, régularité une fois par minute
Nombre d’hôtes
100
1000
10000

Performance (valeurs par seconde)
100
1000
10000

600 items par hôte, régularité une fois par minute
Nombre d’hôtes
100
1000
10000
11/42

Performance (valeurs par seconde)
1000
10000
100000
Zabbix Webinar
Lent versus Rapide
Objet

Lent

Rapide

Taille de la base

Volumineuse

Montée en RAM

Expressions des
Triggers
Collecte des
données

min(),max(),avg() last(), nodata()

Type des données

Texte, string

12/42

Polling (SNMP,
Trappers (agents
Agent-less, agents actifs)
passifs)
Numerique

Zabbix Webinar
Symptomes de baisse des
performances
• La Queue d'attente Zabbix a trop de mesures en retard
Administration->Queue

• Trous dans les graphes, pas de données pour certains
items

• Faux positifs pour les triggers ayant des fonctions
nodata()

• Front-end lent
13/42

Zabbix Webinar
Queue sans problème

14/42

Zabbix Webinar
Identifiez et corrigez
les problèmes
courants
ETAPE 1

15/42

Zabbix Webinar
Ressentis différents
• “J’ai ajouté 5 hôtes et Zabbix est mort” :-(
• “Zabbix trop LENT, je n’ai que 48 hôtes” :-(
Pourtant:

• “Zabbix jalon 3 - 1000 hôtes et ça continue” :-)
• “Notre dernier point: 8500 hôtes, 950400 items,
670340 triggers, 9550 vps” :-)

:-) - Happy!
16/42

:-( - Unhappy!
Zabbix Webinar
Problèmes courants
• Utilisation des templates par défaut
• Personnalisez vos templates
• Paramètres par défaut de la base de données
• Optimisez la base de données
• Paramètres par défaut des processus zabbix_server
• Optimisez les paramètres de la config zabbix_server
• Housekeeper
• Désactivez -le
• Utilisation de releases trop anciennes
• Mettez à jour régulièrement
17/42

Zabbix Webinar
Comment savoir si les
performances de la base sont
mauvaises?
Fichier de config du serveur zabbix, zabbix_server.conf:

LogSlowQueries=1000

18/42

Zabbix Webinar
Optimisez la
configuration de
Zabbix
ETAPE 2

19/42

Zabbix Webinar
Surveillez les items internes
• Nombre réel de VPS
• zabbix[wcache, values, all]
• zabbix[queue,1m] nombre d’items en retard de plus
d’une minute

• Zabbix Server components
• Alerter, Configuration syncer, DB watchdog,

discoverer, escalator, history syncer, http poller,
housekeeper, icmp pinger, ipmi poller, poller,
trapper

20/42

Zabbix Webinar
Surveillez les items internes

Avant la 1.8.5, il était impossible
d’avoir le statut de chaque
composant Zabbix.

21/42

Zabbix Webinar
Surveillez les items internes
• Depuis la 1.8.5, il est possible d’avoir le statut de
chaque composant Zabbix

• Pourcentage du temps d’un processus en état
BUSY

• zabbix[process,<type>,<mode>,<state>]
• <type> - trapper, discoverer, escalator, alerter, etc
• <mode> - avg, count, min, max
• <state> - busy, idle
22/42

Zabbix Webinar
Graphez le Busy Time

• A graph indicating a problem

23/42

Zabbix Webinar
Optimisez le nombre de
processus Zabbix
Fichier de configuration du serveur Zabbix, zabbix_server.conf:

StartPollers=80
StartPingers=10
StartPollersUnreachable=80
StartIPMIPollers=10
StartTrappers=20
StartDBSyncers=8
24/42

Zabbix Webinar
Et après ?
ETAPE 3

25/42

Zabbix Webinar
Utilisez les Proxies
Alerter

Trapper

DATA

Proxy

History
syncer

History
syncer

Conf
syncer

Conf syncer

OTHER

Pollers

DATA

Proxy

Escalator

Pollers

DATA

Trapper

DATA
Trapper

Trapper

DATA

Zabbix Server

Les Proxies déchargent le serveur de la collecte
26/42

Zabbix Webinar
Partitionnez vos tables
• Méthode pour répartir les grosses tables en petites
partitions.

• C’est surtout important pour les tables d’historiques:
• history_*, trends*, events
• Bénéfices
• Il est plus facile de supprimer les données
obsoletes

• Pas d’impact à la suppression des historiques
27/42

Zabbix Webinar
Zabbix server DB access
Housekeeper
Trends

28/42

Zabbix Webinar
Pas de table partitioning

Zabbix
Server
& GUI

29/42

History

Zabbix Webinar
Avec du table partitioning
Partition 2013_09

Zabbix
Server
& GUI

Partition 2013_08

Partition 2013_07

Partition 2013_06

30/42

Zabbix Webinar
J’ai tout essayé!
Les performances sont
toujours minables.
Architecture 3Tiers, répartissez sur 3 serveurs séparés!

Database
Zabbix Server
24 core CPU
8 core CPU
64GB of RAM
4GB of RAM
Disques rapides

31/42

Zabbix GUI
Fast CPU
4GB of RAM

Zabbix Webinar
Check List
Soyez certains de n’avoir rien oublié!

32/42

Zabbix Webinar
Check list
• Les Internes Zabbix sont surveillés!
• Sinon vous n’avez aucune visibilité sur la santé de
votre plateforme Zabbix

• La configuration Zabbix est optimisée
• Les performances de la Base de données sont
optimisées

• Le Housekeeper est dévalidé, utilisez le partitionning
DisableHousekeeper=1
33/42

Zabbix Webinar
Lectures de chevet
• MySQL & PostgreSQL Performance Tuning Guides
• Table partitioning for Zabbix
• MySQL: zabbixzone.com
• PostgreSQL:

https://www.zabbix.org/wiki/Docs/howto/zabbix2_
postgresql_partitioning

• Zabbix Internal Checks
• http://blog.zabbix.com/monitoring-how-busy-zabbi
x-processes-are

• http://www.zabbix.com/documentation/1.8/manual
/config/items#internal_checks

34/42

Zabbix Webinar
Retours d'expérience 1/8
• A partir de quelles NVS a-t-on des problèmes de
Perf ?

• 500 NVS (attention c'est une évaluation de Zabbix)

• Ne gardez pas une installation Zabbix par défaut
• Ne négligez pas les accès au Frontend
• Hackez le frontend (Limitation des périodes de
graphes)
• Dévalidez le housekeeping & Partitionnez
• Changez l'architecture Zabbix
35/42

Zabbix Webinar
Retours d'expérience 2/8

Archi PRA peut vous aider !
36/42

Zabbix Webinar
Retours d'expérience 3/8
• Limitez la taille de la base
• Baissez les durées des historiques
• Augmentez les durées des tendances
• Augmentez les régularités

• Ne soyez pas radin sur le Hardware
• 2/3 du budget pour le serveur de base de données
• Disques SSD pour la base de données
• 95% des problèmes de perf = Base de données

37/42

Zabbix Webinar
Retours d'expérience 4/8
• Mettez à jour Zabbix et Base de données
• Zabbix 1.8 < Zabbix 2.0 < Zabbix 2.2
• Mysql 5.5 < Mysql 5.6

• N'adoptez pas l'architecture DM avant la 2.4
• Je ne suis pas convaincu par l'ajout de proxies
• Architecture DM Master/Child à proscrire
• Architecture DM Master/Child à reconsidérer en
version 2.4 (fin 2014 / début 2015)

38/42

Zabbix Webinar
Retours d'expérience 5/8
• Active vs Passive
• Passive Proxy < Active Proxy
• Passive Agent < Active Agent

• Surveillez les paramètres internes
• Busy processes > 50 %
• Caches < 80 %
• ATTENTION StartDBSyncers

39/42

Zabbix Webinar
Retours d'expérience 6/8
• Choisissez la bonne base de données
• Proscrivez DB2
• Oracle < Postgresql < Mysql (PerconaDB &
MariaDB)
• Réservez sqlite aux proxies peu chargés (voire
embarqués)

• Clustérisez votre base de données
• Galera V24 supporte Mysql 5.6
• Percona XtraDB Cluster intègre la réplication Galera
• MariaDB Galera Cluster
40/42

Zabbix Webinar
Retours d'expérience 7/8

• Top 10 des problèmes de perf
1) Base de données
2) Config Zabbix

3) Organisation de la surveillance
4) CPU Serveur Zabbix
5) ...
6) ...
7) ...
8) ...
9) ...
10)Réseau : Jamais
41/42

Zabbix Webinar
Retours d'expérience 8/8
• Top 10 des outils utilisés
1) Innotop
2) Mysqltuner
3) Tuning-primer.sh
4) iostat
5) tcpdump

42/42

Zabbix Webinar

Más contenido relacionado

La actualidad más candente

Alexei vladishev - Open Source Monitoring With Zabbix
Alexei vladishev - Open Source Monitoring With ZabbixAlexei vladishev - Open Source Monitoring With Zabbix
Alexei vladishev - Open Source Monitoring With ZabbixAndré Déo
 
Alexei Vladishev - Zabbix - Monitoring Solution for Everyone
Alexei Vladishev - Zabbix - Monitoring Solution for EveryoneAlexei Vladishev - Zabbix - Monitoring Solution for Everyone
Alexei Vladishev - Zabbix - Monitoring Solution for EveryoneZabbix
 
Etude et mise en place d'une solution d'administration et de supervision Open...
Etude et mise en place d'une solution d'administration et de supervision Open...Etude et mise en place d'une solution d'administration et de supervision Open...
Etude et mise en place d'une solution d'administration et de supervision Open...Chiheb Ouaghlani
 
ETUDE ET MISE EN PLACE D’UNE SOLUTION DE GESTION DE LA SECURITE DU RESEAU : C...
ETUDE ET MISE EN PLACE D’UNE SOLUTION DE GESTION DE LA SECURITE DU RESEAU : C...ETUDE ET MISE EN PLACE D’UNE SOLUTION DE GESTION DE LA SECURITE DU RESEAU : C...
ETUDE ET MISE EN PLACE D’UNE SOLUTION DE GESTION DE LA SECURITE DU RESEAU : C...Tidiane Sylla
 
Zabbix Performance Tuning
Zabbix Performance TuningZabbix Performance Tuning
Zabbix Performance TuningRicardo Santos
 
Sécurité Réseau à Base d'un Firewall Matériel (fortigate)
Sécurité Réseau à Base d'un Firewall Matériel (fortigate)Sécurité Réseau à Base d'un Firewall Matériel (fortigate)
Sécurité Réseau à Base d'un Firewall Matériel (fortigate)Sakka Mustapha
 
alphorm.com - Formation Linux LPIC-1/Comptia Linux+
alphorm.com - Formation Linux LPIC-1/Comptia Linux+alphorm.com - Formation Linux LPIC-1/Comptia Linux+
alphorm.com - Formation Linux LPIC-1/Comptia Linux+Alphorm
 
Alphorm.com Formation Microsoft Azure (AZ-104) : Administration
Alphorm.com Formation Microsoft Azure (AZ-104) : AdministrationAlphorm.com Formation Microsoft Azure (AZ-104) : Administration
Alphorm.com Formation Microsoft Azure (AZ-104) : AdministrationAlphorm
 
Ansible Automation to Rule Them All
Ansible Automation to Rule Them AllAnsible Automation to Rule Them All
Ansible Automation to Rule Them AllTim Fairweather
 
Zabbix monitoring in 5 pictures
Zabbix monitoring in 5 pictures  Zabbix monitoring in 5 pictures
Zabbix monitoring in 5 pictures Nicola Mauri
 
Rapport PFE ingénieur réseaux marwen SAADAOUI ( Juin 2018 )
Rapport PFE ingénieur réseaux marwen SAADAOUI ( Juin 2018 )Rapport PFE ingénieur réseaux marwen SAADAOUI ( Juin 2018 )
Rapport PFE ingénieur réseaux marwen SAADAOUI ( Juin 2018 )Saadaoui Marwen
 
Alphorm.com Formation Red Hat RH124
Alphorm.com Formation Red Hat RH124Alphorm.com Formation Red Hat RH124
Alphorm.com Formation Red Hat RH124Alphorm
 

La actualidad más candente (20)

Mini projet Zabbix
Mini projet ZabbixMini projet Zabbix
Mini projet Zabbix
 
Alexei vladishev - Open Source Monitoring With Zabbix
Alexei vladishev - Open Source Monitoring With ZabbixAlexei vladishev - Open Source Monitoring With Zabbix
Alexei vladishev - Open Source Monitoring With Zabbix
 
Alexei Vladishev - Zabbix - Monitoring Solution for Everyone
Alexei Vladishev - Zabbix - Monitoring Solution for EveryoneAlexei Vladishev - Zabbix - Monitoring Solution for Everyone
Alexei Vladishev - Zabbix - Monitoring Solution for Everyone
 
Etude et mise en place d'une solution d'administration et de supervision Open...
Etude et mise en place d'une solution d'administration et de supervision Open...Etude et mise en place d'une solution d'administration et de supervision Open...
Etude et mise en place d'une solution d'administration et de supervision Open...
 
Zabbix
ZabbixZabbix
Zabbix
 
Wazuh Pre.pptx
Wazuh Pre.pptxWazuh Pre.pptx
Wazuh Pre.pptx
 
Wazuh Pre.pptx
Wazuh Pre.pptxWazuh Pre.pptx
Wazuh Pre.pptx
 
ZABBIX ET PRTG
ZABBIX ET PRTG ZABBIX ET PRTG
ZABBIX ET PRTG
 
Serveur Zabbix
Serveur ZabbixServeur Zabbix
Serveur Zabbix
 
ETUDE ET MISE EN PLACE D’UNE SOLUTION DE GESTION DE LA SECURITE DU RESEAU : C...
ETUDE ET MISE EN PLACE D’UNE SOLUTION DE GESTION DE LA SECURITE DU RESEAU : C...ETUDE ET MISE EN PLACE D’UNE SOLUTION DE GESTION DE LA SECURITE DU RESEAU : C...
ETUDE ET MISE EN PLACE D’UNE SOLUTION DE GESTION DE LA SECURITE DU RESEAU : C...
 
Zabbix Performance Tuning
Zabbix Performance TuningZabbix Performance Tuning
Zabbix Performance Tuning
 
Sécurité Réseau à Base d'un Firewall Matériel (fortigate)
Sécurité Réseau à Base d'un Firewall Matériel (fortigate)Sécurité Réseau à Base d'un Firewall Matériel (fortigate)
Sécurité Réseau à Base d'un Firewall Matériel (fortigate)
 
alphorm.com - Formation Linux LPIC-1/Comptia Linux+
alphorm.com - Formation Linux LPIC-1/Comptia Linux+alphorm.com - Formation Linux LPIC-1/Comptia Linux+
alphorm.com - Formation Linux LPIC-1/Comptia Linux+
 
Alphorm.com Formation Microsoft Azure (AZ-104) : Administration
Alphorm.com Formation Microsoft Azure (AZ-104) : AdministrationAlphorm.com Formation Microsoft Azure (AZ-104) : Administration
Alphorm.com Formation Microsoft Azure (AZ-104) : Administration
 
Ansible Automation to Rule Them All
Ansible Automation to Rule Them AllAnsible Automation to Rule Them All
Ansible Automation to Rule Them All
 
Zabbix monitoring in 5 pictures
Zabbix monitoring in 5 pictures  Zabbix monitoring in 5 pictures
Zabbix monitoring in 5 pictures
 
Rapport PFE ingénieur réseaux marwen SAADAOUI ( Juin 2018 )
Rapport PFE ingénieur réseaux marwen SAADAOUI ( Juin 2018 )Rapport PFE ingénieur réseaux marwen SAADAOUI ( Juin 2018 )
Rapport PFE ingénieur réseaux marwen SAADAOUI ( Juin 2018 )
 
Cloud computing
Cloud computingCloud computing
Cloud computing
 
Alphorm.com Formation Red Hat RH124
Alphorm.com Formation Red Hat RH124Alphorm.com Formation Red Hat RH124
Alphorm.com Formation Red Hat RH124
 
CloudStack Architecture
CloudStack ArchitectureCloudStack Architecture
CloudStack Architecture
 

Destacado

Zabix formation-zabbix-supervision-d-infrastructure
Zabix formation-zabbix-supervision-d-infrastructureZabix formation-zabbix-supervision-d-infrastructure
Zabix formation-zabbix-supervision-d-infrastructureCERTyou Formation
 
Management
ManagementManagement
ManagementHouria2
 
Nouvelles fonctionnalités MS SQL Server 2012 - Mise à jour MS SQL Server 200x...
Nouvelles fonctionnalités MS SQL Server 2012 - Mise à jour MS SQL Server 200x...Nouvelles fonctionnalités MS SQL Server 2012 - Mise à jour MS SQL Server 200x...
Nouvelles fonctionnalités MS SQL Server 2012 - Mise à jour MS SQL Server 200x...Microsoft Technet France
 
Le licensing Oracle dans le cloud
Le licensing Oracle dans le cloud Le licensing Oracle dans le cloud
Le licensing Oracle dans le cloud EASYTEAM
 
Une gestion efficace du changement de vos structures de données relationnelle...
Une gestion efficace du changement de vos structures de données relationnelle...Une gestion efficace du changement de vos structures de données relationnelle...
Une gestion efficace du changement de vos structures de données relationnelle...Olivier DASINI
 
Offre Sécurité Linagora
Offre Sécurité LinagoraOffre Sécurité Linagora
Offre Sécurité LinagoraLINAGORA
 
L'Entreprise 2.0 - Acte 2 : La conduite du changement
L'Entreprise 2.0 - Acte 2 : La conduite du changementL'Entreprise 2.0 - Acte 2 : La conduite du changement
L'Entreprise 2.0 - Acte 2 : La conduite du changementConseils Atelya
 
FAN, Fully Automated Nagios, Rencontres Mondiales du Logiciel Libre 2008
FAN, Fully Automated Nagios, Rencontres Mondiales du Logiciel Libre 2008FAN, Fully Automated Nagios, Rencontres Mondiales du Logiciel Libre 2008
FAN, Fully Automated Nagios, Rencontres Mondiales du Logiciel Libre 2008FAN Fully Automated Nagios
 
ZMON: Monitoring Zalando's Engineering Platform
ZMON: Monitoring Zalando's Engineering PlatformZMON: Monitoring Zalando's Engineering Platform
ZMON: Monitoring Zalando's Engineering PlatformZalando Technology
 
Rapport de stage nagios
Rapport de stage nagiosRapport de stage nagios
Rapport de stage nagioshindif
 
Alphorm.com Support de la formation Vmware Esxi 6.0
Alphorm.com Support de la formation Vmware Esxi 6.0Alphorm.com Support de la formation Vmware Esxi 6.0
Alphorm.com Support de la formation Vmware Esxi 6.0Alphorm
 
Alphorm.com Support Formation Red Hat Administration Système III RHCSE-(Rh254)
Alphorm.com Support Formation Red Hat Administration Système III RHCSE-(Rh254)Alphorm.com Support Formation Red Hat Administration Système III RHCSE-(Rh254)
Alphorm.com Support Formation Red Hat Administration Système III RHCSE-(Rh254)Alphorm
 
Zabbix 3.0 and beyond - FISL 2015
Zabbix 3.0 and beyond - FISL 2015Zabbix 3.0 and beyond - FISL 2015
Zabbix 3.0 and beyond - FISL 2015Zabbix
 
Rapport nagios miniprojet
Rapport nagios miniprojetRapport nagios miniprojet
Rapport nagios miniprojetAyoub Rouzi
 
7. JSB11 - Enjeux et qualification de la conduite du changement (Voirin)
7. JSB11 - Enjeux et qualification de la conduite du changement (Voirin)7. JSB11 - Enjeux et qualification de la conduite du changement (Voirin)
7. JSB11 - Enjeux et qualification de la conduite du changement (Voirin)Na-Young Kwon
 
Réplication de base de données oracle avec Golden Gate
Réplication de base de données oracle avec Golden GateRéplication de base de données oracle avec Golden Gate
Réplication de base de données oracle avec Golden GateMor THIAM
 
Mise en Forme des Résultats avec SQL*Plus
Mise en Forme des Résultats avec SQL*PlusMise en Forme des Résultats avec SQL*Plus
Mise en Forme des Résultats avec SQL*Pluswebreaker
 
alphorm.com - Formation Powershell 2.0
alphorm.com - Formation Powershell 2.0alphorm.com - Formation Powershell 2.0
alphorm.com - Formation Powershell 2.0Alphorm
 

Destacado (20)

Zabix formation-zabbix-supervision-d-infrastructure
Zabix formation-zabbix-supervision-d-infrastructureZabix formation-zabbix-supervision-d-infrastructure
Zabix formation-zabbix-supervision-d-infrastructure
 
Management
ManagementManagement
Management
 
Nouvelles fonctionnalités MS SQL Server 2012 - Mise à jour MS SQL Server 200x...
Nouvelles fonctionnalités MS SQL Server 2012 - Mise à jour MS SQL Server 200x...Nouvelles fonctionnalités MS SQL Server 2012 - Mise à jour MS SQL Server 200x...
Nouvelles fonctionnalités MS SQL Server 2012 - Mise à jour MS SQL Server 200x...
 
Le licensing Oracle dans le cloud
Le licensing Oracle dans le cloud Le licensing Oracle dans le cloud
Le licensing Oracle dans le cloud
 
Une gestion efficace du changement de vos structures de données relationnelle...
Une gestion efficace du changement de vos structures de données relationnelle...Une gestion efficace du changement de vos structures de données relationnelle...
Une gestion efficace du changement de vos structures de données relationnelle...
 
Offre Sécurité Linagora
Offre Sécurité LinagoraOffre Sécurité Linagora
Offre Sécurité Linagora
 
OpenNMS
OpenNMSOpenNMS
OpenNMS
 
L'Entreprise 2.0 - Acte 2 : La conduite du changement
L'Entreprise 2.0 - Acte 2 : La conduite du changementL'Entreprise 2.0 - Acte 2 : La conduite du changement
L'Entreprise 2.0 - Acte 2 : La conduite du changement
 
Oracle 11g exploitation
Oracle 11g exploitationOracle 11g exploitation
Oracle 11g exploitation
 
FAN, Fully Automated Nagios, Rencontres Mondiales du Logiciel Libre 2008
FAN, Fully Automated Nagios, Rencontres Mondiales du Logiciel Libre 2008FAN, Fully Automated Nagios, Rencontres Mondiales du Logiciel Libre 2008
FAN, Fully Automated Nagios, Rencontres Mondiales du Logiciel Libre 2008
 
ZMON: Monitoring Zalando's Engineering Platform
ZMON: Monitoring Zalando's Engineering PlatformZMON: Monitoring Zalando's Engineering Platform
ZMON: Monitoring Zalando's Engineering Platform
 
Rapport de stage nagios
Rapport de stage nagiosRapport de stage nagios
Rapport de stage nagios
 
Alphorm.com Support de la formation Vmware Esxi 6.0
Alphorm.com Support de la formation Vmware Esxi 6.0Alphorm.com Support de la formation Vmware Esxi 6.0
Alphorm.com Support de la formation Vmware Esxi 6.0
 
Alphorm.com Support Formation Red Hat Administration Système III RHCSE-(Rh254)
Alphorm.com Support Formation Red Hat Administration Système III RHCSE-(Rh254)Alphorm.com Support Formation Red Hat Administration Système III RHCSE-(Rh254)
Alphorm.com Support Formation Red Hat Administration Système III RHCSE-(Rh254)
 
Zabbix 3.0 and beyond - FISL 2015
Zabbix 3.0 and beyond - FISL 2015Zabbix 3.0 and beyond - FISL 2015
Zabbix 3.0 and beyond - FISL 2015
 
Rapport nagios miniprojet
Rapport nagios miniprojetRapport nagios miniprojet
Rapport nagios miniprojet
 
7. JSB11 - Enjeux et qualification de la conduite du changement (Voirin)
7. JSB11 - Enjeux et qualification de la conduite du changement (Voirin)7. JSB11 - Enjeux et qualification de la conduite du changement (Voirin)
7. JSB11 - Enjeux et qualification de la conduite du changement (Voirin)
 
Réplication de base de données oracle avec Golden Gate
Réplication de base de données oracle avec Golden GateRéplication de base de données oracle avec Golden Gate
Réplication de base de données oracle avec Golden Gate
 
Mise en Forme des Résultats avec SQL*Plus
Mise en Forme des Résultats avec SQL*PlusMise en Forme des Résultats avec SQL*Plus
Mise en Forme des Résultats avec SQL*Plus
 
alphorm.com - Formation Powershell 2.0
alphorm.com - Formation Powershell 2.0alphorm.com - Formation Powershell 2.0
alphorm.com - Formation Powershell 2.0
 

Similar a Optimisation de la plateforme de Supervision Zabbix

Les Nouveautés de zabbix 2.2 par Alain Ganuchaud
Les Nouveautés de zabbix 2.2 par Alain GanuchaudLes Nouveautés de zabbix 2.2 par Alain Ganuchaud
Les Nouveautés de zabbix 2.2 par Alain GanuchaudAlain Ganuchaud
 
Serveurs core et virtualisation
Serveurs core et virtualisationServeurs core et virtualisation
Serveurs core et virtualisationChristophe Laporte
 
Alphorm.com Formation Microsoft Hyperconvergence
Alphorm.com Formation Microsoft HyperconvergenceAlphorm.com Formation Microsoft Hyperconvergence
Alphorm.com Formation Microsoft HyperconvergenceAlphorm
 
Elasticsearch 5.0 les nouveautés
Elasticsearch 5.0 les nouveautésElasticsearch 5.0 les nouveautés
Elasticsearch 5.0 les nouveautésMathieu Elie
 
20151013 - Agirc arrco : Behavior driven development
20151013 - Agirc arrco : Behavior driven development20151013 - Agirc arrco : Behavior driven development
20151013 - Agirc arrco : Behavior driven developmentLeClubQualiteLogicielle
 
Conférence AFUP 20minutes.Fr
Conférence AFUP 20minutes.FrConférence AFUP 20minutes.Fr
Conférence AFUP 20minutes.FrOxalide
 
Zimbra Forum France 2016 - Beezim and Ceph
Zimbra Forum France 2016 - Beezim and CephZimbra Forum France 2016 - Beezim and Ceph
Zimbra Forum France 2016 - Beezim and CephZimbra
 
Chtijug springbatch 2011
Chtijug springbatch 2011Chtijug springbatch 2011
Chtijug springbatch 2011Olivier BAZOUD
 
JSS2013 : Haute disponibilité
JSS2013 : Haute disponibilitéJSS2013 : Haute disponibilité
JSS2013 : Haute disponibilitéChristophe Laporte
 
Perfug BOF devoxx2017.pptx
Perfug BOF devoxx2017.pptxPerfug BOF devoxx2017.pptx
Perfug BOF devoxx2017.pptxMarc Bojoly
 
Tout sur les solutions de haute disponibilité et disaster recovery de sql ser...
Tout sur les solutions de haute disponibilité et disaster recovery de sql ser...Tout sur les solutions de haute disponibilité et disaster recovery de sql ser...
Tout sur les solutions de haute disponibilité et disaster recovery de sql ser...Christophe Laporte
 
Techdays 2014 - Le fermier azure (2ème partie)
Techdays 2014 - Le fermier azure (2ème partie)Techdays 2014 - Le fermier azure (2ème partie)
Techdays 2014 - Le fermier azure (2ème partie)Jonathan Le Guellec
 
[Café Techno] Les évolutions de TSM v6.3.4 et bientôt 7.1
[Café Techno] Les évolutions de TSM v6.3.4 et bientôt 7.1[Café Techno] Les évolutions de TSM v6.3.4 et bientôt 7.1
[Café Techno] Les évolutions de TSM v6.3.4 et bientôt 7.1Groupe D.FI
 
MHA : MySQL haute dispo, chez Viadeo par Olivier Dasini
MHA : MySQL haute dispo, chez Viadeo par Olivier DasiniMHA : MySQL haute dispo, chez Viadeo par Olivier Dasini
MHA : MySQL haute dispo, chez Viadeo par Olivier DasiniOlivier DASINI
 
Hug france - Administration Hadoop et retour d’expérience BI avec Impala, lim...
Hug france - Administration Hadoop et retour d’expérience BI avec Impala, lim...Hug france - Administration Hadoop et retour d’expérience BI avec Impala, lim...
Hug france - Administration Hadoop et retour d’expérience BI avec Impala, lim...Modern Data Stack France
 
Alphorm.com Formation Les solutions de Haute Disponibilité sous Windows Serv...
Alphorm.com Formation Les solutions de  Haute Disponibilité sous Windows Serv...Alphorm.com Formation Les solutions de  Haute Disponibilité sous Windows Serv...
Alphorm.com Formation Les solutions de Haute Disponibilité sous Windows Serv...Alphorm
 
Présentation de Zabbix - Zabbix Toulouse #1 - ZUG
Présentation de Zabbix - Zabbix Toulouse #1 - ZUGPrésentation de Zabbix - Zabbix Toulouse #1 - ZUG
Présentation de Zabbix - Zabbix Toulouse #1 - ZUGZabbix User Group
 

Similar a Optimisation de la plateforme de Supervision Zabbix (20)

Les Nouveautés de zabbix 2.2 par Alain Ganuchaud
Les Nouveautés de zabbix 2.2 par Alain GanuchaudLes Nouveautés de zabbix 2.2 par Alain Ganuchaud
Les Nouveautés de zabbix 2.2 par Alain Ganuchaud
 
Serveurs core et virtualisation
Serveurs core et virtualisationServeurs core et virtualisation
Serveurs core et virtualisation
 
Alphorm.com Formation Microsoft Hyperconvergence
Alphorm.com Formation Microsoft HyperconvergenceAlphorm.com Formation Microsoft Hyperconvergence
Alphorm.com Formation Microsoft Hyperconvergence
 
Elasticsearch 5.0 les nouveautés
Elasticsearch 5.0 les nouveautésElasticsearch 5.0 les nouveautés
Elasticsearch 5.0 les nouveautés
 
Exchange 2013 Bonnes pratiques
Exchange 2013 Bonnes pratiques Exchange 2013 Bonnes pratiques
Exchange 2013 Bonnes pratiques
 
Cours 70 410-1
Cours 70 410-1Cours 70 410-1
Cours 70 410-1
 
20151013 - Agirc arrco : Behavior driven development
20151013 - Agirc arrco : Behavior driven development20151013 - Agirc arrco : Behavior driven development
20151013 - Agirc arrco : Behavior driven development
 
Conférence AFUP 20minutes.Fr
Conférence AFUP 20minutes.FrConférence AFUP 20minutes.Fr
Conférence AFUP 20minutes.Fr
 
Zimbra Forum France 2016 - Beezim and Ceph
Zimbra Forum France 2016 - Beezim and CephZimbra Forum France 2016 - Beezim and Ceph
Zimbra Forum France 2016 - Beezim and Ceph
 
Chtijug springbatch 2011
Chtijug springbatch 2011Chtijug springbatch 2011
Chtijug springbatch 2011
 
JSS2013 : Haute disponibilité
JSS2013 : Haute disponibilitéJSS2013 : Haute disponibilité
JSS2013 : Haute disponibilité
 
Perfug BOF devoxx2017.pptx
Perfug BOF devoxx2017.pptxPerfug BOF devoxx2017.pptx
Perfug BOF devoxx2017.pptx
 
Tout sur les solutions de haute disponibilité et disaster recovery de sql ser...
Tout sur les solutions de haute disponibilité et disaster recovery de sql ser...Tout sur les solutions de haute disponibilité et disaster recovery de sql ser...
Tout sur les solutions de haute disponibilité et disaster recovery de sql ser...
 
Techdays 2014 - Le fermier azure (2ème partie)
Techdays 2014 - Le fermier azure (2ème partie)Techdays 2014 - Le fermier azure (2ème partie)
Techdays 2014 - Le fermier azure (2ème partie)
 
[Café Techno] Les évolutions de TSM v6.3.4 et bientôt 7.1
[Café Techno] Les évolutions de TSM v6.3.4 et bientôt 7.1[Café Techno] Les évolutions de TSM v6.3.4 et bientôt 7.1
[Café Techno] Les évolutions de TSM v6.3.4 et bientôt 7.1
 
Cours 70 410 - J4
Cours 70 410 - J4Cours 70 410 - J4
Cours 70 410 - J4
 
MHA : MySQL haute dispo, chez Viadeo par Olivier Dasini
MHA : MySQL haute dispo, chez Viadeo par Olivier DasiniMHA : MySQL haute dispo, chez Viadeo par Olivier Dasini
MHA : MySQL haute dispo, chez Viadeo par Olivier Dasini
 
Hug france - Administration Hadoop et retour d’expérience BI avec Impala, lim...
Hug france - Administration Hadoop et retour d’expérience BI avec Impala, lim...Hug france - Administration Hadoop et retour d’expérience BI avec Impala, lim...
Hug france - Administration Hadoop et retour d’expérience BI avec Impala, lim...
 
Alphorm.com Formation Les solutions de Haute Disponibilité sous Windows Serv...
Alphorm.com Formation Les solutions de  Haute Disponibilité sous Windows Serv...Alphorm.com Formation Les solutions de  Haute Disponibilité sous Windows Serv...
Alphorm.com Formation Les solutions de Haute Disponibilité sous Windows Serv...
 
Présentation de Zabbix - Zabbix Toulouse #1 - ZUG
Présentation de Zabbix - Zabbix Toulouse #1 - ZUGPrésentation de Zabbix - Zabbix Toulouse #1 - ZUG
Présentation de Zabbix - Zabbix Toulouse #1 - ZUG
 

Optimisation de la plateforme de Supervision Zabbix

  • 1. Présentation Alain Ganuchaud Consultant chez Core IT Project http://www.coreit.fr alain@coreit.fr Agence commerciale Lyon chris@coreit.fr Agence commerciale Valence steph@coreit.fr 1/42 Zabbix Webinar
  • 2. Optimisation des Performances Zabbix Tirez le meilleur de vos serveurs 2/42 Zabbix Webinar
  • 3. De quoi s’agit-il ? • Vue d’ensemble des performances Zabbix • Etape 1. Identifiez et corrigez les problèmes basiques • Etape 2. Optimisez les paramètres Zabbix • Etape 3. Et plus encore … 3/42 Zabbix Webinar
  • 4. Vue d’ensemble Quels sont les éléments de performance Zabbix? 4/42 Zabbix Webinar
  • 5. Flux de données standard Alerter GUI Poller DATA Escalator History syncer Poller DATA DATA History syncer Trapper Database Conf syncer Conf syncer OTHER Trapper DATA Serveur Zabbix Architecture standalone (pas de proxies, non distribuée) 5/42 Zabbix Webinar
  • 6. Zabbix Server Components poller Zabbix server Configuration cache alerter escalator ipmi poller unreachable poller proxy poller self-monitoring History & trends cache timer icmp pinger history syncer db watchdog trapper http poller discoverer node watcher configuration syncer housekeeper java gateway poller snmp trapper Database 6/31 Zabbix Webinar
  • 7. Zabbix Server Components alerter – envoie les notifications configuration syncer – gère le cache des configurations db watchdog - surveille la dispo de la base de données Discoverer – gère le changement des composants découverts par le réseau Escalator – gère les escalades history syncer – écrit les données mesurées dans la base http poller processes – déroule les scénarii web Housekeeper – nettoie périodiquement les données obsoletes de la base icmp pinger - icmpping & icmppingpersec items ipmi poller - IPMI items node watcher – gère les nodes en architecture distribuée Self-monitoring – mesure les internes Poller – collecte les données des agents passifs et snmp proxy poller – gère les proxies passifs Timer – gère les fonctions de temps pour les triggers et les périodes de maintenance Trapper – gère les connexions entrantes notamment les active agents, zabbix_sender and active Zabbix proxies unreachable poller – gère les hosts non dispos 7/42 Zabbix Webinar
  • 8. Métriques de Performance Zabbix • Nombre de valeurs proceessées par seconde (NVPS) • Evaluation des NVS dans le tableau de bord NVPS 8/42 Zabbix Webinar
  • 9. Performances assurées par Zabbix Hardware: Quad Core CPU, 6GB, RAID10 BBWC* Budget: ~ 2K EUR • Zabbix est capable d’assurer 1 million de valeurs par minute ( ~15.000 valeurs /s) • En pratique, ce sera moins. Pourquoi?! * Battery Backed Write Cache 9/42 Zabbix Webinar
  • 10. Facteurs impactant les performances • Type d’items, types de valeurs, SNMPv3, nombre de triggers et la nature des triggers • Paramètrages du Housekeeper et la taille de la Database • Nombre d’utilisateurs sur le frontend • Complexité des triggers 10/42 Zabbix Webinar
  • 11. Performance versus nombre d’hôtes 60 items par hôte, régularité une fois par minute Nombre d’hôtes 100 1000 10000 Performance (valeurs par seconde) 100 1000 10000 600 items par hôte, régularité une fois par minute Nombre d’hôtes 100 1000 10000 11/42 Performance (valeurs par seconde) 1000 10000 100000 Zabbix Webinar
  • 12. Lent versus Rapide Objet Lent Rapide Taille de la base Volumineuse Montée en RAM Expressions des Triggers Collecte des données min(),max(),avg() last(), nodata() Type des données Texte, string 12/42 Polling (SNMP, Trappers (agents Agent-less, agents actifs) passifs) Numerique Zabbix Webinar
  • 13. Symptomes de baisse des performances • La Queue d'attente Zabbix a trop de mesures en retard Administration->Queue • Trous dans les graphes, pas de données pour certains items • Faux positifs pour les triggers ayant des fonctions nodata() • Front-end lent 13/42 Zabbix Webinar
  • 15. Identifiez et corrigez les problèmes courants ETAPE 1 15/42 Zabbix Webinar
  • 16. Ressentis différents • “J’ai ajouté 5 hôtes et Zabbix est mort” :-( • “Zabbix trop LENT, je n’ai que 48 hôtes” :-( Pourtant: • “Zabbix jalon 3 - 1000 hôtes et ça continue” :-) • “Notre dernier point: 8500 hôtes, 950400 items, 670340 triggers, 9550 vps” :-) :-) - Happy! 16/42 :-( - Unhappy! Zabbix Webinar
  • 17. Problèmes courants • Utilisation des templates par défaut • Personnalisez vos templates • Paramètres par défaut de la base de données • Optimisez la base de données • Paramètres par défaut des processus zabbix_server • Optimisez les paramètres de la config zabbix_server • Housekeeper • Désactivez -le • Utilisation de releases trop anciennes • Mettez à jour régulièrement 17/42 Zabbix Webinar
  • 18. Comment savoir si les performances de la base sont mauvaises? Fichier de config du serveur zabbix, zabbix_server.conf: LogSlowQueries=1000 18/42 Zabbix Webinar
  • 20. Surveillez les items internes • Nombre réel de VPS • zabbix[wcache, values, all] • zabbix[queue,1m] nombre d’items en retard de plus d’une minute • Zabbix Server components • Alerter, Configuration syncer, DB watchdog, discoverer, escalator, history syncer, http poller, housekeeper, icmp pinger, ipmi poller, poller, trapper 20/42 Zabbix Webinar
  • 21. Surveillez les items internes Avant la 1.8.5, il était impossible d’avoir le statut de chaque composant Zabbix. 21/42 Zabbix Webinar
  • 22. Surveillez les items internes • Depuis la 1.8.5, il est possible d’avoir le statut de chaque composant Zabbix • Pourcentage du temps d’un processus en état BUSY • zabbix[process,<type>,<mode>,<state>] • <type> - trapper, discoverer, escalator, alerter, etc • <mode> - avg, count, min, max • <state> - busy, idle 22/42 Zabbix Webinar
  • 23. Graphez le Busy Time • A graph indicating a problem 23/42 Zabbix Webinar
  • 24. Optimisez le nombre de processus Zabbix Fichier de configuration du serveur Zabbix, zabbix_server.conf: StartPollers=80 StartPingers=10 StartPollersUnreachable=80 StartIPMIPollers=10 StartTrappers=20 StartDBSyncers=8 24/42 Zabbix Webinar
  • 25. Et après ? ETAPE 3 25/42 Zabbix Webinar
  • 26. Utilisez les Proxies Alerter Trapper DATA Proxy History syncer History syncer Conf syncer Conf syncer OTHER Pollers DATA Proxy Escalator Pollers DATA Trapper DATA Trapper Trapper DATA Zabbix Server Les Proxies déchargent le serveur de la collecte 26/42 Zabbix Webinar
  • 27. Partitionnez vos tables • Méthode pour répartir les grosses tables en petites partitions. • C’est surtout important pour les tables d’historiques: • history_*, trends*, events • Bénéfices • Il est plus facile de supprimer les données obsoletes • Pas d’impact à la suppression des historiques 27/42 Zabbix Webinar
  • 28. Zabbix server DB access Housekeeper Trends 28/42 Zabbix Webinar
  • 29. Pas de table partitioning Zabbix Server & GUI 29/42 History Zabbix Webinar
  • 30. Avec du table partitioning Partition 2013_09 Zabbix Server & GUI Partition 2013_08 Partition 2013_07 Partition 2013_06 30/42 Zabbix Webinar
  • 31. J’ai tout essayé! Les performances sont toujours minables. Architecture 3Tiers, répartissez sur 3 serveurs séparés! Database Zabbix Server 24 core CPU 8 core CPU 64GB of RAM 4GB of RAM Disques rapides 31/42 Zabbix GUI Fast CPU 4GB of RAM Zabbix Webinar
  • 32. Check List Soyez certains de n’avoir rien oublié! 32/42 Zabbix Webinar
  • 33. Check list • Les Internes Zabbix sont surveillés! • Sinon vous n’avez aucune visibilité sur la santé de votre plateforme Zabbix • La configuration Zabbix est optimisée • Les performances de la Base de données sont optimisées • Le Housekeeper est dévalidé, utilisez le partitionning DisableHousekeeper=1 33/42 Zabbix Webinar
  • 34. Lectures de chevet • MySQL & PostgreSQL Performance Tuning Guides • Table partitioning for Zabbix • MySQL: zabbixzone.com • PostgreSQL: https://www.zabbix.org/wiki/Docs/howto/zabbix2_ postgresql_partitioning • Zabbix Internal Checks • http://blog.zabbix.com/monitoring-how-busy-zabbi x-processes-are • http://www.zabbix.com/documentation/1.8/manual /config/items#internal_checks 34/42 Zabbix Webinar
  • 35. Retours d'expérience 1/8 • A partir de quelles NVS a-t-on des problèmes de Perf ? • 500 NVS (attention c'est une évaluation de Zabbix) • Ne gardez pas une installation Zabbix par défaut • Ne négligez pas les accès au Frontend • Hackez le frontend (Limitation des périodes de graphes) • Dévalidez le housekeeping & Partitionnez • Changez l'architecture Zabbix 35/42 Zabbix Webinar
  • 36. Retours d'expérience 2/8 Archi PRA peut vous aider ! 36/42 Zabbix Webinar
  • 37. Retours d'expérience 3/8 • Limitez la taille de la base • Baissez les durées des historiques • Augmentez les durées des tendances • Augmentez les régularités • Ne soyez pas radin sur le Hardware • 2/3 du budget pour le serveur de base de données • Disques SSD pour la base de données • 95% des problèmes de perf = Base de données 37/42 Zabbix Webinar
  • 38. Retours d'expérience 4/8 • Mettez à jour Zabbix et Base de données • Zabbix 1.8 < Zabbix 2.0 < Zabbix 2.2 • Mysql 5.5 < Mysql 5.6 • N'adoptez pas l'architecture DM avant la 2.4 • Je ne suis pas convaincu par l'ajout de proxies • Architecture DM Master/Child à proscrire • Architecture DM Master/Child à reconsidérer en version 2.4 (fin 2014 / début 2015) 38/42 Zabbix Webinar
  • 39. Retours d'expérience 5/8 • Active vs Passive • Passive Proxy < Active Proxy • Passive Agent < Active Agent • Surveillez les paramètres internes • Busy processes > 50 % • Caches < 80 % • ATTENTION StartDBSyncers 39/42 Zabbix Webinar
  • 40. Retours d'expérience 6/8 • Choisissez la bonne base de données • Proscrivez DB2 • Oracle < Postgresql < Mysql (PerconaDB & MariaDB) • Réservez sqlite aux proxies peu chargés (voire embarqués) • Clustérisez votre base de données • Galera V24 supporte Mysql 5.6 • Percona XtraDB Cluster intègre la réplication Galera • MariaDB Galera Cluster 40/42 Zabbix Webinar
  • 41. Retours d'expérience 7/8 • Top 10 des problèmes de perf 1) Base de données 2) Config Zabbix 3) Organisation de la surveillance 4) CPU Serveur Zabbix 5) ... 6) ... 7) ... 8) ... 9) ... 10)Réseau : Jamais 41/42 Zabbix Webinar
  • 42. Retours d'expérience 8/8 • Top 10 des outils utilisés 1) Innotop 2) Mysqltuner 3) Tuning-primer.sh 4) iostat 5) tcpdump 42/42 Zabbix Webinar