Avant de partir en quête d'aide sur des forums spécialisés, je me suis dit que je trouverais peut-être des amateurs de Nagios par ici.
J'utilise Nagios avec Centreon pour la supervision de plusieurs dizaines de machines depuis pas mal de temps et malheureusement je bute sur un problème assez épineux.
Je dois poller environ 400 services / minute et je n'arrive pas à abaisser la latence des checks. J'obtiens une latence de 120 à 200s.
Niveau conf, j'ai la conf de base avec quelques aménagements :
- Maximum Concurrent Service Checks : illimité (histoire de pas me casser la tête)
- Use large installation tweaks : non
- Free child process memory : non
- Child processes fork twice : non
- Service Check Timeout : 30
- Host Check Timeout : 30
J'ai regardé un paquet de forums, de posts à ce sujet mais rien n'y fait. Je n'ai réussi à baisser la latence que de 300-400 à 200, ce qui est déjà un début malgré tout.
A noter que la machine de monitoring est relativement suffisante pour cette tâche (Xeon X3450, 4Go, seul nagios/centreon tournent dessus).
Le load average est le suivant : 3.29 3.80 3.36
Nombre de services à check par seconde : environ 7
Merci par avance pour vos éclaircissements


Mon contenu