Ce type de surveillance permet de déceler plusieurs problèmes, des incidents réseau aux problèmes de traitement, je joins une petite liste de contrôles possibles pour corriger l’état de ces modules.
Principaux problèmes de réseau
- L’équipement sur lequel le module est lancé est éteint ou n’a pas de connexion au réseau.
- Il y a une coupure dans le segment du réseau, de sorte que le serveur FMS Pandora ou le serveur Satellite ne pourra pas faire la vérification.
- Un élément intermédiaire bloque la connexion, parfois certains éléments comme le pare-feu, les proxies, etc… bloquent les pétitions et provoquent ce mauvais comportement.
Principaux problèmes de traitement
- L’intervalle du module est trop faible, dans ce cas il est possible qu’il y ait des files d’exécution du module, nous recommandons donc de ne pas avoir des intervalles inférieurs à 1 minute.
- Problèmes de mise en file d’attente générale du serveur, s’il y a beaucoup de modules ICMP et que certains modules sont dans un état inconnu, il est possible que votre serveur Pandora FMS n’ait pas assez de threads pour traiter tous les modules, nous recommandons donc d’augmenter un peu les threads (sans dépasser 50 threads entre tous les serveurs Pandora FMS internes).
- S’il y a un problème de temps, c’est-à-dire si nos vérifications prennent X secondes pour répondre au ping/fping, vous pouvez établir un délai d’attente pour ces modules dans le fichier de configuration du serveur Pandora FMS.
network_timeout 3
Si après les 3 secondes définies dans le paramètre précédent, la vérification n’est pas effectuée correctement, l’exécution est interrompue et l’état du module sera erroné. Tenez compte du fait que si vous définissez un délai d’attente très élevé, le serveur pourrait avoir des problèmes de performance (en fonction de la vitesse de chaque vérification et du nombre total de modules ICMP).