Pandora: Documentation fr: Intro supervision

From Pandora FMS Wiki
Jump to: navigation, search

Revenir à l’index de Documentation Pandora FMS

1 Introduction à la surveillance

Toute l'interaction de l'utilisateur avec Pandora FMS se fait via la console web. La console permet l'accès via un navigateur, sans avoir besoin d'installer des applications lourdes, permettant la gestion depuis n'importe quel ordinateur avec un navigateur.

La surveillance est l'exécution de processus sur tous les types de systèmes pour collecter et stocker des informations, effectuer des actions et prendre des décisions sur la base de ces données.

Pandora FMS est un système de surveillance évolutif qui dispose d'une multitude de fonctionnalités permettant d'étendre la portée et le volume des informations collectées, pratiquement sans limites.


2 Agents sur Pandora FMS

La surveillance effectuée par Pandora FMS est classée dans la catégorie " agents ". Un agent appartient toujours à un " groupe ". Ces agents vont être équivalents à chacun des différents équipements, dispositifs, webs ou applications que nous surveillons.

Les agents définis dans la console Pandora FMS peuvent présenter des informations locales collectées par l'intermédiaire d'un agent logiciel, des informations à distance collectées par le biais de vérifications réseau, ou les deux. Par conséquent, il est important de souligner la différence entre les agents en tant qu'unité organisationnelle dans la console Pandora FMS, et les agents logiciels en tant que services locaux de collecte de données.





AgentHierarchy.png



2.1 Surveillance basée sur des agents software vs. surveillance à distance

Nous pourrions diviser la surveillance en deux grands groupes, selon la façon dont l'information est recueillie : la surveillance fondée sur les agents logiciels et la surveillance à distance.

La surveillance par agent consiste en l'installation d'un petit logiciel qui reste actif dans le système et en l'obtention d'informations " localement ", par l'exécution de commandes et de scripts.

La télésurveillance consiste à utiliser le réseau pour effectuer des contrôles à distance vers les systèmes, sans qu'il soit nécessaire d'installer un composant supplémentaire dans l'équipement à surveiller.

Comme on peut l'apprécier, la surveillance basée sur l'agent obtiendra l'information par le biais de contrôles locaux, tandis que la surveillance à distance obtiendra l'information par le biais de " contrôles réseau " du serveur Pandora FMS.

Avec Pandora FMS la surveillance peut être d'une manière ou d'une autre et aussi combinée, produisant une surveillance mixte.

Les deux types d'agents partagent la même configuration générale et la même visualisation des données.


2.2 Configuration de l’agent dans la console



Configuracion agente consola1.png


Configuracion agente consola2.png


  • Alias : Pour un fonctionnement correct de toutes les fonctions que Pandora FMS exécute avec ses agents/modules, il est recommandé de ne pas utiliser des caractères comme /,\,|,|,%,#,&,$ dans le nom d'agent. Lorsque vous traitez avec ces agents, ils peuvent créer une confusion avec l'utilisation des chemins du système ou l'exécution d'autres commandes, causant des erreurs dans le serveur.
  • Serveur : Serveur qui va exécuter les contrôles configurés dans la surveillance des agents, paramètre spécial en cas de configuration HA dans son installation.
  • Groupes secondaires : Paramètre facultatif permettant à un agent d'appartenir à plus d'un groupe.
  • Protection en cascade : Paramètre permettant d'éviter une avalanche d'alertes. Vous pouvez choisir un agent ou un module d'agent. Dans le premier cas, lorsque l'agent choisi est en situation critique, il ne génère pas d'alertes. Dans le second cas, seulement lorsque le module spécifié est en situation critique, l'agent ne générera pas d'alertes.
  • Définition des modules : Trois modes de travail peuvent être sélectionnés.
    • Mode d'apprentissage : Si XML arrive avec de nouveaux modules, ils seront créés automatiquement (par défaut).
    • Mode Normal : Si un XML arrive avec de nouveaux modules, ils ne seront créés que s'ils sont déjà déclarés dans la console précédemment.
    • "Mode Auto-désactivé : Identique au mode d'apprentissage, mais si tous les modules passent en mode inconnu, l'agent sera désactivé jusqu'à ce que les informations arrivent à nouveau.

2.3 Visualisation de l'agent

Dans cet écran vous pouvez voir une grande quantité d'informations sur l'agent, et nous offre la possibilité de forcer l'exécution de contrôles à distance et de rafraîchir les données qui arrivent.




Visualizacion agente consola1.png



Dans la partie supérieure nous pouvons voir un résumé avec une multitude de données de l'agent, telles que :

  • Total des modules et leur état.
  • Événements des dernières 24 heures.
  • Information de l'agent.
    • Nom.
    • Version.
    • Accessibilité de l'agent.
    • Groupe.




Visualizacion agente consola2.png



Ensuite, nous pouvons voir la liste des modules appartenant à l'agent, où ces modules en état non initié ne pourront pas être observés, et en-dessous, les alertes générées pour ces modules.




Visualizacion agente consola3.png



Enfin, nous verrons les événements générés par l'agent.




Visualizacion agente consola4.png




3 Modules

Les modules sont des unités d'information stockées dans un agent. Il s'agit des éléments de surveillance avec lesquels l'information est extraite de l'appareil ou du serveur vers lequel l'agent pointe. '"Chaque module ne peut stocker qu'un seul type de métrique.

Dans le même agent, il ne peut pas y avoir deux modules portant le même nom. Tous les modules ont un état associé, qui peut être :

  • Non commencé : où aucune donnée n'a encore été reçue.
  • Normal : reçoit des données dont les valeurs se situent en dehors des seuils d'avertissement ou des seuils critiques.
  • Avertissement : reçoit des données dont les valeurs se situent à l'intérieur du seuil d'avertissement.
  • Critique : Les données sont reçues avec des valeurs inférieures au seuil critique.
  • Inconnu :' le module a fonctionné et a cessé de recevoir des informations pendant un certain temps.

Les modules disposent de différents types de données, telles que booléennes, numériques ou alphanumériques. Selon les informations recueillies par le module, elles seront d'un type ou d'un autre.

3.1 Types de modules

Il existe plusieurs types de modules dans Pandora FMS.

  • Module de données : est un type de module de surveillance local avec lequel des contrôles sont effectués sur le système dans lequel se trouve l'agent, comme par exemple l'utilisation du CPU de l'appareil ou de sa mémoire libre.
  • Module réseau : est un type de module de surveillance à distance avec lequel on vérifie la connexion avec le périphérique ou le serveur vers lequel pointe l'agent, comme par exemple s'il fonctionne ou s'il a un port particulier ouvert.
  • Plugin Module : est un type de module de surveillance locale ou à distance avec lequel vous pouvez effectuer des contrôles personnalisés par la création de scripts. Avec eux, des contrôles plus poussés et plus poussés que ceux proposés directement via la console Pandora FMS peuvent être effectués.
  • Module WMI : est un type de module de monitoring local avec lequel il est possible de vérifier le système Windows via le protocole WMI, comme par exemple pour obtenir la liste des services installés ou la charge courante du CPU.
  • Module de prédiction :est un type de module de surveillance prédictive avec lequel différentes opérations arithmétiques sont effectuées par la consultation de données provenant d'autres modules "de base", comme l'utilisation moyenne du CPU des serveurs surveillés ou la somme des latences de connexion.
  • Module Serveur Web : est un type de surveillance Web avec lequel on vérifie l'état d'un site Web et on obtient des données de celui-ci, comme par exemple voir si un site Web est en panne ou s'il contient un mot spécifique.
  • Module d'analyse Web : est un type de surveillance Web avec lequel des simulations de la navigation Web d'un utilisateur sont effectuées, comme la navigation vers un site Web, l'introduction d'informations d'identification ou l'exécution de formulaires.

3.2 Paramètres communs

Dans la configuration de chaque module, il y a des paramètres communs à tous les modules.



Parametros comunes modulos1.png



  • Utilisation de module de bibliothèque : Pandora FMS possède un répertoire de modules par défaut qui peuvent être utilisés. En fonction du module sélectionné, les paramètres nécessaires seront remplis automatiquement pour effectuer la surveillance. Ce token apparaît dans tous les types de modules, à l'exception des modules de prédiction.
  • 'Intervalle de plage dynamique : token de surveillance dynamique qui sera expliqué dans une section ultérieure.
  • Avertissement/seuil critique : token pour la surveillance de l'état qui sera expliqué dans une section ultérieure.
  • Seuil de bascule : connu sous le nom de bascule (FF) est un phénomène courant dans la surveillance, quand une valeur oscille fréquemment entre des valeurs alternatives (MAL/BIEN), ce qui la rend difficile à interpréter. Dans ce cas, on utilise généralement un "seuil", de sorte que pour considérer que quelque chose a changé d'état, il doit "rester" plus de X intervalles consécutifs dans un état non modifié. C'est ce que nous appelons, dans la terminologie de Pandora FMS, le " FF Threshold".



Fft.png


Le paramètre FF Threshold (FF = FlipFlop) est utilisé pour "filtrer" les changements d'état continus dans la génération d'événements/états, de sorte que Pandora FMS peut être informé que tant qu'un élément n'est pas au moins X fois dans le même état, après un changement d'état original, ne le considère pas comme changé. Prenons un exemple classique : un ping vers un hôte où il y a perte de paquets. Dans un tel environnement, il pourrait nous donner des résultats comme :

1
1
0
1
1
0
1
1
1

Cependant, l'hôte est vivant dans tous les cas. Ce que nous voulons vraiment dire à Pandora FMS, c'est que tant que l'hôte ne dit pas qu'il est au moins trois fois plus bas, ne le marquez pas comme tel, de sorte que, dans le cas précédent, il ne serait jamais considéré comme défaillant, et seulement dans ce cas il le serait :

1
1
0
1
0
0
0

A partir de maintenant, vous le marquerez comme étant défaillant, mais pas avant.

Par conséquent, la protection Flip-Flop permet d'éviter ces fluctuations gênantes. Tous les modules l'implémentent et son utilisation est d'éviter le changement d'état (délimité par ses limites définies ou ses limites automatiques, comme c'est le cas des modules *proc).

  • Keep counters

Il s'agit d'une option avancée de Flip Flop pour contrôler l'état d'un module. A l'aide de "keep counters" nous allons établir des valeurs de compteur à passer d'un état à l'autre, en fonction, au lieu de la valeur, de l'état du module avec la valeur reçue.

Vous trouverez ci-dessous un exemple de fonctionnement.

Supposons qu'il existe un module avec les caractéristiques suivantes :

Intervalle : 5 min.
Seuil :
  Critique : 90 - 100;
  Avertissement : 80 - 90;

Flip Flop :
   Normal : 0;
   Warning : 3;
   Critical : 2;

Etat actuel : Normal;

Puis, voici les les données / état reçus :

Dato Estado
81 Warning
83 Warning
95 Critical
89 Warning
98 Critical
81 Warning
86 Warning

Comme vous pouvez le voir dans l'exemple, les données affichées appartiennent à des états d'avertissement et critiques, mais l'état actuel est normal car les conditions de bascule ne sont pas remplies.

En configurant le paramètre "Conserver les compteurs", un compteur d'état sera maintenu, ce qui entraînera le changement d'état comme on peut le voir ci-dessous :

Dato Estado Dato Estado Módulo
81 Warning Normal
83 Warning Normal
95 Critical Normal
89 Warning Warning
98 Critical Warning
81 Warning Warning
86 Warning Warning

Prenons un cas plus complet :

Supposons qu’un module a les caractéristiques suivantes :

Intervalle : 5 min.
Seuils :
  Critique : 90 - 100;
  Warning : 80 - 90;

Flip Flop :
   Normal : 2;
   Warning : 3;
   Critical : 2;

Etat actuel : Normal;

Le compteur d'états n'accumule les états normaux et critiques que s'ils arrivent consécutivement. D'autre part, l'état d'alerte peut être cumulé même s'il n'arrive pas consécutivement.

Le compteur d'état est redémarré dans les cas suivants : - Une valeur arrive dont l'état coïncide avec l'état actuel. - Le statut est modifié lorsque les conditions de maintien du compteur sont remplies.

Les compteurs normaux et critiques ont un comportement particulier, pour lequel seuls ces compteurs seront redémarrés, s'ils ne sont pas consécutifs.

Dans ce cas, les données suivantes sont reçues :

Donnée État de donnée Compteur warning Compteur warning Compteur normal État du module
81 Warning 0 1 0 Normal
83 Warning 0 2 0 Normal
95 Critical 1 2 0 Normal
89 Warning 0 0 0 Warning
Lorsque le compteur d'avertissement atteint trois, l'état d'avertissement est modifié et tous les compteurs sont réinitialisés.
50 Normal 0 0 1 Warning
98 Critical 1 0 0 Warning
Le compteur normal et le compteur critique doivent être consécutifs pour continuer à augmenter. Dès réception d'une valeur critique, le compteur normal devient 0.
91 Critical 0 0 0 Critical
Lorsque le compteur critique atteint deux, l'état critique est modifié en état critique et tous les compteurs sont redémarrés.
30 Normal 0 0 1/td> Critical
31 Normal 0 0 0/td> Normal
Lorsque le compteur normal atteint deux, l'état normal passe à normal et tous les compteurs sont remis à zéro.
81 Warning 0 1 0/td> Normal
83 Warning 0 2 0/td> Normal
12 Normal 0 0 0/td> Normal
Lors de la réception de données à l'état normal égal à l'état actuel, les compteurs sont redémarrés.

Dans les options avancées des modules, les paramètres communs suivants peuvent être observés.




Parametros comunes modulos2.png






Parametros comunes modulos3.png



  • Intervalle : Paramètre dans lequel est définie la période pendant laquelle le module doit renvoyer les données. Dans le cas des modules distants, il s'agit de la période pendant laquelle le contrôle à distance est effectué. Dans le cas des modules de données, il s'agit d'une valeur numérique qui représente X fois l'intervalle d'agent défini, effectuant le contrôle local pendant cette période. Si un module passe plus de deux intervalles sans recevoir de données, il entrera dans un état inconnu.
  • Posprocessed : Paramètre par lequel les données reçues par le module peuvent être converties. Par défaut, il est désactivé avec la valeur 0. Les conversions suivantes peuvent être effectuées :
    • Secondes à mois
    • Secondes à semaines
    • Secondes à jours
    • Secondes à minutes
    • Octets à Gigaoctets
    • Octets à Mégaoctets
    • Octets à Kilo-octets
    • Durée en semaines
    • Timeticks à jours
  • Intervalle de bascule : Si le seuil de bascule est activé et qu'il y a un changement d'état, l'intervalle du module sera modifié pour la prochaine exécution.
  • Bascule temps d'attente : Paramètre qui ne peut être utilisé que dans les modules asynchrones. Pour qu'un changement d'état par bascule soit efficace, des données consécutives égales doivent être reçues dans l'intervalle spécifié.
  • Silencieux : Paramètre par lequel le module continuera à recevoir des informations, mais aucun type d'événement ou d'alerte ne sera généré.
  • Cascade Protection Services : Paramètre par lequel la génération d'événements et d'alertes passerait au service auquel il appartient, si cette fonctionnalité est activée.
  • Cron : Paramètre par lequel il est possible de spécifier des périodes de temps dans lesquelles le module sera exécuté avec la nomenclature : Minute, Heure, Jour du mois, Mois, Jour de la semaine. Il y a trois possibilités différentes :
    • Cron de (from) : n'importe -> Il n'y a aucune restriction de surveillance (par défaut).
    • Cron de : spécifique. Cron à : a -> Il ne sera exécuté que lorsqu'il coïncidera avec le nombre stipulé. Ex : 15 20 * * *, fonctionnera tous les jours à 20:15
    • Cron de : spécifique. Cron à : spécifique -> S'exécutera pendant l'intervalle exposé. Ex : 5-10 * * * * , fonctionne toutes les heures entre les minutes 5 et 10.
  • Macros personnalisées : n'importe quel nombre de macros de module peut être défini. Le format recommandé pour les noms de macros est le suivant :
   macronom_de_macronom

Par exemple :

    _technology_
   _modulepriority_
   _contactperson_

Ces macros peuvent être utilisées dans les alertes de module. Si le module est un type d'analyse de module Web :

Les macros dynamiques auront un format spécial commençant par @ et auront ces substitutions possibles :

  @DATE_FORMAT (date/heure actuelle avec format défini par l'utilisateur)
  @DATE_FORMAT_nh (heures)
  @DATE_FORMAT_nm (minutes)
  @DATE_FORMAT_nd (jours)
  @DATE_FORMAT_ns (secondes)
  @DATE_FORMAT_nM (mois)
  @DATE_FORMAT_nY (années)

Où "n" peut être un nombre sans signe positif ou négatif.

  • Tags :

Les tags sont des étiquettes associées à chaque module qui seront propagées aux événements générés par ce module et peuvent être utilisées dans les alertes d'événements de ce module. Les tags sont utiles car ils permettent de les utiliser comme filtres dans les rapports, les vues d'événements et même d'avoir des vues spécifiques pour eux. Les informations complémentaires du tag (URL, email, téléphone) peuvent être utilisées dans les alertes, car elles sont disponibles sous forme de macro.

Pour créer ou modifier un tag, cliquez sur Module tags :


Module tags imagen2.png

Le tag permet de définir un nom, une description et éventuellement une URL complète (http://somewebpage.com), email ou téléphone associé à ce tag. Il est à noter que vous pouvez associer un ou plusieurs tags à chaque module. Pour ce faire, ils doivent d'abord être créés comme décrit ci-dessus. Une fois créés, ils seront disponibles pour être assignés à chaque module.

Dans les options avancées d'un module, les tags disponibles seront affichées dans la colonne de gauche et dans la colonne de droite les tags déjà associées au module :

Tags 1.png

Les tags peuvent également être utilisées pour accorder des permissions d'accès spécifiques à un module, de sorte qu'un utilisateur ne peut accéder qu'à un seul module de l'agent, sans avoir accès au reste des modules. Ceci peut être vu dans la section profil des utilisateurs dans gestion et administration.

Revenir à l’index de documentation Pandora FMS

3.3 Surveillance des états

Lorsque nous surveillons, nous obtenons des valeurs d'un système, qu'il s'agisse de la mémoire, du CPU, de la température du châssis, du nombre d'utilisateurs connectés, des commandes dans un WEB e-commerce ou de toute autre valeur numérique. Parfois nous ne nous intéressons qu'aux données, mais en général nous voulons associer un ETAT à ces valeurs, de sorte que lorsque nous surmontons un "SEUIL", l'état change pour savoir si quelque chose est bon ou mauvais. C'est pourquoi, lorsque nous parlons de contrôle, nous devons introduire le concept d'ETAT.

Pandora FMS permet de définir 'seuils pour définir l'état qu'aura un contrôle en fonction des données qu'il affiche. Les trois états possibles sont : NORMAL, WARNING et CRITICAL. Un seuil est une valeur à partir de laquelle on passe d'un état à un autre. L'état que les modules vont acquérir dépendra de ces seuils, qui sont spécifiés au moyen des paramètres suivants présents dans la configuration de chaque module :

  • Warning status - Min. Max. : limites inférieure et supérieure de l'état d'avertissement. Si la valeur numérique du module se trouve dans cette plage, le module passe en état d'avertissement. Si aucune limite supérieure n'est spécifiée, elle sera infinie (toute valeur supérieure à la limite inférieure).
  • Warning status - Str. : expression régulière pour les modules alphanumériques (string). Si des coïncidences sont trouvées, le module passe en état d'avertissement.
  • Critical status - Min. Max. : limites inférieure et supérieure de l'état critique. Si la valeur numérique du module se situe dans cette plage, le module passe à l'état critique. Si aucune limite supérieure n'est spécifiée, elle sera infinie (toute valeur supérieure à la limite inférieure).
  • Critical status - Str. : expression régulière pour les modules alphanumériques (chaîne). Si des coïncidences sont trouvées, le module passera à l'état critique.
  • Inverse interval : présent à la fois pour le seuil d'alerte et le seuil critique. S'il est activé, le module change d'état lorsque ses valeurs sont ''en dehors de l'intervalle spécifié dans les seuils. Il fonctionne également pour les modules alphanumériques (chaîne de caractères) ; si les chaînes de texte ne coïncident PAS avec ce qui est spécifié dans Avertissement/Str. critique, le module change d'état.


Threshold1.JPG



Threshold2.JPG


Info.png

Si les seuils "warning" et "critical" coïncident dans une plage quelconque, le seuil "critical" prévaudra toujours.

 


3.3.1 Seuils numériques - Cas pratique 1

Nous avons un module de pourcentage d'utilisation du CPU qui sera toujours vert à l'état agent, puisqu'il rapporte simplement une valeur entre 0% et 100%. Si nous voulons que le module d'utilisation du CPU passe à l'état d'alerte (jaune) quand il atteint 70% de son utilisation, et à l'état critique (rouge) quand il atteint 90%, nous devons configurer les seuils comme suit :

  • Warning status Min.: 70
  • Critical status Min.: 90


Threshold3.JPG


Ainsi, lorsque la valeur de 90 est atteinte, le module apparaîtra en rouge (CRITICAL), alors qu'entre 70 et 89.99 il apparaîtra en jaune (WARNING), et au-dessous de 70 en vert (NORMAL).

En raison du fonctionnement des seuils, il n'est pas nécessaire, dans de tels cas, de fixer des limites supérieures. En effet, si seul le seuil inférieur est fixé, le seuil supérieur sera pris en compte comme "aucune limite", de sorte que toute valeur supérieure au seuil inférieur sera prise en compte comme faisant partie du seuil. De plus, si les seuils sont dépassés, le seuil critique prévaudra sur l'avertissement, ce qui donne le graphique des seuils indiqué dans la capture précédente.

3.3.1.1 Seuils de texte - Étude de cas 2

Si nous avons un module de type string, nous pouvons configurer les états en utilisant des expressions régulières dans les champs Str des paramètres Warning Status et Critical Status. Dans ce cas, nous avons un module qui peut nous renvoyer des données : OK,ERROR connection fail ouBUSY too many devices, en fonction du résultat de la requête.

Pour configurer les états WARNING et CRITICAL du module de texte, nous utiliserons les expressions régulières suivantes :

État de l'avertissement : *BUSY.*
Statut Crirical : .*ERROR.*.


Threshold4.JPG


Avec cette configuration, le module aura le statut WARNING lorsque les données contiennent la chaîne BUSY et son statut sera CRITICAL lorsque les données contiennent la chaîne ERROR. Vous devez être prudent car les expressions régulières sont sensibles à la casse.

3.3.2 = Surveillance dynamique (seuils automatiques)

La surveillance dynamique consiste en l'ajustement dynamique et automatique des seuils d'état des modules de manière intelligente et prédictive. La méthode de travail consiste à collecter les valeurs d'une période donnée et à calculer une moyenne et un écart-type, qui sont utilisés pour établir les seuils correspondants.

La configuration se fait au niveau du module, et les paramètres possibles sont :

  • Dynamic Threshold Interval : intervalle de temps qui sera considéré pour effectuer le calcul des seuils. Si nous choisissons 1 mois, le système prendra toutes les données existantes du dernier mois et construira les seuils en fonction de ces données.
  • Dynamic Threshold Two Tailed : s'il est activé, le système de seuils dynamiques établira également des seuils 'inférieurs à la moyenne. S'il n'est pas coché (par défaut), seuls les seuils dont les valeurs sont supérieures à la moyenne seront établis.
  • Dynamic Threshold Max.' : permet d'augmenter la limite supérieure du pourcentage que vous indiquez. Par exemple : si les valeurs moyennes sont autour de 60 et que le seuil critique a été établi à partir de la valeur 80, si nous établissons la valeur Seuil Dynamique Max : 10, nous allons augmenter ce seuil critique de 10%, le laissant à 88.
  • Dynamic Threshold Min. : ne s'applique que si le paramètre Seuil Dynamique Deux Suivant est actif. Il permet de réduire la limite inférieure du pourcentage que nous indiquons. Par exemple, si les valeurs moyennes sont autour de 60 et que le seuil critique inférieur a été fixé à 40, si nous fixons la valeur Dynamic Threshold Min: 10, nous réduirons ce seuil critique de 10%, le laissant à 36.

Il y a aussi plusieurs paramètres de configuration supplémentaires dans le fichier pandora_server.conf.

  • dynamic_updates : ce paramètre détermine combien de fois les seuils sont recalculés pendant la période définie dans Intervalle seuil dynamique. Si nous configurons l'intervalle de seuil dynamique avec une valeur de 1 semaine, par défaut les données sont collectées à partir d'une semaine en arrière et le calcul est fait une seule fois, en répétant le processus après une semaine. Si nous modifions le paramètre dynamic_updates nous pourrions augmenter cette fréquence. Par exemple, si vous configurez le paramètre avec une valeur de 3, les seuils seront recalculés jusqu'à trois fois au cours d'une semaine (ou la période que nous avons configurée dans Dynamic Threshold Interval) Sa valeur par défaut est 5.
  • Dynamic_warning : différence entre le seuil d'alerte et le seuil critique, en pourcentage. Sa valeur par défaut est 25.
  • dynamic_constant : détermine l'écart de la moyenne qui sera utilisée pour établir les seuils ; des valeurs plus élevées éloignent les seuils des valeurs moyennes. Sa valeur par défaut est 10.


Dans l'exemple suivant, la valeur moyenne calculée est à la hauteur de la ligne rouge (environ 30) :


Thresh1.JPG


Lors de l'activation des seuils dynamiques, le seuil supérieur (env. 45 et plus) a été réglé de cette manière :


Thresh2.JPG


Nous avons activé le paramètre " Dynamic Threshold Two Tailed ", de sorte qu'un seuil critique a également été fixé en dessous des valeurs moyennes (environ 15 et en dessous) :


Thresh3.JPG


Nous avons maintenant réglé les paramètres Dynamic Threshold Min. et Dynamic Threshold Max. sur 20 et 30 respectivement, de sorte que les seuils ont été ouverts, étant légèrement plus permissifs :


Thresh4.JPG



3.3.2.1 Cas pratique 1

Nous partons d'un module de latence web. La configuration de base que nous avons utilisée tient compte d'un intervalle d'une semaine :


Dynamic1.JPG


Lors de l'enregistrement des modifications, après avoir lancé pandora_db, les seuils ont été définis de cette façon :


Dynamic2.JPG


Le module passe donc à l'état "warning" lorsque la latence est supérieure à 0'33 secondes, et à l'état "critical" lorsqu'elle est supérieure à 0'37 secondes. Le graphique le montre comme suit :


Dynamic3.JPG


Il a été considéré que le seuil est quelque peu permissif, c'est pourquoi il a été décidé d'utiliser le paramètre Dynamic Threshold Min. pour réduire les seuils minimaux. Comme dans ce cas, le seuil n'a pas de valeurs maximales car toute valeur supérieure à une certaine valeur sera considérée comme incorrecte, nous n'utiliserons pas Dynamic Threshold Max.. La modification apportée est la suivante :


Dynamic4.JPG


Après l'application des changements et l'exécution de pandora_db, les seuils sont fixés comme suit :


Dynamic5.JPG


Et le graphique ressemblera à ceci :


Dynamic6.JPG


3.3.3 Cas pratique 2

Dans cet exemple, nous surveillons la température d'une salle de contrôle ou d'un CPD. Le graphique montre quelques valeurs avec peu de variation :


Dynamic7.JPG


Dans cette situation, il est essentiel que la température reste stable et n'atteigne pas des valeurs beaucoup plus élevées mais pas beaucoup plus basses, c'est pourquoi nous utiliserons le paramètre " Dynamic Threshold Two Tailed " pour délimiter les seuils au-dessus et au-dessous. La configuration est la suivante :


Dynamic8.JPG


Les seuils qui ont été générés automatiquement sont les suivants :


Dynamic9.JPG


Le graphique les montre de cette façon :


Dynamic10.JPG


De cette façon, toutes les valeurs entre 23'10 et 26 seront considérées comme normales, car c'est la température acceptable dans notre CPD ou salle de contrôle. Si nécessaire, nous pouvons utiliser les paramètres Dynamic Threshold Min. et "Dynamic Threshold Max. pour ajuster les seuils si nécessaire. Revenir à l’index de Documentation Pandora FMS