Seuils dynamiques : caractéristiques de la surveillance dynamique

Un seuil est une valeur à partir de laquelle le passage d’un état à un autre se fera dans un contrôle, et la surveillance dynamique consiste à ajuster automatiquement les seuils des états du module de manière intelligente et prédictive. Lorsque les seuils sont définis par la surveillance dynamique, on parle de seuils dynamiques.

En fonction du seuil, un état ou un autre est défini, ce qui permet de savoir comment se déroule un contrôle. Par conséquent, l’état que les différents contrôles acquièrent dépend de ces seuils et, à partir de cette information, nous pouvons savoir si le serveur, le processus, l’application ou l’élément de réseau fonctionne correctement ou s’il présente une anomalie ou un incident et lancer les alertes correspondantes pour le résoudre.

En interne, à un bas niveau, les seuils dynamiques fonctionnent en collectant les valeurs pour une période donnée et en calculant une moyenne et un écart type. Il est nécessaire d’établir une période pendant laquelle le système de surveillance peut apprendre à partir des données collectées, ce qui lui permet d’analyser quelles valeurs sont inférieures ou supérieures à la moyenne et donc de nous aider à évaluer s’il y a d’éventuels incidents dans notre infrastructure informatique. Si nous donnons un temps d’apprentissage faible, comme cinq ou dix minutes, le système ne dispose que de données récentes, il est donc conseillé de fixer un temps de plusieurs jours ou semaines pour que davantage de valeurs soient prises en compte lors de ces calculs, afin d’obtenir les seuils dynamiques de manière plus solide, à l’aide d’un plus grand nombre de valeurs. Une fois les calculs effectués avec les données obtenues pour obtenir la moyenne et l’écart type, ils sont utilisés pour définir automatiquement les seuils dynamiques correspondants dans les modules. Ces seuils changent en fonction des données collectées, le recalcul est effectué et les seuils varient et s’adaptent à la nouvelle réalité en appliquant l’intelligence susmentionnée aux données.

Dans ces conditions, nous obtenons les avantages suivants dans notre outil de surveillance en appliquant la surveillance dynamique :

  • Il applique les seuils automatiquement. La principale caractéristique est qu’une fois qu’il a appris des données collectées dans le temps défini, il applique automatiquement les seuils dans les modules que nous considérons ; il n’est pas nécessaire de définir manuellement les seuils. Cette tâche est automatisée et, en plus, elle est personnalisée en fonction des valeurs de chaque module, ce qui nous amène à penser à une surveillance intelligente.
  • Recalcule les seuils. Le système recalcule les seuils de temps en temps en fonction des informations obtenues, ce qui signifie qu’ils sont mis à jour avec les valeurs reçues.
  • Il offre une certaine souplesse dans la définition des seuils. Bien que la surveillance dynamique soit axée sur l’automatisation, il est également possible d’ajuster manuellement une plage dynamique pour donner plus de souplesse aux seuils générés automatiquement.

Après avoir vu le fonctionnement et les avantages que l’utilisation des seuils dynamiques apporte à la surveillance de notre infrastructure, mettons-la en pratique en examinant quelques exemples d’utilisation.

Surveillance de la latence du web

Nous avons défini un temps d’apprentissage d’une semaine dans le module :

Une fois la configuration ci-dessus appliquée, les seuils suivants ont été définis :

Ce module passera à l’état d’avertissement lorsque la latence sera supérieure à 0,33 seconde et à l’état critique lorsqu’elle sera supérieure à 0,37 seconde. Nous représentons ces changements sur la base du graphique pour voir l’action qui sera entreprise :

Nous pouvons l’affiner davantage, car le seuil a été défini à un niveau élevé en raison des pics existants dans la surveillance. Il est possible de le réduire de 20 % afin que les alertes soient déclenchées avec un seuil plus bas. Nous modifierons les valeurs du champ Seuil dynamique minimal en utilisant une valeur négative pour abaisser les seuils minimaux. Comme il n’y a pas de valeur maximale, puisqu’elle sera considérée comme critique à partir d’un certain moment, il n’est pas nécessaire de modifier le champ Seuil dynamique max :

Après avoir appliqué les changements, les seuils ont été recalculés et sont restés dans cet état :

Le graphique se présente désormais comme suit :

En appliquant les seuils dynamiques, nous avons réussi à définir les seuils ; nous avons également vérifié qu’en plus du calcul effectué pour obtenir les seuils en fonction du temps, nous pouvons affiner et ajuster davantage les changements d’état en fonction de nos besoins de surveillance.

Surveillance de la température dans un DPC

La température dans le DPC doit être contrôlée et stable, c’est pourquoi le graphique de contrôle présentera les informations suivantes :

Comme on peut le voir sur l’image, il s’agit d’un graphique linéaire qui se situe toujours entre les mêmes valeurs ; il n’est pas souhaitable qu’il ait des changements brusques, qu’il ne monte pas ou ne descende pas de manière excessive.

Dans ce cas, nous avons voulu ajuster les seuils au maximum, c’est pourquoi nous avons défini manuellement une plage dynamique avec les informations suivantes :

Nous avons activé le paramètre “Dynamic Threshold Two Tailed” pour délimiter les seuils au-dessus et au-dessous. Ce sont les seuils dynamiques générés :

Ils sont représentés comme suit dans le graphique :

De cette façon, nous nous ajustons le plus possible à la température à laquelle nous voulons que le DPC se trouve, entre 23 et 26 degrés. En regardant le graphique, nous pouvons analyser que tout ce qui se trouve entre 23’10 et 26 est considéré comme normal. Tout ce qui sort de ces seuils déclenchera les alertes.

Le Pandora FMS dispose d’une surveillance dynamique

Le logiciel de surveillance Pandora FMS dispose d’une surveillance dynamique, il établit des seuils dynamiques dans les modules, il n’est donc pas nécessaire de connaître la définition des seuils pour les alertes et les événements. Laissez Pandora FMS le faire pour vous.

Vous pouvez consulter plus d’informations sur la surveillance dynamique dans Pandora FMS en cliquant sur ce lien.

Enfin, n’oubliez pas que Pandora FMS est un logiciel de surveillance flexible, capable de surveiller des appareils, des infrastructures, des applications, des services et des processus d’entreprise.

Voulez-vous en savoir plus sur ce que Pandora FMS peut vous offrir ? Découvrez-le en cliquant ici.

Si vous avez plus de 100 appareils à surveiller, vous pouvez nous contacter via le formulaire suivant.

N’oubliez pas non plus que si vos besoins de surveillance sont plus limités, vous avez à votre disposition la version OpenSource de Pandora FMS. Vous trouverez plus d’informations ici.

N’hésitez pas à nous envoyer vos questions, l’équipe de Pandora FMS se fera un plaisir de vous aider !

Si cet article vous a intéressé, vous pouvez également lire : Pourquoi trop d’alertes n’aident pas à la supervision ?

Shares