Dans le blog de Pandora FMS nous aimons nous lever tôt, nous préparer une tasse de menthe poivrée et tandis qu’il repose, faire quelques étirements, nous laver le visage et commencer le jour à définir des mots bizarres utiles pour nos lecteurs. Aujourd’hui c’est : Télémétrie !

Savez-vous ce qu’est la télémétrie ? Aujourd’hui, nous vous le dirons

Rentrons-nous dans le vif du sujet ?

Rentrons dans le vif du sujet alors !

La télémétrie, grosso modo, est ce qui mesure, collecte et transmet automatiquement des données provenant de sources distantes, grâce à des dispositifs qui servent à collecter des données.

Il transmet ensuite ces données à un emplacement central où elles sont analysées et nous pouvons déjà considérer notre système distant comme supervisé et contrôlé.

Bien sûr, les données de télémétrie aident, tout en contrôlant la sécurité, à améliorer l’expérience client et à superviser l’état des applications, la qualité et les performances.

Mais allons plus loin, quelle est la véritable fonction de la télémétrie ?

Comme vous le comprenez, la collecte de données télémétriques est essentielle à la gestion de l’infrastructure informatique.

Les données sont utilisées pour superviser les performances des systèmes et avoir à portée de main des informations exploitables.

Comment mesurer la télémétrie ?

Facile !

Avec la supervision !

Les outils de supervision mesurent tous les types de données de télémétrie.

Ils commencent par les performances du serveur et se dirigent vers l’infini exploitable.

Quelques types de données télémétriques

Tout commence par un petit signal indiquant si un serveur est actif ou inactif.

Ensuite, il a tendance à se compliquer.

Les données d’événements et de métriques incluent déjà l’utilisation du processeur d’un serveur, y compris les pics et les moyennes sur plusieurs périodes.

Par exemple, un type de données télémétriques à superviser comprend l’utilisation de la mémoire du serveur et la charge d’E/S au fil du temps.

*Ces données sont particulièrement importantes lors de l’utilisation de la virtualisation de serveurs.

Dans ces situations, les statistiques fournies par les serveurs virtuels peuvent ne pas révéler de problèmes avec l’utilisation du processeur ou de la mémoire ; au lieu de cela, le serveur physique sous-jacent peut être sous-utilisé en termes de mémoire physique, de virtualisation, de CPU et de connectivité d’E/S avec les périphériques.

Enfin, les requêtes des utilisateurs au fil du temps et l’activité concurrente des utilisateurs dans les graphiques d’écart type doivent être incluses dans les mesures spécifiques au serveur.

Cela révélera comment vos systèmes sont utilisés en général, ainsi que des informations sur les performances du serveur.

Supervision des données télémétriques

Maintenant que nous avons jeté un coup d’œil aux serveurs et à leur télémétrie, nous allons voir un peu plus en profondeur, certains des composants fondamentaux de leur application physique.

Il s’agit de :

  • L’infrastructure réseau.
  • L’infrastructure de stockage.
  • La capacité.
  • La consommation globale de bande passante.

Comme tout informaticien expérimenté peut vous avertir :

Quantifier la supervision du réseau au-delà du strict commun est important.

La mesure du trafic réseau en bits par seconde via les LAN et les sous-LAN au sein de votre infrastructure applicative doit toujours faire partie de la supervision de l’utilisation du réseau.

Pour prédire quand des paquets seront perdus et quand des tempêtes peuvent se produire sur le réseau, il est essentiel de comprendre les limites théoriques et pratiques de ces segments.

L’utilisation de la bande passante du segment au fil du temps dans plusieurs zones du réseau doit être révélée par la supervision réseau.

La supervision de certains protocoles réseau fournira également une vue plus détaillée de l’utilisation des applications en temps réel et, éventuellement, des problèmes de performances de certaines fonctionnalités.

En outre, la supervision des demandes adressées à certains ports réseau peut également révéler des failles de sécurité, ainsi que des retards de routage et de commutation dans les composants réseau concernés.

En plus de superviser l’utilisation brute du réseau, il est nécessaire de superviser les systèmes de stockage connectés au réseau.

Pour afficher l’utilisation du stockage, les temps d’attente et les défaillances de disque probables, une télémétrie spécifique est nécessaire.

Encore une fois, il est important de superviser à la fois la surutilisation et la sous-utilisation des ressources de stockage.

Quelques données de base sur la supervision de la télémétrie des applications

Il est très important de superviser la télémétrie qui peut impliquer l’accès à la base de données et son traitement, de superviser le nombre de connexions de base de données ouvertes, qui peuvent être déclenchées et affecter les performances.

La supervision dans le temps permet de détecter les décisions de conception qui ne changent pas à mesure que l’utilisation de l’application augmente.

Il est tout aussi crucial de contrôler le nombre de requêtes à la base de données, leurs temps de réponse et la quantité d’informations circulant entre la base de données et les applications.

Il faut aussi prendre en compte les valeurs atypiques et les moyennes.

Une latence peu fréquente peut être dissimulée ou masquée si seules les moyennes sont contrôlées, mais ces valeurs atypiques pourraient encore avoir un impact négatif et irriter les utilisateurs.

Votre stratégie de supervision doit toujours tenir compte des exceptions de l’outil, des erreurs ou avertissements de la base de données, des journaux du serveur d’applications à la recherche d’une activité inhabituelle…

Et ce n’est que le début.

Votre logiciel de supervision

Avoir une stratégie de supervision solide est crucial, mais il est également important d’avoir une stratégie de réaction bien pensée qui intègre :

  • Déterminer, comprendre et commencer l’analyse de la cause racine.
  • Une stratégie de communication écrite incluant les noms et coordonnées des responsables.
  • Identifier des solutions faciles pour rétablir le programme à court terme.
  • Une stratégie de recherche pour prévenir les problèmes futurs.

Éléments de supervision télémétrique

Quelques éléments de supervision télémétrique que vous pouvez utiliser :

  • Tableaux de bord ou autres outils d’information et de télémétrie du système en temps réel.
  • Technologies d’analyse de registres sûres pour une utilisation avec des systèmes de production.
  • Intelligence d’entreprise pour extraire les données des journaux, telles que les tendances d’utilisation ou les problèmes de sécurité pendant des périodes spécifiques.
  • Outils qui automatisent la détection, la récupération et l’atténuation des risques pour éliminer le travail manuel.

En utilisant un système centralisé et en travaillant avec un fournisseur de logiciels, vous pouvez mettre en place une stratégie de supervision solide qui sera développée au fil du temps et deviendra plus complète.

Et c’est là, mon ami, que nous entrons.

Shares