Qu’est-ce qu’un SLA

Un Service Level Agreement (SLA) est un document qui détaille le niveau de service attendu garanti par un fournisseur ou un produit. Ce document définit généralement des métriques telles que les attentes de disponibilité et les éventuels bénéfices si ces niveaux ne sont pas atteints.

Par exemple, si un fournisseur annonce un temps de disponibilité de 99,9 % et dépasse 43 minutes et 50 secondes d’indisponibilité du service, techniquement, le SLA a été violé et le client peut avoir droit à un certain type de rémunération en fonction de l’accord.

À qui sortent les SLA

Un accord de niveau de service (SLA) sert à spécifier la qualité d’un service. C’est une manière de définir la limite des pannes ou des temps dans lesquels la réponse à un service est mesurée. Chaque service mesure sa qualité d’une manière différente, mais dans tous les cas elle se réfère à des temps, et donc elle peut être mesurée.
Par exemple, si nous travaillions dans un restaurant, nous définirons notre SLA de service client avec plusieurs paramètres :

  • Temps maximum depuis qu’un client se met à table et est servi par un serveur.
  • Temps maximum depuis que vous commandez la boisson et qu’elle vous est servie.
  • Temps maximum depuis que vous commandez de la nourriture et qu’elle vous est servie.
  • Temps maximum depuis la demande du compte et le paiement.

Supposons que dans notre restaurant, nous considérons que la chose la plus importante est l’attention initiale, et qu’il ne peut pas s’écouler plus de 60 secondes, entre le moment où vous vous asseyez et le moment où vous êtes servi. Si nous avions une entreprise entièrement sensorielle avec la technologie IoT, nous pourrions mesurer le temps écoulé entre le moment où le client s’assoit à une table et celui où un serveur s’approche de la table.

De cette façon, nous pourrions mesurer chaque serveur le nombre de fois qu’il parvient à servir un client dans le temps marqué. La façon de le faire peut être plus ou moins simple, mais restons simple, supposons qu’à chaque fois qu’ils le font en moins de 60 secondes ils se conforment et quand ils n’arrivent pas, ils ne se conforment pas. Donc, si sur dix clients qui servent en une heure, seuls deux échouent, ils seraient conformes à 80 %. Nous pouvons prendre la moyenne de votre journée entière et ainsi comparer facilement différents employés pour savoir lequel a le plus de « qualité » dans la métrique de « servir un client lorsqu’il s’assoit ».

Si nous utilisons un système de supervision, nous pourrions informer notre responsable à chaque fois que la qualité globale du service descend en dessous de 80 % et grâce à la génération de rapports automatiques, nous pourrions chaque mois récompenser ceux qui ont le meilleur pourcentage de conformité au service et punir (ou licencier) ceux qui font le pire.

L’une des fonctions les plus importantes des systèmes de supervision est de mesurer. Et mesurer la conformité du service est essentiel si nous nous soucions de la qualité. Que nous soyons côté fournisseur ou côté client.

Si vous payez pour un service, ne voudriez-vous pas vérifier que vous obtenez réellement ce pour quoi vous payez ?

Parfois on fait bien de ne pas se fier aux mensurations des autres, et il faut le vérifier de « notre côté ». Pour cela, des outils de supervision tels que Pandora FMS sont indispensables.

Quel est le « uptime » ou temps d’activité ?

Le temps d’activité est la durée pendant laquelle un service est disponible et opérationnel. Il s’agit généralement de la mesure la plus importante pour un site Web, un service en ligne ou un fournisseur Web. Parfois, la disponibilité est confondue avec le SLA, mais la disponibilité n’est rien de plus qu’une métrique très courante dans les services en ligne qui est utilisée pour mesurer les SLA, pas un SLA, qui, comme nous l’avons vu auparavant, est quelque chose de beaucoup plus large.

Le compromis est le temps d’arrêt – la durée d’indisponibilité d’un service.

La disponibilité est généralement exprimée en pourcentage, par exemple « 99,9 % », sur une période de temps spécifiée (généralement un mois). Par exemple, une disponibilité de 99,9 % équivaut à 43 minutes et 50 secondes d’inactivité.

Quelles sont les métriques typiques d’un fournisseur ?

Ceux qui sont convenus entre le fournisseur et le client. Chaque service aura ses propres métriques et indicateurs. Ainsi, dans notre service de Monitoring as a Service (MAAS) nous établissons plusieurs paramètres à mesurer, entre autres, voyons en quelques-uns pour mieux comprendre comment « mesurer la qualité de service » via le SLA :

  • Temps de réponse minimum à un nouvel incident, 1h en service standard.
  • Temps de résolution des incidents critiques : 6 heures en service standard.
  • Temps de disponibilité du service, de 99,932 % dans le service standard.

Quand on parle d’un pourcentage du temps, il s’agit généralement du calcul annuel, de cette manière, 99,932 % correspondent à un total de 5h 57m 38s d’arrêt de service dans un an. Nous pouvons utiliser notre calculateur SLA (ci-dessous pour tester d’autres pourcentages).

Au contraire, 1h serait le calcul inverse, et pour cela nous pouvons utiliser des outils en ligne tels que uptime.is. En l’utilisant on obtiendra ce 6h qui correspondent à :

  • Weekly reporting: 99.405 %
  • Monthly reporting: 99.863 %
  • Quarterly reporting: 99.954 %
  • Yearly reporting: 99.989 %

Semblable à l’exemple du serveur initial, nous pouvons mesurer la conformité à un SLA de support en mesurant la somme de plusieurs facteurs, si tous sont respectés, nous respectons le SLA, sinon non. C’est ainsi que Pandora ITSM le mesure, le composant helpdesk intégré à Pandora FMS. Les clients Pandora FMS utilisent Pandora ITSM pour l’assistance, et grâce à cela, nous pouvons nous assurer que les clients sont toujours servis à temps.

Comment calculer le temps SLA d’un service ?

Utilisez notre calculateur en ligne pour calculer le temps d’arrêt d’un service. Par exemple, testez 99,99 % pour voir le temps d’arrêt maximal pour un jour, un mois ou toute l’année.

 Error: Embedded data could not be displayed.

Comment Pandora FMS peut-il vous aider avec les SLA ?

Pandora FMS dispose de différents outils pour contrôler de manière exhaustive les SLA de votre client/fournisseur. Vous avez des rapports SLA segmentés par heures, jours ou semaines. De cette façon, vous pouvez évaluer visuellement où se trouvent les valeurs par défaut.

Il s’agit d’un exemple de rapport SLA dans une plage de temps personnalisée (un mois) avec des tranches par plages de quelques minutes.

Il existe des rapports préparés pour montrer le cas des sources d’informations avec sauvegarde (backup) afin que vous puissiez connaître la disponibilité du service du point de vue du client et du point de vue interne :

Celui-ci est un exemple de vue SLA mensuel en détail par des heures et des jours :

Celui-ci est un exemple de la vue d’un rapport de SLA mensuel avec vue par semaines et du détail quotidien :

Celui-ci est un exemple de la vue d’un rapport de SLA par des mois, avec des vues simples par des jours :

Supervision services

Une des fonctions les plus avancées que Pandora FMS est la supervision service avec Pandora FMS. Elle est utilisée pour superviser continuellement l’état d’un service, qui comme nous avons vu au principe est composée d’un ensemble d’indicateurs ou métriques. Ce service a souvent une série de dépendances et de pondérations (il y a des choses plus importantes que d’autres) et tous les services ont une certaine tolérance ou une marge, surtout s’ils sont composés de beaucoup d’éléments et certains de ceux-ci sont traduits.

Le meilleur exemple est une grappe, où si nous avons dix employés, nous savons que le système fonctionne parfaitement avec sept d’entre eux. De sorte que le service comme tel peut être opérationnel avec une défaillance de d’un, deux ou jusqu’à trois machines.

Dans d’autres cas, un service peut avoir des éléments non critiques, qui font partie du service et que nous voulons contrôler, même si le service n’est pas affecté :

Un des avantages de la supervision service, est que nous pouvons facilement obtenir la route vers la défaillance, être littéralement capables de trouver l’aiguille dans l’étable, quand nous parlerons de technologie, l’origine d’un problème peut être quelque chose petite en comparaison avec la quantité de données que nous recevons. Les services nous aident à déterminer l’origine du problème et à nous isoler du bruit informatif. En outre nous permettent de superviser le degré de l’accomplissement du service en temps réel et d’agir avant que la qualité du service face à un client soit affectée.

Shares