La bataille recommence : Pandora FMS Vs Nagios. ¡FIGHT !

NagiosXI est l’héritier propriétaire de l’un des outils les plus connus en informatique pour surveiller les systèmes sans licence, c’est-à-dire en tant que produit gratuit. En tant que produit gratuit, Nagios (sans XI) est un produit qui a presque 20 ans et qui souffre de nombreux défauts, mais pendant de nombreuses années il a été la norme parmi les produits “gratuits” et il a rempli son rôle dans les cas où le budget était assez court ou les fonctionnalités nécessaires étaient peu nombreuses. Ces dernières années, son rôle d’outil gratuit a été remplacé par Zabbix, plus moderne.

Caractéristiques du produit

Nagios XI n’est pas un produit en tant que tel, mais il combine plusieurs composants indépendants préexistants. Le meilleur exemple est, par exemple, l’interface de gestion WEB Nagios XI, avec plusieurs éléments, chacun ayant son propre système d’accréditation. Les autres composants du système installés sur l’appliance Nagios XI sont les suivants :

  • Interface utilisateur de Nagios XI : Interface “superposée” sur l’interface “de base” de Nagios.
  • Nagios Core : Interface traditionnelle.
  • NSCA : Agent pour les tests passifs et plugins (non maintenu depuis 2011).
  • NSPA : Agent pour les tests passifs et plugins, avec gestion à distance.
  • NRPE : Agent pour l’exécution des plugins Nagios.
  • NRDP : Agent, théoriquement un remplacement du NSCA, dont le développement n’a pas été mis à jour depuis 2012.
  • Plugins Nagios : Scripts de surveillance. Il y a eu plusieurs “bifurcations” de la communauté.
  • NagiosFusion : Système similaire à Pandora FMS Metaconsole.
  • Netflow Analyzer : Composant spécifique pour travailler avec les flux Netflow/SFlow.
  • Serveur de journaux Nagios : Système de stockage et de surveillance des journaux.

Chaque composant doté d’une interface WEB possède son propre “look & feel”, son propre système de gestion des utilisateurs et, bien sûr, sa propre configuration et intégration avec d’autres éléments. Et ce sont des éléments conçus par la société elle-même, Nagios Enterprise.

Composants tiers “OpenSource

  • PNP : Plugin pour surveiller les performances en utilisant les bases de données binaires RRD.
  • Nagvis (cartes) : Cartes définies par l’utilisateur.
  • NDOUtils : Exportation des informations de nagios vers SQL.
  • NSClient ++ : Agent alternatif qui supporte Nagios/Icinga.
  • NagiosQL (modifié) : Interface d’administration avec stockage des données dans MySQL.

Aucun de ces éléments, qui constituent la solution “Nagios XI”, n’est même par Nagios lui-même, donc la compatibilité et la cohérence entre eux est relative. Dans de nombreux cas, personne ne peut garantir la qualité ou la maintenabilité de ces logiciels.

Tableau comparatif des fonctionnalités entre Pandora FMS et Nagios

Caractéristiques générales Nagios Pandora
Contrôle de l’expérience des utilisateurs NON OUI
Contrôle de la disponibilité OUI OUI
Suivi des performances Partiel OUI
Gestion des événements NON OUI
Système de corrélation d’événements NON OUI
Multi-tenant NON OUI
Collecte de données OUI OUI
Gestion centralisée à l’aide de politiques de surveillance OUI OUI
Mises à jour de sécurité certifiées OUI OUI
Géolocalisation NON OUI
Gestion de la ligne de commande NON OUI
Authentification LDAP/AD OUI OUI
Virtualisation et informatique dématérialisée OUI OUI
Haute disponibilité OUI OUI
Extensibilité horizontale (Metaconsole) OUI OUI
Surveillance des services (BAM) NON OUI
Console visuelle personnalisable OUI OUI
Modules synthétiques (création dynamique de données sur des données existantes) NON OUI
Base de données historique pour le stockage de données à long terme NON OUI
Distribution centralisée des plugins OUI OUI
Surveillance de z/OS NON OUI
Surveillance de SAP R3 et S4 NON OUI
Télécommande (eHorus) NON OUI
Technologie des agents Nagios Pandora
Agents multiplateformes pour Windows, HP-UX, Solaris, BSD, AIX et Linux. OUI OUI
Gestion à distance de la configuration des agents logiciels (avec des politiques et manuellement) OUI OUI
Agents pour Android, IOS et systèmes embarqués NON OUI
Inventaire à distance ou avec des agents NON OUI
Surveillance centralisée de la virtualisation : Vmware, RHEV, XenServer, HyperV OUI OUI
Oracle, Informix, SyBase, DB2, Weblogic, Jboss, Exchange, Citrix, WebSphere monitoring (entre autres) Partiel OUI
Rapports et graphiques Nagios Pandora
Personnalisation des rapports (première page, en-tête, images, contenu dynamique, contenu statique) NON OUI
Jusqu’à 6 décimales de précision dans les rapports SLA NON OUI
Système ACL à grain fin. 100% multitenant, prêt pour le SaaS NON OUI
Rapports avancés sur les SLA (quotidiens, hebdomadaires, mensuels) NON OUI
Tableau de bord OUI OUI
Arrêts planifiés et exclusion NON OUI
Modèles de rapports NON OUI
Caractéristiques du réseau Nagios Pandora
Détection et autodécouverte de la topologie du réseau L2 NON OUI
IPAM (gestion des adresses IP) NON OUI
Surveillance SNMP et WMI décentralisée (serveurs proxy, serveurs satellites) NON OUI
Surveillance des pièges SNMP OUI OUI
Cartes dynamiques navigables sur le réseau, modifiables par l’utilisateur dans un environnement graphique (console réseau) NON OUI
Analyse ICMP et SNMP à grande vitesse NON OUI
Netflow OUI OUI
Console SSH/Telnet OUI OUI

Points contre Nagios

Suivi des technologies actuelles

La création de nouveaux contrôles est basée sur des assistants ou des plugins. Dans les deux cas, il faut être un expert pour modifier l’un d’entre eux(il faut programmer au niveau des commandes, connaître le langage spécifique de définition des modèles et déboguer manuellement), ce qui rend difficile l’élargissement de la variété des contrôles ou la personnalisation de l’un d’entre eux facilement à partir de l’interface elle-même. Dans Pandora FMS, toute extension peut être réalisée à l’aide de l’interface WEB, sans descendre au niveau de la console, en plus d’offrir une plus grande collection de plugins pour les logiciels d’entreprise qui ne nécessitent aucun type de codage.

Lorsque vous appliquez des paramètres, vous devez les “compiler” de sorte que si quelque chose ne va pas, les changements ne peuvent pas être appliqués jusqu’à ce qu’ils soient corrigés. Cela serait insensé dans un environnement comportant de nombreux hôtes. Supprimer un agent sans supprimer d’abord le service qu’il contient vous empêche d’effectuer la modification, mais ne la résout pas, par exemple. Dans Pandora FMS, toute l’opération se fait en temps réel ou, dans le cas de l’application de changements majeurs, est gérée en arrière-plan par le système, sans interruption ni nécessité d’interagir à bas niveau avec le système.

Automatisation de la gestion

En général, la surveillance est tellement manuelle qu’il faudrait beaucoup de temps pour surveiller 100 agents, à moins de créer des scripts de bas niveau pour automatiser l’ensemble du processus, il n’y a donc pas de norme ni d’outils qui permettent l’automatisation, ni de bonnes pratiques, cela dépend exclusivement de la capacité de l'”expert nagios” à automatiser ces tâches efficacement, ce qui est une un processus entièrement manuel.

Rapports

Bien que Nagios dispose de rapports “personnalisés”, cette personnalisation se limite à paramétrer les rapports déjà disponibles, qui ne sont que de 20 types. Chaque rapport montre un type d’information disponible avec une présentation prédéfinie, par exemple le SLA :

nagios1

Il est possible d’ajouter des filtres et de les enregistrer comme favoris, mais ce n’est pas un rapport qui peut être beaucoup plus personnalisé. En résumé, les rapports sont destinés à l’usage du technicien, jamais à celui d’un client interne ou externe. Les rapports ne permettent pas de combiner différents types d’éléments ou d’afficher des graphiques génériques de mesures spécifiques.

Facilité d’utilisation dans les grands environnements

La charge de la console pour très peu d’agents est extrêmement élevée. La facilité d’utilisation avec un grand nombre de systèmes est très faible. Bien qu’il soit possible de le rendre capable de surveiller de nombreux systèmes, il n’a clairement pas été conçu pour cela. Pandora FMS est actuellement utilisé pour exploiter et gérer des systèmes comptant plus de 100 000 nœuds.

Agents Windows

Les agents Nagios “avancés” pour Windows (NSCA) datent de 2011 et il n’y a pas eu de mise à jour depuis. Il existe plusieurs “Forks” (iCinga, ISCA-NG), mais pas pour Windows. Malgré le fait que Nagios possède jusqu’à quatre types d’agents (NRPE, NSCA), leurs performances et leur puissance sont loin d’être comparables à celles de Pandora FMS, surtout dans les environnements Windows.

Suivi des performances

Jusqu’à très récemment, Nagios utilisait un logiciel tiers pour gérer les données et les graphiques de performance. Il a maintenant été intégré, mais il reste un composant tiers sur mesure, qui ne fait pas partie de l’architecture initiale. Pandora FMS est un outil de capacité native, il peut être utilisé pour élaborer des tableaux de bord, puisqu’il travaille avec des données et un moteur SQL dès sa première version.

Manque de gestion des événements

Nagios ne fait pas de gestion par événement, il ne peut pas valider automatiquement les événements des moniteurs qui ont été récupérés, il ne peut pas les grouper, et il ne peut pas spécifier d’alertes par événement. Pour vous dire la vérité, il n’y a pas de concept d'”événement” dans Nagios comme dans d’autres outils (OpenView, Tivoli, Patrol, SCOM, Spectrum, etc). Pandora FMS a évolué en fonction des exigences des anciens utilisateurs de ces outils, de sorte que le niveau de conformité aux normes industrielles est très élevé.
Pour Nagios, les événements consistent en un journal textuel pour un examen visuel simple, comme le montre la capture d’écran suivante :

nagios2.

Nagios ne peut pas faire une analyse des causes profondes,

Puisqu’il n’y a pas de corrélation entre les événements. PandoraFMS le possède, et il dispose également de multiples outils (cartes L2, services, escalade d’alerte, protection en cascade) qui aident l’utilisateur à cet égard.

Nagios ne peut pas faire de BPM (surveillance des services).

Avec Nagios, vous ne pouvez pas définir une hiérarchie basée sur les poids de différents éléments provenant de différents systèmes. Pandora FMS a un composant spécifique (Service Maps) pour ce point précis.

Défauts au niveau du réseau.

Nagios ne peut pas afficher un réseau physique, puisqu’il n’est pas capable de détecter ou d’afficher les topologies au niveau des liens. Cela limite la surveillance des commutateurs et des routeurs. En outre, ses cartes de réseau ne sont pas interactives et ne peuvent pas être modifiées ou personnalisées, contrairement à Pandora FMS Enterprise.

Sa surveillance des pièges SNMP n’est pas intégrée à la surveillance et ne permet donc pas d’afficher des graphiques, des rapports ou des alertes supplémentaires. Il en va de même pour son interface de surveillance Netflow, qui est conçue comme un outil auxiliaire.

Tableau de bord et affichages visuels personnalisés

Ce qui se rapproche le plus des consoles visuelles Pandora FMS sur Nagios est le plugin tiers NAGVIS qui a à peine évolué au cours des 15 dernières années. Nagvis est un plugin externe, qui n’est même pas complètement intégré à Nagios XI. Il va même jusqu’à avoir un look & feel différent :

nagios3

Bien que Nagios dispose également d’un tableau de bord dont le concept est similaire à celui de Pandora FMS, il ne possède pas d’éléments de base, comme l’affichage de graphiques de chaque élément surveillé, ou de données numériques des valeurs collectées. Cela se passe de la même manière avec les rapports, qui comportent des éléments “prédéfinis” n’offrant que peu ou pas de flexibilité lorsqu’il s’agit de construire vos propres tableaux de bord.

Gestion des permissions et multilocation

NagiosXI n’est pas destiné à fonctionner dans une organisation complexe, où peuvent coexister différents administrateurs et utilisateurs ayant accès à différents groupes de machines. Sa ségrégation d’accès est très basique :

nagios4

Le scénario où vous en avez plusieurs dizaines, avec des autorisations ACL différentes selon les groupes d’utilisateurs, n’est même pas envisagé. Bien qu’il dispose d’un journal d’audit, il n’est pas utile de savoir ce que l’administrateur ou les utilisateurs font avec l’outil, il s’agit plutôt d’un outil de diagnostic du serveur.

Conclusions

Nagios est un outil logiciel qui peut être utile dans les environnements où il y a déjà une personne ayant une connaissance avancée de Nagios qui s’occupe de tout et l’adapte manuellement en fonction des besoins de l’environnement. L’entreprise n’a pas de “Nagios”, elle a une “personne qui connaît Nagios”, donc le coût de la solution totale est en réalité le coût de cette personne, y compris un éventuel remplacement. Dans ce cas, vous ne payez pas de licence ni de maintenance, mais les coûts cachés sont d’une autre nature. La personnalisation et l’évolution des outils dépendent entièrement de cette personne. Il ne s’agit pas d’une solution standard, mais d’une solution totalement “ad-hoc”.

100% de nos clients, prospects ou entreprises consultées qui utilisent Nagios, utilisent en fait la version “gratuite” de Nagios, qui a moins de fonctionnalités que celles incluses dans ce comparatif. Il existe de nombreux forks de Nagios, les plus populaires étant Icinga ou Centreon. Il existe des alternatives commerciales avec une qualité supérieure à celle de Nagios XI, le meilleur représentant serait OP5.

Nagios XI est un outil dont le principal atout est le prix de sa licence, qui est gratuite dans la plupart des cas, et qui, même en cas de paiement de la version “Entreprise”, est plus compétitive que Solarwinds ou Whatsup Gold pour n’en citer que quelques-uns.

Pandora FMS est un outil qui concurrence – et a déjà remplacé dans plusieurs cas – les outils d’IBM, HP, CA et BMC tels que Tivoli, OpenView, Spectrum et Patrol. L’ampleur, les ressources et la portée des projets sont clairement différentes.

Shares