Comienza de nuevo la batalla: Pandora FMS Vs Nagios. ¡FIGHT!

NagiosXI es el heredero de pago de una de las herramientas más conocidas dentro del mundo técnico para monitorizar sistemas sin licencia, es decir, como producto gratuito. Como producto gratuito, Nagios (sin el XI) es un producto que tiene casi 20 años y que adolece de muchísimas carencias, pero durante muchos años ha sido el estándar de facto dentro de los productos “gratuitos” y que cumplía su papel en aquellos casos donde no había presupuesto o las funcionalidades necesarias eran pocas. En los últimos años, su papel como herramienta gratuita ha sido reemplazado por el más moderno Zabbix.

Características del producto

Nagios XI no es un producto como tal, sino la agregación de varios componentes independientes preexistentes. El mejor ejemplo de ello es por ejemplo, la interfaz de gestión WEB de Nagios XI, con varios elementos y cada uno de ellos con su propio sistema de credenciales. Otros componentes del sistema instalados en el appliance de Nagios XI incluyen:

  • Nagios XI UI: interfaz “superpuesta” sobre la interfaz “básica” de Nagios.
  • Nagios Core: Interfaz tradicional.
  • NSCA: Agente para pruebas pasivas y de plugins (no mantenido desde 2011).
  • NSPA: Agente para pruebas pasivas y de plugins, con gestión remota.
  • NRPE: Agente para ejecución de plugins Nagios.
  • NRDP: Agente, teóricamente sustituto para NSCA cuyo desarrollo no se actualiza desde 2012.
  • Nagios Plugins: Scripts de monitorización. Han sufrido varios “forks” de la comunidad.
  • NagiosFusion. Sistema similar a la metaconsola de Pandora.
  • Netflow Analyzer: Componente específico para trabajar con flujos Netflow/SFlow.
  • Nagios Log Server: sistema de almacenamiento y monitorización de logs.

Cada componente con interfaz WEB tiene su propio “look&feel”, su propio sistema de gestión de usuarios y por supuesto, su propia configuración e integración con otros elementos. Y estos son elementos diseñados por la propia compañía, Nagios Enterprise.

Componentes “OpenSource” de terceros

  • PNP: Plugin para monitorizar rendimiento utilizando bases de datos binarias RRD.
  • Nagvis (mapas): Mapas definidos por el usuario.
  • NDOUtils: Exportación de la información de Nagios a SQL.
  • NSClient++: Agente alternativo compatible con Nagios/Icinga.
  • NagiosQL (modified): Interfaz de administración con almacenamiento de datos en MySQL.

Ninguno de estos elementos, que componen la solución “Nagios XI” son siguiera de la propia empresa de Nagios, por lo que la compatibilidad y la coherencia entre ellos es relativa. En muchos casos nadie puede garantizar la calidad ni la mantenibilidad de esas piezas de software.

Tabla comparativa de funcionalidades entre Pandora FMS y Nagios

General features Nagios Pandora
User Experience monitoring NO YES
Availability monitoring YES YES
Performance monitoring Partial YES
Event management NO YES
Event correlation system NO YES
Multitenant NO YES
Log collection YES YES
Centralized management using monitoring policies YES YES
Certified Security Updates YES YES
Geolocation NO YES
Command line management NO YES
LDAP/AD authentication YES YES
Virtualization and cloud computing YES YES
High availability YES YES
Horizontal scalability (Metaconsole) YES YES
Service monitoring (BAM) NO YES
Customizable visual console YES YES
Synthetic modules (dynamic creation of data on existing data) NO YES
Historical database for long-term data storage NO YES
Centralized plugin distribution YES YES
z/OS monitoring NO YES
SAP R3 & S4 monitoring NO YES
Remote control (eHorus) NO YES
Agent technology Nagios Pandora
Multiplatform agents for Windows, HP-UX, Solaris, BSD, AIX and Linux YES YES
Remote management of software agent configuration (with policies and manually) YES YES
Agents for Android, IOS and embedded systems NO YES
Remote inventory or with agents NO YES
Centralized virtualization monitoring: Vmware, RHEV, XenServer, HyperV YES YES
Oracle, Informix, SyBase, DB2, Weblogic, Jboss, Exchange, Citrix, WebSphere monitoring (among others) Partial YES
Reports and graphs Nagios Pandora
Customization of reports (first page, header, images, dynamic content, static content) NO YES
Up to 6 decimals of precision in SLA reports NO YES
Fine-grain ACL system. 100% multitenant ready for SaaS NO YES
SLA advanced reports (daily, weekly, monthly) NO YES
Dashboard YES YES
Planned stops and exclusion NO YES
Report templates NO YES
Network features Nagios Pandora
Network L2 topology detection and self-discovery NO YES
IPAM (IP Address Management) NO YES
Decentralized SNMP and WMI monitoring (proxy servers, satellite servers) NO YES
SNMP trap monitoring YES YES
Dynamic network navigable maps, modifiable by the user in a graphical environment (Network console) NO YES
High-speed ICMP and SNMP scanning NO YES
Netflow YES YES
SSH/Telnet Console YES YES

Puntos en contra de Nagios

Monitorización de tecnologías actuales

La creación de nuevos chequeos se basa en wizards o en plugins. En ambos casos hay que ser un experto para tocar cualquiera de ellos (hay que programar a nivel de comando, conocer el lenguaje específico de definición de plantillas y depurar errores de manera manual), lo que hace difícil que podamos ampliar el juego de chequeos o personalizar uno de ellos de forma fácil desde la propia interfaz. En Pandora FMS cualquier ampliación se puede realizar utilizando la interfaz WEB, sin requerir bajar a nivel de consola, además de disponer de una mayor colección de plugins para software empresarial que no requiere codificación de ningún tipo.

A la hora de aplicar configuraciones, necesitamos “compilarlas” de forma que si falla algo, no se pueden aplicar cambios hasta que no se corrijan. Esto en un entorno con muchos hosts puede ser demencial. Borrar un agente sin antes borrar el servicio contenido en él impide hacer el cambio, pero no te lo soluciona, por ejemplo. En Pandora FMS toda la operativa es en tiempo real, o en el caso de la aplicación de grandes cambios, gestionada en segundo plano por el sistema, sin interrupciones ni necesidad de interactuar a bajo nivel con el sistema.

Automatización de la administración

En general, la monitorización es tan manual, que se necesitaría mucho tiempo para monitorizar 100 agentes, a no ser que se creen scripts de bajo nivel que automaticen todo el proceso, de forma que no hay un standard ni herramientas que permitan la automatización, o las buenas prácticas, se depende en exclusiva de la habilidad del “experto en nagios” para automatizar esas tareas de forma eficiente, siendo en todos los casos un proceso completamente artesanal.

Informes

Aunque Nagios dispone de informes “personalizados” esta personalización se limita a parametrizar los informes ya disponibles, que son únicamente de 20 tipos. Cada informe muestra un tipo de información disponible con una presentación pre-fijada, por ejemplo el de SLA:

nagios1

Se le pueden añadir filtros y guardar como favorito, pero no es un informe que se pueda personalizar mucho más. En resumen, los informes están pensados para el consumo del técnico, nunca para poder utilizarlos para un cliente interno o externo. Los informes no permiten combinar diferentes tipos de elementos ni mostrar gráficas genéricas de métricas concretas.

Usabilidad en grandes entornos

La carga de la consola para muy pocos agentes es extremadamente alta. La usabilidad con un número alto de sistemas es muy mala. Aunque se pueda lograr que monitorice muchos sistemas, claramente no ha sido concebido para ello. Pandora FMS se está usando actualmente para operar y gestionar sistemas con más de 100,000 nodos.

Agentes Windows

Los agentes “avanzados” de Nagios para Windows (NSCA), son de 2011 y desde entonces no hay ninguna actualización. Hay varios “Forks” (iCinga, ISCA-NG), pero no para Windows. Pese a que Nagios tiene hasta cuatro tipos de agentes (NRPE, NSCA), su funcionalidad y potencia dista de ser comparable a la de Pandora FMS, especialmente en entornos Windows.

Monitorización de rendimiento

Hasta hace muy poco Nagios utilizaba software de terceros para gestionar los datos de rendimiento y las gráficas. Ahora lo ha integrado, pero sigue siendo un componente de terceros adaptado, y no parte de su arquitectura inicial. Pandora FMS es una herramienta nativa de capacidad, se puede usar para elaborar cuadros de mando, ya que trabaja con datos y un motor SQL desde su primera versión.

Inexistencia de la gestión de eventos

Nagios no realiza una gestión basada en eventos, no puede validar automáticamente eventos de monitores que se han recuperado, no puede agruparlos ni puede especificar alertas basadas en eventos. A decir verdad, no existe siguiera el concepto de “evento” en Nagios como en otras herramientas (OpenView, Tivoli, Patrol, SCOM, Spectrum, etc). PandoraFMS ha evolucionado en base a requisitos de antiguos usuarios de estas herramientas, con lo que el nivel de adecuación a los estándares de la industria, es muy alto.

Para Nagios, los eventos consisten en un log de texto para una simple revisión visual, como se ve en la siguiente captura de pantalla:

nagios2.

Nagios no puede hacer un análisis de causa raíz

Ya que no existe correlación de eventos. PandoraFMS si lo tiene, y además presenta múltiples herramientas (Mapas L2, Servicios, Escalado de alertas, Protección en cascada) que ayudan al usuario en este sentido.

Nagios no puede hacer BPM (monitorización de servicios)

Con Nagios no se puede establecer una jerarquía basada en pesos de diferentes elementos de diferentes sistemas. Pandora FMS tiene un componente específico (Mapas de servicio) para este punto específico.

Carencias a nivel de red

Nagios no puede visualizar una red física, ya que no es capaz de detectar topologías a nivel de enlace ni visualizarlas. Limitando en gran medida la monitorización de switches y routers. Además sus mapas de red no son interactivos ni se pueden editar o personalizar a diferencia de Pandora FMS Enterprise.

Su monitorización de traps SNMP no está integrada con la monitorización y por tanto no se pueden mostrar gráficas, informes o alertas agregadas. Ocurre lo mismo con su interfaz de monitorización Netflow que está concebida como una herramienta auxiliar.

Dashboard y pantallas visuales personalizadas

Lo más parecido a las consolas visuales de Pandora en Nagios, son el complemento de terceros NAGVIS que no ha evolucionado apenas en los últimos 15 años. Nagvis es un complemento externo, que ni siquiera está totalmente integrado con Nagios XI. Llegando incluso al extremo de tener un “look&feel” diferente:

nagios3

Aunque Nagios también dispone de un Dashboard con un concepto similar a Pandora, no dispone de elementos básicos, como mostrar gráficas de cada elemento monitorizado, o datos numéricos de los valores recogidos. Pasa de manera similar a los informes, que dispone de elementos “predefinidos” que aportan poca o nula flexibilidad a la hora de construir cuadros de mando propios.

Gestión de permisos y Multi-tenancy

NagiosXI No está pensado para trabajar en una organización compleja, donde puedan coexistir diferentes administradores y usuarios con acceso a diferentes grupos de máquinas. Su segregación de accesos es muy básica:

nagios4

Donde el escenario en el que tuviéramos varias docenas, con diferentes permisos de ACL por grupos de usuario no está ni siquiera contemplado. Aunque tiene un log de auditoría no sirve para saber qué hace el administrador o los usuarios con la herramienta, es más una herramienta de diagnóstico del servidor.

Conclusiones

Nagios es una herramienta de software que puede ser útil en entornos donde existe ya una persona con conocimientos avanzados de Nagios que se hace cargo de todo y lo adapta de forma artesanal conforme a las necesidades del entorno. La empresa no tiene un “Nagios”, tiene una “persona que sabe de Nagios”, por lo que el coste de la solución total es realmente el coste de esa persona, incluida su substitución. En este caso no estamos pagando ni licencia ni mantenimiento, pero los costes ocultos son otros. La personalización y evolución de la herramienta depende completamente de esa persona. No es una solución estándar, es una solución completamente “ad-hoc”.

El 100% de nuestros clientes, prospectos o empresas consultadas que utilizan Nagios, realmente utilizan la versión “gratis” de Nagios, que es inferior en características a la mostrada en esta comparativa. Existen muchos forks de Nagios, siendo los más conocidos Icinga o Centreon. Existen alternativas comerciales con una calidad superior a Nagios XI, siendo el mejor representante, OP5.

Nagios XI es una herramienta cuyo fuerte principal es su precio de licencia, que en la mayoría de los casos es gratuita, y que aún en el caso de pagar la versión “Enterprise” es más competitiva que Solarwinds o Whatsup Gold por citar algunos.

Pandora FMS es una herramienta que compite -y que ya ha reemplazado en varios casos- a herramientas de IBM, HP, CA y BMC como son Tivoli, OpenView, Spectrum y Patrol. El ámbito de actuación, los recursos y el alcance de los proyectos son claramente diferentes.

Shares