Monitorización dinámica con Pandora FMS 7.0 NG
This post is also available in : Inglés
Monitorización dinámica: nueva funcionalidad de Pandora FMS 7.0 NG
La versión 7.0, «Next Generation», de Pandora FMS añade muchas nuevas funcionalidades. En este artículo vamos a hablar de la “Monitorización dinámica”, comenzando por comentar qué entendemos por monitorización dinámica, explicando brevemente su funcionamiento y exponiendo algunos ejemplos.
Definición de monitorización dinámica
La monitorización dinámica consiste en una adaptación predictiva e inteligente de los parámetros de aviso de nuestros sistemas de monitorización. Actúa de forma automática y se basa en datos ya existentes. Los umbrales, (warning y critical), irán variando en función de la información recogida durante un cierto periodo de tiempo configurable.
La posibilidad de establecer automáticamente los umbrales favorece notablemente la facilidad de uso y la puesta en marcha de la herramienta. Ya no va a ser necesario hacer un estudio de los sistemas propios para establecer los umbrales, porque Pandora FMS lo va a hacer por nosotros.
Obviamente, esto requiere que la información exista. De primeras es imposible determinar cuáles son los valores normales de los sistemas; por ahora Pandora FMS no puede hacer magia.
Funcionamiento
El sistema de monitorización dinámica utiliza datos existentes para calcular desviaciones en la tendencia y, basándose en esto, configura automáticamente los umbrales de los diferentes módulos.
El modo de trabajo inteligente analiza todos los datos durante un periodo de tiempo, por ejemplo una semana, y establece valores promedios, tendencia y desviación de los datos. Conociendo esta información, establece unos umbrales de aviso determinados. Los umbrales pueden existir tanto por encima de los valores como por debajo (umbrales de dos frentes), y además es posible aumentar o reducir estos umbrales manualmente, una vez establecidos.
Configuración
El sistema de monitorización dinámica se configura desde la consola de Pandora FMS, pero requiere que el predictionserver se encuentre habilitado en el fichero de configuración pandora_server.conf.
predictionserver 1
En la configuración individual de cada módulo, estableceremos el rango de actuación del sistema de monitorizacion dinámica. Indicaremos el plazo de tiempo del cual recoger las muestras:
En el ejemplo anterior, se tomarán todos los datos existentes de los últimos 7 días para realizar el cálculo de umbrales.
Mediante el uso de los campos Dynamic Threshold Min. y Dynamic Threshold Max. podemos dar mayor flexibilidad a los umbrales automáticamente generados.
En la captura anterior incrementaremos un 5% los valores mínimos de los umbrales y un 10% los valores máximos, de modo que tendríamos en general unos umbrales más altos.
Estos campos también pueden utilizarse al revés, para reducir el valor de los umbrales si introducimos números negativos, como en la siguiente captura:
Existe otro parámetro, el Dynamic Threshold Two Tailed, que crea umbrales no solo por encima de los valores promedio (comportamiento por defecto), sino también por debajo de estos. El funcionamiento podría asemejarse a utilizar la funcionalidad inverse interval de los umbrales.
En las siguientes gráficas vemos dos ejemplos; ambos corresponden a umbrales dinámicos para un módulo en el que se ha utilizado un intervalo de un día.
En el primer ejemplo el parámetro Dynamic Threshold Two Tailed se encuentra desmarcado:
En el segundo ejemplo se ha marcado el parámetro Dynamic Threshold Two Tailed:
Por supuesto, estas configuraciones se pueden realizar masivamente mediante políticas.
Casos prácticos
Vamos a plantear varios ejemplos reales para ver con detalle la configuración y el efecto que tiene en nuestra monitorizacion dinamica.
Caso 1
Partimos de un módulo de latencia web. Aplicaremos una configuración básica con un intervalo de una semana:
Tras aplicar los cambios se han creado los siguientes umbrales:
Por lo tanto, el módulo pasará a estado warning cuando la latencia sea superior a 0’33 segundos, y a estado crítico cuando sea superior a 0’37 segundos:
Como consideramos que el umbral es algo relajado, vamos a reducirlo un 20% para que las alertas salten con mayor facilidad; para ello, vamos a modificar los valores del campo Dynamic Threshold Min. y utilizar un valor negativo para que desciendan los mínimos de los umbrales. Como no hay valor máximo, ya que se considerará crítico desde un determinado tiempo en adelante, no tenemos que modificar el umbral Dynamic Threshold Max.:
Tras aplicar los cambios los umbrales quedan en este estado:
Y la gráfica presenta este aspecto:
Caso 2
En el siguiente ejemplo estamos monitorizando la temperatura de una sala de control; la gráfica con los valores de la última semana es la siguiente:
En este caso es muy importante que la temperatura se mantenga estable y ni suba ni baje en exceso, por lo que utilizaremos el parámetro Dynamic Threshold Two Tailed para delimitar umbrales tanto por encima como por debajo. La configuración utilizada ha sido la siguiente:
Y los umbrales automáticos generados:
Se muestran del siguiente modo en la gráfica:
Como puede observarse, se considera normal todo lo que se encuentra en el rango entre 23’10 y 26, ya que es la temperatura deseada en la sala de control; todo lo que se salga de esos umbrales hará disparar las alertas.
De nuevo, mediante el uso de los parámetros Dynamic Threshold Min. y Dynamic Threshold Max. podríamos ajustar estos umbrales haciendo modificaciones porcentuales.
El equipo de redacción de Pandora FMS está formado por un conjunto de escritores y profesionales de las TI con una cosa en común: su pasión por la monitorización de sistemas informáticos.
Pandora FMS’s editorial team is made up of a group of writers and IT professionals with one thing in common: their passion for computer system monitoring.