Cuando tenemos encolamiento en el /var/spool/pandora/data_in
hay una seria de chequeos y comprobaciones que debemos realizar:
- Estado del servidor Pandora FMS:
[root@pandora ~]# /etc/init.d/pandora_server status
En caso de no estar corriendo (ejecutando) tenemos que levantarlo (iniciarlo); si el servidor Pandora FMS está parado (detenido) es normal que haya encolamiento, pues no se procesarían los XML procedentes de los agentes.
- Cantidad de ficheros BADXML en el
/var/spool/pandora/data_in
:
[root@pandora ~]# ls -l /var/spool/pandora/data_in | grep BADXML | wc -l
Puede ser que uno o varios de los agentes estén generando ficheros BADXML, en caso de haberlos lo recomendable sería borrarlos:
[root@pandora ~]# rm -rf /var/spool/pandora/data_in/*BADXML
- Número de hilos configurados en el Data server:
En el fichero /etc/pandora/pandora_server.conf
se puede configurar el número de hilos que utiliza el Data server para procesar datos, por lo que en caso de encolamiento habría que revisar si este número es bajo para aumentar el número de hilos:
[root@pandora ~]# vi /etc/pandora/pandora_server.conf
Establecer:
dataserver_threads 5
Después de hacer el cambio hay que reiniciar el servicio para hacer efectivo el cambio.
[root@pandora ~]# /etc/init.d/pandora_server restart
- Comprobar
xml_buffer
en agentes:
El parámetro XML buffer se encuentra en el /etc/pandora/pandora_agent.conf
” de los agentes, si está configurado a 1
lo que hace es que, cuando el agente se queda sin contacto con el servidor de Pandora FMS y no puede enviar el XML a este, acumula el XML en el directorio /tmp
del agente, así ocurre cada intervalo, va generando XML y si no los puede enviar al servidor los va acumulando, una vez que se recupera la conexión se envían todos los XML generados durante la desconexión, por lo que podemos tener uno o varios agentes que envían una cantidad importante de XML al server en un corto espacio de tiempo, por lo que así el server quedaría encolado de XML que no ha procesado.
- Como solución se puede hacer varias cosas: cambiar el parámetro
dataserver_lifo
a 1, en el/etc/pandora/pandora_server.conf
del servidor, este token lo que hace es procesar de una manera más “rápida” los XML. - Mover los XML acumulados en
/var/spool/pandora/data_in
a un directorio temporal, y posteriormente ir moviéndolo de nuevo poco a poco al/var/spool/pandora/data_in
para que este los vaya procesando pero de manera que no acumule muchos en este directorio. - Borrar los XML encolados, para hacer esta acción hay que valorar cuanto de importante es la monitorización que vamos perder, pues los XML encolados son monitorización acumulada que no ha sido procesada.