Welcome to Pandora FMS Community › Forums › Soporte de la comunidad › Módulos en desconocido antes de tiempo
-
Módulos en desconocido antes de tiempo
Posted by ids on October 3, 2016 at 19:55Tengo un agente con varios módulos definidos. Algunos de estos se ejecutan con el mismo intervalo que el agente, otros tienen configurado un periodo mayor múltiplo del periodo del agente. En estos últimos algunas veces los monitores entran en estado desconocido con un periodo que no les corresponde.
En las capturas se puede observar que teniendo periodo de 1día, en ningún caso debería estar en desconocido a los 49 minutos.
La prueba la he realizado con un Windows Server 2012, instalado de nuevas el agente en última versión 6.0SP3 y con la siguiente configuración del agente:
——————————————————-
server_ip X.X.X.X
server_path /var/spool/pandora/data_in
temporal “C:Program Filespandora_agenttemp”group “Servers”
interval 300
xml_buffer 0
# HostName
module_begin
module_name HostName
module_type generic_data_string
module_wmiquery SELECT CSName FROM Win32_operatingsystem
module_wmicolumn CSName
module_interval 288
module_description Nombre de la maquina
module_end
——————————————————-Me ha venido pasando de vez en cuando con otros agentes que ya tenía pero no consigo ver el error en la configuración.
Un saludo,
\Izanids replied 8 years, 3 months ago 3 Members · 17 Replies -
17 Replies
-
::
¿Aguna idea?
Tengo varios módulos en este estado y el servidor de datos tiene un retraso de 7 horas. No es por falta de capacidad de procesado puesto que si reinicio los agentes los módulos los procesa sin ningún problema, así que más bien parece que está registrando ese retraso debido a los módulos que se quedan en desconocido.
Puedo bajar el periodo de esos módulos para que sea igual que el del servidor y no tener ese problema pero preferiría dar con la raíz del problema.
Un saludo,
\Izan -
::
Hola Izan,
Por favor, ¿podrías decirnos que versión te aparece en la consola al pie de la página?
Pandora FMS v6.0SP3 – Build PC161006
Comentas que esto te ocurre únicamente con algunos módulos, ¿son todos del mismo tipo o hay algún patrón común que nos permita acotar el problema? Quiero decir, si son todos módulos locales WMI por ejemplo, o que reciban un dato de tipo string.
Un saludo,
Enrique. -
::
Pandora FMS v6.0SP3 – Revisión PC161003
De todas formas llevo arrastrándolo un par de versiones. Además sólo me ocurre con los módulos nuevos que creo y nunca con los que ya tenía (empecé por la 4.0) de servidor de datos y tipo indistintamente generic_data y generic_data_string. Adjunto otra captura que se ve claramente: periodo del módulo 1 día y en desconocido a las 19 horas :S
De momento lo he “solucionado” quitando la sentencia module_interval en los módulos que me fallan para que vayan con el mismo periodo que el agente pero debería poder elegir el tiempo en un futuro.
Un saludo!
\Izan -
::
Hola Izan,
Perdona mi insistencia pero, ¿podrías indicar que versión te aparece en la consola al pie de la página? Aparece con el formato:
Pandora FMS v6.0SP3 – Build PC161006
Si tienes alguna actualización de la consola pendiente, realizala.
También te agradecería que me dijeras si dentro de que sean módulos locales son modulos exec, WMI, SNMP, etc. (dentro de los módulos para agentes Windows hay algunas configuraciones propias como la que muestras arriba que sería un módulo WMI).
Un saludo,
Enrique. -
-
-
-
-
::
Hola Izan,
No llegue a preguntarte esto, ¿en el log del agente figura algún error para los módulos que te pasan a desconocido?
Si es posible en la configuración de tu agente (pandora_agent.conf) incluye la linea siguiente:
debug 1
A continuación revisa el fichero “pandora_debug.log” ubicado por defecto en “C:Program Filespandora_agent” para ver si aparece algo y en el directorio “C:Program Filespandora_agenttemp” revisa si los ficheros que se generan incluyen información del módulo.
Un saludo,
Enrique. -
::
pandora_debug.log:
2016-10-28 17:19:23 Run begin
2016-10-28 17:19:23 Run Espacio libre C:
2016-10-28 17:19:23 Espacio libre C:: Interval is not fulfilled
2016-10-28 17:19:23 Run Espacio Total C:
2016-10-28 17:19:23 Espacio Total C:: Interval is not fulfilled
2016-10-28 17:19:23 Run Uso CPU
2016-10-28 17:19:25 Run Memoria Libre
2016-10-28 17:19:25 Run Memoria Total
2016-10-28 17:19:25 Memoria Total: Interval is not fulfilled
2016-10-28 17:19:25 Run Usuarios
2016-10-28 17:19:25 Run HostName
2016-10-28 17:19:25 HostName: Interval is not fulfilled
2016-10-28 17:19:25 Run Modelo
2016-10-28 17:19:25 Modelo: Interval is not fulfilled
2016-10-28 17:19:25 Run N Serie
2016-10-28 17:19:25 N Serie: Interval is not fulfilled
2016-10-28 17:19:25 Run Modelo CPU
2016-10-28 17:19:25 Modelo CPU: Interval is not fulfilled
2016-10-28 17:19:25 Run Interfaces de red
2016-10-28 17:19:25 Interfaces de red: Interval is not fulfilled
2016-10-28 17:19:25 Run WMI Service
2016-10-28 17:19:26 Espacio libre C: getXML begin
2016-10-28 17:19:26 Espacio Total C: getXML begin
2016-10-28 17:19:26 Uso CPU getXML begin
2016-10-28 17:19:26 Uso CPU getXML end
2016-10-28 17:19:26 Memoria Libre getXML begin
2016-10-28 17:19:26 Memoria Libre getXML end
2016-10-28 17:19:26 Memoria Total getXML begin
2016-10-28 17:19:26 Usuarios getXML begin
2016-10-28 17:19:26 Usuarios getXML end
2016-10-28 17:19:26 HostName getXML begin
2016-10-28 17:19:26 Modelo getXML begin
2016-10-28 17:19:26 N Serie getXML begin
2016-10-28 17:19:26 Modelo CPU getXML begin
2016-10-28 17:19:26 Interfaces de red getXML begin
2016-10-28 17:19:26 WMI Service getXML begin
2016-10-28 17:19:26 WMI Service getXML end
2016-10-28 17:19:26 Copying XML on C:Program Filespandora_agenttempXDEA01.18306.data
2016-10-28 17:19:26 Remote copying XML C:Program Filespandora_agenttempXDEA01.18306.data on server 172.31.0.153
2016-10-28 17:19:26 Command tentacle_client.exe -a 172.31.0.153 -p 41121 “C:Program Filespandora_agenttempXDEA01.18306.data”
2016-10-28 17:19:26 Successfuly copied XML file to server.
2016-10-28 17:19:26 Next execution on 300 secondsXDEA01.XXXX.datasent:
Que entiendo que es lo habitual. Si el intervalo no se cumple, no manda datos de dichos módulos. Sin embargo la consola entiende que debe entrar en estado desconocido porque no recibe datos de estos.
Yo me inclino más a pensar que es del lado del servidor.
Un saludo,
\Izan -
-
::
Hola de nuevo,
Actualicé la semana pasada y sigue con el mismo comportamiento.
Pero sí me he dado cuenta de una cosa curiosa, en las capturas se ve claramente. El fallo se produce cuando asigno un grupo al módulo. ¿Hay alguna relación entre el grupo al que pertenezca y el siguiente contacto que la consola no esté interpretando bien?
P.D: CentOS Linux release 7.2.1511 (Core)
Un saludo,
-
::
Hola Izan,
Estoy probando en las versiones más recientes y no logro replicar tu problema.
Según la información que aportas, los logs muestran correctamente la información sobre el intervalo todavía no completado, y efectivamente el XML no trae la información de los módulos, esto es correcto. Además la consola refleja el intervalo ampliado x288 correctamente, pero aún así los módulos pasan a estado desconocido.Podrías ejecutar la siguiente consulta en tu base de datos?
select * from tagente_modulo where id_agente_modulo = 14779
Para comprobar que el intervalo está correctamente configurado en la base de datos y no se trata de un error visual.
con respecto a lo de mover los módulos a un grupo, no debería estar relacionado. Igualmente si haces alguna prueba relacionada con ello y sacas algo en claro no dudes en comentarlo.Un saludo,
Antonio. -
::
He hecho la query y el module_interval estaba bien (tenía sentido ya que la consola lo muestra correctamente). He cambiado el grupo del módulo y he repetido la query para ver si modificaba algún parámetro. Te copio las dos filas con las columnas que cambian en negrita, por si alguna puede estar provocando el fallo:
id_agente_modulo id_agente id_tipo_modulo descripcion extended_info nombre unit id_policy_module max min module_interval tcp_port tcp_send tcp_rcv snmp_community snmp_oid ip_target id_module_group flag id_modulo disabled id_export plugin_user plugin_pass plugin_parameter id_plugin post_process prediction_module max_timeout custom_id history_data min_warning max_warning str_warning min_critical max_critical str_critical min_ff_event delete_pending policy_linked policy_adopted custom_string_1 custom_string_2 custom_string_3 custom_integer_1 custom_integer_2 module_ff_interval wizard_level macros quiet critical_instructions warning_instructions unknown_instructions critical_inverse warning_inverse cron_interval max_retries id_category disabled_types_event module_macros min_ff_event_normal min_ff_event_warning min_ff_event_critical each_ff ff_timeout dynamic_interval dynamic_max dynamic_min prediction_sample_window prediction_samples prediction_threshold 14958 689 3 Nombre de la maquina HostName NULL 0 0 0 86400 0 NULL NULL 0 0 1 1 0 0 NULL NULL NULL 0 0.000000000000000 0 0 1 0.00 0.00 NULL 0.00 0.00 NULL 0 0 0 0 NULL NULL NULL 0 0 0 nowizard NULL 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 14958 689 3 Nombre de la maquina HostName 0 0 0 86400 NULL 15 0 1 0 0 0 0.000000000000000 NULL 0 1 0.00 0.00 0.00 0.00 0 0 0 0 0 0 0 nowizard 0 0 0 0 0 {“going_unknown”:1} W10= 0 0 0 0 0 0 0 0 0 0 0 Parece que la columna disabled_types_event se rellena porque al editarlo con la consola la opción “Generar eventos desconocidos” no lo marca por defecto. En cualquier caso es un comportamiento erróneo ya que no debería generarlos en ningún caso, no antes de tiempo. Voy a probar a rehabilitarlo desde la consola en los módulos que tengo en desconocido a ver si se arregla.
Un saludo,
\Izan -
-
::
Hola,
En principio no debería tener que ver, puede deberse simplemente a que en la base de datos trae unos valores por defeto (NULL), y al enviar el formulario vacío simplemente los actualiza a vacíos (“”).
Te diría de aplicar cualquier actualización que tengas pendiente, ya que como te comento en la versión actual no he logrado replicarlo. Y tiene pinta de ser del lado de la consola/servidor, ya que según los logs y los xml mostrados el agente parece que está haciendo correctamente su trabajo.Para debugear también te diría de comenzar haciendo pruebas más estrechas, por ejemplo instalando un agente y estableciendo un intervalo corto (unos 30 segundos) y comenzar a añadir módulos, a ser posible los mismos que hasta ahora, y comenzar a modificar sus intervalos para ver en qué punto se quedan en desconocido, quizá al ser un factor multiplicador muy grande haya algún tipo de problema, ya que las pruebas que yo he hecho han sido éstas pero únicamente subiendo el multiplicador a 4 o 5.
Un saludo,
Antonio. -