Welcome to Pandora FMS Community!

Find answers, ask questions, and connect with our community around the world.

Welcome to Pandora FMS Community Forums Soporte de la comunidad Módulos en desconocido antes de tiempo

  • Módulos en desconocido antes de tiempo

    Posted by ids on October 3, 2016 at 19:55

    Tengo un agente con varios módulos definidos. Algunos de estos se ejecutan con el mismo intervalo que el agente, otros tienen configurado un periodo mayor múltiplo del periodo del agente. En estos últimos algunas veces los monitores entran en estado desconocido con un periodo que no les corresponde.

    En las capturas se puede observar que teniendo periodo de 1día, en ningún caso debería estar en desconocido a los 49 minutos.

    La prueba la he realizado con un Windows Server 2012, instalado de nuevas el agente en última versión 6.0SP3 y con la siguiente configuración del agente:
    ——————————————————-
    server_ip X.X.X.X
    server_path /var/spool/pandora/data_in
    temporal “C:Program Filespandora_agenttemp”

    group “Servers”

    interval 300

    xml_buffer 0

    # HostName
    module_begin
    module_name HostName
    module_type generic_data_string
    module_wmiquery SELECT CSName FROM Win32_operatingsystem
    module_wmicolumn CSName
    module_interval 288
    module_description Nombre de la maquina
    module_end
    ——————————————————-

    Me ha venido pasando de vez en cuando con otros agentes que ya tenía pero no consigo ver el error en la configuración.

    Un saludo,
    \Izan

    ids replied 8 years, 3 months ago 3 Members · 17 Replies
  • 17 Replies
  • ids

    Member
    October 5, 2016 at 13:26
    0 Karma points
    Community rank: tentacle-noob-1 Tentacle noob
    Like it
    Up
    0
    Down
    Drop it
    ::

    ¿Aguna idea?

    Tengo varios módulos en este estado y el servidor de datos tiene un retraso de 7 horas. No es por falta de capacidad de procesado puesto que si reinicio los agentes los módulos los procesa sin ningún problema, así que más bien parece que está registrando ese retraso debido a los módulos que se quedan en desconocido.

    Puedo bajar el periodo de esos módulos para que sea igual que el del servidor y no tener ese problema pero preferiría dar con la raíz del problema.

    Un saludo,
    \Izan

  • enrique_m

    Member
    October 6, 2016 at 11:55
    0 Karma points
    Community rank: tentacle-noob-1 Tentacle noob
    Like it
    Up
    0
    Down
    Drop it
    ::

    Hola Izan,

    Por favor, ¿podrías decirnos que versión te aparece en la consola al pie de la página?

    Pandora FMS v6.0SP3 – Build PC161006

    Comentas que esto te ocurre únicamente con algunos módulos, ¿son todos del mismo tipo o hay algún patrón común que nos permita acotar el problema? Quiero decir, si son todos módulos locales WMI por ejemplo, o que reciban un dato de tipo string.

    Un saludo,
    Enrique.

  • ids

    Member
    October 6, 2016 at 13:10
    0 Karma points
    Community rank: tentacle-noob-1 Tentacle noob
    Like it
    Up
    0
    Down
    Drop it
    ::

    Pandora FMS v6.0SP3 – Revisión PC161003

    De todas formas llevo arrastrándolo un par de versiones. Además sólo me ocurre con los módulos nuevos que creo y nunca con los que ya tenía (empecé por la 4.0) de servidor de datos y tipo indistintamente generic_data y generic_data_string. Adjunto otra captura que se ve claramente: periodo del módulo 1 día y en desconocido a las 19 horas :S

    De momento lo he “solucionado” quitando la sentencia module_interval en los módulos que me fallan para que vayan con el mismo periodo que el agente pero debería poder elegir el tiempo en un futuro.

    Un saludo!
    \Izan

  • enrique_m

    Member
    October 6, 2016 at 13:51
    0 Karma points
    Community rank: tentacle-noob-1 Tentacle noob
    Like it
    Up
    0
    Down
    Drop it
    ::

    Hola Izan,

    Perdona mi insistencia pero, ¿podrías indicar que versión te aparece en la consola al pie de la página? Aparece con el formato:

    Pandora FMS v6.0SP3 – Build PC161006

    Si tienes alguna actualización de la consola pendiente, realizala.

    También te agradecería que me dijeras si dentro de que sean módulos locales son modulos exec, WMI, SNMP, etc. (dentro de los módulos para agentes Windows hay algunas configuraciones propias como la que muestras arriba que sería un módulo WMI).

    Un saludo,
    Enrique.

  • ids

    Member
    October 6, 2016 at 13:59
    0 Karma points
    Community rank: tentacle-noob-1 Tentacle noob
    Like it
    Up
    0
    Down
    Drop it
    ::

    Te lo he puesto más arriba en negrita 😀

    Pandora FMS v6.0SP3 – Revisión PC161003

    No me aparece ninguna actualización más…

    Me ocurre tanto con modulos exec como wmi.

    Un saludo,
    \Izan

  • enrique_m

    Member
    October 6, 2016 at 14:18
    0 Karma points
    Community rank: tentacle-noob-1 Tentacle noob
    Like it
    Up
    0
    Down
    Drop it
    ::

    Discúlpame, lo pase por alto al ser la primera línea :S

    Voy a intentar replicar tu problema para ver si se trata efectivamente de un bug o si puede ser un error en la configuración.

    Un saludo,
    Enrique.

  • ids

    Member
    October 17, 2016 at 22:08
    0 Karma points
    Community rank: tentacle-noob-1 Tentacle noob
    Like it
    Up
    0
    Down
    Drop it
    ::

    Buenas,

    Conseguiste replicar el problema?

    Un saludo,
    \Izan

  • enrique_m

    Member
    October 19, 2016 at 15:59
    0 Karma points
    Community rank: tentacle-noob-1 Tentacle noob
    Like it
    Up
    0
    Down
    Drop it
    ::

    Hola Izan,

    No he tenido ocasión para intentar replicar tu problema todavía. En cuanto me sea posible intentaré hacerlo y te avisaré con cualquier resultado.

    Un saludo,
    Enrique.

  • enrique_m

    Member
    October 26, 2016 at 15:22
    0 Karma points
    Community rank: tentacle-noob-1 Tentacle noob
    Like it
    Up
    0
    Down
    Drop it
    ::

    Hola Izan,

    No llegue a preguntarte esto, ¿en el log del agente figura algún error para los módulos que te pasan a desconocido?

    Si es posible en la configuración de tu agente (pandora_agent.conf) incluye la linea siguiente:

    debug 1

    A continuación revisa el fichero “pandora_debug.log” ubicado por defecto en “C:Program Filespandora_agent” para ver si aparece algo y en el directorio “C:Program Filespandora_agenttemp” revisa si los ficheros que se generan incluyen información del módulo.

    Un saludo,
    Enrique.

  • ids

    Member
    October 28, 2016 at 19:28
    0 Karma points
    Community rank: tentacle-noob-1 Tentacle noob
    Like it
    Up
    0
    Down
    Drop it
    ::

    pandora_debug.log:
    2016-10-28 17:19:23 Run begin
    2016-10-28 17:19:23 Run Espacio libre C:
    2016-10-28 17:19:23 Espacio libre C:: Interval is not fulfilled
    2016-10-28 17:19:23 Run Espacio Total C:
    2016-10-28 17:19:23 Espacio Total C:: Interval is not fulfilled
    2016-10-28 17:19:23 Run Uso CPU
    2016-10-28 17:19:25 Run Memoria Libre
    2016-10-28 17:19:25 Run Memoria Total
    2016-10-28 17:19:25 Memoria Total: Interval is not fulfilled
    2016-10-28 17:19:25 Run Usuarios
    2016-10-28 17:19:25 Run HostName
    2016-10-28 17:19:25 HostName: Interval is not fulfilled
    2016-10-28 17:19:25 Run Modelo
    2016-10-28 17:19:25 Modelo: Interval is not fulfilled
    2016-10-28 17:19:25 Run N Serie
    2016-10-28 17:19:25 N Serie: Interval is not fulfilled
    2016-10-28 17:19:25 Run Modelo CPU
    2016-10-28 17:19:25 Modelo CPU: Interval is not fulfilled
    2016-10-28 17:19:25 Run Interfaces de red
    2016-10-28 17:19:25 Interfaces de red: Interval is not fulfilled
    2016-10-28 17:19:25 Run WMI Service
    2016-10-28 17:19:26 Espacio libre C: getXML begin
    2016-10-28 17:19:26 Espacio Total C: getXML begin
    2016-10-28 17:19:26 Uso CPU getXML begin
    2016-10-28 17:19:26 Uso CPU getXML end
    2016-10-28 17:19:26 Memoria Libre getXML begin
    2016-10-28 17:19:26 Memoria Libre getXML end
    2016-10-28 17:19:26 Memoria Total getXML begin
    2016-10-28 17:19:26 Usuarios getXML begin
    2016-10-28 17:19:26 Usuarios getXML end
    2016-10-28 17:19:26 HostName getXML begin
    2016-10-28 17:19:26 Modelo getXML begin
    2016-10-28 17:19:26 N Serie getXML begin
    2016-10-28 17:19:26 Modelo CPU getXML begin
    2016-10-28 17:19:26 Interfaces de red getXML begin
    2016-10-28 17:19:26 WMI Service getXML begin
    2016-10-28 17:19:26 WMI Service getXML end
    2016-10-28 17:19:26 Copying XML on C:Program Filespandora_agenttempXDEA01.18306.data
    2016-10-28 17:19:26 Remote copying XML C:Program Filespandora_agenttempXDEA01.18306.data on server 172.31.0.153
    2016-10-28 17:19:26 Command tentacle_client.exe -a 172.31.0.153 -p 41121 “C:Program Filespandora_agenttempXDEA01.18306.data”
    2016-10-28 17:19:26 Successfuly copied XML file to server.
    2016-10-28 17:19:26 Next execution on 300 seconds

    XDEA01.XXXX.datasent:

    Que entiendo que es lo habitual. Si el intervalo no se cumple, no manda datos de dichos módulos. Sin embargo la consola entiende que debe entrar en estado desconocido porque no recibe datos de estos.

    Yo me inclino más a pensar que es del lado del servidor.

    Un saludo,
    \Izan

  • enrique_m

    Member
    November 7, 2016 at 20:51
    0 Karma points
    Community rank: tentacle-noob-1 Tentacle noob
    Like it
    Up
    0
    Down
    Drop it
    ::

    Hola Izan,

    Ya que está disponible la versión 6.0SP4, ¿podrías actualizar tu Pandora y comprobar si se sigue produciendo tu problema? También me he dado cuenta de que no te pregunte en qué sistema operativo se encuentra tu servidor de Pandora.

    Un saludo,
    Enrique.

  • ids

    Member
    November 16, 2016 at 15:48
    0 Karma points
    Community rank: tentacle-noob-1 Tentacle noob
    Like it
    Up
    0
    Down
    Drop it
    ::

    Hola de nuevo,

    Actualicé la semana pasada y sigue con el mismo comportamiento.

    Pero sí me he dado cuenta de una cosa curiosa, en las capturas se ve claramente. El fallo se produce cuando asigno un grupo al módulo. ¿Hay alguna relación entre el grupo al que pertenezca y el siguiente contacto que la consola no esté interpretando bien?

    P.D: CentOS Linux release 7.2.1511 (Core)

    Un saludo,

  • antonio

    Member
    November 16, 2016 at 20:03
    0 Karma points
    Community rank: tentacle-noob-1 Tentacle noob
    Like it
    Up
    0
    Down
    Drop it
    ::

    Hola Izan,

    Estoy probando en las versiones más recientes y no logro replicar tu problema.
    Según la información que aportas, los logs muestran correctamente la información sobre el intervalo todavía no completado, y efectivamente el XML no trae la información de los módulos, esto es correcto. Además la consola refleja el intervalo ampliado x288 correctamente, pero aún así los módulos pasan a estado desconocido.

    Podrías ejecutar la siguiente consulta en tu base de datos?

     

    select * from tagente_modulo where id_agente_modulo = 14779

    Para comprobar que el intervalo está correctamente configurado en la base de datos y no se trata de un error visual.
    con respecto a lo de mover los módulos a un grupo, no debería estar relacionado. Igualmente si haces alguna prueba relacionada con ello y sacas algo en claro no dudes en comentarlo.

    Un saludo,
    Antonio.

  • ids

    Member
    November 17, 2016 at 19:05
    0 Karma points
    Community rank: tentacle-noob-1 Tentacle noob
    Like it
    Up
    0
    Down
    Drop it
    ::

    He hecho la query y el module_interval estaba bien (tenía sentido ya que la consola lo muestra correctamente). He cambiado el grupo del módulo y he repetido la query para ver si modificaba algún parámetro. Te copio las dos filas con las columnas que cambian en negrita, por si alguna puede estar provocando el fallo:

    id_agente_modulo id_agente id_tipo_modulo descripcion extended_info nombre unit id_policy_module max min module_interval tcp_port tcp_send tcp_rcv snmp_community snmp_oid ip_target id_module_group flag id_modulo disabled id_export plugin_user plugin_pass plugin_parameter id_plugin post_process prediction_module max_timeout custom_id history_data min_warning max_warning str_warning min_critical max_critical str_critical min_ff_event delete_pending policy_linked policy_adopted custom_string_1 custom_string_2 custom_string_3 custom_integer_1 custom_integer_2 module_ff_interval wizard_level macros quiet critical_instructions warning_instructions unknown_instructions critical_inverse warning_inverse cron_interval max_retries id_category disabled_types_event module_macros min_ff_event_normal min_ff_event_warning min_ff_event_critical each_ff ff_timeout dynamic_interval dynamic_max dynamic_min prediction_sample_window prediction_samples prediction_threshold
    14958 689 3 Nombre de la maquina HostName NULL 0 0 0 86400 0 NULL NULL 0 0 1 1 0 0 NULL NULL NULL 0 0.000000000000000 0 0 1 0.00 0.00 NULL 0.00 0.00 NULL 0 0 0 0 NULL NULL NULL 0 0 0 nowizard NULL 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
    14958 689 3 Nombre de la maquina HostName 0 0 0 86400 NULL 15 0 1 0 0 0 0.000000000000000 NULL 0 1 0.00 0.00 0.00 0.00 0 0 0 0 0 0 0 nowizard 0 0 0     0 0 {“going_unknown”:1} W10= 0 0 0 0 0 0 0 0 0 0 0

    Parece que la columna disabled_types_event se rellena porque al editarlo con la consola la opción “Generar eventos desconocidos” no lo marca por defecto. En cualquier caso es un comportamiento erróneo ya que no debería generarlos en ningún caso, no antes de tiempo. Voy a probar a rehabilitarlo desde la consola en los módulos que tengo en desconocido a ver si se arregla.

    Un saludo,
    \Izan

  • ids

    Member
    November 17, 2016 at 19:40
    0 Karma points
    Community rank: tentacle-noob-1 Tentacle noob
    Like it
    Up
    0
    Down
    Drop it
    ::

    Nada, eso no lo soluciona.

    El campo que he modificado cambió de {“going_unknown”:1} a {“going_unknown”:0}.

    A ver si pudiera ser otra de las columnas.

    Un saludo,
    \Izan

  • antonio

    Member
    November 18, 2016 at 13:34
    0 Karma points
    Community rank: tentacle-noob-1 Tentacle noob
    Like it
    Up
    0
    Down
    Drop it
    ::

    Hola,

    En principio no debería tener que ver, puede deberse simplemente a que en la base de datos trae unos valores por defeto (NULL), y al enviar el formulario vacío simplemente los actualiza a vacíos (“”).
    Te diría de aplicar cualquier actualización que tengas pendiente, ya que como te comento en la versión actual no he logrado replicarlo. Y tiene pinta de ser del lado de la consola/servidor, ya que según los logs y los xml mostrados el agente parece que está haciendo correctamente su trabajo.

    Para debugear también te diría de comenzar haciendo pruebas más estrechas, por ejemplo instalando un agente y estableciendo un intervalo corto (unos 30 segundos) y comenzar a añadir módulos, a ser posible los mismos que hasta ahora, y comenzar a modificar sus intervalos para ver en qué punto se quedan en desconocido, quizá al ser un factor multiplicador muy grande haya algún tipo de problema, ya que las pruebas que yo he hecho han sido éstas pero únicamente subiendo el multiplicador a 4 o 5.

    Un saludo,
    Antonio.

  • ids

    Member
    November 18, 2016 at 14:01
    0 Karma points
    Community rank: tentacle-noob-1 Tentacle noob
    Like it
    Up
    0
    Down
    Drop it
    ::

    Hola,

    Está actualizado a última versión (community).

    No sé qué procesos de desarrollo se siguen, pero entiendo que dentro de los test automatizados se deberían testear ese tipo de condiciones.

    Un saludo,
    \Izan