Welcome to Pandora FMS Community!

Find answers, ask questions, and connect with our community around the world.

Welcome to Pandora FMS Community Forums Soporte de la comunidad [Postfix & ntpd] “master dead but pid file exists’

  • [Postfix & ntpd] “master dead but pid file exists’

    Posted by mario741 on March 21, 2017 at 15:54

    Buenas, tras volver del puente he reiniciado Pandora FMS (instalado a través de Docker) y al revisar el envío de alertas y ver que no funcionaba he llegado a detectar que tanto el servicio postfix como el ntpd al checkear el status en ambos me apetece “master dead but pid file exists”.

    En el caso de Postfix he borrado el master.pid (/var/spool/postfix/pid/master.pid) y el /var/lock/subsys/postfix. Tras borrar ambos ficheros he lanazado los comandos “service postfix stop & service postfix start” y pese a que con el start me devuelve [OK], al volver a comprobar el status me sale el mensaje de “master dead”

    Hace unos día funcionaba sin problema, lanzaba las alertas al correo con normalidad. El tema de configuración lo descarto ya que antes funcionaba con la configuración por defecto que viene en la imagen de Docker.

    He estado revisando varios post en internet que hablan sobre el tema pero no consigo hacer funcionar de nuevo el servidor Postfix, ¿Alguien sabe a que puede ser debido este fallo?

    antonio replied 7 years, 11 months ago 2 Members · 9 Replies
  • 9 Replies
  • mario741

    Member
    March 21, 2017 at 16:36
    0 Karma points
    Community rank: tentacle-noob-1 Tentacle noob
    Like it
    Up
    0
    Down
    Drop it
    ::

    He probado a borrar los contenedores y las imágenes Docker, las he vuelto a instalar y me sigue pasando lo mismo

  • antonio

    Member
    March 21, 2017 at 17:03
    0 Karma points
    Community rank: tentacle-noob-1 Tentacle noob
    Like it
    Up
    0
    Down
    Drop it
    ::

    Hola mario741,

    No se trata de un problema de Pandora como tal así que no te puedo asegurar cuál es el problema. Pero vamos a ver si nos acercamos.

    En primer lugar, sabes si se produjo alguna actualización del sistema operativo? Es posible que el problema sea debido a algún cambio de versión.
    Observa en los logs del sistema (/var/log/messages o syslog) a ver qué aparece en los mismos cuando intentas arrancar el servicio.
    Comprueba que no haya procesos atascados (ps aux |grep postfix/ntp…), en caso afirmativo ciérralos.
    Comprueba que el usuario que levanta los servicios tiene permisos sobre los directorios que utilizan, por ejemplo que puede borrar sin problema el fichero .pid.

    Un saludo,
    Antonio.

  • mario741

    Member
    March 21, 2017 at 17:18
    0 Karma points
    Community rank: tentacle-noob-1 Tentacle noob
    Like it
    Up
    0
    Down
    Drop it
    ::

    Buenas Antonio.S,

    He revisado y no se ha producido ninguna actualización del sistema operativo (Ubuntu 16.04), ni de Docker (1.12.5) y la versión de CentOS del contenedor es la 6.8.

    En cuanto a los logs, he revisado el /var/log/maillog y /var/log/messages, ambos están vacíos. En cuanto al syslog, no aparece en el contenedor que alberga al servidor de Pandora.

    Listando los procesos, me aparece el asociado al master.pid:

    root      1504  0.0  0.0  80960  5948 ?        Ss  13:06  0:00 /usr/libexec/postfix/master
    postfix  1506  0.0  0.0  81040  5864 ?        S    13:06  0:00 pickup -l -t fifo -u
    postfix  1507  0.0  0.0  81108  5756 ?        S    13:06  0:00 qmgr -l -t fifo -u

    En este caso cuando lanzo “kill 1504” me mata también los procesos 1506 y 1507

    Hasta el momento la secuencia que he seguido ha sido la siguiente:

    [root@1c0a1f3a807a log]# service postfix status
    master dead but pid file exists

    [root@1c0a1f3a807a pid]# tail /var/spool/postfix/pid/master.pid
                                1789

    [root@1c0a1f3a807a postfix]# tail /var/lib/postfix/master.lock
                                1789

    [root@1c0a1f3a807a pid]# ps aux | grep postfix
    root      1789  0.0  0.0  80960  6208 ?        Ss  13:11  0:00 /usr/libexec/postfix/master
    postfix  1791  0.0  0.0  81040  6268 ?        S    13:11  0:00 pickup -l -t fifo -u
    postfix  1792  0.0  0.0  81108  6344 ?        S    13:11  0:00 qmgr -l -t fifo -u
    root      1846  0.0  0.0  8028  2056 ?        S+  13:13  0:00 grep postfix

    kill 1789

    rm -f /var/spool/postfix/pid/master.pid
    rm -f /var/lib/postfix/master.lock

    [root@1c0a1f3a807a postfix]# service postfix restart
    Shutting down postfix:                                    [FAILED]
    Starting postfix:                                          [  OK  ]

    [root@1c0a1f3a807a postfix]# service postfix status
    master dead but pid file exists

    Trás esos pasos vuelvo al mismo problema.

    Lanzando también el netstat para el puerto 25 obtengo esto

    [root@1c0a1f3a807a postfix]# netstat -an | grep 25
    tcp        0      0 127.0.0.1:25                0.0.0.0:*                  LISTEN     
    tcp        0      0 ::1:25                      :::*                        LISTEN     
    unix  3      [ ]        STREAM    CONNECTED    11501025

    Un saludo

  • mario741

    Member
    March 22, 2017 at 23:57
    0 Karma points
    Community rank: tentacle-noob-1 Tentacle noob
    Like it
    Up
    0
    Down
    Drop it
    ::

    He estado revisando varios hilos en internet en el que se trata este problema y en practicamente todos ponen que se soluciona borrando el master.pid y el master.lock y reiniciando el servicio postfix. Estoy probando y no hay manera.

    He revisado los permisos de las carpetas que utiliza postfix y en todas tiene acceso el usuario root. En la imagen de docker proporcionada para montar Pandora FMS opero siempre con usuario root.

  • mario741

    Member
    March 28, 2017 at 12:30
    0 Karma points
    Community rank: tentacle-noob-1 Tentacle noob
    Like it
    Up
    0
    Down
    Drop it
    ::

    He estado revisando un poco más este problema y he conseguido que muestre logs en /var/log/maillog

    Tras lanzar un “service postfix restart”, en el log me aparece que el puerto está siendo utilizado ya

    Mar 28 08:24:08 1fc1d277ca20 postfix/postfix-script[30730]: fatal: the Postfix mail system is not running
    Mar 28 08:24:08 1fc1d277ca20 postfix/postfix-script[30800]: starting the Postfix mail system
    Mar 28 08:24:08 1fc1d277ca20 postfix/master[30801]: fatal: bind 127.0.0.1 port 25: Address already in use

    Pero al intentar ver que programa esta utilizándolo me sale esto:

    [root@1fc1d277ca20 postfix]# netstat -tulpn | grep :25
    tcp        0      0 127.0.0.1:25                0.0.0.0:*                  LISTEN      –                 
    tcp        0      0 ::1:25                            :::*                          LISTEN      – 

  • antonio

    Member
    March 28, 2017 at 13:05
    0 Karma points
    Community rank: tentacle-noob-1 Tentacle noob
    Like it
    Up
    0
    Down
    Drop it
    ::

    Hola mario741,

    No tienes algún otro servidor de correo instalado en la máquina o software similar?
    También puedes ejecutar:

    nmap -p 25 localhost
    

    Y ver qué te devuelve. Si devuelve “open” efectivamente hay algo escuchando en ese puerto y se puede ver “desde fuera”.

    Un saludo,
    Antonio.

  • mario741

    Member
    March 28, 2017 at 13:36
    0 Karma points
    Community rank: tentacle-noob-1 Tentacle noob
    Like it
    Up
    0
    Down
    Drop it
    ::

    Buenas Antonio, solo tengo instalado lo que venía en la propia imagen de docker para pandora server.

    Efectivamente me dice que el puerto esta abierto:

    Starting Nmap 5.51 ( http://nmap.org ) at 2017-03-28 09:24 UTC
    Nmap scan report for localhost (127.0.0.1)
    Host is up (0.000065s latency).
    Other addresses for localhost (not scanned): 127.0.0.1
    PORT   STATE SERVICE
    25/tcp open  smtp
    
    Nmap done: 1 IP address (1 host up) scanned in 0.10 seconds

    —————————————————————————————-

    Antes de lanzar el nmap sobre el puerto 25. He matado los procesos asociados a postfix (ps aux | grep postfix), eliminado el master.pid y el master.lock y lanzado “service postfix restart”. Tras hacer eso, en el maillog me aparece esto:

    Mar 28 09:22:30 1fc1d277ca20 postfix/postfix-script[1733]: fatal: the Postfix mail system is not running
    Mar 28 09:22:30 1fc1d277ca20 postfix/postfix-script[1803]: starting the Postfix mail system
    Mar 28 09:22:30 1fc1d277ca20 postfix/master[1804]: daemon started -- version 2.6.6, configuration /etc/postfix
    Mar 28 09:23:03 1fc1d277ca20 postfix/postfix-script[1858]: the Postfix mail system is running: PID: 1804

    Aunque si lanzo “service postfix status” me sigue saliendo master dead but pid file exists.

    Y si lanzo “postfix status” me devuelve: postfix/postfix-script: the Postfix mail system is running: PID: 755

    Un saludo

  • mario741

    Member
    March 28, 2017 at 13:50
    0 Karma points
    Community rank: tentacle-noob-1 Tentacle noob
    Like it
    Up
    0
    Down
    Drop it
    ::

    Desde fuera del contenedor de Docker me dice que el puerto 25 está cerrado.

    nmap -p 25 localhost
    
    Starting Nmap 7.01 ( https://nmap.org ) at 2017-03-28 11:46 CEST
    Nmap scan report for localhost (127.0.0.1)
    Host is up (0.000061s latency).
    PORT   STATE  SERVICE
    25/tcp closed smtp
    
    Nmap done: 1 IP address (1 host up) scanned in 0.05 seconds
    
  • antonio

    Member
    March 28, 2017 at 14:54
    0 Karma points
    Community rank: tentacle-noob-1 Tentacle noob
    Like it
    Up
    0
    Down
    Drop it
    ::

    Hola mario741,

    No soy especialista en docker, pero si no me equivoco al levantar el contenedor se permitía crear mapeos de los puertos del contenedor a los puertos del host donde se levanta. Puede ser que exista algún mapeo de este tipo y sea el propio docker el que está levantando un puerto 25 en su entorno, pero esté mapeado con otra cosa en la máquina, y por eso aparece como cerrado desde fuera.

    Si no me equivoco estos mapeos se definían al levantar la imagen docker, pero no recuerdo si era posible modificarlos una vez levantada. Quizá el problema pueda venir por aquí, viendo que desde fuera aparece cerrado.

    Un saludo,
    Antonio.