2009-08-22 4 views
1

J'écris un démon dans c sur linux. Il piège les signaux SIGHUP, SIGTERM, SIGINT et SIGQUIT, les enregistre à l'aide de syslog et se ferme. Si elle reçoit SIGSEGV, les core dumps. Lorsque cela se produit, tout se passe comme prévu, mais une fois de temps en temps, il se ferme ... il ne sort pas proprement, ne consigne pas le signal et ne laisse pas de vidage du noyau. Je suis perplexe et je ne sais pas comment déboguer le problème. De quelles façons peut-il quitter autre que ces signaux? Y a-t-il une réponse évidente, quelque chose qui me manque? Quelles autres pratiques de débogage recommandez-vous pour déboguer un problème apparemment si sporadique dans un processus démon?Debugginng un démon qui se termine de façon inattendue

Répondre

3

Si votre démon fonctionne avec des sockets réseau, il est fort probable qu'il soit SIGPIPE - vous obtenez ceci si vous essayez d'écrire sur un socket (ou un tube) qui a été fermé par l'autre côté. Notez que même si vous vérifiez si le socket est inscriptible avant de l'écrire (par exemple avec select()), il peut toujours être fermé entre ce contrôle et l'écriture elle-même.

+0

Ah! J'utilise des sockets et ne piège pas SIGPIPE, je n'y ai pas pensé, je parie que c'est ça. Actuellement, mon appel select() est dans une boucle qui se casse si elle est interrompue mais je veux rester dans la boucle s'il s'agit d'un SIGPIPE. De votre commentaire, je comprends qu'un appel select() ne sera jamais interrompu par un SIGPIPE, seuls les appels read()/write(), est-ce vrai? – user19745

+1

Votre processus ne sera pas signalé par 'SIGPIPE' à partir d'un select()', mais il retournera avec le descripteur de fichier marqué comme lisible (pour que vous puissiez découvrir qu'il a été fermé). 'SIGPIPE' est seulement élevé par' write() 's. Si vous ignorez ou manipulez 'SIGPIPE', le' write() 'retournera' EPIPE'. – caf

2

Vous pouvez faire en sorte que le parent du démon reste et l'attende, puis demander au parent de consigner la raison pour laquelle le démon a quitté (c'est-à-dire s'il a été signalé ou s'il est sorti).

+0

Ceci est une excellente solution, comment pouvez-vous obtenir cette information du parent une fois que l'enfant est mort? – user19745

+0

Dans le parent, appelez wait, utilisez WIFEXITED/WIFSIGNALED pour déterminer ce qui s'est passé, puis appelez syslog avec le message de journal approprié. Vérifiez la page de manuel pour attendre. –

1

Eh bien, il y a beaucoup d'autres signaux qui vont le faire quitter, y compris bien sûr SIGKILL, dont vous ne pourrez rien faire. Fondamentalement, rien dans le contenu suivant de man 7 signalAction est Term ou Core (bien que celui-ci serait au moins laisser une décharge de base):

First the signals described in the original POSIX.1-1990 standard. 

    Signal  Value  Action Comment 
    ------------------------------------------------------------------------- 
    SIGHUP  1  Term Hangup detected on controlling terminal 
           or death of controlling process 
    SIGINT  2  Term Interrupt from keyboard 
    SIGQUIT  3  Core Quit from keyboard 
    SIGILL  4  Core Illegal Instruction 

    SIGABRT  6  Core Abort signal from abort(3) 
    SIGFPE  8  Core Floating point exception 
    SIGKILL  9  Term Kill signal 
    SIGSEGV  11  Core Invalid memory reference 
    SIGPIPE  13  Term Broken pipe: write to pipe with no readers 
    SIGALRM  14  Term Timer signal from alarm(2) 
    SIGTERM  15  Term Termination signal 
    SIGUSR1 30,10,16 Term User-defined signal 1 
    SIGUSR2 31,12,17 Term User-defined signal 2 
    SIGCHLD 20,17,18 Ign  Child stopped or terminated 
    SIGCONT 19,18,25 Cont Continue if stopped 
    SIGSTOP 17,19,23 Stop Stop process 
    SIGTSTP 18,20,24 Stop Stop typed at tty 
    SIGTTIN 21,21,26 Stop tty input for background process 
    SIGTTOU 22,22,27 Stop tty output for background process 

    The signals SIGKILL and SIGSTOP cannot be caught, blocked, or ignored. 

    Next the signals not in the POSIX.1-1990 standard but described in SUSv2 and POSIX.1-2001. 

    Signal  Value  Action Comment 
    ------------------------------------------------------------------------- 
    SIGBUS  10,7,10  Core Bus error (bad memory access) 
    SIGPOLL     Term Pollable event (Sys V). Synonym of SIGIO 
    SIGPROF  27,27,29 Term Profiling timer expired 
    SIGSYS  12,-,12  Core Bad argument to routine (SVr4) 
    SIGTRAP  5  Core Trace/breakpoint trap 
    SIGURG  16,23,21 Ign  Urgent condition on socket (4.2BSD) 
    SIGVTALRM 26,26,28 Term Virtual alarm clock (4.2BSD) 
    SIGXCPU  24,24,30 Core CPU time limit exceeded (4.2BSD) 
    SIGXFSZ  25,25,31 Core File size limit exceeded (4.2BSD) 

    Up to and including Linux 2.2, the default behaviour for SIGSYS, SIGXCPU, SIGXFSZ, and (on architectures other than SPARC 
    and MIPS) SIGBUS was to terminate the process (without a core dump). (On some other Unices the default action for SIGX- 
    CPU and SIGXFSZ is to terminate the process without a core dump.) Linux 2.4 conforms to the POSIX.1-2001 requirements 
    for these signals, terminating the process with a core dump. 

    Next various other signals. 

    Signal  Value  Action Comment 
    -------------------------------------------------------------------- 
    SIGIOT   6  Core IOT trap. A synonym for SIGABRT 
    SIGEMT  7,-,7  Term 
    SIGSTKFLT -,16,-  Term Stack fault on coprocessor (unused) 
    SIGIO  23,29,22 Term I/O now possible (4.2BSD) 
    SIGCLD  -,-,18  Ign  A synonym for SIGCHLD 
    SIGPWR  29,30,19 Term Power failure (System V) 
    SIGINFO  29,-,-    A synonym for SIGPWR 
    SIGLOST  -,-,-  Term File lock lost 
    SIGWINCH 28,28,20 Ign  Window resize signal (4.3BSD, Sun) 
    SIGUNUSED -,31,-  Term Unused signal (will be SIGSYS) 
2

Fixer gdb avec

gdb -p <pid>
Assurez-vous que vous avez compilé avec le drapeau -g et prenez une trace dès qu'elle sortira. Bonne chance!

+0

Je ne savais pas que vous pouviez faire ça! C'est génial car le démon fonctionne sur un serveur auquel je n'ai pas accès physiquement. Je suis périodiquement en mouvement avec mon ordinateur portable et ne peux pas garder un terminal ouvert surveillant quand je suis en mouvement. De cette façon, je peux attacher/détacher gdb si nécessaire sans arrêter le démon; excellent! – user19745

1

Un wrapper de shell peut capturer l'état de sortie de votre démon. Voilà comment cela fonctionne:

$ ./waitstatus true 
pid 1512: exit status 0 (success) 

$ ./waitstatus false 
pid 1514: exit status 1 (abnormal) 

$ ./waitstatus perl -e 'exit 21' 
pid 1518: exit status 21 (abnormal) 

$ ./waitstatus perl -e 'kill TERM => $$' 
pid 1520: terminated on signal 15 

$ ./waitstatus no-such-command 
pid 1522: command not found: no-such-command 

$ ./waitstatus /sbin/EACCES.contrived 
pid 1524: command not executable: /sbin/EACCES.contrived 

... et voilà comment il est mis en œuvre:

$ cat ./waitstatus 
#! /bin/bash 

"[email protected]" & 
PID=$! 

wait $PID 
STATUS=$? 

if [ $STATUS -gt 128 ]; then 
    MSG="terminated on signal $(($STATUS - 128))"; 
else 
    case $STATUS in 
    0) 
     MSG="exit status 0 (success)" 
     ;; 
    127) 
     MSG="command not found: $1" 
     ;; 
    126) 
     MSG="command not executable: $1" 
     ;; 
    *) 
     MSG="exit status $STATUS (abnormal)" 
     ;; 
    esac 
fi 

echo "pid $PID: $MSG" 
exit $STATUS 

Vous pouvez modifier cette dernière ligne echo à l'invocation de votre commande de système logger, par exemple, diriger le message d'état vers syslog.

Questions connexes