记得刚入职的时候,那时候什么都不懂,组长让我跑个迁移程序,还没跑完就关终端走人了,结果可想而知,那是第一次知道守护进程的概念。
当时后来是加了nohup参数解决的,
nohup ./program &
但是总是强迫别人用nohup来启动自己的程序毕竟不是办法,所以还是要把自己的进程变成守护进程才行。
C/C++的版本就不说了,这里有篇文章写的很清楚。 
http://colding.bokee.com/5277082.html
这里主要介绍一下在网上无意发现的一个国外哥们的写的python版本: 
http://www.jejik.com/articles/2007/02/a_simple_unix_linux_daemon_in_python/
顺便吐个槽,这哥们用的Vim配色明显是Wombat~~
代码如下(对私有函数名加了_前缀,便于理解,并加了一定的注释):
#!/usr/bin/python
# -*- coding: utf-8 -*-
import sys, os, time, atexit
from signal import SIGTERM
class Daemon:
    """
    A generic daemon class.
    
    Usage: subclass the Daemon class and override the _run() method
    """
    def __init__(self, pidfile, stdin='/dev/null', stdout='/dev/null', stderr='/dev/null'):
        self.stdin = stdin
        self.stdout = stdout
        self.stderr = stderr
        self.pidfile = pidfile
    def _daemonize(self):
        """
        do the UNIX double-fork magic, see Stevens' "Advanced 
        Programming in the UNIX Environment" for details (ISBN 0201563177)
        http://www.erlenstar.demon.co.uk/unix/faq_2.html#SEC16
        """
        #脱离父进程
        try:
            pid = os.fork()
            if pid > 0:
                sys.exit(0)
        except OSError, e:
            sys.stderr.write("fork #1 failed: %d (%s)\n" % (e.errno, e.strerror))
            sys.exit(1)
        #脱离终端
        os.setsid()
        #修改当前工作目录  
        os.chdir("/")
        #重设文件创建权限
        os.umask(0)
        #第二次fork,禁止进程重新打开控制终端
        try:
            pid = os.fork()
            if pid > 0:
                sys.exit(0)
        except OSError, e:
            sys.stderr.write("fork #2 failed: %d (%s)\n" % (e.errno, e.strerror))
            sys.exit(1)
        sys.stdout.flush()
        sys.stderr.flush()
        si = file(self.stdin, 'r')
        so = file(self.stdout, 'a+')
        se = file(self.stderr, 'a+', 0)
        #重定向标准输入/输出/错误
        os.dup2(si.fileno(), sys.stdin.fileno())
        os.dup2(so.fileno(), sys.stdout.fileno())
        os.dup2(se.fileno(), sys.stderr.fileno())
        #注册程序退出时的函数,即删掉pid文件
        atexit.register(self.delpid)
        pid = str(os.getpid())
        file(self.pidfile,'w+').write("%s\n" % pid)
    def delpid(self):
        os.remove(self.pidfile)
    def start(self):
        """
        Start the daemon
        """
        # Check for a pidfile to see if the daemon already runs
        try:
            pf = file(self.pidfile,'r')
            pid = int(pf.read().strip())
            pf.close()
        except IOError:
            pid = None
        if pid:
            message = "pidfile %s already exist. Daemon already running?\n"
            sys.stderr.write(message % self.pidfile)
            sys.exit(1)
        # Start the daemon
        self._daemonize()
        self._run()
    def stop(self):
        """
        Stop the daemon
        """
        # Get the pid from the pidfile
        try:
            pf = file(self.pidfile,'r')
            pid = int(pf.read().strip())
            pf.close()
        except IOError:
            pid = None
        if not pid:
            message = "pidfile %s does not exist. Daemon not running?\n"
            sys.stderr.write(message % self.pidfile)
            return # not an error in a restart
        # Try killing the daemon process    
        try:
            while 1:
                os.kill(pid, SIGTERM)
                time.sleep(0.1)
        except OSError, err:
            err = str(err)
            if err.find("No such process") > 0:
                if os.path.exists(self.pidfile):
                    os.remove(self.pidfile)
            else:
                print str(err)
                sys.exit(1)
    def restart(self):
        """
        Restart the daemon
        """
        self.stop()
        self.start()
    def _run(self):
        """
        You should override this method when you subclass Daemon. It will be called after the process has been
        daemonized by start() or restart().
        """
class MyDaemon(Daemon):
    def _run(self):
        while True:
            time.sleep(1)
if __name__ == "__main__":
    daemon = MyDaemon('/tmp/daemon-example.pid')
    if len(sys.argv) == 2:
        if 'start' == sys.argv[1]:
            daemon.start()
        elif 'stop' == sys.argv[1]:
            daemon.stop()
        elif 'restart' == sys.argv[1]:
            daemon.restart()
        else:
            print "Unknown command"
            sys.exit(2)
        sys.exit(0)
    else:
        print "usage: %s start|stop|restart" % sys.argv[0]
        sys.exit(2)
简单解释一下,整个类实现的功能:
1.进程脱离父进程及终端绑定
2.进程唯一性保证
3.标准输入/输出/错误重定向
附:
源代码下载
OK,就这样~
GlacJAY on #
在 PyPI 里面有现成的库的,我用过的是 python-daemon 。
Reply
Dante on #
去看了一下,果然是有现成的库的,多谢~~
Reply
雨碎江南 on #
...守护进程...
话说我正在和sbin/init作斗争.
Reply
可可火山 on #
对于这个事情我看了 《让进程在后台可靠运行的几种方法》 有了比较全面的理解
http://www.ibm.com/developerworks/cn/linux/l-cn-nohup/
平时工作都用screen。
python刚开始,学习了。python库太多?有标准么
Reply
Dante on #
嗯,去看了一下那个链接,确实讲的更深刻一些。。。
python的话,pypi上面的库应该就算比较正式的了~
Reply
blankyao on #
博主是啥部门的?好像是同事,呵呵
Reply
Dante on #
呵呵,互联网的~~看了你的资料,应该也是互联网的吧~~
Reply
GuoJing on #
不错,这个得支持一下。正准备写python后台运行的程序呢。
Reply
Dante on #
呵呵,羡慕啊,在douban可以用这么优雅的语言写程序~
Reply
yogoloth on #
其实关键就是setsid
Reply
Dante on #
嗯,不过考虑了更多的细节~
把unix环境编程所要求的5点都实现了。
Reply
Zealot Ke on #
start时建议加上这个检查:os.kill(pid, 0),确认pid对应的进程确实存在,没有异常死掉。
p.s. man 2 kill
"If sig is 0, then no signal is sent, but error checking is still performed; this can be used to check for the
existence of a process ID or process group ID."
Reply
依云 on #
原来用 kill 就可以判断进程是否存在啊~学习了~~
Reply
妞妞 on #
同样学习了
Reply
Dante on #
的确的确,包括线程也是可以通过:
pthread_kill_err = pthread_kill(*it,0);
来判断是否死亡的~
if(pthread_kill_err == ESRCH)
{
ERROR_LOG("ID为0x%x的线程不存在或者已经退出。\n",(unsigned int)*it);
}
Reply
cc on #
nohup 启动 python 脚本为 daemon
会不会导致
no job control in this shell
bg, fg ...
无法使用呢?
Reply
cc on #
我意思是:
nohup 会不会没有完全脱离当前终端 ...
导致终端占用,从而导致 no job control
Reply
Dante on #
应该是完全脱离了的,你可以ps -ef 看进程的状态,是没有tty的。
Reply
cc on #
开机自启动 /etc/init.d/test
完全脱离 tty
开机后手动启动没有脱离,总有tty or pts/*
Reply
包菜兄 on #
我怎么觉得这样的叫做脱离终端进程,没有守护呀。
Reply