`
kenby
  • 浏览: 716871 次
  • 性别: Icon_minigender_1
  • 来自: 北京
社区版块
存档分类
最新评论

(转) Linux 的僵尸(zombie)进程

阅读更多

 

原文地址:  http://coolshell.cn/articles/656.html

可能很少有人意识到,在一个进程调用了exit之后,该进程 并非马上就消失掉,而是留下一个称为僵尸进程(Zombie)的数据结构。在Linux进程的5种状态中,僵尸进程是非常特殊的一种,它已经放弃了几乎所 有内存空间,没有任何可执行代码,也不能被调度,仅仅在进程列表中保留一个位置,记载该进程的退出状态等信息供其他进程收集,除此之外,僵尸进程不再占有 任何内存空间。

僵尸进程的来由,要追溯到Unix,Unix的设计者们设计这个东西并非是因为闲来无事想装装酷什么的。上面说到,僵尸进程中保存着很多对程序员和系统管理员非常重要的信息,首先,这个进程是怎么死亡的?是正常退出呢,还是出现了错误,还是被其它进程强迫退出的?也就是说,这个程序的退出码是什么?其次,这个进程占用的总系统CPU时间和总用户CPU时间分别是多少?发生页错误的数目和收到信号的数目。这些信息都被存储在僵尸进程中,试想如果没有僵尸进程,进程执行多长我们并不知道,一旦其退出,所有与之相关的信息都立刻都从系统中清除,而如果此时父进程或系统管理员需要用到,就只好干瞪眼了。

 

所以,进程退出后,系统会把该进程的状态变成Zombie,然后给上一定的时间等着父进程来收集其退出信息,因为可能父进程正忙于别的事情来不及收集,所以,使用Zombie状态表示进程退出了,正在等待父进程收集信息中。

Zombie进程不可以用kill命令清楚,因为进程已退出,如果需要清除这样的进程,那么需要清除其父进程,或是等很长的时间后被内核清除。因为Zombie的进程还占着个进程ID号呢,这样的进程如果很多的话,不利于系统的进程调度。

下面,让我们来看看一个示例:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
/* zombie.c */
#include <sys/types.h>
#include <unistd.h>  main()
{
    pid_t pid; 
    pid=fork();
    if(pid<0) { /* 如果出错 */ 
        printf("error occurred!\n");
    }else if(pid==0){ /* 如果是子进程 */ 
        exit(0);
    }else/* 如果是父进程 */ 
        sleep(60);  /* 休眠60秒 */ 
        wait(NULL); /* 收集僵尸进程 */
    }
}

编译这个程序:

1
$ cc zombie.c -o zombie

后台运行程序,以使我们能够执行下一条命令

1
2
$ ./zombie &
[1] 1217

列一下系统内的进程

1
2
3
4
5
6
$ ps -ax
... ...
1137   pts/0   S   0:00   -bash
1217   pts/0   S   0:00   ./zombie
1218   pts/0   Z   0:00   [zombie]
1578   pts/0   R   0:00   ps   -ax

其中的”Z”就是僵尸进程的标志,它表示1218号进程现在就是一个僵尸进程。

收集Zombie进程的信息,并终结这些僵尸进程,需要我们在父进程中使用waitpid调用和wait调用。这两者的作用都是收集僵尸进程留下的信息,同时使这个进程彻底消失。

 

个人总结:

 

1 僵尸进程的用途

存储进程占用的总系统CPU时间和总用户CPU时间分别是多少?

发生页错误的数目和收到信号的数目.进程退出的状态, 

供回收者查看

 

2 什么是僵尸进程

僵尸进程不是真正的进程, 它是一种状态, 进程一退出就成为了僵尸进程,

只有三种方法才能回收僵尸进程

(1) 父进程显示地调用wait和waitpid回收之

(2) 杀死父进程, 僵尸进程就会过继给 init, init 始终会负责清理僵尸进程

(3) 重启系统

所以,  如果父进程不调用 wait 和 waitpid 回收僵尸进程, 在父进程活着的情况下, 

僵尸进程将一直存在下去

注意, 不能通过 kill  发信号退出, 因为僵尸进程已退出, 无法接受信号

 

3 僵尸进程的危害

这样的进程如果很多的话,塞满process table, 不利于系统的进程调度

 

4  区别僵尸进程与孤儿进程

如果父进程先于子进程退出,  子进程就成为了孤儿进程, 没有父亲的孩子

统统都送到孤儿院 init 进程领养.

孤儿进程的特点是: 父亲死了, 我还活着, 我是孤儿

僵尸进程的特点是: 我死了, 父亲还活着, 但它不给我收尸

 

5 如何防止僵尸进程的产生

(1) 阻塞方式:  父进程显示的调用 wait 或 waitpid 回收僵尸进程

(2) 异步方式:  父进程捕捉 SIGCHLD 信号, 然后调用 wait 或 waitpid 回收僵尸进程

 

6 正确地回收僵尸进程。

如果父进程很忙,就采用异步回收的方式,捕捉 SIGCHLD 信号,其处理函数为:

void sig_chld(int signo)
{
    pid_t pid;
    int stat;

    pid = wait(&stat);
    printf("child %d terminated\n", pid);
}
 

这里存在一个问题,如果多个子进程同时退出,同时产生SIGCHLD信号,

而SIGCHLD是不可靠信号,不支持排队。所以可能只会捕捉到一次,在这种

情况下,只有一个子进程被回收,其它子进程将变成僵尸进程。

 

解决办法是收到SIGCHLD信号后,不是只回收一个子进程,而是回收所有退出了的子进程。

考虑在信号处理函数内循环调用wait, 当没有子进程退出时,wait会一直阻塞,信号处理函数

将无法返回。我们需要的是 waitpid,通过设置 WNOHANG 选项,在没有子进程退出时,

waitpid 返回 -1, 这时 退出循环,信号处理函数返回。

 

void sig_chld(int signo)
{
    pid_t pid;
    int stat;

    while ((pid = waitpid(-1, &stat, WNOHANG)) > 0) {
        printf("child %d terminated\n", pid);
    }
}
 

 

 

 

分享到:
评论

相关推荐

Global site tag (gtag.js) - Google Analytics