linux后台开发中避免僵尸进程的方法总结

时间：2020-10-10 10:28:40 来源：作者：

一、什么是僵死进程？

一般情况下，程序调用exit（包括_exit和_Exit,它们的区别这里不做解释），它的绝大多数内存和相关的资源已经被内核释放掉，但是在进程表中这个进程项（entry）还保留着（进程ID，退出状态，占用的资源等等），你可能会问，为什么这么麻烦，直接释放完资源不就行了吗？这是因为有时它的父进程想了解它的退出状态。在子进程退出但还未被其父进程“收尸”之前，该子进程就是僵死进程，或者僵尸进程。如果父进程先于子进程去世，那么子进程将被init进程收养，这个时候init就是这个子进程的父进程。

所以一旦出现父进程长期运行，而又没有显示调用wait或者waitpid，同时也没有处理SIGCHLD信号，这个时候init进程就没有办法来替子进程收尸，这个时候，子进程就真的成了“僵尸”了。

二、僵死进程与孤儿进程的区别？

回答这个问题很简单，就是爸爸（父进程）和儿子（子进程）谁先死的问题！

如果当儿子还在世的时候，爸爸去世了，那么儿子就成孤儿了，这个时候儿子就会被init收养，换句话说，init进程充当了儿子的爸爸，所以等到儿子去世的时候，就由init进程来为其收尸。

如果当爸爸还活着的时候，儿子死了，这个时候如果爸爸不给儿子收尸，那么儿子就会变成僵尸进程。

三、僵死进程的危害？

僵死进程的PID还占据着，意味着海量的子进程会占据满进程表项，会使后来的进程无法fork.
僵死进程的内核栈无法被释放掉（1K 或者 2K大小），为啥会留着它的内核栈，因为在栈的最低端，有着thread_info结构，它包含着 struct_task 结构，这里面包含着一些退出信息。

四、避免僵死进程的方法

网上搜了下，总结有三种方方法：

① 程序中显示的调用signal(SIGCHLD, SIG_IGN)来忽略SIGCHLD信号，这样子进程结束后，由内核来wai和释放资源

② fork两次，第一次fork的子进程在fork完成后直接退出，这样第二次fork得到的子进程就没有爸爸了，它会自动被老祖宗init收养，init会负责释放它的资源，这样就不会有“僵尸”产生了

③ 对子进程进行wait，释放它们的资源，但是父进程一般没工夫在那里守着，等着子进程的退出，所以，一般使用信号的方式来处理，在收到SIGCHLD信号的时候，在信号处理函数中调用wait操作来释放他们的资源。

五、对每个避免僵死进程方法的解析与总结

首先我们让我们来看一个生成僵尸进程的程序zombie.c如下：

#include <stdio.h>  
#include <stdlib.h>  #include <unistd.h>    int main(int argc, const char *argv[])  
{      int i;  
    pid_t pid;        for (i = 0; i < 10; i++) {  
        if ((pid = fork()) == 0)    /* child */  
            _exit(0);  
    }      sleep(10);  
      exit(EXIT_SUCCESS);  }

运行程序，在10s睡眠期间使用ps查看进程，你会发现有10个标记为“defunct”的僵尸进程：

接下来看第一种方法，程序avoid_zombie1.c如下:

#include <stdio.h>  
#include <stdlib.h>  #include <signal.h>  #include <unistd.h>  #include <errno.h>    int main(int argc, const char *argv[])  
{      pid_t pid;        if (SIG_ERR == signal(SIGCHLD, SIG_IGN)) {  
        perror("signal error");  
        _exit(EXIT_FAILURE);      }        while (1) {  
        if ((pid = fork()) == 0)    /* child */  
            _exit(0);  
    }        exit(EXIT_SUCCESS);  }

程序运行期间通过ps命令的确没有发现僵尸进程的存在。

在man文档中有这段话：

Note that even though the default disposition of SIGCHLD is "ignore", explicitly setting the disposition to SIG_IGN results in different treatment of zombie process children.

意思是说尽管系统对信号SIGCHLD的默认处理就是“ignore”，但是显示的设置成SIG_IGN的处理方式在在这里会表现不同的处理方式（即子进程结束后，资源由系统自动收回，所以不会产生僵尸进程），这是信号SIGCHLD与其他信号的不同之处。

在man文档中同样有这样一段话：

The original POSIX standard left the behavior of setting SIGCHLD to SIG_IGN unspecified. 看来这个方法不是每个平台都使用，尤其在一些老的系统中，兼容性不是很好，所以如果你在写一个可移植的程序的话，不推荐使用这个方法。

第二种方法，即通过两次fork来避免僵尸进程，我们来看一个例子avoid_zombie2.c：

#include <stdio.h>  
#include <stdlib.h>  #include <signal.h>  #include <unistd.h>  #include <errno.h>    int main(int argc, const char *argv[])  
{      pid_t pid;        while (1) {  
        if ((pid = fork()) == 0) {  /* child */  
            if ((pid = fork()) > 0)  
                _exit(0);  
            sleep(1);  
            printf("grandchild, parent id = %ldn",  
                            (long)getppid());              _exit(0);  
        }          if (waitpid(-1, NULL, 0) != pid) {  
            perror("waitpid error");  
            _exit(EXIT_FAILURE);          }      }        exit(EXIT_SUCCESS);  }

这的确是个有效的办法，但是我想这个方法不适宜网络并发服务器中，应为fork的效率是不高的。

最后来看第三种方法，也是最通用的方法

先看我们的测试程序avoid_zombie3.c

#include <stdio.h>  
#include <stdlib.h>  #include <errno.h>  #include <string.h>  
#include <libgen.h>  #include <signal.h>  #include <unistd.h>  #include <sys/wait.h>  #include <sys/types.h>      void avoid_zombies_handler(int signo)  
{      pid_t pid;      int exit_status;  
    int saved_errno = errno;  
      while ((pid = waitpid(-1, &exit_status, WNOHANG)) > 0) {  
        /* do nothing */  
    }        errno = saved_errno;  }    int main(int argc, char *argv[])  
{      pid_t pid;      int status;  
    struct sigaction child_act;   
      memset(&child_act, 0, sizeof(struct sigaction));  
    child_act.sa_handler = avoid_zombies_handler;      child_act.sa_flags = SA_RESTART | SA_NOCLDSTOP;       sigemptyset(&child_act.sa_mask);      if (sigaction(SIGCHLD, &child_act, NULL) == -1) {  
        perror("sigaction error");  
        _exit(EXIT_FAILURE);      }        while (1) {  
        if ((pid = fork()) == 0) {  /* child process */  
            _exit(0);  
        } else if (pid > 0) {        /* parent process */  
        }      }            _exit(EXIT_SUCCESS);  }

首先需要知道三点：

1. 当某个信号的信号处理函数被调用时，该信号会被操作系统阻塞（默认sa_flags不设置SA_NODEFER标志）。

2.当某个信号的信号处理函数被调用时，该信号阻塞时，该信号又多次发生，那么操作系统并不将它们排队，而是只保留第一次的，后续的被抛弃。

还有一点我们必须清楚的是

3. wait系列函数与信号SIGCHLD是没有任何关系的，即wait系列函数并不是信号SIGCHLD驱动的。

这个时候，肯定有人有疑问了，既然会丢弃信号，那怎么保证可以收回所有的僵尸进程呢？

关于这个问题，我们可以这样来理解，当子进程结束时，不管有没有产生SIGCHLD信号，或者子进程产生了SIGCHLD信号，而不管父进程有没有收到SIGCHLD信号，这都与子进程已经终止这个事实无关，就是说，子进程终止与信号其实没有任何关系，只是操作系统在子进程终止时会发送信号SIGCHLD给父进程，告之其子进程终止的消息，这样的话，父进程就可以做相应的操作了。而wait系列函数的目的就是收回子进程终止时残留在进程列表中的信息，所以任何时候调用while ((pid = waitpid(-1, &exit_status, WNOHANG)) > 0)都可以收回所有的僵尸进程信息（可以参考下面的程序）。但是这里为什么放在信号处理函数中处理了，这样做的原因是：子进程什么时候结束是个异步事件，而信号机制就是用来处理异步事件的，所以当子进程结束时，可以迅速的收回其残余信息，这样系统中就不会积累大量的僵尸进程了。

也可以这样来理解：系统把所有的僵尸进程串在一起形成一个僵尸进程链表，而while ((pid = waitpid(-1, &exit_status, WNOHANG)) > 0)就是来清空这个链表的，直到waitpid()返回0，表明已经没有僵尸进程了，或者返回-1，表明出错（当错误码errno为ECHILD的时候同样表明已经不存在僵尸进程了）。

了解了以上知识点，就能理解为什么while ((pid = waitpid(-1, &exit_status, WNOHANG)) > 0)能够回收所有的僵尸进程了。

我们可以在上面的信号处理函数中加入相应的打印信息：

static int num1 = 0  
static int num2 = 0;  
void avoid_zombies_handler(int signo)  
{      pid_t pid;  
    int exit_status;  
    int saved_errno = errno;  
      printf("num1 = %dn", ++num1);  
    while ((pid = waitpid(-1, &exit_status, WNOHANG)) > 0) {  
        printf("num2 = %dn", ++num2);  
    }        errno = saved_errno;  }

打印的结果你会发现，当num1递增1的时候，即每调用一次信号处理函数，num2一般会递增很多，即while循环了很多次，所以尽管有的SIGCHLD信号被丢弃了，但是我们不用担心子进程的残余信息会收不回来。退出while循环时，证明此时系统中已经没有僵尸进程了，所以退出信号处理函数后，阻塞的唯一SIGCHLD信号会再次触发该信号处理函数，这样我们就不用担心了。我们不防做个最坏的打算，即之前的信号全部被丢弃了，只有最后一次的SIGCHLD信号被捕获，从而触发了信号处理函数，这样我们也不用担心，因为while循环会一次性收回全部的僵尸进程信息，只是这次循环的次数要多得多罢了，当然这只是假设，一般系统不会出现这样的情况（可以参考本文最后一个程序事例）。

为了证明wait系统函数与信号SIGCHLD没有任何关系，我们可以做个简单的实验,代码如下：

#include <stdio.h>  
#include <stdlib.h>  
#include <unistd.h>  
#include <sys/wait.h>  
#include <sys/types.h>  
  int main(int argc, char *argv[])  {      int i;      pid_t pid;        for (i = 0; i < 5; i++) {  
        if ((pid = fork()) == 0)    /* child */  
            _exit(0);  
    }  
    sleep(10);  
    while (waitpid(-1, NULL, WNOHANG) > 0) {  
        /* do nothing */      }      sleep(10);        _exit(EXIT_SUCCESS);  }

以下是打印结果：

可以看到第一次sleep时系统中积累了5个僵尸进程，第二次sleep时，那5个僵尸进程都被收回了。这个也明显的看到了使用信号处理函数的优势，即可以保证系统不会积累大量的僵尸进程，它可以迅速的清理掉系统中的僵尸进程。

Tags：僵尸进程点击:() 评论:()

声明：本站部分内容及图片来自互联网,转载是出于传递更多信息之目的,内容观点仅代表作者本人,如有任何标注错误或版权侵犯请与我们联系(Email:2595517585@qq.com)，我们将及时更正、删除，谢谢。

▌相关推荐

linux后台开发中避免僵尸进程的方法总结

一、什么是僵死进程？一般情况下，程序调用exit（包括_exit和_Exit,它们的区别这里不做解释），它的绝大多数内存和相关的资源已经被内核释放掉，但是在进程表中这个进程项（entry）还保留着...【详细内容】

2020-10-10　　Tags: 僵尸进程点击:(140)　　评论:(0)　　加入收藏

一次 Docker 容器内大量僵尸进程排查分析

前段时间线上的一个使用 Google Puppeteer 生成图片的服务炸了，每个 docker 容器内都有几千个孤儿僵死进程没有回收，如下图所示。这篇文章比较长，主要就讲了下面这几个问题。 ...【详细内容】

2019-12-24　　Tags: 僵尸进程点击:(58)　　评论:(0)　　加入收藏

什么是Linux僵尸进程？怎么产生的？怎么避免？

僵尸进程是指它的父进程已经退出(父进程没有等待(调用wait/waitpid)它)，而该进程dead之后没有进程接受，就成为僵尸进程，也就是(zombie)进程。一个进程在调用了exit命令之后结...【详细内容】

2019-07-03　　Tags: 僵尸进程点击:(610)　　评论:(0)　　加入收藏

▌简易百科推荐

linux du命令

作用显示文件或目录所占用的磁盘空间使用命令格式du [option] 文件/目录命令功能显示文件或目录所占用的磁盘空间一些写法的区别du -sh xxx 显示总目录的大小，但是不会列出...【详细内容】

2021-12-23　　mitsuhide1992　　　　Tags:du命令　点击:(12)　　评论:(0)　　加入收藏

什么是linux内核？linux内核模块是什么？内核模块详解

什么是linux内核linux就像是一个哲学的最佳实践。如果非要对它评价，我真的不知道该怎么赞叹，我只能自豪地说着：“linux的美丽简直让人沉醉。”我只能说是我处在linux学习的修炼...【详细内容】

2021-12-23　　linux上的码农　　　　Tags:linux内核　点击:(15)　　评论:(0)　　加入收藏

Linux中 service 和 systemctl 命令比较

本文将比较 Linux 中 service 和 systemctl 命令，先分别简单介绍这两个命令的基础用法，然后进行比较。从 CentOS 7.x 开始，CentOS 开始使用 systemd 服务来代替 service服务（dae...【详细内容】

2021-12-23　　软件架构　　　　Tags:systemctl 　点击:(13)　　评论:(0)　　加入收藏

Linux之mv命令

mv是move的缩写,可以用来移动文件或者重命名文件名,经常用来备份文件或者目录。命令格式mv [选项] 源文件或者目录目标文件或者目录命令功能mv命令中第二个参数类型的不同（...【详细内容】

2021-12-17　　入门小站　　　　Tags:mv命令　点击:(23)　　评论:(0)　　加入收藏

Linux sed命令

大数据技术AI Flink/Spark/Hadoop/数仓，数据分析、面试，源码解读等干货学习资料 98篇原创内容 -->公众号 Linux sed 命令是利用脚本来处理文本文件。sed 可依照脚本的指令来处...【详细内容】

2021-12-17　　仙风道骨的宝石骑士　　　　Tags:sed命令　点击:(21)　　评论:(0)　　加入收藏

node是什么？如何在linux下安装node？

Node是个啥？　　写个东西还是尽量面面俱到吧，所以有关基本概念的东西我也从网上选择性地拿了下来，有些地方针对自己的理解有所改动，对这些概念性的东西有过了解的可选择跳过这段...【详细内容】

2021-12-15　　linux上的码农　　　　Tags:node 　点击:(21)　　评论:(0)　　加入收藏

ubuntu16.04 unity桌面设置攻略

难道只有我一个人觉得Ubuntu的unity桌面非常好用吗？最近把台式机上面的Ubuntu 16.04格式化了，装了黑苹果用了一周，不得不说，MacOS确实很精美，软件生态比Linux丰富很多，比Windows简...【详细内容】

2021-12-14　　地球末日村　　　　Tags:ubuntu 　点击:(34)　　评论:(0)　　加入收藏

Linux netstat命令详解

简介Netstat 命令用于显示各种网络相关信息，如网络连接，路由表，接口状态 (Interface Statistics)，masquerade 连接，多播成员 (Multicast Memberships) 等等。输出信息含义执行net...【详细内容】

2021-12-13　　窥镜天　　　　Tags:Linux netstat 　点击:(26)　　评论:(0)　　加入收藏

从Linux源码角度看Epoll，透过现象看本质

对于较多数量的文件描述符的监听无论是select还是poll系统调用都显得捉襟见肘，poll每次都需要将所有的文件描述符复制到内核，内核本身不会对这些文件描述符加以保存，这样的设计...【详细内容】

2021-12-13　　深度Linux　　　　Tags:Linux 　点击:(16)　　评论:(0)　　加入收藏

Linux eBPF解析

今天，我们来了解下 Linux 系统的革命性通用执行引擎-eBPF，之所以聊着玩意，因为它确实牛逼，作为一项底层技术，在现在的云原生生态领域中起着举足轻重的作用。截至目前，业界使用范...【详细内容】

2021-12-10　　架构驿站　　　　Tags:eBPF 　点击:(24)　　评论:(0)　　加入收藏

推荐资讯

远程软件发展迅猛，ToDe	倒计时！企业QQ即将下架
极简Windows11与iPhon	iPhone信号问题，花10元
惊人数据：App Store中4	个人所得税递延纳税报
非常实用的 Python 库	等离子电视技术先进，为