首先确认是否存在僵尸进程,通过ps命令检测状态为Z的进程;随后记录其PID与PPID,优先向父进程发送SIGCHLD信号促使其回收;若无效,则重启或终止父进程以释放资源;最后利用pstree分析进程关系,定位并处理异常父进程,确保系统稳定。

如果您在使用LINUX系统时发现某些进程状态异常,且资源无法被正常回收,则可能是遇到了僵尸进程。僵尸进程是已经终止但其退出状态尚未被父进程读取的进程,这类进程虽不占用CPU或内存资源,但会占用进程表项,影响系统稳定性。以下是识别与清理僵尸进程的具体方法。
本文运行环境:Dell PowerEdge服务器,Ubuntu 22.04
一、识别僵尸进程
通过查看系统中进程的状态可以判断是否存在僵尸进程。僵尸进程在进程状态中显示为“Z”或“Z+”。使用系统命令可快速定位这些异常进程。
1、打开终端,执行以下命令查看所有进程状态:
ps aux | awk '{print $8}' | grep -c Z
2、若返回值大于0,说明存在僵尸进程,接着运行以下命令列出详细信息:
ps aux | grep 'Z'
3、记录下僵尸进程的PID及其父进程PID(PPID),以便后续处理。
二、向父进程发送SIGCHLD信号
僵尸进程未被回收通常是因为其父进程未正确调用wait()或waitpid()系统调用来获取子进程的退出状态。可以通过向父进程发送SIGCHLD信号,促使其执行清理操作。
1、确定僵尸进程对应的父进程PID(PPID)。
2、执行命令向该父进程发送SIGCHLD信号:
kill -s SIGCHLD 父进程PID
3、等待几秒后重新检查是否仍有僵尸进程残留。
三、重启父进程
如果父进程存在逻辑缺陷或长期未响应,导致无法自动回收僵尸进程,则可通过重启父进程来强制释放所有子进程资源。
1、确认父进程名称及服务类型,避免误关闭关键系统服务。
2、停止该进程:
sudo systemctl stop 服务名
3、启动该进程:
sudo systemctl start 服务名
4、验证僵尸进程是否已被清除。
四、手动终止父进程
当父进程非系统关键进程且无响应时,可考虑直接终止该进程,从而使其子进程被init接管并自动清理。
1、检查父进程是否可安全终止:
ps -p 父进程PID -o comm=
2、终止父进程:
kill 父进程PID
3、再次检查僵尸进程列表,确认是否已消失。
五、使用调试工具分析进程关系
借助系统工具如pstree可直观查看进程间的父子关系,帮助定位产生大量僵尸进程的源头程序。
1、安装pstree(如未预装):
sudo apt install psmisc
2、查看进程树结构:
pstree -p
3、查找标记为“Z”的进程节点,追踪其父进程行为模式。










