vmstat r 队列长期高但 top 无明显热点进程的等待分析

冷漠man

发布时间：2026-01-24 18:46:03

238人浏览过

来源于php中文网

原创

r 值表示运行队列长度，即正在运行或等待 CPU 调度的进程总数；若长期高于 CPU 核心数，说明调度拥堵，需结合 D 状态进程、iostat、中断统计、cgroup throttling 等多维度排查真实瓶颈。

vmstat r 队列长期高但 top 无明显热点进程的等待分析

看懂 `r` 值到底在等什么

r 是 vmstat 中「运行队列长度」，它统计的是**正在 CPU 上运行 + 等待 CPU 调度的进程总数**。注意：它不区分用户态/内核态，也不管进程是不是卡在 I/O、锁、内存分配或中断里——只要没被调度出去，就还在队列里。所以 r 长期高于 CPU 核心数（比如 8 核服务器 r > 8），说明调度器“排不上号”，但 top 里看不到高 CPU 进程，恰恰说明这些进程根本没机会跑满 CPU，而是被别的东西拦住了。

重点排查 D 状态进程和不可中断等待

当进程因磁盘 I/O、NFS 挂载、内核锁或硬件驱动阻塞时，会进入 D（Uninterruptible Sleep）状态。这类进程：
• 不响应信号（kill -9 无效）
• 不计入 top 的 CPU 使用率（因为没执行指令）
• 却持续占据 r 队列位置
• 在 ps aux 输出中 STATE 列显示为 D

快速检查：ps -eo stat,pid,comm | grep "^D"
结合 vmstat 1 观察 b 列（阻塞进程数）是否同步升高；若 r 和 b 都高，基本锁定 I/O 或内核路径阻塞
用 iostat -x 1 看 %util 是否接近 100%、await 是否远超 10ms（SSD）或 50ms（HDD）

别漏掉中断和内核线程的“隐形消耗”

CPU 负载高但用户进程不占 CPU，常见于高频硬件中断（如网卡收包、NVMe 驱动、USB 设备）或内核线程密集争抢资源。这类负载不会出现在 top 默认视图，但会推高 vmstat 的 in（每秒中断数）、cs（上下文切换）和 sy（系统态 CPU）。

墨鱼aigc

一款超好用的Ai写作工具，为用户提供一键生成营销广告、原创文案、写作辅助等文字生成服务。

下载

查中断分布：watch -n1 'cat /proc/interrupts | sort -k2nr | head -10'，关注某 CPU 上某设备中断是否突增
查内核线程：top -H -p $(pgrep kthreadd) 或 ps -eLh o pid,tid,class,rtprio,ni,pri,psr,pcpu,state,comm | awk '$11=="R" || $11=="D" {print}' | sort -k7nr | head -10
确认 irqbalance 是否启用：systemctl is-active irqbalance；若关闭且中断集中在一个核，r 高就非常典型

短生命周期进程和 cgroup 限制也会“藏”负载

频繁 fork/exit 的进程（如 CGI 脚本、容器健康检查、日志轮转）可能在 top 刷新间隔（默认 3 秒）内一闪而过，导致“看不见但压得死”。另外，如果进程受 cgroup CPU quota 限制（如 cpu.max = 10000 100000），它会反复被 throttled，表现为调度队列积压，但单次运行时间极短，top 统计不到显著占用。

捕获瞬时进程：pidstat -u 1 10（比 top 更细粒度）或 atop -r /var/log/atop/atop_$(date +%Y%m%d) -r 1（需提前开启 atop 日志）
检查 cgroup 限频：cat /sys/fs/cgroup/cpu,cpuacct/*/cpu.stat 2>/dev/null | grep throttled，有非零值即存在节流
验证是否是调度延迟本身：perf sched latency -s max 可输出最高调度延迟及对应进程

真正难缠的不是 r 高，而是它背后混着 I/O 阻塞、中断风暴、内核锁竞争、cgroup 节流等多种机制——必须靠 vmstat 定向、ps/iostat/perf 多点交叉，才能揪出那个“不动声色却堵死通道”的元凶。

Linux 运维：如何执行裸机恢复 (bare-metal restore)

Linux文件系统losetup命令详解

如何在Linux中挂载外部存储设备？

如何在Linux中挂载和卸载文件系统？

Linux如何挂载USB设备到指定目录

相关标签:

usb ai ios 热点 print NULL sort date CGI class 线程 var

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：Linux 如何降低人为操作风险？下一篇：暂无

作者最新文章

ethtool -S eth0 rx_missed_errors 持续增加的硬件/驱动/ring buffer 原因

2026-01-24 17:37

Linux NAS 与本地磁盘的差异

2026-01-24 17:49

multipathd "map in use" 无法 remove 的 dmsetup remove --force 使用

2026-01-24 17:53

SQL 如何通过设计避免死锁？

2026-01-24 17:55

俄罗斯引擎官方入口无需登录俄罗斯引擎yandex官方入口

2026-01-24 17:58

AO3官网入口2026最新地址 2026年AO3网页版链接免登录

2026-01-24 17:59

最新Yandex网页版入口地址 Yandex搜索引擎网页免登录地址

2026-01-24 17:59

Python 如何安全地执行用户输入的表达式（不要用 eval）

2026-01-24 18:02

gc.get_referents() 如何用来快速排查对象引用链

2026-01-24 18:03

SQL 线上误操作如何防范？

2026-01-24 18:05

热门AI工具

DeepSeek

幻方量化公司旗下的开源大模型平台

AI大模型

开放平台

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI大模型

通义千问

阿里巴巴推出的全能AI助手

AI大模型

腾讯元宝

腾讯混元平台推出的AI助手

文档处理

Excel 表格

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

AI大模型

中文写作

讯飞写作

基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

中文写作

写作工具

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

图片拼接

图画生成

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI大模型

中文写作

智谱清言 - 免费全能的AI助手

AI大模型

PC软件

相关专题

python中print函数的用法

python中print函数的语法是“print(value1, value2, ..., sep=' ', end=' ', file=sys.stdout, flush=False)”。本专题为大家提供print相关的文章、下载、课程内容，供大家免费下载体验。

185

2023.09.27

c语言中null和NULL的区别

c语言中null和NULL的区别是：null是C语言中的一个宏定义，通常用来表示一个空指针，可以用于初始化指针变量，或者在条件语句中判断指针是否为空；NULL是C语言中的一个预定义常量，通常用来表示一个空值，用于表示一个空的指针、空的指针数组或者空的结构体指针。

233

2023.09.22

java中null的用法

在Java中，null表示一个引用类型的变量不指向任何对象。可以将null赋值给任何引用类型的变量，包括类、接口、数组、字符串等。想了解更多null的相关内容，可以阅读本专题下面的文章。

437

2024.03.01

sort排序函数用法

sort排序函数的用法：1、对列表进行排序，默认情况下，sort函数按升序排序，因此最终输出的结果是按从小到大的顺序排列的；2、对元组进行排序，默认情况下，sort函数按元素的大小进行排序，因此最终输出的结果是按从小到大的顺序排列的；3、对字典进行排序，由于字典是无序的，因此排序后的结果仍然是原来的字典，使用一个lambda表达式作为key参数的值，用于指定排序的依据。

387

2023.09.04