0

0

sar -q 显示 runq-sz 很大但没有明显 CPU 消耗的隐藏等待

舞夢輝影

舞夢輝影

发布时间:2026-01-19 16:51:22

|

814人浏览过

|

来源于php中文网

原创

runq-sz 持续偏高但 %idle 很高,说明进程卡在不可中断睡眠(D 状态)而非 CPU 瓶颈,常见于 I/O 阻塞、内存回收或驱动异常;需用 ps、iostat、dmesg 等交叉定位。

sar -q 显示 runq-sz 很大但没有明显 cpu 消耗的隐藏等待

runq-sz 显示的是当前就绪队列中等待被调度执行的进程数(包括正在运行和已就绪但未获得 CPU 的进程)。当 sar -q 输出中 runq-sz 持续偏高(比如 > 10,或明显超过 CPU 核心数),但 sar -u 显示 %idle 很高、%usr/%sys 很低时,说明系统有大量任务在排队,却没怎么用 CPU —— 这通常不是 CPU 真的空闲,而是这些任务被卡在了其他资源上,无法推进。

常见原因:I/O 等待被“隐藏”了

Linux 中,处于不可中断睡眠状态(D 状态)的进程不会计入 CPU 使用率(因为没跑在 CPU 上),但会留在 run queue 中,持续推高 runq-sz。这类进程往往卡在底层 I/O 操作上,例如:

  • 等待慢速磁盘响应(如故障硬盘、RAID 同步、ext4 journal 阻塞)
  • 访问挂载失败或响应极慢的 NFS/CIFS 共享
  • 内核模块 bug 或驱动 hang 住(如某些旧版 NVMe 或 USB 存储驱动)
  • 内存严重不足触发 direct reclaim,而回收过程又阻塞在 I/O(如 swapout 到慢盘)

快速定位 D 状态进程

直接查看当前有哪些进程卡在不可中断状态:

MaxAI
MaxAI

MaxAI.me是一款功能强大的浏览器AI插件,集成了多种AI模型。

下载
  • ps -eo pid,ppid,stat,comm,wchan --sort=-stat | head -20 —— 关注 STAT 列含 D 的行,wchan 显示其等待的内核函数(如 io_schedulenvme_queue_rq__wait_on_bit
  • ps aux | awk '$8 ~ /D/ {print $0}' —— 简单筛选 D 状态进程
  • cat /proc/[pid]/stack(对任一 D 进程)—— 查看其内核调用,确认阻塞点

结合 I/O 和内存指标交叉验证

单独看 runq-sz 容易误判,需同步检查:

  • sar -d 1 5:看 await%util 是否异常高(尤其某设备 util 接近 100% 且 await > 100ms)
  • iostat -x 1 5:关注 r_await/w_awaitavgqu-sz(设备级队列长度),若 avgqu-sz 大但 %util 不高,可能是驱动或队列深度问题
  • free -h + cat /proc/meminfo | grep -E "^(MemAvailable|SwapFree|SReclaimable)":确认是否内存紧张导致频繁 kswapd 或 direct reclaim
  • dmesg -T | tail -50:查找 I/O timeout、ATA/NVMe reset、NFS stale handle 等错误日志

典型场景示例

一台 8 核服务器,sar -q 显示 runq-sz 长期在 30–50,sar -u 显示 %idle > 95%,但用户反馈应用响应慢。执行 ps 发现 20+ 进程 STAT=D,wchan=“nvme_queue_rq”。进一步 iostat -x 显示 nvme0n1 的 await 达 2000ms,%util=99.8%,dmesg 有 “nvme 0000:01:00.0: Device not ready” 报错 —— 基本可判定是 NVMe 盘硬件故障或固件异常,导致所有发往该盘的 I/O 请求挂起,进程集体卡 D 状态,堆积在 run queue 中。

相关专题

更多
python中print函数的用法
python中print函数的用法

python中print函数的语法是“print(value1, value2, ..., sep=' ', end=' ', file=sys.stdout, flush=False)”。本专题为大家提供print相关的文章、下载、课程内容,供大家免费下载体验。

185

2023.09.27

sort排序函数用法
sort排序函数用法

sort排序函数的用法:1、对列表进行排序,默认情况下,sort函数按升序排序,因此最终输出的结果是按从小到大的顺序排列的;2、对元组进行排序,默认情况下,sort函数按元素的大小进行排序,因此最终输出的结果是按从小到大的顺序排列的;3、对字典进行排序,由于字典是无序的,因此排序后的结果仍然是原来的字典,使用一个lambda表达式作为key参数的值,用于指定排序的依据。

386

2023.09.04

堆和栈的区别
堆和栈的区别

堆和栈的区别:1、内存分配方式不同;2、大小不同;3、数据访问方式不同;4、数据的生命周期。本专题为大家提供堆和栈的区别的相关的文章、下载、课程内容,供大家免费下载体验。

392

2023.07.18

堆和栈区别
堆和栈区别

堆(Heap)和栈(Stack)是计算机中两种常见的内存分配机制。它们在内存管理的方式、分配方式以及使用场景上有很大的区别。本文将详细介绍堆和栈的特点、区别以及各自的使用场景。php中文网给大家带来了相关的教程以及文章欢迎大家前来学习阅读。

572

2023.08.10

堆和栈的区别
堆和栈的区别

堆和栈的区别:1、内存分配方式不同;2、大小不同;3、数据访问方式不同;4、数据的生命周期。本专题为大家提供堆和栈的区别的相关的文章、下载、课程内容,供大家免费下载体验。

392

2023.07.18

堆和栈区别
堆和栈区别

堆(Heap)和栈(Stack)是计算机中两种常见的内存分配机制。它们在内存管理的方式、分配方式以及使用场景上有很大的区别。本文将详细介绍堆和栈的特点、区别以及各自的使用场景。php中文网给大家带来了相关的教程以及文章欢迎大家前来学习阅读。

572

2023.08.10

磁盘配额是什么
磁盘配额是什么

磁盘配额是计算机中指定磁盘的储存限制,就是管理员可以为用户所能使用的磁盘空间进行配额限制,每一用户只能使用最大配额范围内的磁盘空间。php中文网为大家提供各种磁盘配额相关的内容,教程,供大家免费下载安装。

1349

2023.06.21

如何安装LINUX
如何安装LINUX

本站专题提供如何安装LINUX的相关教程文章,还有相关的下载、课程,大家可以免费体验。

703

2023.06.29

PHP WebSocket 实时通信开发
PHP WebSocket 实时通信开发

本专题系统讲解 PHP 在实时通信与长连接场景中的应用实践,涵盖 WebSocket 协议原理、服务端连接管理、消息推送机制、心跳检测、断线重连以及与前端的实时交互实现。通过聊天系统、实时通知等案例,帮助开发者掌握 使用 PHP 构建实时通信与推送服务的完整开发流程,适用于即时消息与高互动性应用场景。

11

2026.01.19

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
PostgreSQL 教程
PostgreSQL 教程

共48课时 | 7.4万人学习

Git 教程
Git 教程

共21课时 | 2.8万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号