perf top 显示 [kworker]/[ksoftirqd] 热点时的下一步分析路径

冷炫風刃

发布时间：2026-01-24 16:21:08

177人浏览过

来源于php中文网

原创

kworker或ksoftirqd占CPU高是内核响应压力的表象，需通过perf抓栈、/proc/softirqs、/proc/interrupts等定位真实源头，而非盲目绑核或kill。

perf top 显示 [kworker]/[ksoftirqd] 热点时的下一步分析路径

看到 `kworker` 或 `ksoftirqd` 占 CPU 高，先别急着调优

它们不是“问题本身”，而是内核在响应某种压力的信号。比如 ksoftirqd/0 持续跑满一个核，大概率是软中断积压；kworker/1:0H 高，可能是某个设备驱动或文件系统操作在后台密集工作。直接 kill 或绑核只会掩盖根源。

先确认是否真异常：用 top -1 看单个 CPU 核是否被长期独占（而非瞬时毛刺）
区分类型：ksoftirqd 专处理软中断（网络收包、定时器、tasklet）；kworker 是通用工作队列，来源更杂（块设备、电源管理、fsnotify、驱动回调等）
注意后缀含义：/1:0H 中的 H 表示 high-priority 工作队列，u8:0 表示 unbound（不绑定 CPU），这类线程可能跨 NUMA 节点调度，带来额外开销

用 `perf record -g` 抓调用栈，定位真正触发者

perf top 只显示当前运行函数，但 ksoftirqd 的热点函数（如 __do_softirq）或 kworker 的入口（如 process_one_work）都是壳，必须看它“被谁推着跑”。

快速抓 10 秒： perf record -g -e cpu-clock -- sleep 10
导出火焰图看源头：perf script | ./stackcollapse-perf.pl | ./flamegraph.pl > ksoftirqd_flame.svg
重点关注火焰图底部（leaf functions）：如果是 net_rx_action → igb_poll → skb_copy_datagram_iter，就是网卡收包路径过载；如果是 blk_mq_run_hw_queue → scsi_queue_rq，就要查磁盘 I/O 或存储驱动

结合系统指标交叉验证，避免误判

单靠 perf 容易断章取义。比如 kworker/u8:0 高，可能只是因为大量 inotify 事件（如 IDE 实时扫描文件），未必是性能瓶颈。

蕉点AI

AI电商商品图生成平台 | 智能商品素材制作工具

下载

查软中断分布：cat /proc/softirqs，重点看 NET_RX、NET_TX、HI、TIMER 列是否持续增长（对比两次采样差值）
查硬中断来源：cat /proc/interrupts | grep -E "(eth|enp|nvme|ioapic)"，确认是否某块网卡或 NVMe 设备 IRQ 过于集中
查 RPS/RFS 是否启用：cat /sys/class/net/eth0/queues/rx-0/rps_cpus，若为 0 且单核处理所有软中断，就是典型的单点瓶颈
查 NUMA 分布：numastat -c ksoftirqd/0，若远端内存访问（numa_foreign）高，说明软中断处理和网卡不在同一 NUMA 节点

常见误操作与绕不开的底层约束

很多“优化”反而让问题更隐蔽。比如简单把 ksoftirqd/0 绑到 CPU 1，结果流量全涌向 CPU 1，其他核空闲——这不是均衡，是转移瓶颈。

不要手动 taskset 绑定 ksoftirqd：它的调度由内核自动完成，手动干预会破坏 softirq 负载均衡逻辑
RPS 配置需配合网卡 RSS：仅开 RPS 不开 RSS，软中断仍全落一个 CPU；RSS 未开启硬件多队列，RPS 也无队列可分
kworker 的高负载常来自用户态行为：比如频繁 inotify_add_watch、大量 sync_file_range、或容器 runtime 频繁调用 cgroup 接口，得回溯上层应用
某些场景无法根治：如高吞吐 DPDK 应用关闭了中断聚合，必然导致 NET_RX 软中断飙升——这时应换 polling 模式，而非硬压 softirq

真正的难点从来不是怎么让 kworker 消失，而是看懂它背后那条从硬件中断、到协议栈、再到用户态应用的完整链路。漏掉任何一环，分析就只剩表象。

如何在Debian上导出GIMP作品

perf top 显示 [kworker]/[ksoftirqd] 热点时的下一步分析路径

Linux CPU 飙高的排查流程

"rcu detected stall" 导致 CPU 卡死的软/硬锁或中断风暴解决

Linux 网络延迟高的可能原因

相关标签:

svg 栈热点性能瓶颈接口栈 class 线程事件 ide 负载均衡

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：Linux 内存占用高一定是问题吗？下一篇：Linux 系统日志的整体架构

作者最新文章

拼多多直通车关键词出价多少合适？拼多多直通车关键词优化口诀

2026-01-23 14:51

发票查询官网是哪个？发票查询官网正规入口

2026-01-23 15:03

交互图的作用是什么？交互图的作用与实际用途说明

2026-01-23 15:03

雨课堂电脑端登录方法_雨课堂电脑网页版插件登录指南

2026-01-23 15:26

Golang 游戏开发常用：方向枚举/按键枚举 iota 写法

2026-01-23 15:33

小红书网页版浏览入口怎么找_小红书网页版发现页面快速入口

2026-01-23 15:42

空调不制热是什么原因怎么解决

2026-01-23 16:28

空调外机噪音太大怎么处理空调外机嗡嗡响怎么回事

2026-01-23 16:48

微信经营帐户的钱怎样转入零钱?

2026-01-23 16:54

微信经营帐户收款扣手续费吗怎么扣

2026-01-23 17:02

热门AI工具

DeepSeek

幻方量化公司旗下的开源大模型平台

AI大模型

开放平台

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI大模型

通义千问

阿里巴巴推出的全能AI助手

AI大模型

腾讯元宝

腾讯混元平台推出的AI助手

文档处理

Excel 表格

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

AI大模型

中文写作

讯飞写作

基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

中文写作

写作工具

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

图片拼接

图画生成

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI大模型

中文写作

智谱清言 - 免费全能的AI助手

AI大模型

PC软件

相关专题

硬盘接口类型介绍

硬盘接口类型有IDE、SATA、SCSI、Fibre Channel、USB、eSATA、mSATA、PCIe等等。详细介绍：1、IDE接口是一种并行接口，主要用于连接硬盘和光驱等设备，它主要有两种类型：ATA和ATAPI，IDE接口已经逐渐被SATA接口；2、SATA接口是一种串行接口，相较于IDE接口，它具有更高的传输速度、更低的功耗和更小的体积；3、SCSI接口等等。

1051

2023.10.19