Linux高负载如何排查_最佳实践总结助你快速突破【指导】-linux运维-PHP中文网

Linux高负载如何排查_最佳实践总结助你快速突破【指导】

冷炫風刃

发布： 2025-12-19 22:01:03

原创

524人浏览过

Linux高负载需按“负载值→资源类型→进程→线程→调用链”逐层排查：先比对负载与CPU核心数（阈值=核数×0.7），再用mpstat/iostat/pidstat区分CPU型或I/O型，接着用strace/jstack定位线程级瓶颈，最后检查内存与swap影响。

linux高负载如何排查_最佳实践总结助你快速突破【指导】

Linux高负载不是“CPU用满了”那么简单——它反映的是系统整体任务队列的积压程度。真正关键的是：先看负载值是否越界，再分清是CPU忙、IO堵、内存缺，还是进程卡在系统调用里。定位准了，修复才快。

别只盯着uptime或top里那个数字。先查CPU核心数：

高负载但CPU使用率低？大概率是I/O卡住了。反过来，CPU使用率飙高+负载高，才是计算密集问题。

CPU型：用 mpstat -P ALL 1 3 看各核%idle是否接近0；再用 pidstat -u 1 找出%CPU最高的进程
I/O型：用 iostat -x 1 3 看%util是否持续＞90%，同时%wa（iowait）是否＞10%；再用 iotop -o 找实际在刷盘的进程
混合型：pidstat -u 1 -d 1 可同时输出CPU和IO指标，一眼比对

找到高消耗进程只是第一步，得往下挖一层——是哪个线程、哪段代码、甚至哪个系统调用在拖慢它。

AI发型设计

虚拟发型试穿工具和发型模拟器

247

对Java进程：用 top -Hp [PID] 找到高CPU线程TID，转成十六进制（printf "%x\n" [TID]），再用 jstack [PID] | grep -A10 [hex] 定位堆栈
对任意进程：用 strace -p [PID] -tt -T -f -o /tmp/trace.log 捕获系统调用耗时，重点关注反复出现的read、write、futex、epoll_wait等长耗时调用
如果进程卡在D状态（不可中断睡眠），基本可断定是磁盘或驱动层问题，ls /proc/[PID]/stack 能看到内核栈

表面看是CPU或IO问题，背后常是内存不足触发了OOM Killer或频繁swap，导致大量进程排队等待页回收。

用 free -h 看available是否严重偏低；用 cat /proc/meminfo | grep -E "^(MemAvailable|SwapTotal|SwapFree|PageIn|PageOut)" 查交换活动
运行 dmesg -T | grep -i "killed process" 确认是否有进程被OOM Killer干掉
观察vmstat 1 5 中的si/so（swap in/out）和pgmajfault（主缺页次数），若数值持续非零，说明内存压力真实存在

基本上就这些。排查不是靠猜，而是按“负载值→资源类型→进程→线程→调用链”逐层收窄。工具不用全记，但mpstat、iostat、pidstat、strace这四个组合，覆盖90%的高负载场景。

以上就是Linux高负载如何排查_最佳实践总结助你快速突破【指导】的详细内容，更多请关注php中文网其它相关文章！