Linux高负载需按“负载值→资源类型→进程→线程→调用链”逐层排查:先比对负载与CPU核心数(阈值=核数×0.7),再用mpstat/iostat/pidstat区分CPU型或I/O型,接着用strace/jstack定位线程级瓶颈,最后检查内存与swap影响。

Linux高负载不是“CPU用满了”那么简单——它反映的是系统整体任务队列的积压程度。真正关键的是:先看负载值是否越界,再分清是CPU忙、IO堵、内存缺,还是进程卡在系统调用里。定位准了,修复才快。
别只盯着uptime或top里那个数字。先查CPU核心数:
grep -c 'processor' /proc/cpuinfo 或 nproc
load average: 12.4, 9.8, 7.2 —— 若1分钟值远高于15分钟值,说明突发尖峰;若三者都高且平稳,大概率是长期瓶颈高负载但CPU使用率低?大概率是I/O卡住了。反过来,CPU使用率飙高+负载高,才是计算密集问题。
mpstat -P ALL 1 3 看各核%idle是否接近0;再用 pidstat -u 1 找出%CPU最高的进程iostat -x 1 3 看%util是否持续>90%,同时%wa(iowait)是否>10%;再用 iotop -o 找实际在刷盘的进程pidstat -u 1 -d 1 可同时输出CPU和IO指标,一眼比对找到高消耗进程只是第一步,得往下挖一层——是哪个线程、哪段代码、甚至哪个系统调用在拖慢它。
top -Hp [PID] 找到高CPU线程TID,转成十六进制(printf "%x\n" [TID]),再用 jstack [PID] | grep -A10 [hex] 定位堆栈
strace -p [PID] -tt -T -f -o /tmp/trace.log 捕获系统调用耗时,重点关注反复出现的read、write、futex、epoll_wait等长耗时调用ls /proc/[PID]/stack 能看到内核栈表面看是CPU或IO问题,背后常是内存不足触发了OOM Killer或频繁swap,导致大量进程排队等待页回收。
free -h 看available是否严重偏低;用 cat /proc/meminfo | grep -E "^(MemAvailable|SwapTotal|SwapFree|PageIn|PageOut)" 查交换活动dmesg -T | grep -i "killed process" 确认是否有进程被OOM Killer干掉vmstat 1 5 中的si/so(swap in/out)和pgmajfault(主缺页次数),若数值持续非零,说明内存压力真实存在基本上就这些。排查不是靠猜,而是按“负载值→资源类型→进程→线程→调用链”逐层收窄。工具不用全记,但mpstat、iostat、pidstat、strace这四个组合,覆盖90%的高负载场景。
以上就是Linux高负载如何排查_最佳实践总结助你快速突破【指导】的详细内容,更多请关注php中文网其它相关文章!
每个人都需要一台速度更快、更稳定的 PC。随着时间的推移,垃圾文件、旧注册表数据和不必要的后台进程会占用资源并降低性能。幸运的是,许多工具可以让 Windows 保持平稳运行。
Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号