0

0

Linux系统运行状态分析_关键指标解读说明【教程】

冷漠man

冷漠man

发布时间:2025-12-30 17:42:07

|

733人浏览过

|

来源于php中文网

原创

CPU使用率是否真高需分三类看:%us、%sy、%wa;%wa>20%说明I/O瓶颈而非CPU,结合pidstat、mpstat和top Shift+I模式综合判断。

linux系统运行状态分析_关键指标解读说明【教程】

怎么看 CPU 使用率是否真的高?

Linux 的 tophtop 显示的 %CPU 常被误读。关键要看三类值:用户态(%us)、内核态(%sy)、等待 I/O(%wa)——如果 %wa 长期 >20%,说明不是 CPU 瓶颈,而是磁盘或网络卡住了。

更准的做法是结合 pidstat -u 1 查单个进程的真正 CPU 消耗,避免被短时峰值误导。注意:top 默认按 CPU% 排序,但会把多核总和当 100%,比如 4 核机器满载显示为 400%,需用 top → Shift+I 切换到“整体使用率”模式(即归一化到 100%)。

  • mpstat -P ALL 1 可查看每颗 CPU 核心的负载差异,排查不均衡调度
  • Java 进程常因 GC 导致 %sy 升高,此时要查 jstat -gc 而非只盯 %us
  • 容器环境里,docker stats 显示的 CPU% 是相对于容器限制值(--cpus)计算的,不是宿主机物理核占比

内存到底够不够?别只看 free -havailable

available 字段是内核估算的“当前可立即分配的内存”,比 free 更靠谱,但它不包含可快速回收的 page cache。真实压力要看 pgpgin/pgpgoutpgmajfault

watch -n 1 'grep -E "pgpgin|pgpgout|pgmajfault" /proc/vmstat'

pgmajfault 每秒持续 >100,说明频繁缺页中断,进程在反复申请新内存又释放;若 pgpgin 远大于 pgpgout,可能有内存泄漏或缓存堆积。

  • 应用堆内存(如 Java -Xmx)设得过大,反而会推高 pgmajfault,因为内核要花更多时间找连续物理页
  • slabtop 能定位内核模块(如 xfs_inodeext4_inode_cache)是否占用了异常多的 slab 内存
  • /proc/meminfo 中的 MemAvailable 是动态估算值,低内存设备上可能滞后,建议同时看 Committed_AS / CommitLimit 比值是否 >90%

磁盘 I/O 等待时间(%util为什么不准?

iostat -x 1 输出的 %util 只表示设备忙的时间百分比,不反映队列深度或响应延迟。SSD 或 NVMe 设备即使 %util 为 100%,await 也可能只有 0.1ms;而机械盘 %util 70% 时 await 已达 20ms+,才是真正瓶颈。

Inworld.ai
Inworld.ai

InWorldAI是一个AI角色开发平台,开发者可以创建具有自然语言、上下文意识和多模态的AI角色,并可以继承到游戏和实时媒体中

下载

更关键的指标是 avgqu-sz(平均队列长度)和 r_await/w_await(读写平均延迟)。当 avgqu-sz > 1r_await > 10(HDD)或 > 1(NVMe),说明 I/O 请求开始排队。

  • 使用 iotop -oPa 可直接看到哪些进程在发起同步 I/O(IO 列非 0),比 ps aux --sort=-%cpu 更准
  • LVM 或加密设备(如 LUKS)会在 dm-* 层引入额外延迟,iostat 要加 -d 参数才能显示底层物理设备(如 sda)的真实指标
  • cat /sys/block/sda/queue/scheduler 查当前 IO 调度器,云主机常用 none(绕过内核调度),本地 HDD 应设为 deadline

网络丢包和重传怎么快速定位?

netstat -sss -s 显示的 “retransmits” 是累计值,看不出实时恶化趋势。应优先看:

watch -n 1 'ss -i | grep -E "(retrans|rtt)" | head -5'

重点关注每行末尾的 retrans 计数(单连接重传次数)和 rtt(往返时间)。若某连接 retrans:2+rtt:1000+(ms),基本可判定链路不稳定。

  • tcpretrans(bpftrace 工具)能追踪每个重传报文的原始 socket 和进程,比 tcpdump 更轻量
  • 云环境常见问题是网卡多队列未绑定 IRQ,导致单核软中断(softirq)打满,用 cat /proc/interrupts | grep eth0 查各 CPU 上网卡中断分布
  • ethtool -S eth0 中的 rx_missed_errorstx_aborted_errors 非零,说明驱动或硬件层已出问题,不是 TCP 协议能解决的

这些指标之间很少孤立变化。比如 %wa 升高时,大概率伴随 pgpgin 暴涨和 r_await 上升——与其单独调优某一项,不如用 perf record -e syscalls:sys_enter_read,syscalls:sys_enter_write -a sleep 10 抓系统调用热点,从源头看进程到底在等什么。

相关专题

更多
java
java

Java是一个通用术语,用于表示Java软件及其组件,包括“Java运行时环境 (JRE)”、“Java虚拟机 (JVM)”以及“插件”。php中文网还为大家带了Java相关下载资源、相关课程以及相关文章等内容,供大家免费下载使用。

799

2023.06.15

java正则表达式语法
java正则表达式语法

java正则表达式语法是一种模式匹配工具,它非常有用,可以在处理文本和字符串时快速地查找、替换、验证和提取特定的模式和数据。本专题提供java正则表达式语法的相关文章、下载和专题,供大家免费下载体验。

722

2023.07.05

java自学难吗
java自学难吗

Java自学并不难。Java语言相对于其他一些编程语言而言,有着较为简洁和易读的语法,本专题为大家提供java自学难吗相关的文章,大家可以免费体验。

727

2023.07.31

java配置jdk环境变量
java配置jdk环境变量

Java是一种广泛使用的高级编程语言,用于开发各种类型的应用程序。为了能够在计算机上正确运行和编译Java代码,需要正确配置Java Development Kit(JDK)环境变量。php中文网给大家带来了相关的教程以及文章,欢迎大家前来阅读学习。

394

2023.08.01

java保留两位小数
java保留两位小数

Java是一种广泛应用于编程领域的高级编程语言。在Java中,保留两位小数是指在进行数值计算或输出时,限制小数部分只有两位有效数字,并将多余的位数进行四舍五入或截取。php中文网给大家带来了相关的教程以及文章,欢迎大家前来阅读学习。

398

2023.08.02

java基本数据类型
java基本数据类型

java基本数据类型有:1、byte;2、short;3、int;4、long;5、float;6、double;7、char;8、boolean。本专题为大家提供java基本数据类型的相关的文章、下载、课程内容,供大家免费下载体验。

445

2023.08.02

java有什么用
java有什么用

java可以开发应用程序、移动应用、Web应用、企业级应用、嵌入式系统等方面。本专题为大家提供java有什么用的相关的文章、下载、课程内容,供大家免费下载体验。

428

2023.08.02

java在线网站
java在线网站

Java在线网站是指提供Java编程学习、实践和交流平台的网络服务。近年来,随着Java语言在软件开发领域的广泛应用,越来越多的人对Java编程感兴趣,并希望能够通过在线网站来学习和提高自己的Java编程技能。php中文网给大家带来了相关的视频、教程以及文章,欢迎大家前来学习阅读和下载。

16860

2023.08.03

桌面文件位置介绍
桌面文件位置介绍

本专题整合了桌面文件相关教程,阅读专题下面的文章了解更多内容。

0

2025.12.30

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
PostgreSQL 教程
PostgreSQL 教程

共48课时 | 6.2万人学习

Git 教程
Git 教程

共21课时 | 2.3万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号