0

0

LinuxOOM问题排查流程_内存不足场景分析【教程】

冷炫風刃

冷炫風刃

发布时间:2025-12-30 20:31:02

|

336人浏览过

|

来源于php中文网

原创

最直接判断系统是否被OOM Killer干掉是检查dmesg日志中是否有“Out of memory: Kill process”记录,需结合时间戳与业务异常时刻比对,并注意oom_score_adj、RSS及运行时长等被杀依据。

linuxoom问题排查流程_内存不足场景分析【教程】

怎么看系统是不是被OOM Killer干掉了

最直接的判断方式是检查内核日志里有没有 Out of memory: Kill process 这类记录。OOM Killer 触发后,dmesg 输出里通常紧跟着进程名、PID、内存占用估算值和被选中的理由。

执行:

dmesg -T | grep -i "killed process"
或更宽泛地:
dmesg -T | grep -E "(Out of memory|Killed process)"

  • 注意时间戳是否贴近业务异常发生时刻
  • 被杀进程不一定就是罪魁祸首,oom_score_adj 值高、RSS 大、运行时间短的进程更容易被挑中
  • 如果日志里只有 page allocation failure 但没看到 Killed process,说明还没走到 OOM Killer 阶段,可能是内存碎片或直接回收失败

/proc/sys/vm/overcommit_memory 设为 1 真的能防OOM吗

不能,它只是改变内存申请时的检查策略,不是内存不足的解药。设为 1 表示“总是允许分配”,内核不再校验是否有足够空闲页,等真正写入时才可能触发 OOM —— 实际上让问题延后、更难定位。

常见误判场景:

echo 1 > /proc/sys/vm/overcommit_memory
后应用看似启动更快,但运行几小时后突然被杀,且 dmesg 显示大量匿名页分配失败。

  • overcommit_memory=0(默认):启发式检查,较保守
  • overcommit_memory=2:严格模式,CommitLimit = SwapTotal + vm.overcommit_ratio * RAM,适合对稳定性要求高的服务
  • 改完记得同步更新 /etc/sysctl.conf,否则重启失效

top 或 ps 看 RSS 高就一定是内存泄漏吗

不一定。RSS(Resident Set Size)反映的是进程当前实际占用的物理内存页,但它包含共享库、mmap 映射、tmpfs 文件等非堆内存区域。Java 应用常因 DirectByteBuffer 或 JNI 调用导致 RSS 持续上涨,而堆内存(jstat -gc)却很平稳。

Lateral App
Lateral App

整理归类论文

下载

排查建议:

  • pmap -x 查看各内存段分布,重点关注 anonmapped 区域大小
  • 对 Java 进程,加 JVM 参数 -XX:NativeMemoryTracking=detail 后用 jcmd VM.native_memory summary 对比
  • 检查是否启用了 transparent_hugepage,某些版本内核下它会导致 RSS 虚高且难以释放

为什么 free -h 显示还有几G空闲,系统却触发OOM

因为 free 显示的 “available” 才是真正可立即分配的内存;“free” 字段只是完全未使用的页,现代 Linux 会把空闲内存用于 page cache、slab 等缓存,这些在需要时本该快速回收 —— 但如果回收速度赶不上分配速度(比如突发大量 mmap(MAP_ANONYMOUS)),就会 OOM。

关键指标要看:

cat /proc/meminfo | grep -E "(MemAvailable|MemFree|Buffers|Cached|SReclaimable|PageTables|CommitLimit|Committed_AS)"

  • MemAvailable 显著低于 MemTotal * 0.1 是危险信号
  • Committed_AS > CommitLimit 表示已超承诺上限,即使 MemAvailable 还有余量,OOM Killer 也可能随时介入
  • 某些容器环境(如 cgroups v1)中,MemAvailable 不反映 cgroup 限额,得看 /sys/fs/cgroup/memory/xxx/memory.usage_in_bytes

OOM 的根本难点不在识别,而在区分「谁在持续吃内存」和「谁只是恰好站得太高」——oom_score 是结果,不是原因。查到被杀进程后,务必回溯它的内存增长路径,而不是只调大 oom_score_adj 或加 swap。

相关专题

更多
java
java

Java是一个通用术语,用于表示Java软件及其组件,包括“Java运行时环境 (JRE)”、“Java虚拟机 (JVM)”以及“插件”。php中文网还为大家带了Java相关下载资源、相关课程以及相关文章等内容,供大家免费下载使用。

801

2023.06.15

java正则表达式语法
java正则表达式语法

java正则表达式语法是一种模式匹配工具,它非常有用,可以在处理文本和字符串时快速地查找、替换、验证和提取特定的模式和数据。本专题提供java正则表达式语法的相关文章、下载和专题,供大家免费下载体验。

722

2023.07.05

java自学难吗
java自学难吗

Java自学并不难。Java语言相对于其他一些编程语言而言,有着较为简洁和易读的语法,本专题为大家提供java自学难吗相关的文章,大家可以免费体验。

727

2023.07.31

java配置jdk环境变量
java配置jdk环境变量

Java是一种广泛使用的高级编程语言,用于开发各种类型的应用程序。为了能够在计算机上正确运行和编译Java代码,需要正确配置Java Development Kit(JDK)环境变量。php中文网给大家带来了相关的教程以及文章,欢迎大家前来阅读学习。

395

2023.08.01

java保留两位小数
java保留两位小数

Java是一种广泛应用于编程领域的高级编程语言。在Java中,保留两位小数是指在进行数值计算或输出时,限制小数部分只有两位有效数字,并将多余的位数进行四舍五入或截取。php中文网给大家带来了相关的教程以及文章,欢迎大家前来阅读学习。

398

2023.08.02

java基本数据类型
java基本数据类型

java基本数据类型有:1、byte;2、short;3、int;4、long;5、float;6、double;7、char;8、boolean。本专题为大家提供java基本数据类型的相关的文章、下载、课程内容,供大家免费下载体验。

445

2023.08.02

java有什么用
java有什么用

java可以开发应用程序、移动应用、Web应用、企业级应用、嵌入式系统等方面。本专题为大家提供java有什么用的相关的文章、下载、课程内容,供大家免费下载体验。

428

2023.08.02

java在线网站
java在线网站

Java在线网站是指提供Java编程学习、实践和交流平台的网络服务。近年来,随着Java语言在软件开发领域的广泛应用,越来越多的人对Java编程感兴趣,并希望能够通过在线网站来学习和提高自己的Java编程技能。php中文网给大家带来了相关的视频、教程以及文章,欢迎大家前来学习阅读和下载。

16860

2023.08.03

桌面文件位置介绍
桌面文件位置介绍

本专题整合了桌面文件相关教程,阅读专题下面的文章了解更多内容。

0

2025.12.30

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
PostgreSQL 教程
PostgreSQL 教程

共48课时 | 6.2万人学习

Git 教程
Git 教程

共21课时 | 2.3万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号