0

0

Linux系统之 OOM 解析

看不見的法師

看不見的法師

发布时间:2025-06-25 11:48:28

|

508人浏览过

|

来源于php中文网

原创

在实际业务场景中,我们经常会遇到这种情况:基于虚拟机(vm)环境部署的spring boot应用服务,在运行过程中常常会将内存利用率推到极限,甚至达到90%以上。此时,许多同事会呼吁领导进行内存扩容。然而,这样的需求是否合理?作为技术人员,我们应该如何应对和解决这个问题?本文将从linux内存结构、内存分析以及oom killer三个方面结合笔者多年的实践经验进行探讨,若有不足之处,欢迎大家批评指正。

内存结构

从宏观角度来看,内存管理系统是操作系统的核心部分之一。在内存管理的系统调用方面,虽然POSIX并未指定任何具体的系统调用,但Linux却拥有自己的内存管理系统调用,主要包括以下几种:

系统调用 描述 | s = brk(addr) | 改变数据段大小 | | a = mmap(addr,len,prot,flags,fd,offset) | 进行映射 | | s = unmap(addr,len) | 取消映射 |
  1. brk 通过指定数据段之外的第一个字节地址来调整数据段的大小。如果新值大于原值,数据区将扩展,反之则缩小。
  2. mmap和unmap 系统调用用于控制文件映射。mmap的第一个参数addr决定文件映射的地址,必须是页面大小的倍数。若为0,系统会分配并返回地址a。第二个参数len表示需要映射的字节数,同样是页面大小的倍数。prot参数决定映射文件的保护位,可以设置为可读、可写、可执行或它们的组合。flags参数控制文件的私有性或可读性以及addr的必要性。fd是需要映射的文件描述符,仅打开的文件可以被映射。offset参数指示文件映射的起始位置,不一定从零开始。

Linux的内存管理涉及广泛且复杂的领域,从早期计算机开始,我们实际使用的内存往往比系统中存在的物理内存多。为此,内存分配策略引入了虚拟内存(Virtual Memory),通过在多个进程之间共享虚拟内存,使系统能够有效管理和分配资源。以下是Linux系统的总览图:

Linux系统之 OOM  解析(此图源自网络)

Linux内存通常被认为是“物理内存”,但只有内核可以直接访问物理内存。进程需要访问内存时,Linux内核为每个进程提供独立的虚拟地址空间,访问的是虚拟内存。虚拟内存空间内部划分为内核空间和用户空间:

  1. 进程在用户态只能访问用户空间内存。
  2. 进程进入内核态才能访问内核空间内存。
  3. 每个进程都包含内核空间,但这些内核空间都关联相同的物理内存。

内存映射将虚拟内存地址映射到物理内存地址。内核为每个进程维护一张页表,记录虚拟地址和物理地址的映射关系,页表存储在CPU的内存管理单元(MMU)中,处理器通过硬件直接查找要访问的内存。以下是内核线形地址空间布局图:

Linux系统之 OOM  解析

简要描述如下:

  1. 内核直接映射空间PAGE_OFFSET~VMALLOC_START,kmalloc和__get_free_page()分配的是这里的页面,通过Slab分配器直接分配物理页并转换为逻辑地址,适用于分配小段内存。此区域包含内核镜像、物理页框表mem_map等资源。
  2. 内核动态映射空间VMALLOC_START~VMALLOC_END,被vmalloc使用,可表示的空间较大。
  3. 内核永久映射空间PKMAP_BASE ~ FIXADDR_START,使用kmap。
  4. 内核临时映射空间FIXADDR_START~FIXADDR_TOP,使用kmap_atomic。

内存分析

内存分析手段多样,根据不同水平的需求,我们可以使用Top、Free和Vmstat命令来追踪和观察内存的动态变化,以实时了解操作系统的资源状态。以下是相关命令的示例输出及其解析:

[administrator@JavaLangOutOfMemory ~ ] %top
PID USER      PR  NI    VIRT    RES    SHR S  %CPU %MEM     TIME+ COMMAND
  1 root      20   0  128032   7996   5556 S   80.0  80.4   0:01.03 java
  2 root      20   0       0      0      0 S   0.0  0.0   0:00.00 kthreadd

简要解析如下:

AMiner
AMiner

AMiner——新一代智能型科技情报挖掘与服务系统,能够为你提供查找论文、理解论文、分析论文、写作论文四位一体一站式服务。

下载
  1. VIRT:虚拟内存,包括进程的代码段、数据段、共享内存、已申请的堆内存和已换出的内存等,已申请但未分配物理内存的内存也计入虚拟内存。
  2. RSS:常驻内存,是进程实际使用的物理内存,不包括Swap和共享内存。
  3. SHR:共享内存,包括与其他进程共同使用的真实共享内存、加载的动态链接库以及程序的代码段。
  4. %MEM:进程使用物理内存占系统内存的百分比。
[administrator@JavaLangOutOfMemory ~ ] %free
              total        used        free      shared  buff/cache   available
Mem:        2031744       98176     1826192        8784      107376     1800144
Swap:       2097148           0     2097148

此命令输出内容简单,主要打印已用、剩余、可用、共享内存以及缓存等信息。部分参数释义如下:

  1. Shared:共享内存,通过Tmpfs实现,其大小即Tmpfs使用的内存大小。
  2. Available:可用内存,是新进程可以使用的最大内存,包括剩余内存和未使用的内存。
  3. Buffer/Cache:缓存包括两部分,一部分是磁盘读取文件的页缓存,用于缓存从磁盘读取的数据,加速后续访问速度;另一部分是Slab分配的可回收缓存。缓冲区是对原始磁盘的临时存储,用于缓存将要写入磁盘的数据,优化磁盘写入。
[administrator@JavaLangOutOfMemory ~ ] %vmstat 1 1
procs -----------memory---------- ---swap-- -----io---- -system-- ------cpu-----
 r  b   swpd   free   buff  cache   si   so    bi    bo   in   cs us sy id wa st
 1  0      0 1815348   2108 111872    0    0     1     0   11   11  0  0 100  0  0

简要解析如下:

  1. si:换入,每秒从磁盘读入虚拟内存的大小,若此值长时间持续大于0,表示物理内存不足或内存泄漏,需要定位问题。
  2. so:换出,每秒从内存写入磁盘的大小,若此值长时间持续大于0,表示物理内存不足,需要排查内存问题。

OOM Killer

在某些场景下,如VM上部署多个Spring Boot微服务,在业务促销、压力测试或网络抖动等特殊时刻,服务可能会突然无预警地被终止。此时,我们需要快速定位问题原因。

这种情况通常是由于内存溢出(OOM,Out Of Memory)导致的。Linux通过OOM Killer机制进行自我保护,防止内存不足时出现严重问题。Linux内核会监控占用内存过大的进程,特别是在某一时刻内存使用快速增长的进程,以防止系统内存耗尽而自动终止这些进程。系统内核检测到内存不足时,会通过内核源代码linux/mm/oom_kill.c中的out_of_memory()函数触发,然后调用select_bad_process()选择并终止一个“bad”进程。选择“bad”进程的标准是通过oom_badness()函数计算的,算法简单且直接:最“bad”的进程就是最占用内存的进程。

OOM Killer源码解析

OOM Killer的核心函数是out_of_memory(),执行流程如下:

  1. 调用check_panic_on_oom()检查是否允许执行内核恐慌,若允许则需要重启系统。
  2. 若定义了/proc/sys/vm/oom_kill_allocating_task,即允许终止当前正在申请分配物理内存的进程,则杀死当前进程。
  3. 调用select_bad_process,选择badness score最高的进程。
  4. 调用oom_kill_process,终止选择的进程。

通过分析Badness Score的计算函数,我们可以理解OOM Killer如何选择需要终止的进程。具体源码如下:

unsigned long oom_badness(struct task_struct *p, struct mem_cgroup *memcg,
                          const nodemask_t *nodemask, unsigned long totalpages){
        long points;
        long adj;
        /* 若该进程不能被终止,则分数返回0. */
        if (oom_unkillable_task(p, memcg, nodemask))
                return 0;
        p = find_lock_task_mm(p);
        if (!p)
                return 0;
        /* 获取该进程的oom_score_adj,这是用户为进程设置的badness score调整值,若此值为-1000或进程被标记为不可终止,或进程处于vfork()过程中,badness score返回0。 */
        adj = (long)p->signal->oom_score_adj;
        if (adj == OOM_SCORE_ADJ_MIN ||
                        test_bit(MMF_OOM_SKIP, &p->mm->flags) ||
                        in_vfork(p)) {
                task_unlock(p);
                return 0;
        }
        /* badness score分数 = 物理内存页数 + 交换区页数 + 页表Page Table数量。 */
        points = get_mm_rss(p->mm) + get_mm_counter(p->mm, MM_SWAPENTS) +
                mm_pgtables_bytes(p->mm) / PAGE_SIZE;
        task_unlock(p);
        /* 利用以下公式对badness score值进行调整。 */
        adj *= totalpages / 1000;
        points += adj;
        /* 返回badness score,若等于0,则返回1。 */
        return points > 0 ? points : 1;
}

通过对Badness Score计算函数的分析,我们发现OOM Killer是基于RSS(常驻物理内存)来选择进程进行终止操作,从而释放相关内存以进行系统自我保护。有关OOM Killer的配置、查看及分析将在后续文章中详细介绍,请大家留意。

综上所述,本文主要通过对Linux内存结构、分析及OOM Killer三个核心维度,从主动和被动场景两方面对Linux操作系统内存进行剖析,探讨在实际业务场景中内存表现的相关活动及经验认知。关于Linux系统内存解析的内容到此结束,大家如有疑问、想法及建议,欢迎留言沟通。

相关专题

更多
spring框架介绍
spring框架介绍

本专题整合了spring框架相关内容,想了解更多详细内容,请阅读专题下面的文章。

102

2025.08.06

spring boot框架优点
spring boot框架优点

spring boot框架的优点有简化配置、快速开发、内嵌服务器、微服务支持、自动化测试和生态系统支持。本专题为大家提供spring boot相关的文章、下载、课程内容,供大家免费下载体验。

135

2023.09.05

spring框架有哪些
spring框架有哪些

spring框架有Spring Core、Spring MVC、Spring Data、Spring Security、Spring AOP和Spring Boot。详细介绍:1、Spring Core,通过将对象的创建和依赖关系的管理交给容器来实现,从而降低了组件之间的耦合度;2、Spring MVC,提供基于模型-视图-控制器的架构,用于开发灵活和可扩展的Web应用程序等。

389

2023.10.12

Java Spring Boot开发
Java Spring Boot开发

本专题围绕 Java 主流开发框架 Spring Boot 展开,系统讲解依赖注入、配置管理、数据访问、RESTful API、微服务架构与安全认证等核心知识,并通过电商平台、博客系统与企业管理系统等项目实战,帮助学员掌握使用 Spring Boot 快速开发高效、稳定的企业级应用。

68

2025.08.19

Java Spring Boot 4更新教程_Java Spring Boot 4有哪些新特性
Java Spring Boot 4更新教程_Java Spring Boot 4有哪些新特性

Spring Boot 是一个基于 Spring 框架的 Java 开发框架,它通过 约定优于配置的原则,大幅简化了 Spring 应用的初始搭建、配置和开发过程,让开发者可以快速构建独立的、生产级别的 Spring 应用,无需繁琐的样板配置,通常集成嵌入式服务器(如 Tomcat),提供“开箱即用”的体验,是构建微服务和 Web 应用的流行工具。

33

2025.12.22

Java Spring Boot 微服务实战
Java Spring Boot 微服务实战

本专题深入讲解 Java Spring Boot 在微服务架构中的应用,内容涵盖服务注册与发现、REST API开发、配置中心、负载均衡、熔断与限流、日志与监控。通过实际项目案例(如电商订单系统),帮助开发者掌握 从单体应用迁移到高可用微服务系统的完整流程与实战能力。

114

2025.12.24

堆和栈的区别
堆和栈的区别

堆和栈的区别:1、内存分配方式不同;2、大小不同;3、数据访问方式不同;4、数据的生命周期。本专题为大家提供堆和栈的区别的相关的文章、下载、课程内容,供大家免费下载体验。

389

2023.07.18

堆和栈区别
堆和栈区别

堆(Heap)和栈(Stack)是计算机中两种常见的内存分配机制。它们在内存管理的方式、分配方式以及使用场景上有很大的区别。本文将详细介绍堆和栈的特点、区别以及各自的使用场景。php中文网给大家带来了相关的教程以及文章欢迎大家前来学习阅读。

571

2023.08.10

Golang gRPC 服务开发与Protobuf实战
Golang gRPC 服务开发与Protobuf实战

本专题系统讲解 Golang 在 gRPC 服务开发中的完整实践,涵盖 Protobuf 定义与代码生成、gRPC 服务端与客户端实现、流式 RPC(Unary/Server/Client/Bidirectional)、错误处理、拦截器、中间件以及与 HTTP/REST 的对接方案。通过实际案例,帮助学习者掌握 使用 Go 构建高性能、强类型、可扩展的 RPC 服务体系,适用于微服务与内部系统通信场景。

8

2026.01.15

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
最新Python教程 从入门到精通
最新Python教程 从入门到精通

共4课时 | 0.9万人学习

Rust 教程
Rust 教程

共28课时 | 4.4万人学习

Kotlin 教程
Kotlin 教程

共23课时 | 2.5万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号