systemd-oomd 杀错进程或不杀的优先级/score 配置经验

舞夢輝影

发布时间：2026-01-25 19:04:02

882人浏览过

来源于php中文网

原创

systemd-oomd 不依赖 /proc/*/oom_score_adj 直接排序，而是综合 OOMScoreAdj、cgroup v2 内存压力、cgroup 层级权重及关键进程标记来判定优先级；要避免被杀，需设 OOMScoreAdjust=-1000 并配合 MemoryMax、MemoryLow、独立 cgroup 及启用 systemd-oomd。

systemd-oomd 杀错进程或不杀的优先级/score 配置经验

systemd-oomd 的进程优先级判定依据是 `OOMScoreAdj` 和内存压力信号

systemd-oomd 不读取传统内核 OOM killer 的 /proc/*/oom_score_adj 值做直接排序，而是结合：
– 进程的 OOMScoreAdj 设置（范围 -1000 ~ +1000）
– 实时内存压力指标（来自 cgroup v2 memory.pressure）
– 进程所属 cgroup 的层级与权重（如用户会话、服务 scope）
– 是否为“关键进程”（例如标记了 MemoryLimit= 或 OOMScoreAdjust= 的 service）
它默认更倾向杀死低优先级、高内存占用、且处于高压力 cgroup 中的进程，而非单纯看谁的 OOMScoreAdj 数值最高。

如何让某个进程「不被 systemd-oomd 杀」：设负值 + 锁定 cgroup 资源

仅设 OOMScoreAdjust=-1000 不够可靠——systemd-oomd 会降权但不跳过；必须配合资源约束和 cgroup 稳定性措施：

在对应 unit 文件中设置 OOMScoreAdjust=-1000（注意是负值，越小越不易杀）
显式限制内存上限：MemoryMax=2G（避免该进程拖垮整个 cgroup）
启用内存压控：MemoryLow=512M，让内核提前回收其 page cache，降低压力传导
确保该 service 运行在独立 scope 或 slice 下（避免被父 cgroup 的压力波及）
禁用自动 OOM 处理（谨慎）：OOMPolicy=continue（仅适用于你完全接管内存管理的场景）

为什么改了 `OOMScoreAdj` 却没效果？常见配置盲区

systemd-oomd 只作用于启用 cgroup v2 且启用了 SystemMaxUse= 类内存策略的系统；以下情况会导致配置失效：

Mulan AI

画布式AI视频创作平台，轻松制作爆款视频

下载

系统仍运行在 cgroup v1 模式（检查 cat /proc/1/environ | tr '\0' '\n' | grep systemd 中是否有 systemd.unified_cgroup_hierarchy=1）
unit 启动后被动态移动到其他 cgroup（例如被 systemd-run --scope 临时包裹，或桌面环境 session manager 重挂载）
OOMScoreAdjust= 写在了错误的 unit 类型里：对 .service 有效，但对 .slice 或 .scope 无效（后者需用 DefaultLimitMEM= 或 cgroup 属性接口）
systemd-oomd 本身被禁用：sudo systemctl is-active systemd-oomd 返回 inactive，需 sudo systemctl enable --now systemd-oomd

验证和调试：别只看日志，要查实时 score 和 pressure

journalctl 日志（如 systemd-oomd[...]: Killed process ...）只告诉你“结果”，无法反映决策逻辑。真要定位误杀，得实时比对：

查当前各进程 OOMScoreAdj：awk '/^OOMScoreAdj:/ {print $2}' /proc/*/status 2>/dev/null | sort -n | tail -10
查所属 cgroup 的压力等级：cat /sys/fs/cgroup/user.slice/memory.pressure（关注 some 和 full 字段的 10s/60s/600s 均值）
看 systemd-oomd 内部评估：sudo systemd-oomdctl status（显示当前活跃的 high-pressure cgroups 和 top candidate 进程）
模拟压力测试：stress-ng --vm 2 --vm-bytes 3G --timeout 30s，再立刻执行上述检查

真正容易被忽略的是：systemd-oomd 的评分每 2 秒刷新一次，且会平滑衰减历史压力；短时峰值可能被忽略，而持续中低压力却可能触发更激进的回收——这和传统 OOM killer 的瞬时快照逻辑完全不同。

Linux高可用系统设计教程_多活架构解析

Linux 安全：如何安全管理 API 密钥 / JWT / Session

Linux PAM模块配置与使用指南

Linux怎么踢出指定的登录用户

如何在Linux中配置PAM模块 Linux认证流程定制方法

相关标签:

session ai 内存占用为什么 print NULL sort Session continue 接口 tr

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：服务器随机丢包但 ping 延迟正常的 perf + bpftrace 抓包定位下一篇：暂无

作者最新文章

Win11 系统使用技巧有哪些？Win11 系统实用技巧整理说明

2026-01-24 17:30

SQL 分布式架构下的数据一致性

2026-01-24 17:32

Windows 激活怎么关闭？Windows 激活关闭设置说明

2026-01-24 17:43

logging.handlers.RotatingFileHandler 如何设置按大小+时间双重轮转

2026-01-24 17:45

random: crng init 卡死几分钟的 haveged/rng-tools 加速方案

2026-01-24 17:46

lsof +L1 显示大量 (deleted) 文件占用空间的批量安全释放

2026-01-24 17:47

chrony sources 显示 stratum 16 或 delay 极大但 ntpdate 能同步的原因

2026-01-24 17:55

Win11 系统盘制作怎么做？Win11 系统盘制作工具与步骤说明

2026-01-24 18:01

Linux 存储扩容如何做到不停机？

2026-01-24 18:01

pandas 如何在 read_csv 时自动推断 bool 类型而不误判

2026-01-24 18:03

热门AI工具

DeepSeek

幻方量化公司旗下的开源大模型平台

AI大模型

开放平台

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI大模型

通义千问

阿里巴巴推出的全能AI助手

AI大模型

腾讯元宝

腾讯混元平台推出的AI助手

文档处理

Excel 表格

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

AI大模型

中文写作

讯飞写作

基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

中文写作

写作工具

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

图片拼接

图画生成

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI大模型

中文写作

智谱清言 - 免费全能的AI助手

AI大模型

PC软件

相关专题

python中print函数的用法

python中print函数的语法是“print(value1, value2, ..., sep=' ', end=' ', file=sys.stdout, flush=False)”。本专题为大家提供print相关的文章、下载、课程内容，供大家免费下载体验。

186

2023.09.27

c语言中null和NULL的区别

c语言中null和NULL的区别是：null是C语言中的一个宏定义，通常用来表示一个空指针，可以用于初始化指针变量，或者在条件语句中判断指针是否为空；NULL是C语言中的一个预定义常量，通常用来表示一个空值，用于表示一个空的指针、空的指针数组或者空的结构体指针。

234

2023.09.22

java中null的用法

在Java中，null表示一个引用类型的变量不指向任何对象。可以将null赋值给任何引用类型的变量，包括类、接口、数组、字符串等。想了解更多null的相关内容，可以阅读本专题下面的文章。

437

2024.03.01

sort排序函数用法

sort排序函数的用法：1、对列表进行排序，默认情况下，sort函数按升序排序，因此最终输出的结果是按从小到大的顺序排列的；2、对元组进行排序，默认情况下，sort函数按元素的大小进行排序，因此最终输出的结果是按从小到大的顺序排列的；3、对字典进行排序，由于字典是无序的，因此排序后的结果仍然是原来的字典，使用一个lambda表达式作为key参数的值，用于指定排序的依据。

389

2023.09.04

session失效的原因

session失效的原因有会话超时、会话数量限制、会话完整性检查、服务器重启、浏览器或设备问题等等。详细介绍：1、会话超时：服务器为Session设置了一个默认的超时时间，当用户在一段时间内没有与服务器交互时，Session将自动失效；2、会话数量限制：服务器为每个用户的Session数量设置了一个限制，当用户创建的Session数量超过这个限制时，最新的会覆盖最早的等等。

315

2023.10.17