K3s 集群突然大量 pod 变成 Evicted 状态怎么找触发原因

舞夢輝影

发布时间：2026-01-17 23:53:02

739人浏览过

来源于php中文网

原创

Evicted 由节点资源压力或 kubelet 配置异常触发，需依次检查 MemoryPressure/DiskPressure、kubelet 日志中的 eviction manager 提示、镜像/日志堆积情况，以及 config.yaml 中过激的 eviction-hard 设置。

k3s 集群突然大量 pod 变成 evicted 状态怎么找触发原因

直接查节点资源和 kubelet 日志，Evicted 不是随机发生的，背后一定有明确的触发信号。

先看节点有没有资源压力

Evicted 最常见原因是节点资源耗尽。重点检查三类指标：

内存：运行 kubectl describe node ，看 Conditions 下是否出现 MemoryPressure True
磁盘：同样在 describe node 输出里找 DiskPressure；也可登录节点执行 df -h 和 df -i，特别关注 /var/lib/kubelet 和容器运行时（如 /var/lib/rancher/k3s/agent/containerd）所在分区
inodes 耗尽：即使磁盘空间没满，df -i 显示 inode 使用率 100% 同样会触发驱逐，常见于大量小日志文件或未清理的临时镜像层

再查 kubelet 的实时行为

K3s 的 kubelet 日志是核心线索，它会明确记录“为什么驱逐”：

薏米AI

YMI.AI-快捷、高效的人工智能创作平台

下载

在对应节点上执行：journalctl -u k3s -n 200 --no-pager | grep -i -E "(evict|pressure|failed|gc)"
重点关注含 eviction manager、NodeHasMemoryPressure、NodeHasDiskPressure 或 imageGC failed 的行
如果看到类似 evicting pod: xxx, reason: memory usage is over threshold，就锁定了根本原因

确认是不是镜像或日志堆积导致

K3s 环境中，镜像 GC 失败或 Pod 日志无限制增长是高频诱因：

检查镜像数量：crictl images | wc -l，若超千个且长期未清理，可能触发 imageGCFailed
查日志目录大小：du -sh /var/lib/rancher/k3s/agent/logs/* 或挂载到节点的 emptyDir、hostPath 日志路径
是否有 Pod 配置了 limitRange 但没设日志轮转，导致单个容器日志涨到几十 GB

顺手验证下有没有配置异常

某些 K3s 启动参数会放大驱逐敏感度：

检查 /etc/rancher/k3s/config.yaml 是否设置了过激的 eviction-hard，比如 memory.available 或 nodefs.available
确认没有误删 systemd 单元文件或修改过 k3s.service 的内存限制（如 MemoryLimit=），导致 kubelet 自身被 OOM kill 后反复重启并误报压力
运行 kubectl get events --sort-by=.lastTimestamp，过滤出最近 1 小时内带 Evicted 或 NodeNotReady 的事件，看是否集中在某个节点或时间点

使用宝塔在服务器上部署 Vue + Node 项目全流程

【玩转 Cloud Studio】以 Rust 为例定制自己的开发环境

十一、可观测性——你的应用健康吗

VS Code的Git Control无法正确识别husky(NVM)问题

CentOS7环境安装Kubernetes四部曲之四：安装kubectl工具

相关标签:

node ai 为什么 sort 堆 var 事件 kubelet rancher

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：sudo 命令执行时报 “sudo: sorry, you must have a tty to run sudo” 怎么解决下一篇：暂无

作者最新文章

艾诺迪亚4怎么刷装备_艾诺迪亚4刷紫装BOSS位置攻略

2026-01-16 10:37

联发科发表天玑9500s、8500 抢攻高阶与轻旗舰市场

2026-01-16 10:43

IP地址查询本机官网_IP地址在线查询官方正版

2026-01-16 10:52

b站在线观看人数在哪里看 b站实时观看人数查询【指南】

2026-01-16 11:02

抖音怎么解绑银行卡抖音银行卡解除绑定教程

2026-01-16 11:07

苹果序列号以L开头生产地是哪里_L开头苹果序列号代表哪个工厂

2026-01-16 11:10

发票查询全国统一发票平台官网网址_全国发票查验平台国家税务总局官方入口

2026-01-16 11:15

公积金个人账户余额官网查询入口

2026-01-16 11:23

booking预订酒店步骤 booking预订酒店教程

2026-01-16 11:24

booking官网首页 booking网页版入口

2026-01-16 11:26

热门AI工具

DeepSeek

幻方量化公司旗下的开源大模型平台

AI大模型

开放平台

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI大模型

通义千问

阿里巴巴推出的全能AI助手

AI大模型

腾讯元宝

腾讯混元平台推出的AI助手

文档处理

Excel 表格

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

AI大模型

中文写作

讯飞写作

基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

中文写作

写作工具

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

图片拼接

图画生成

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI大模型

中文写作

智谱清言 - 免费全能的AI助手

AI大模型

PDF 文档

相关专题

sort排序函数用法

sort排序函数的用法：1、对列表进行排序，默认情况下，sort函数按升序排序，因此最终输出的结果是按从小到大的顺序排列的；2、对元组进行排序，默认情况下，sort函数按元素的大小进行排序，因此最终输出的结果是按从小到大的顺序排列的；3、对字典进行排序，由于字典是无序的，因此排序后的结果仍然是原来的字典，使用一个lambda表达式作为key参数的值，用于指定排序的依据。

386

2023.09.04

堆和栈的区别

堆和栈的区别：1、内存分配方式不同；2、大小不同；3、数据访问方式不同；4、数据的生命周期。本专题为大家提供堆和栈的区别的相关的文章、下载、课程内容，供大家免费下载体验。

390

2023.07.18

堆和栈区别

堆(Heap)和栈(Stack)是计算机中两种常见的内存分配机制。它们在内存管理的方式、分配方式以及使用场景上有很大的区别。本文将详细介绍堆和栈的特点、区别以及各自的使用场景。php中文网给大家带来了相关的教程以及文章欢迎大家前来学习阅读。

572

2023.08.10

高德地图升级方法汇总

本专题整合了高德地图升级相关教程，阅读专题下面的文章了解更多详细内容。

2026.01.16

全民K歌得高分教程大全

本专题整合了全民K歌得高分技巧汇总，阅读专题下面的文章了解更多详细内容。

2026.01.16

C++ 单元测试与代码质量保障

本专题系统讲解 C++ 在单元测试与代码质量保障方面的实战方法，包括测试驱动开发理念、Google Test/Google Mock 的使用、测试用例设计、边界条件验证、持续集成中的自动化测试流程，以及常见代码质量问题的发现与修复。通过工程化示例，帮助开发者建立可测试、可维护、高质量的 C++ 项目体系。

2026.01.16