Linux内存泄漏排查需先用free和vmstat观察available持续下降与buff/cache单向上涨、sr/si/so异常等表层信号,再结合ps、/proc/meminfo、slabtop、perf等工具定位进程或内核泄漏源。

Linux内存泄漏排查核心在于识别“持续增长且不释放”的内存占用,free 和 vmstat 是两个轻量、实时、无需安装的诊断入口工具,但它们只反映表层状态,需结合逻辑判断和进一步追踪才能定位真实泄漏点。
free -h(或 free -m)输出中重点关注三列:
free 列更真实反映系统余量;available 持续下降,需警惕 slab 或内核模块泄漏;建议每 5–10 秒运行一次观察:watch -n 5 'free -h'。若 available 持续走低、buff/cache 却未同步回落,说明有内存被“钉住”无法回收,可能是内核驱动、BPF 程序、或未正确释放的内核内存(如 kmalloc/kmem_cache_alloc 后未 kfree)。
vmstat 1 每秒输出一行,重点看以下字段:
available 走低。注意:vmstat 本身不显示谁占了内存,但它能告诉你“系统是否在挣扎”。如果 free 显示 available 快见底,而 vmstat 的 sr 居高不下、si/so 开始跳动,基本可确认存在未释放资源,下一步必须深入进程或内核层面。
仅靠 free/vmstat 无法定位到具体进程或代码行,但可快速缩小范围:
ps aux --sort=-%mem | head -10 查内存 RSS 最高的用户进程,检查其生命周期是否异常(如本该退出却常驻、连接数线性增长);cat /proc/meminfo | grep -E "SReclaimable|Slab|KernelStack|PageTables" 关注内核内存子系统:若 Slab 持续上涨且 SReclaimable 不增,大概率是 slab 分配器中某 kmem_cache 未释放对象(常见于驱动或内核模块);pmap -x <pid></pid> 看其地址空间分布,关注 anon 区域是否随时间不断扩张;slabtop 实时观察各缓存使用量,或通过 /sys/kernel/slab/ 下各 cache 目录的 objects、slabs 文件跟踪增长;perf record -e kmem:kmalloc,kmem:kfree -a sleep 30 录制内核内存事件,再用 perf script 分析分配/释放是否匹配(需开启 CONFIG_KPROBE_EVENTS 和 debugfs)。别把“buff/cache 高”当泄漏——Linux 会尽可能利用空闲内存做缓存,这是设计优势;
别忽略内核模块或 eBPF 程序:它们分配的内存不会出现在用户进程 RSS 中,但会体现在 Slab 或直接占用直接映射区;
别依赖 top 的 %MEM 排序:它基于 VIRT 计算易失真,优先用 ps 的 RSS 或 PSS;
容器环境要进对应 cgroup 查 /sys/fs/cgroup/memory/xxx/memory.usage_in_bytes,宿主机 free 看不到容器内存上限外溢的真实压力。
以上就是Linux内存泄漏怎么排查_free与vmstat解析【教学】的详细内容,更多请关注php中文网其它相关文章!
每个人都需要一台速度更快、更稳定的 PC。随着时间的推移,垃圾文件、旧注册表数据和不必要的后台进程会占用资源并降低性能。幸运的是,许多工具可以让 Windows 保持平稳运行。
Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号