0

0

Linux存储运维最佳实践_长期运行经验解析【教程】

舞夢輝影

舞夢輝影

发布时间:2026-01-05 19:46:02

|

909人浏览过

|

来源于php中文网

原创

Linux存储运维稳定关键在变更可追溯、容量有余量、故障能自察;需排查df/du差异、合理配置挂载选项、优化rsync、用WWID绑定设备、监控LVM快照并规范操作。

linux存储运维最佳实践_长期运行经验解析【教程】

Linux存储运维没有银弹,长期稳定运行的关键不在“配置多炫酷”,而在“变更可追溯、容量有余量、故障能自察”。以下是从百台生产服务器、五年无重大存储事故中沉淀出的实操要点。

df 和 du 差异大到报警?先查 noatime 和挂载选项

常见现象:df -h 显示根分区 98% 满,但 du -sh /* 2>/dev/null | sort -hr | head -5 加起来才 60GB——差值不是小数点误差,而是真实磁盘空间被“吃掉”了。

  • 最常被忽略的是已删除但进程仍打开的文件:用 lsof +L1 查找处于 deleted 状态的句柄,重启对应服务或 kill 进程释放空间
  • noatime 虽能减少 IO,但某些监控脚本依赖 atime 判断文件活跃度,误判会导致归档逻辑失效;生产环境建议用 relatime 替代
  • XFS 文件系统启用 inode64 挂载选项后,xfs_info 显示的 agcount 可能影响大目录 ls 性能,不升级内核前勿在老硬件上盲目开启

rsync 同步大量小文件时卡在 “building file list”?别只加 -a

这个阶段本质是客户端扫描源目录生成文件列表,卡住说明 I/O 或内存受限,而非网络慢。

  • --files-from= 预先生成路径列表(用 find /src -type f -print0 | sort -z > list.txt),跳过递归扫描,提速 3–5 倍
  • 禁用 -a 中的 -o(属主)和 -g(属组):若目标端 UID/GID 映射不一致,会反复 stat 失败并重试,改用 -rltDv --chmod=Du=rwx,Dgo=rx,Fu=rw,Fgo=r
  • 对超过 100 万文件的同步任务,务必加 --max-alloc=1G 限制 rsync 自身内存用量,否则可能触发 OOM Killer 杀掉其他关键进程

udev 规则写错导致 /dev/sd* 顺序乱?用 WWID 绑定才是正解

依赖 /dev/sdb 这类内核分配名做 LVM PV 或数据库裸设备,机器重启后设备名漂移是高频事故源头。

CoCo
CoCo

智谱AI推出的首个有记忆的企业自主Agent智能体

下载
  • 永远不用 SUBSYSTEM=="block", KERNEL=="sd*", PROGRAM="/bin/bash -c 'echo $kernel'" 这类不可靠匹配;应查 scsi_id --whitelisted --replace-whitespace --device=/dev/sda 得到 WWID(如 360050763008000000000000000000001
  • udev 规则中必须用 SYMLINK+="disk-db-primary" 而非 NAME="disk-db-primary"(后者已被废弃且无效)
  • 规则生效后,检查 /dev/disk/by-id/wwn-0x 是否存在,并在 /etc/fstab 中直接引用该路径,避免任何中间层解析

LVM 快照撑爆 VG?监控不能只看 lv_size

快照逻辑卷(snapshot LV)本身不存数据,但其 COW(copy-on-write)元数据区会随原 LV 修改增长。一旦耗尽所在 VG 的剩余 PE,整个 VG 冻结,连 lvremove 都执行不了。

  • 监控指标必须包含:lvs -o lv_name,origin,snap_percent,vg_free,尤其关注 snap_percent 超过 70% 的快照
  • 创建快照时强制指定大小:lvcreate -s -L 5G -n snap_web /dev/vg0/www,绝不依赖默认(通常是原 LV 的 100%,极易误判)
  • 快照仅用于短时备份或测试,上线系统严禁用快照替代备份;lvconvert --merge 要求原 LV 未激活,合并前需停服务或卸载文件系统

真正难的不是命令怎么敲,而是每次 lvextend 前是否确认过文件系统支持在线扩容,每次 umount 前是否验证过 NFS 客户端已全部断开,每次 dd if=/dev/zero 清盘前是否 blkid 核对过设备号——这些动作没有日志自动记录,全靠人盯住。

相关专题

更多
c语言中null和NULL的区别
c语言中null和NULL的区别

c语言中null和NULL的区别是:null是C语言中的一个宏定义,通常用来表示一个空指针,可以用于初始化指针变量,或者在条件语句中判断指针是否为空;NULL是C语言中的一个预定义常量,通常用来表示一个空值,用于表示一个空的指针、空的指针数组或者空的结构体指针。

231

2023.09.22

java中null的用法
java中null的用法

在Java中,null表示一个引用类型的变量不指向任何对象。可以将null赋值给任何引用类型的变量,包括类、接口、数组、字符串等。想了解更多null的相关内容,可以阅读本专题下面的文章。

435

2024.03.01

if什么意思
if什么意思

if的意思是“如果”的条件。它是一个用于引导条件语句的关键词,用于根据特定条件的真假情况来执行不同的代码块。本专题提供if什么意思的相关文章,供大家免费阅读。

718

2023.08.22

sort排序函数用法
sort排序函数用法

sort排序函数的用法:1、对列表进行排序,默认情况下,sort函数按升序排序,因此最终输出的结果是按从小到大的顺序排列的;2、对元组进行排序,默认情况下,sort函数按元素的大小进行排序,因此最终输出的结果是按从小到大的顺序排列的;3、对字典进行排序,由于字典是无序的,因此排序后的结果仍然是原来的字典,使用一个lambda表达式作为key参数的值,用于指定排序的依据。

381

2023.09.04

数据库三范式
数据库三范式

数据库三范式是一种设计规范,用于规范化关系型数据库中的数据结构,它通过消除冗余数据、提高数据库性能和数据一致性,提供了一种有效的数据库设计方法。本专题提供数据库三范式相关的文章、下载和课程。

340

2023.06.29

如何删除数据库
如何删除数据库

删除数据库是指在MySQL中完全移除一个数据库及其所包含的所有数据和结构,作用包括:1、释放存储空间;2、确保数据的安全性;3、提高数据库的整体性能,加速查询和操作的执行速度。尽管删除数据库具有一些好处,但在执行任何删除操作之前,务必谨慎操作,并备份重要的数据。删除数据库将永久性地删除所有相关数据和结构,无法回滚。

2071

2023.08.14

vb怎么连接数据库
vb怎么连接数据库

在VB中,连接数据库通常使用ADO(ActiveX 数据对象)或 DAO(Data Access Objects)这两个技术来实现:1、引入ADO库;2、创建ADO连接对象;3、配置连接字符串;4、打开连接;5、执行SQL语句;6、处理查询结果;7、关闭连接即可。

346

2023.08.31

MySQL恢复数据库
MySQL恢复数据库

MySQL恢复数据库的方法有使用物理备份恢复、使用逻辑备份恢复、使用二进制日志恢复和使用数据库复制进行恢复等。本专题为大家提供MySQL数据库相关的文章、下载、课程内容,供大家免费下载体验。

253

2023.09.05

漫蛙2入口地址合集
漫蛙2入口地址合集

本专题整合了漫蛙2入口汇总,阅读专题下面的文章了解更多详细内容。

162

2026.01.06

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
PostgreSQL 教程
PostgreSQL 教程

共48课时 | 6.7万人学习

Git 教程
Git 教程

共21课时 | 2.5万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号