0

0

mdadm RAID degraded 后如何判断是哪块盘真坏(smart 值对比)

舞夢輝影

舞夢輝影

发布时间:2026-01-19 17:20:03

|

309人浏览过

|

来源于php中文网

原创

RAID degraded时需结合/proc/mdstat与SMART数据交叉验证故障盘:先通过[2/1][\_U]等标记定位离线盘,再用smartctl -a检查Reallocated_Sector_Ct、Current_Pending_Sector、Offline_Uncorrect三项原始值,横向对比同组硬盘并辅以dmesg和物理连接排查。

mdadm raid degraded 后如何判断是哪块盘真坏(smart 值对比)

mdadm 显示 RAID 处于 degraded 状态(如 [2/1] [_U]),说明至少有一块成员盘已失效或被移出阵列。但“失效”不等于“物理损坏”——可能是临时掉线、连接松动、控制器误判,也可能是硬盘真实老化或坏道累积。要确认哪块盘真坏,不能只看 /proc/mdstat,必须结合 SMART 数据交叉验证。

先定位疑似故障盘

/proc/mdstat 输出中识别异常标记:

  • [2/1] [_U]:2块盘参与,仅1块在线;下划线 _ 对应的盘(通常是第一块)已离线
  • [3/2] [UU_]:第3块盘状态为 _,即它已不可用
  • 同时运行 mdadm --detail /dev/mdX,查看 State : 行和每块设备后的 FaultyRemoved 或空状态

对每块成员盘执行 SMART 全面检测

不要只看 smartctl -H /dev/sdX 的 summary,它可能显示 PASSED 却掩盖严重隐患。重点检查以下三项原始值(Raw Value):

  • Reallocated_Sector_Ct (ID 5):重映射扇区总数。值 > 0 就需警惕;> 50 基本可判定盘体开始劣化
  • Current_Pending_Sector (ID 197 / C5):等待重映射的扇区数。> 0 表示有读取失败扇区,尚未完成重映射,属于高危信号
  • Offline_Uncorrect (ID 198 / C6):离线无法纠正错误数。> 0 意味着硬盘在自检时发现坏道但无法修复,是物理损坏的强证据

执行命令:
smartctl -a /dev/sdX | grep -E "(Reallocated_Sector_Ct|Current_Pending_Sector|Offline_Uncorrect)"

百度MCP广场
百度MCP广场

探索海量可用的MCP Servers

下载

对比分析:关键看变化趋势与绝对值

同一 RAID 组内各盘应使用同型号、相近服役时间。横向对比更有效:

  • 若某盘 Current_Pending_Sector 为 32,其余均为 0 → 这块盘正在“挣扎”,极可能即将 Failure
  • 若某盘 Reallocated_Sector_Ct 是 127,其他盘都是 0~3 → 它已启用大量备用扇区,寿命大幅缩短
  • 若某盘 Offline_Uncorrect > 0,而其他盘为 0 → 这块盘存在无法修复的物理缺陷,必须更换
  • 特别注意:SSD 要额外关注 Media_Wearout_Indicator (ID 233)Available_Reserve_Space (ID 234),低于 10% 需立即干预

辅助验证:检查系统日志与连接状态

SMART 是静态快照,还需动态佐证:

  • 查内核日志:dmesg | grep -i "sdX\|ata\|raid",找 ATA bus errorconnection timed outreset failed 等线索
  • 检查物理连接:lsblk 确认设备是否还在;lsscsi 查 SAS/SATA 链路是否识别正常;拔插后能否重新上线
  • 排除控制器问题:同一控制器下其他 RAID 组是否也出现 degraded?如果是,优先怀疑 RAID 卡或背板

相关专题

更多
scripterror怎么解决
scripterror怎么解决

scripterror的解决办法有检查语法、文件路径、检查网络连接、浏览器兼容性、使用try-catch语句、使用开发者工具进行调试、更新浏览器和JavaScript库或寻求专业帮助等。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

187

2023.10.18

500error怎么解决
500error怎么解决

500error的解决办法有检查服务器日志、检查代码、检查服务器配置、更新软件版本、重新启动服务、调试代码和寻求帮助等。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

288

2023.10.25

PHP WebSocket 实时通信开发
PHP WebSocket 实时通信开发

本专题系统讲解 PHP 在实时通信与长连接场景中的应用实践,涵盖 WebSocket 协议原理、服务端连接管理、消息推送机制、心跳检测、断线重连以及与前端的实时交互实现。通过聊天系统、实时通知等案例,帮助开发者掌握 使用 PHP 构建实时通信与推送服务的完整开发流程,适用于即时消息与高互动性应用场景。

11

2026.01.19

微信聊天记录删除恢复导出教程汇总
微信聊天记录删除恢复导出教程汇总

本专题整合了微信聊天记录相关教程大全,阅读专题下面的文章了解更多详细内容。

71

2026.01.18

高德地图升级方法汇总
高德地图升级方法汇总

本专题整合了高德地图升级相关教程,阅读专题下面的文章了解更多详细内容。

108

2026.01.16

全民K歌得高分教程大全
全民K歌得高分教程大全

本专题整合了全民K歌得高分技巧汇总,阅读专题下面的文章了解更多详细内容。

152

2026.01.16

C++ 单元测试与代码质量保障
C++ 单元测试与代码质量保障

本专题系统讲解 C++ 在单元测试与代码质量保障方面的实战方法,包括测试驱动开发理念、Google Test/Google Mock 的使用、测试用例设计、边界条件验证、持续集成中的自动化测试流程,以及常见代码质量问题的发现与修复。通过工程化示例,帮助开发者建立 可测试、可维护、高质量的 C++ 项目体系。

58

2026.01.16

java数据库连接教程大全
java数据库连接教程大全

本专题整合了java数据库连接相关教程,阅读专题下面的文章了解更多详细内容。

44

2026.01.15

Java音频处理教程汇总
Java音频处理教程汇总

本专题整合了java音频处理教程大全,阅读专题下面的文章了解更多详细内容。

20

2026.01.15

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
计算机系统从应用层到底层
计算机系统从应用层到底层

共6课时 | 0.3万人学习

开源物联网开发实例
开源物联网开发实例

共6课时 | 0.4万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号