PCEVA,PC绝对领域,探寻真正的电脑知识
开启左侧

如何找出阵列中损坏的硬盘

[复制链接]
kknd1928 发表于 2018-4-30 09:22 | 显示全部楼层 |阅读模式
点击数:921|回复数:7
如何找出阵列中损坏的硬盘?机器上面接了十几个硬盘,有个硬盘坏了,只能在RAID 控制器上面根据硬盘SN找吗?请指教。
CDB 信息上面好像没有这个?RAID控制器是LSI 9271-8i 接 SAS扩展卡 HP 468406-b21。

控制器日志:
第24号硬盘Offline了是这样的:
Controller ID: 0 Error: Port 0 - 3:1:0 (Error 244)
Controller ID: 0 PD Reset: PD = Port 0 - 3:1:0, Error = 3, Path = 0x500143800791E906
Controller ID: 0 State change: PD = Port 0 - 3:1:0 Previous = Online Current = Configured - Shielded
Controller ID: 0 Diagnostics failed for PD : Port 0 - 3:1:0

第16号硬盘Offline是这样的:
Controller ID:  0 Event From : 172.25.10.10   Unexpected sense:   PD  =   -:-:0Logical unit failed self-test,   CDB   =    0x1d 0x04 0x00 0x00 0x00 0x00    ,   Sense   = 0x70 0x00 0x04 0x00 0x00 0x00 0x00 0x0a 0x00 0x00 0x00 0x00 0x3e 0x03 0x00 0x00 0x00 0x00
Controller ID:  0 Event From : 172.25.10.10  Diagnostics failed on PD:   -:-:0
Controller ID:  0 Event From : 172.25.10.10   State change:   PD  =   -:-:0  Previous   =   Configured - shielded Current   =   Failed



本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?注册

x
幻风灵月 发表于 2018-4-30 09:29 | 显示全部楼层
不是有灯么,阵列灯
来自苹果客户端来自苹果客户端
kknd1928  楼主| 发表于 2018-4-30 09:33 | 显示全部楼层
幻风灵月 发表于 2018-4-30 09:29
不是有灯么,阵列灯

DIY机器没有可以接SGPIO的面板。
XXHJACK 发表于 2018-4-30 19:11 | 显示全部楼层
难道不报坏的接口位?
nighttob 发表于 2018-4-30 20:23 | 显示全部楼层
你这个SAS Expander跟RAID卡不兼容吧,port# enclosure# slot#全是无效值

2017-05-30 5个盘做了一个OCE
2017-06-01 OCE完成,报了一个PD       =   12Invalid field in CDB
2017-09-26 Patrol Read中发现PD   -:-:0      Location   0x1535d78硬盘有坏道,然后修复了
2017-11-21 Patrol Read中发现PD   -:-:0      Location   0x1533168硬盘有坏道,然后修复了
2017-11-27 3个盘新建了一个VD1和VD2,报了五个PD       =   12Invalid field in CDB,还重启了16回?
2018-01-13 1个盘硬重置,指令超时
2018-01-24 Patrol Read中发现PD   -:-:0      Location   0x1531550硬盘有坏道,然后修复了
2018-02-05 发现PD       =   -:-:0多个不可纠正错误,坏道记录;1个盘硬重置,指令超时;阵列卡硬重置
2018-02-06 VD2中一个硬盘多个不可纠正错误,坏道记录;没完没了的报错,直到02-28
2018-03-06 阵列卡硬重置;1个盘硬重置,指令超时,判fail;VD1 offline;Cache pinned,全局read ahead被禁用;硬盘被拔出,然后重新插回;VD2数据错误;强制上线硬盘,VD1恢复;硬盘硬重置,指令超时,判fail;VD1 offline;Cache pinned,全局read ahead被禁用;硬盘被拔出,然后重新插回;VD2数据错误;强制上线硬盘,VD1恢复
2018-03-07 1个盘硬重置,指令超时;VD2中一个硬盘多个不可纠正错误,坏道记录;没完没了的报错
2018-03-14 一个硬盘多个不可纠正错误,坏道记录;没完没了的报错

有一堆的Unexpected sense我就不都列了,肯定是阵列卡和Expander不兼容
先收个log看看吧

storcli /c0 show all
storcli /c0 /dall show all
storcli /c0 /eall show all
storcli /c0 /eall /sall show all
不过我觉得收出来的也都是无效值
nighttob 发表于 2018-4-30 20:27 | 显示全部楼层
4_30那个log看起来太痛苦,不看了
已经很痛苦了
kknd1928  楼主| 发表于 2018-5-1 16:05 | 显示全部楼层
nighttob 发表于 2018-4-30 20:23
你这个SAS Expander跟RAID卡不兼容吧,port# enclosure# slot#全是无效值

2017-05-30 5个盘做了一个OCE

噢,阵列卡和Expander不兼容这个事情还真没想过。看来现在只能查SN了,感谢。
BI4RMD 发表于 2018-5-12 22:25 | 显示全部楼层
版主厉害,看日志发现这么多问题,我工作中也会碰到很多RAID卡重置,有时间向您请教
来自苹果客户端来自苹果客户端
您需要登录后才可以回帖 登录 | 注册

本版积分规则

快速回复 返回顶部