PCEVA,PC绝对领域,探寻真正的电脑知识

标题: 如何找出阵列中损坏的硬盘 [打印本页]

作者: kknd1928    时间: 2018-4-30 09:22
标题: 如何找出阵列中损坏的硬盘
如何找出阵列中损坏的硬盘?机器上面接了十几个硬盘,有个硬盘坏了,只能在RAID 控制器上面根据硬盘SN找吗?请指教。
CDB 信息上面好像没有这个?RAID控制器是LSI 9271-8i 接 SAS扩展卡 HP 468406-b21。

控制器日志:
第24号硬盘Offline了是这样的:
Controller ID: 0 Error: Port 0 - 3:1:0 (Error 244)
Controller ID: 0 PD Reset: PD = Port 0 - 3:1:0, Error = 3, Path = 0x500143800791E906
Controller ID: 0 State change: PD = Port 0 - 3:1:0 Previous = Online Current = Configured - Shielded
Controller ID: 0 Diagnostics failed for PD : Port 0 - 3:1:0

第16号硬盘Offline是这样的:
Controller ID:  0 Event From : 172.25.10.10   Unexpected sense:   PD  =   -:-:0Logical unit failed self-test,   CDB   =    0x1d 0x04 0x00 0x00 0x00 0x00    ,   Sense   = 0x70 0x00 0x04 0x00 0x00 0x00 0x00 0x0a 0x00 0x00 0x00 0x00 0x3e 0x03 0x00 0x00 0x00 0x00
Controller ID:  0 Event From : 172.25.10.10  Diagnostics failed on PD:   -:-:0
Controller ID:  0 Event From : 172.25.10.10   State change:   PD  =   -:-:0  Previous   =   Configured - shielded Current   =   Failed




作者: 幻风灵月    时间: 2018-4-30 09:29
不是有灯么,阵列灯

作者: kknd1928    时间: 2018-4-30 09:33
幻风灵月 发表于 2018-4-30 09:29
不是有灯么,阵列灯

DIY机器没有可以接SGPIO的面板。

作者: XXHJACK    时间: 2018-4-30 19:11
难道不报坏的接口位?
作者: nighttob    时间: 2018-4-30 20:23
你这个SAS Expander跟RAID卡不兼容吧,port# enclosure# slot#全是无效值

2017-05-30 5个盘做了一个OCE
2017-06-01 OCE完成,报了一个PD       =   12Invalid field in CDB
2017-09-26 Patrol Read中发现PD   -:-:0      Location   0x1535d78硬盘有坏道,然后修复了
2017-11-21 Patrol Read中发现PD   -:-:0      Location   0x1533168硬盘有坏道,然后修复了
2017-11-27 3个盘新建了一个VD1和VD2,报了五个PD       =   12Invalid field in CDB,还重启了16回?
2018-01-13 1个盘硬重置,指令超时
2018-01-24 Patrol Read中发现PD   -:-:0      Location   0x1531550硬盘有坏道,然后修复了
2018-02-05 发现PD       =   -:-:0多个不可纠正错误,坏道记录;1个盘硬重置,指令超时;阵列卡硬重置
2018-02-06 VD2中一个硬盘多个不可纠正错误,坏道记录;没完没了的报错,直到02-28
2018-03-06 阵列卡硬重置;1个盘硬重置,指令超时,判fail;VD1 offline;Cache pinned,全局read ahead被禁用;硬盘被拔出,然后重新插回;VD2数据错误;强制上线硬盘,VD1恢复;硬盘硬重置,指令超时,判fail;VD1 offline;Cache pinned,全局read ahead被禁用;硬盘被拔出,然后重新插回;VD2数据错误;强制上线硬盘,VD1恢复
2018-03-07 1个盘硬重置,指令超时;VD2中一个硬盘多个不可纠正错误,坏道记录;没完没了的报错
2018-03-14 一个硬盘多个不可纠正错误,坏道记录;没完没了的报错

有一堆的Unexpected sense我就不都列了,肯定是阵列卡和Expander不兼容
先收个log看看吧

storcli /c0 show all
storcli /c0 /dall show all
storcli /c0 /eall show all
storcli /c0 /eall /sall show all
不过我觉得收出来的也都是无效值

作者: nighttob    时间: 2018-4-30 20:27
4_30那个log看起来太痛苦,不看了
已经很痛苦了
作者: kknd1928    时间: 2018-5-1 16:05
nighttob 发表于 2018-4-30 20:23
你这个SAS Expander跟RAID卡不兼容吧,port# enclosure# slot#全是无效值

2017-05-30 5个盘做了一个OCE

噢,阵列卡和Expander不兼容这个事情还真没想过。看来现在只能查SN了,感谢。

作者: BI4RMD    时间: 2018-5-12 22:25
版主厉害,看日志发现这么多问题,我工作中也会碰到很多RAID卡重置,有时间向您请教





欢迎光临 PCEVA,PC绝对领域,探寻真正的电脑知识 (https://bbs.pceva.com.cn/) Powered by Discuz! X3.2