PCEVA,PC绝对领域,探寻真正的电脑知识
打印 上一主题 下一主题
开启左侧

如何找出阵列中损坏的硬盘

[复制链接]
跳转到指定楼层
1#
kknd1928 发表于 2018-4-30 09:22 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
点击数:6884|回复数:7
如何找出阵列中损坏的硬盘?机器上面接了十几个硬盘,有个硬盘坏了,只能在RAID 控制器上面根据硬盘SN找吗?请指教。
CDB 信息上面好像没有这个?RAID控制器是LSI 9271-8i 接 SAS扩展卡 HP 468406-b21。

控制器日志:
第24号硬盘Offline了是这样的:
Controller ID: 0 Error: Port 0 - 3:1:0 (Error 244)
Controller ID: 0 PD Reset: PD = Port 0 - 3:1:0, Error = 3, Path = 0x500143800791E906
Controller ID: 0 State change: PD = Port 0 - 3:1:0 Previous = Online Current = Configured - Shielded
Controller ID: 0 Diagnostics failed for PD : Port 0 - 3:1:0

第16号硬盘Offline是这样的:
Controller ID:  0 Event From : 172.25.10.10   Unexpected sense:   PD  =   -:-:0Logical unit failed self-test,   CDB   =    0x1d 0x04 0x00 0x00 0x00 0x00    ,   Sense   = 0x70 0x00 0x04 0x00 0x00 0x00 0x00 0x0a 0x00 0x00 0x00 0x00 0x3e 0x03 0x00 0x00 0x00 0x00
Controller ID:  0 Event From : 172.25.10.10  Diagnostics failed on PD:   -:-:0
Controller ID:  0 Event From : 172.25.10.10   State change:   PD  =   -:-:0  Previous   =   Configured - shielded Current   =   Failed



本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?注册

x
2#
幻风灵月 发表于 2018-4-30 09:29 | 只看该作者
不是有灯么,阵列灯
来自苹果客户端来自苹果客户端
3#
kknd1928  楼主| 发表于 2018-4-30 09:33 | 只看该作者
幻风灵月 发表于 2018-4-30 09:29
不是有灯么,阵列灯

DIY机器没有可以接SGPIO的面板。
4#
XXHJACK 发表于 2018-4-30 19:11 | 只看该作者
难道不报坏的接口位?
5#
nighttob 发表于 2018-4-30 20:23 | 只看该作者
你这个SAS Expander跟RAID卡不兼容吧,port# enclosure# slot#全是无效值

2017-05-30 5个盘做了一个OCE
2017-06-01 OCE完成,报了一个PD       =   12Invalid field in CDB
2017-09-26 Patrol Read中发现PD   -:-:0      Location   0x1535d78硬盘有坏道,然后修复了
2017-11-21 Patrol Read中发现PD   -:-:0      Location   0x1533168硬盘有坏道,然后修复了
2017-11-27 3个盘新建了一个VD1和VD2,报了五个PD       =   12Invalid field in CDB,还重启了16回?
2018-01-13 1个盘硬重置,指令超时
2018-01-24 Patrol Read中发现PD   -:-:0      Location   0x1531550硬盘有坏道,然后修复了
2018-02-05 发现PD       =   -:-:0多个不可纠正错误,坏道记录;1个盘硬重置,指令超时;阵列卡硬重置
2018-02-06 VD2中一个硬盘多个不可纠正错误,坏道记录;没完没了的报错,直到02-28
2018-03-06 阵列卡硬重置;1个盘硬重置,指令超时,判fail;VD1 offline;Cache pinned,全局read ahead被禁用;硬盘被拔出,然后重新插回;VD2数据错误;强制上线硬盘,VD1恢复;硬盘硬重置,指令超时,判fail;VD1 offline;Cache pinned,全局read ahead被禁用;硬盘被拔出,然后重新插回;VD2数据错误;强制上线硬盘,VD1恢复
2018-03-07 1个盘硬重置,指令超时;VD2中一个硬盘多个不可纠正错误,坏道记录;没完没了的报错
2018-03-14 一个硬盘多个不可纠正错误,坏道记录;没完没了的报错

有一堆的Unexpected sense我就不都列了,肯定是阵列卡和Expander不兼容
先收个log看看吧

storcli /c0 show all
storcli /c0 /dall show all
storcli /c0 /eall show all
storcli /c0 /eall /sall show all
不过我觉得收出来的也都是无效值
6#
nighttob 发表于 2018-4-30 20:27 | 只看该作者
4_30那个log看起来太痛苦,不看了
已经很痛苦了
7#
kknd1928  楼主| 发表于 2018-5-1 16:05 | 只看该作者
nighttob 发表于 2018-4-30 20:23
你这个SAS Expander跟RAID卡不兼容吧,port# enclosure# slot#全是无效值

2017-05-30 5个盘做了一个OCE

噢,阵列卡和Expander不兼容这个事情还真没想过。看来现在只能查SN了,感谢。
8#
BI4RMD 发表于 2018-5-12 22:25 | 只看该作者
版主厉害,看日志发现这么多问题,我工作中也会碰到很多RAID卡重置,有时间向您请教
来自苹果客户端来自苹果客户端
您需要登录后才可以回帖 登录 | 注册

本版积分规则

快速回复 返回顶部