PCEVA,PC绝对领域,探寻真正的电脑知识

标题: 在OMV系统里更换RAID6坏掉的HDD以及RAID6扩容 [打印本页]

作者: overthink    时间: 2016-1-11 19:37
标题: 在OMV系统里更换RAID6坏掉的HDD以及RAID6扩容
前阵子为了更好的容错性,从RAID5升级到了RAID6
http://bbs.pceva.com.cn/thread-123836-1-1.html

哪知天有不测风云,盘有旦夕祸福。最近发现有一个盘出坏道了。

发现过程是这样的:

前几天随手翻看了一下硬盘SMART信息,发现有一个盘,/dev/sdc的温度有点高。

[attach]340686[/attach]

就顺手再点开看一下SMART详细信息,发现SMART 里Raw_Read_Error_Rate 不为0
[attach]340687[/attach]
查看了其它的几个盘,这个都是0。心里隐约感觉有些不对。

记下硬盘的SN,停机,拔下来,接到台机上用HDTUNE扫一下。

结果是这样的:

[attach]340688[/attach]


在少一个硬盘的状态下开机,RAID6运行在降级状态。不过依然在线,数据读写什么的都没问题。
[attach]340689[/attach]

虽说硬盘在保,但是返修来回也得一周多,赶紧从京东买了一个,顶上。

PS:京东的物流真快,今天买,明天到,在RAID6降级状态运行了二十来个小时后,新硬盘到了。

直接在不停机的状态下接到原来位置上。接好后,在物理磁盘页面就可以看到新加入的HDD了。顺手移到SMART页面,打开SMART监听。

[attach]340690[/attach]

下面是RAID6的重建:

移动到RAID管理页面,现在是在掉盘,降级状态。点上面的恢复

[attach]340691[/attach]

把/dev/sdc添加到阵列里面。
[attach]340692[/attach]

这样操作后,设备页面可以看到5个设备了,状态显示正在重建,有百分比及剩余时间显示
[attach]340693[/attach]

重建过程中的CPU使用率(单核心 E3 1230V2,大概有50%左右的占用。)
[attach]340694[/attach]

阵列详情
[attach]340695[/attach]

重建的时间不算慢,从17:10分开始,到22:40,五个半小时,就搞到82%了。
由于时间太晚,没继续等,第二天起来查看,一切搞定

[attach]340696[/attach]


三天后返回京东的硬盘,来电话说给换新,保修时间按照原来的计。自然同意了。
        
第二天,收到的硬盘是这个样子的:

[attach]340697[/attach]
上面有FRU显示比较奇怪,一般品牌机才有这个编号。

直接热插到OMV系统里去。

[attach]340698[/attach]
物理磁盘页面顺利认到。

到RAID管理,扩充一下

[attach]340699[/attach]

扩充的时候没有进度百分比。只显示reshaping
[attach]340700[/attach]

不过这难不到我们,选中RAID点,开细节,这里有进度百分比显示了
[attach]340701[/attach]
耗时比较长,建议晚上搞,第二天起来查看一下,如果完成,到文件系统页面调整一下大小就可以正常使用了。

总结:

LSI 9211 8i可以进行热插拔操作。如果你确认不会拔错,可以不停机这么干。不过还是建议记一下SN,关机再拔。以防拔错。
添加硬盘可以不用关机,直接添加就可以,不出问题的话可以在OMV系统里面看到。

硬盘位对应的硬盘SN,建议写到EXCEL文档里,以备以后更换硬盘时参考。

除了关机状态,在开机的时候,更换硬盘,添加硬盘,扩充容量,不影响NAS的正常使用,只是速度会慢一些。

PS:看了一下返修回来,新硬盘的SMART,发现后面有LENOVO,应该是联想定制的吧,竟然会在零售渠道拿到,好奇怪地说。固件倒是挺新的,从MX6OABB0更新到MX6OABW0了。

[attach]340702[/attach]



作者: overthink    时间: 2016-1-11 19:42
@frontwing 这盘是被联想砍单的么?
作者: zhu890103    时间: 2016-1-11 19:54
估计是别的品牌机买家的问题盘,然后复新 专门给京东做售后用的
作者: einstein86    时间: 2016-1-11 19:59
不错哎。不过UBER 10^14的盘这么跑,没问题么。
作者: 羽落风尘    时间: 2016-1-11 20:07
我比较好奇坏掉的那个是什么原因坏掉的



作者: frontwing    时间: 2016-1-11 20:17
overthink 发表于 2016-1-11 19:42
@frontwing 这盘是被联想砍单的么?

来源只有京东自己知道,不过我记得前年某代理的希捷盘就有过一批dell OEM的,而且他们也给质保。
作者: tsammammb    时间: 2016-1-11 20:32
LZ多久关次机,这样用还是难保靠谱啊
作者: chrisr    时间: 2016-1-11 21:04
管他什么盘  给保修就行
作者: Cogae    时间: 2016-1-11 21:25
只要保修没问题就行
作者: OstCollector    时间: 2016-1-11 22:08
本帖最后由 OstCollector 于 2016-1-11 22:16 编辑

OMV的前端做的不错啊

虽然我是linux console党……


说起来,OMV没有巡检吗?我的系统里面有一个cron,每周进行一次巡检,确认磁盘数据的一致性

作者: overthink    时间: 2016-1-12 09:48
zhu890103 发表于 2016-1-11 19:54
估计是别的品牌机买家的问题盘,然后复新 专门给京东做售后用的

问题盘,  砍单盘还好说,问题盘就有点过分了

作者: overthink    时间: 2016-1-12 09:52
einstein86 发表于 2016-1-11 19:59
不错哎。不过UBER 10^14的盘这么跑,没问题么。

出问题几率高一些。  自己能接受就好。
PS:赶紧发呆鹅T630,我资金够的话真想像你那样搞个

作者: overthink    时间: 2016-1-12 09:54
frontwing 发表于 2016-1-11 20:17
来源只有京东自己知道,不过我记得前年某代理的希捷盘就有过一批dell OEM的,而且他们也给质保。 ...

盒子上写的喜和的代理,没问题就好。
作者: overthink    时间: 2016-1-12 09:56
tsammammb 发表于 2016-1-11 20:32
LZ多久关次机,这样用还是难保靠谱啊

24小时不关机的,挂掉这个开机13320小时,加电次数123次



作者: overthink    时间: 2016-1-12 09:58
OstCollector 发表于 2016-1-11 22:08
OMV的前端做的不错啊

虽然我是linux console党……

应该有,没搞过,以后得定期检查了,这些盘最高的上线接近两年了。

作者: overthink    时间: 2016-1-12 10:01
羽落风尘 发表于 2016-1-11 20:07
我比较好奇坏掉的那个是什么原因坏掉的

不知道,应该是个体差异,其它几个盘都没问题。
作者: 红色狂想    时间: 2016-1-12 17:01
O大的NAS干啥用,需要24小时不停机
作者: Epic    时间: 2016-1-12 23:22
E3当NAS真奢侈。(补丁)
作者: gmx168    时间: 2016-1-13 15:23
通报一下,几个月前我的东芝3T也挂掉一个。
作者: gmx168    时间: 2016-1-13 15:27
5个硬盘组Raid6,你好奢侈啊~~~
作者: overthink    时间: 2016-1-13 15:50
Epic 发表于 2016-1-12 23:22
E3当NAS真奢侈。(补丁)

不只只是NAS, 四五个系统在上面跑呢  虚拟机就是爽啊

作者: overthink    时间: 2016-1-13 15:51
gmx168 发表于 2016-1-13 15:27
5个硬盘组Raid6,你好奢侈啊~~~

现在是8个盘了,就这样用着吧。

作者: cyqsimon    时间: 2016-1-14 16:50
羽落风尘 发表于 2016-1-11 20:07
我比较好奇坏掉的那个是什么原因坏掉的

hdd毕竟有高速旋转的部件,机械损耗导致的损毁是正常现象,从统计学角度看就是随机事件而已,所以具体是什么原因没什么意义吧

反正raid本身的目的就是防止随机损毁导致数据丢失,所以换了就行了,别想太多......

作者: overthink    时间: 2016-1-17 21:45
cyqsimon 发表于 2016-1-14 16:50
hdd毕竟有高速旋转的部件,机械损耗导致的损毁是正常现象,从统计学角度看就是随机事件而已,所以具体是 ...

对的,那个坏掉的加电1.3W小时。



作者: cnhnln    时间: 2016-12-10 03:36
楼主用的什么机箱?什么raid卡?
作者: overthink    时间: 2016-12-10 19:28
cnhnln 发表于 2016-12-10 03:36
楼主用的什么机箱?什么raid卡?

机箱,NZXT 530     RAID卡是用的9240刷了9211的FW。

作者: cnhnln    时间: 2016-12-10 21:14
overthink 发表于 2016-12-10 19:28
机箱,NZXT 530     RAID卡是用的9240刷了9211的FW。

现在raid卡啥牌子好?adaptec,intel,highpoint比lsi咋样?

作者: overthink    时间: 2016-12-10 21:45
cnhnln 发表于 2016-12-10 21:14
现在raid卡啥牌子好?adaptec,intel,highpoint比lsi咋样?

纯做扩展,不用RAID的话,还是LSI9211好。 用RAID的话,LSI9260起

作者: cnhnln    时间: 2016-12-11 16:08
overthink 发表于 2016-12-10 21:45
纯做扩展,不用RAID的话,还是LSI9211好。 用RAID的话,LSI9260起

多谢。看上9271-8i了,打算E3-1235L V5+华擎C236 WSI。除了机架有啥多盘位好机箱吗?
作者: overthink    时间: 2016-12-11 18:27
cnhnln 发表于 2016-12-11 16:08
多谢。看上9271-8i了,打算E3-1235L V5+华擎C236 WSI。除了机架有啥多盘位好机箱吗? ...

http://item.jd.com/944808.html

幻影II,  6个 3.5HDD 3个光驱位可改成硬盘位,一个2.5 SSD位

作者: cnhnln    时间: 2016-12-11 22:21
overthink 发表于 2016-12-11 18:27
http://item.jd.com/944808.html

幻影II,  6个 3.5HDD 3个光驱位可改成硬盘位,一个2.5 SSD位

太大了,找了几个miniitx的。万由NSC-800,银欣SST-DS380B,联力 PC-Q26
作者: NERV    时间: 2016-12-12 00:36
表示lz玩得专业
作者: overthink    时间: 2016-12-12 15:36
cnhnln 发表于 2016-12-11 22:21
太大了,找了几个miniitx的。万由NSC-800,银欣SST-DS380B,联力 PC-Q26

我是扔客厅角落的,还行。  要是空间有要求就根据条件来。

作者: nazca001    时间: 2016-12-14 19:30
overthink 发表于 2016-12-12 15:36
我是扔客厅角落的,还行。  要是空间有要求就根据条件来。

你的NAS是不是当服务器用,客户机用无盘?

作者: overthink    时间: 2016-12-14 21:21
nazca001 发表于 2016-12-14 19:30
你的NAS是不是当服务器用,客户机用无盘?

NAS是服务器上的一个虚拟机。直通了LSI9211,然后接了8个3T的硬盘做RAID6

作者: duo_luo    时间: 2017-3-23 11:08
请教下,如果硬盘容量大小不一致是不是没办法用raid6的了。
看到现在有很多成品nas比如Drobo这种的貌似是支持不同容量硬盘随便组的,就不知道自己弄的话能实现吗?
作者: OstCollector    时间: 2017-3-23 11:18
基于Linux的软raid可以在分区的层次上实现……不过成品也可能会自己实现一套
作者: overthink    时间: 2017-3-23 11:21
duo_luo 发表于 2017-3-23 11:08
请教下,如果硬盘容量大小不一致是不是没办法用raid6的了。
看到现在有很多成品nas比如Drobo这种的貌似是支 ...

可以用但是不经济。性能一致性也不好。所以不建议这么搞。

Drobo貌似是自有格式,可以随便组。


作者: duo_luo    时间: 2017-3-23 11:42
overthink 发表于 2017-3-23 11:21
可以用但是不经济。性能一致性也不好。所以不建议这么搞。

Drobo貌似是自有格式,可以随便组。

感谢指教。

主要是现在手上已经有的好多个硬盘容量参差不齐,2T,3T,4T的都有.....





欢迎光临 PCEVA,PC绝对领域,探寻真正的电脑知识 (https://bbs.pceva.com.cn/) Powered by Discuz! X3.2