本帖最后由 xudaiqing 于 2014-11-6 20:51 编辑
貌似没人在这里提过这方面的问题,发出来分享下
长期以来消费级硬盘URE或者叫不可恢复性读取错误(来自西数datasheet)一直保持10^-14,这意味着每12.5tb的数据就可能出现一个错误。
对于一个由4个4T硬盘组成的raid5系统(或raidz系统)当一块硬盘完全损坏时,有接近100%的几率会遇到一个比特的数据出错。对于大部分的raid控制器来说这意味着重建失败。也就是说只要有一块硬盘损坏就可以认为raid系统已经损坏,可以准备数据救援了(当然先得再准备至少3块4T硬盘)。
如果使用10^-15的企业盘或西数的RED pro仍然会有约10%的几率重建出错。相比它们高昂的价格这样的结果实在无法让人满意。
如果需要达成更高的可靠性应该使用raid6 或者 raidz2 或者3向镜像。在损失一块硬盘的情况下,再次在两个硬盘上同位置出现数据错误的可能性是很低的。
tips:
1. raid5的用途:低成本实现超大容量单分区;最低成本获得超过单个硬盘性能极限的速度。当然是以损失可靠性作为代价的。
2. 为什么平时很难感觉到URE带来的影响:系统会在数据出错时猜一个它认为最合适的数据上去。由于URE产生的错误发生在单个比特,所以很难察觉。如果某个压缩包出错无法解压,或者音乐、视频、照片发生些奇特的变化等比特反转现象,URE是一个主要原因。
3. 高端的raid会允许重建时出现URE,就是在出现URE时随机猜个数据上去。 |