本帖最后由 nighttob 于 2012-8-26 11:23 编辑
Hard Disk Sentinel是一个用来查看和追踪记录硬盘SMART,及修复硬盘逻辑坏道的软件。它的特点就是,可以看到RAID/SCSI卡后磁盘的SMART状态,并且能够自动记录SMART值的变化,方便用户跟踪硬盘健康变化;以及在Windows平台下,对硬盘逻辑坏道进行修复(类似于DOS下的MHDD)。除此以外Hard Disk Sentinel还提供磁盘温度追踪记录、磁盘状态警告提示、AAM/APM调节等功能。
SMART查看和追踪记录功能显而易见,这个就不多说了,只要每天让Hard Disk Sentinel运行一次,它就会自己记录。
硬盘逻辑坏道修复功能可以用以替代MHDD,特别是在不能使用DOS的情况下,这个功能就显得十分有用,在运行磁盘表面检测和修复的同时,用户依然可以正常操作Windows。美中不足的一点是Hard Disk Sentinel不能提供如MHDD那样详细的检测报告(每个问题扇区的错误类型,操作延迟等),但是对于处理实际问题来说并无影响,而且可以自行定义一些检测参数,灵活性更优。
因为软件已经提供中文版本,而且图形界面设计的比较清晰,大家可以自己下载安装实用一下就能明白大部分功能的情况。红色字体部分是我的一次逻辑坏道修复实践,有此需求的可以直接跳过去看。
软件本身比较大,如有需要请自行搜索下载。只是看SMART不需要注册,运行磁盘检测和修复才需要注册,注册机在第二页#31楼。
我原本不知道这个软件的,直到我有块硬盘07挂了……
使用这款软件的初衷是需要一个能看到RAID卡后面硬盘SMART情况的软件,因为不论是HD Tune、ADIA64还是CDI都对此无能为力,只有一片空白,而RAID管理软件Web GUI显示的项目又很有限,就像这次已经要挂了才告诉我Faild,然后SMART又是一片空白……
这样根本不知道是什么问题,因为当时此盘以及阵列都在正常工作,我只能让热备盘上线,然后把有问题的盘从阵列中脱离,插到主板上单独检测。这时候CDI告诉我,07挂了。
但这样做效率很低,而且还要热插拔,特别是鑫谷C2这机箱设计的还很蛋疼(抱歉我又吐槽机箱了,以后不会了……),把线弄乱了侧板盖不回去。
来论坛发帖求助这盘的后续事宜后,有人推荐了这款软件,马上试用以后发现确实很合意,于是就用它来看硬盘SMART了。
从上图就可见这个软件不仅能看到RAID卡后面硬盘的SMART,而且还有追踪记录的功能,可以记录从第一次使用至今每块硬盘的SMART值变动情况(当然软件必须开着才能记录,最后保存的是当日软件关闭前获取的最后一次信息,如果跨天了,前一天的最后一次信息就被覆盖掉了)。这对某些强迫症患者(纠结帝们)来说是个很贴心的功能,至少不用手动Excel了。对我来说,当然就是能尽早发现潜在问题,及时解决。
但是,只把Hard Disk Sentinel当作看SMART的工具,显然是大材小用了。从上面图上就可以看到Hard Disk Sentinel会对每块硬盘的性能和健康状况做出评估,然后是磁盘的温度情况,以及如ADIA64一样详细的磁盘硬件信息。
如图所见,Hard Disk Sentinel会记录每天的温度平均/最高值,和一段时间内的温度变化状况。
非常详细的磁盘硬件信息。
以上都是讲Hard Disk Sentinel的监控功能,除此以外还可以调整磁盘的AAM、APM及跌落感应[工具栏第一道分割线后第一个图标,下同],随机寻道测试[第二个图标],表面测试[第三个图标],硬盘测试[第四个图标]。
不同于我们经常用HD Tune测试硬盘的连续读写,Hard Disk Sentinel只测试随机,但是有几种模式选择,当然,这个不是重点……
重点要介绍一下的是表面测试,或者换个说法就是检测和修复坏道。
这个功能是我这两天刚刚试过的……从前文的逻辑可以很容易地推出,我一定又是把硬盘玩坏了,所以才翻出新功能的。确实,因为上月底把07挂的盘拿去保修,前天才把新盘拿回来(有点小插曲就不说了)。上线之前肯定先是做个基本测试,因此昨天才加回阵列重建。重建完以后热插拔把备用盘取下来,然后想测试下把SSD插阵列卡上IOP如何,接着就用intel ssd toolbox安全擦除,告诉我硬盘锁定,需要热插拔电源线,OK咱们干,拔掉再插上,过一会儿蓝屏……重启以后发现阵列卡掉盘,重新插拔了一下重启,正常进系统了。Hard Disk Sentinel自动启动,警告SMART有状况,仔细一看,刚掉的那块盘C5和C6都从0涨到8。嗯,这下可以不用测试SSD了,继续折腾HDD吧……
本着早发现早治疗,不把问题扩大化的原则(折腾呗……),把备用盘重新上线,问题盘下线,继续重建阵列……把问题盘插到主板上,一测还是C5/C6都是8,然后开始考虑办法。
首先想到的是MHDD,浴室大大的教程(http://bbs.pceva.com.cn/thread-1396-1-1.html)看了N遍了,但是MHDD要DOS下,也就是说这机器在未来的24小时内基本上就废了(这个时间是可以估算的,第一遍读的时间就是容量/平均读速度,大约5小时;然后重置扇区的速度要慢2-3倍左右,也就是10-15小时)……这个当然不能接受,然后看看手头的资源,正好Hard Disk Sentinel也提供类似的功能,所以稍微研究了下,觉得可行,然后就开干了。
在此之前还是先解释下跟坏道有关的05、C5、C6这几个值吧。依然是浴室大大的教学,http://bbs.pceva.com.cn/thread-1467-1-1.html。简单地说,05是有多少坏扇区被成功替换到备用扇区上,C5是有多少扇区被怀疑是坏扇区,C6是磁盘尝试修复但是不成功的扇区。也就是说被C5标记的扇区不一定就是坏的,就像浴室大大教学里提到的,很可能是有逻辑错误或者读写困难,这是可以被修复的。但是如果放任不管,C5、C6就有可能变成05,原本连续的读写就会被重映射打断。
类似于MHDD,Hard Disk Sentinel也提供了几种不同的检测和修复方式。
第1项是检测,这个就跟用HD Tune慢扫绿块和MHDD全盘扫描一样,发现有问题就会用红色标记出来,但是不会去修复。
2/3/4/5项都是修复,但是级别不一样。具体可以看Hard Disk Sentinel的详细说明,我是用了最后一项“重新初始化磁盘表面”,应该说即使是第二项写入测试也足以纠正逻辑坏扇区了,但是保险起见还是选“低格”了。不同于MHDD需要手动选择是否重映射坏扇区,Hard Disk Sentinel是自动重映射。因为很重要所以还是要提醒,进行此操作之前一定要确保重要数据已经备份,全盘初始化以后肯定是数据全丢的。
在第二个选项卡,配置中可以自定义设置一些参数。比如跟MHDD一样的起止扇区,另外还有检测次数,因为是在windows系统中,为了避免系统过来捣乱,软件默认是勾选“测试期间锁定驱动器”的。
接下来就是正是开扫了,先确定坏道的所在,用第1项快速扫一遍(5个小时呢……)。扫完以后发现有一个扇区有错误,被红点标记了(没截图,抱歉),其余都正常。接着用第5项修复,一开始跟我说预期16个小时,这时候已经是晚上11点了,我就开着机器扫,自己去睡觉了。今天早上起来发现已经扫过有问题的扇区了,全绿,说明问题已经纠正。估计就是突然蓝屏重启之后掉盘所导致的,真是有物理坏道,我可不想再跑进村一趟……
图上红圈标记的地方就是之前扫出来的坏扇区位置,现在已经没了。
SMART也已经恢复正常,虽然SMART追踪记录里没留下这次事件的记录,但是总览健康信息留下了,日志里也留下了一笔。
这样问题就修复完成了,现在已经把盘加回阵列,进行这两天以来的第三次重建,到目前为止进行到70%了……
等重建完会继续测试一下SSD性能的,然后写一个这个磁盘阵列卡的使用感受。没人借我8块硬盘,所以只能写缩水版的了…… |
本帖子中包含更多资源
您需要 登录 才可以下载或查看,没有帐号?注册
x
评分
-
查看全部评分
|