PCEVA,PC绝对领域,探寻真正的电脑知识
打印 上一主题 下一主题
开启左侧

了解SSD在发生电源故障时的健壮性问题

[复制链接]
跳转到指定楼层
1#
neeyuese 发表于 2015-12-4 20:56 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
点击数:13048|回复数:32
上次的帖子我已经说过了SSD为什么需要带掉电保护,我也对掉电时会出现的问题做了基本的解释,本帖我再举例几种典型的掉电故障类型。

由于闪存读取和编程的单位是Page(页),而擦除的单位是Block(块),因此需要利用FTL(映射表)来维护所有的读写擦操作,如果映射表损坏,那么SSD上的数据就不复存在了。为了保证SSD的性能,映射表的更新一般都在高速缓存内进行,但是高速缓存掉电会丢数据,因此在编程和擦除操作的时候突发掉电就会引起下面标出的错误。

掉电故障类型



如图所示(画的不好见笑了),主要故障类型有:

Bit出错 - 突发掉电时,闪存正在做擦除操作,擦除指令已发送下去,但是并未完成就掉电了,下次上电后SSD主控以为之前的擦除操作完成了,接下来对这个区域编程的时候,可能返回的还是旧数据,因此ECC报错了。

元数据出错 - 突发掉电时,映射表没有来得及写入到闪存,并且下次上电后没有被完整恢复(如果映射表损伤严重或者恢复过程中又碰到了掉电等严重问题),没有元数据等于不知道盘内用户数据在哪里,就会造成数据完全或者部分损坏。

SSD变砖 - 突发掉电时,关键数据出错,并且上电后无法恢复,整块SSD无法使用。

掉电位 - 类似上个帖子说的MLC颗粒在编程Upper Page时突发掉电,造成之前写入的Lower Page数据出错。

写飞 - 编程操作时突发掉电,造成写入的数据位置出错。

写入顺序出错 - A1和A2将要写入同一个地址,原本是A2在缓存里把之前的A1覆盖并写入闪存,因为突发掉电造成A2没有在缓存里覆盖A1,导致写入顺序出错,最终出现了A2丢失的结果。

以上所有的问题,在SSD有完整端对端和掉电保护的方案中都能够被解决,当然前提是SSD的固件健壮性过关,没有隐藏的bug。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?注册

x
2#
fjzjk1 发表于 2015-12-4 20:57 | 只看该作者
其实我觉得吧,固件健壮性更重要点。掉电保护还可以考ups凑合下,固件就没办法了
3#
McLaren 发表于 2015-12-4 21:08 | 只看该作者
手慢了没抢到。。。前排瓜子果仁专卖

掉电保护还是必要的
4#
overthink 发表于 2015-12-4 21:38 | 只看该作者
写个好固件还真是费脑袋,要和设计方案匹配的好才可以。
5#
ghoc0012a 发表于 2015-12-4 21:39 | 只看该作者
第一次这么靠前~~学习了~
6#
Marshal007 发表于 2015-12-4 21:39 | 只看该作者
蓝屏或者黑屏的时候直接按重启键属于掉电吗?
7#
neeyuese  楼主| 发表于 2015-12-4 21:53 | 只看该作者
Marshal007 发表于 2015-12-4 23:39
蓝屏或者黑屏的时候直接按重启键属于掉电吗?

这个case by case的,要看为什么会蓝屏或者黑屏的,有概率算异常掉电的。

8#
pcpp 发表于 2015-12-5 13:43 | 只看该作者
没有缓存的话,SSD抗掉电应该强一些,这个意义上说SSDPLUS比ARC100要好,两者速度在旧机升级上来看,没有差别。但个人感觉ARC100掉电更危险一些,虽然理论上ARC100速度快那么一点点。
9#
terryworld 发表于 2015-12-5 14:25 | 只看该作者
pcpp 发表于 2015-12-5 13:43
没有缓存的话,SSD抗掉电应该强一些,这个意义上说SSDPLUS比ARC100要好,两者速度在旧机升 ...

Qpro 的既没有缓存,PCMark7/8跑分完全算得上旗舰级别,又有掉电保护(尽管是非完整的那种),很好的一款,当初上市的时候价格也不错。东芝换壳加价到800多之后,好像没什么人买了...

10#
Mufasa 发表于 2015-12-5 21:39 | 只看该作者
作为多款不同厂商SSD的用户,经常因为误操作导致机器被关,目前没有发生数据损坏或变砖的情况。

也许是因为我用的电源都比较高烧吧,各种大马拉小车。

保持时间足够长的电源,可以为SSD掉电保护争取更多的宽容时间,虽然不是决定性的因素,但总比没有好。
11#
nighttob 发表于 2015-12-5 21:42 | 只看该作者
Mufasa 发表于 2015-12-5 21:39
作为多款不同厂商SSD的用户,经常因为误操作导致机器被关,目前没有发生数据损坏或变砖的情况。

也许是因 ...

狮王你这是要纠结党们给扫雷机都配1KW电源去啊
12#
neeyuese  楼主| 发表于 2015-12-5 21:44 | 只看该作者
Mufasa 发表于 2015-12-5 23:39
作为多款不同厂商SSD的用户,经常因为误操作导致机器被关,目前没有发生数据损坏或变砖的情况。

也许是因 ...

一款好的电源确实很重要,深有体会。

13#
cell-v 发表于 2015-12-5 22:06 | 只看该作者
“有完整端对端和掉电保护”那这次团购的这批算么?
14#
neeyuese  楼主| 发表于 2015-12-5 22:11 | 只看该作者
cell-v 发表于 2015-12-6 00:06
“有完整端对端和掉电保护”那这次团购的这批算么?

有/有/有,重要的事情说3遍。

15#
zsbstephen 发表于 2015-12-5 22:23 发自PCEVA移动客户端 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
16#
neeyuese  楼主| 发表于 2015-12-5 22:26 | 只看该作者
zsbstephen 发表于 2015-12-6 00:23
端对端保护不是要服务器CPU、ECC内存、服务器主板/芯片组都支持才能启用么? ...

SSD的端对端保护是指的SSD内部,SSD主控,外置缓存开启ECC,配合掉电保护达到数据在盘内不出错。

至于外面的端对端保护,则要靠你自己对CPU,内存,主板等设备进行保证了。

17#
jie_chen 发表于 2015-12-5 23:17 | 只看该作者
电脑的开关电源断电有一定的延迟,闪存的速度要比内存速度还要快。SSD因断电而损坏的概率比较低。
18#
jie_chen 发表于 2015-12-5 23:19 | 只看该作者
Marshal007 发表于 2015-12-4 21:39
蓝屏或者黑屏的时候直接按重启键属于掉电吗?

不算的,你按电源开关需要一段时间电脑才关闭。
19#
haierccc 发表于 2015-12-6 21:22 | 只看该作者
对于电源的“保持时间”的含义是什么,一直不是很清楚
停电了以后电源还能保持一段时间的电流输出,这段时间又能做什么呢?
如果说,这段时间可以让硬盘或SSD把在缓存中的数据写入从而避免数据丢失或者其它故障
但在断电的一瞬间,电源并不会向磁盘发出“我这里停电了,趁着我还能坚持一段时间,你赶快把缓存的数据写入”的命令
所以对于使用缓存的设备,照样还是认为“突然断电”的
而且,缓存的数据策略,也不可能在“保持时间”这么短的时间就把缓存的数据写入磁盘(如果电源的保持时间能坚持1分钟到几分钟,倒是有可能)
20#
adsl4096 发表于 2015-12-6 23:58 | 只看该作者
求推荐文中所述的优良产品
您需要登录后才可以回帖 登录 | 注册

本版积分规则

快速回复 返回顶部