【PCEVA 玩转SSD】第8期：固态硬盘的4K性能到底重要吗？

仙行一步 · 发表于 2018-5-4 11:07

由主编@Essence 执笔编写的【PCEVA 玩转SSD】系列节目开播了
深入浅出的了解SSD的各种知识

我们主要投稿网站有优酷、B站和腾讯视频，欢迎大家观看。

优酷视频地址

B站视频地址
另外B站允许外链，如果想在这里看的可以直接点击下方的视频进行观看
PS：Chrome浏览器因为Flash协议问题，播放不了，请进入视频网站或者更换浏览器观看

腾讯视频地址

固态硬盘的4K到底有没有用？

说起固态硬盘的性能指标，很多人都知道持续读写和4K随机性能。这里的4K是指4KB区块的随机读写性能，通常是以IOPS（每秒输入输出次数）表达，也有的地方折算成带宽来展示。

4K高、性能好，这是近几年不少玩家对固态硬盘性能的认识。很多固态硬盘制造商呢也迎合消费者的需求，着重再优化4K随机读写性能。那么4K高了是不是就是好硬盘？4K性能指标对于固态硬盘的使用体验到底有没有用？

正方：4K当然有用，君不见企业级固态硬盘都再拼随机读写IOPS吗？

反方：4K永远吃不满，要来有何用？

家用条件不比企业级应用，通过分析记录硬盘读写活动就会发现，很多时候硬盘每秒完成的读写操作次数不过几十次而已，你给我10万IOPS的能力，我用不上又有什么用？！

好了，正反双方的观点已经亮明了，相信这个话题的观众不会少。前排出售瓜子饮料矿泉水啦！

首先呢我为正方补充一些有利的论据：就以PCEVA最近评测的英特尔傲腾800P来说吧，他呢是一款PCIE 3.0 x2接口的NVMe固态硬盘，单看接口的话非常寒酸，这个时代为什么还要出X2接口的固态硬盘啊，X4都普及了，就等X8、X16出来跟显卡抢速度了是不是？

但是呢这个傲腾800P的4K读写能力暴强，4K读取可以达到200多M每秒，乖乖不得了，这一项就把其他固态硬盘按到地上摩擦了。

从PCMark 8实际应用性能测试来看呢，这款其貌不扬的3D XPoint固态硬盘就以区区118GB的容量，挑落了一众比他容量大很多倍的型号，几乎是棋无对手，很强很暴力啊。

但其实呢仔细看完PCEVA评测的朋友会发现，800P也不是没有弱点，它的爆发写入速度比较低，只有600M左右，所以在重负载Photoshop应用的情况下，速度反而是不如一些带有SLC缓存的3D TLC固态硬盘。所以说固态硬盘的参数中没有哪个是完全没用的。

包括像金士顿那样，只告诉你本SSD比机械盘快多少倍的，简单粗暴但是很有效：你会发现厂商的宣传有时候看上去像是在迷惑你，其实也不是完全没有价值。

我再来举一个支持反方观点的例子：东芝的Q200，很多朋友都比较熟悉了，这款固态硬盘问世时间很长了，一直是原厂MLC闪存固态硬盘中点名率比较高的型号。

Q200有一个非常显著的缺点：它的4K读取速度很一般，可以说随便来一张TLC固态硬盘都能在4K读取这方面暴虐Q200。

但问题是4K不行的它，实际用起来却很溜。这绝对不是说MLC的感觉在作怪，实际上它的确是很快的。我们来看它的PCMark 8存储测试成绩：突破5000分了，已经摸到了NVMe固态硬盘的水平。

这就很邪门了吧？这点拿不出手的4K性能，硬是能追上NVMe固态硬盘的速度。

好了，我也不跟大家绕圈子了，直截了当的说，傲腾800P和东芝Q200他们两个之所以用起来很快是因为它们在延迟上有优势，而4K真的是和家用性能没有必然联系的：家用的使用负载太低了，不像服务器中那样有众多并发的读写请求能够发挥它的作用。

延迟就是从发出请求到收到回应之间的时间延误。

现在的固态硬盘和过去宽带不普及时的网络类似，带宽决定的是容量，延迟才决定速度。

这一点在网吧玩过网游的朋友应该有所体会，ping比带宽重要多了（延迟比带宽更影响在线游戏体验），旁边偷偷看片的那个家伙比苍蝇讨厌多了（带宽不足引起IO阻塞和排队会提升延迟）。

对于电脑开机、游戏加载、程序开启这些用户需要立等可得的情景，延迟直接决定使用体验。而对于挂机下载、视频播放一类的工作，它的完成过程中不需要人与电脑的直接交互，带宽才是最重要的影响因素，IOPS对于BT下载也有一定帮助。

说到交互谈话，突然想起一只延迟非常高的家伙，跟他谈话必然是非常崩溃的感觉……

由于下载和视频播放一类的工作由机械硬盘都可以轻松完成，所以大家购买固态硬盘的主要目标就是为了应对延迟敏感型的应用。硬盘同时能处理多少数据不是最重要的，重要的是你请求的数据它能快速的给到你，低延迟意味着程序秒开。

无论是网络还是存储的带宽都是相对容易提升的，举个最简单的法子，组建一个RAID0阵列就能让带宽成倍增长。

由于NCQ原生命令队列的影响，增高队列深度也能提升硬盘的吞吐带宽，不过坏处同样明显，那就是延迟会更大。

所以现在消费级固态硬盘只标注IOPS，没人会像企业级固态硬盘那样标注延迟。

IOPS与延迟并不是线性关系，随着IOPS提升，当主控处理不过来、纠错引擎达到极限，或者闪存通道等其他地方出现瓶颈之后，延迟就会陡然升高。对于同一时刻应对大量并发读写请求的企业级固态硬盘而言，如果只标IOPS而不谈延迟就是成了耍流氓。

说了这么多有关延迟的重要性，那么如何能够降低延迟呢？一个存储系统的延迟来自多个方面，最主要的有闪存的读写延迟、协议和软件层的延迟等等。

如何能够降低延迟？当然你可以选择釜底抽薪，降低闪存读写延迟，最直接的法子就是买块英特尔的傲腾固态硬盘。3D XPoint的延迟比传统NAND闪存的延迟要低很多倍。

第二就是选择NVMe固态硬盘。NVMe有助于降低协议层面上的延迟开销，但其他部分的延迟依然存在。尤其是一些无外置缓存，固件优化又不够好的入门NVMe固态硬盘，实际使用速度恐怕不一定比SATA接口的Q200快。所以对于NVMe固态硬盘也不能全盘迷信。

第三个呢就是更改系统设置减少不必要的节能延迟。在不需要节能的台式机条件下，关闭SATA固态硬盘的LPM节能、

PCIE固态硬盘的ASPM节能，

能够带来一定的降延迟保性能的效果。

这一期的节目就到这里，关于4K到底有没有用的问题不知道大家心中是否已经有了明确的答案？欢迎关注PCEVA公众号，探寻真正的电脑知识。我们下期节目再见。

Ramaxel · 发表于 2018-5-4 14:55

一直打开aspm，机器快慢不是一个固盘能决定的，你拿傲腾配奔腾，我拿i7配山寨，谁快谁慢不需要任何讨论，所以配件都差不多，速度自然就有保障了

tualatin · 发表于 2018-5-4 19:20

5K有个30M就够用。低延迟才是真的爽

wanfeng304 · 发表于 2018-5-4 21:03

所以要I7甚至I9@4.5G+再配合900P？

wanghuang95 · 发表于 2018-5-4 21:06

LPM和ASPM到底能省多少电。。。。。

蛋炒饭 · 发表于 2018-5-4 22:02

Q200继续使用中，感觉用起来确实不错

Essence · 发表于 2018-5-5 15:12

wanfeng304 发表于 2018-5-4 21:03
所以要I7甚至+再配合900P？

现在i5也有六核了嘛，而且也没那么拘束，平时谁又能让硬件性能完整发挥。

Essence · 发表于 2018-5-5 15:14

wanghuang95 发表于 2018-5-4 21:06
LPM和ASPM到底能省多少电。。。。。

暂时没有工具可以测试具体效果。SSD的功耗在整机中占比不算大，对于笔记本续航有一点点的帮助。
NVMe SSD有一点好处，节能做好的话待机温度会比较低，遇到突发写入能多撑几秒吧。没有散热片的话最终都是限速。

红色狂想 · 发表于 2018-5-5 17:30

Q200 EX这么溜？就是外壳不怎么好看，卷边儿到处是窟窿，有点光驱位转接架的味道

PolyMorph · 发表于 2018-5-6 08:56

文件大小随机4k 随机64kb 连续128k 都很重要，这三个在所有文件大小里占比较大
办公、家用都是浅队列 qd1最多到qd16比例就很低了
还有他们不同读取比例表现，比如0.8读/0.2写 0.6读/0.4写

wanfeng304 · 发表于 2018-5-6 09:08

Essence 发表于 2018-5-5 15:12
现在i5也有六核了嘛，而且也没那么拘束，平时谁又能让硬件性能完整发挥。
...

主板的pcie不够，所以我强调说要I7甚至I9.

xufeng73 · 发表于 2018-5-6 13:55

那么如何测延迟？就是上面那个访问时间？

Essence · 发表于 2018-5-6 15:11

xufeng73 发表于 2018-5-6 13:55
那么如何测延迟？就是上面那个访问时间？

AS SSD Benchmark的Acc.Time本意是想测延迟，但是它在测读取延迟之前没有对全盘填满数据，因而测出的数值无效。浴室很久之前有帖子说过这个问题，如果请求读取的位置是空的，主控会直接返回零，省去了从闪存实际读取的过程，表面看延迟很低，却并非是真正的延迟。测延迟的话，先填满全盘吧。不同的区块大小、不同的读写混合比例、不同的垃圾回收状态下延迟表现差异是很大的。

StormBolt · 发表于 2018-5-7 00:23

Essence 发表于 2018-5-6 15:11
AS SSD Benchmark的Acc.Time本意是想测延迟，但是它在测读取延迟之前没有对全盘填满数据，因而测出的数值 ...

这么说我原来的intel 525半满就能测得0.2 0.3的延迟，一查sf2281都这样，别的盘都是0.0x的，那实际差距且多队列时肯定更更更大？难怪我用着有差距原来不是错觉

pphiuyt · 发表于 2018-5-11 23:55

Q200 和MX500 哪个更快呢？

haierccc · 发表于 2018-5-12 21:20

好文！
看来SF2281和Q200EX都是延迟很低！

StormBolt · 发表于 2018-5-12 21:44

haierccc 发表于 2018-5-12 21:20
好文！
看来SF2281和Q200EX都是延迟很低！

2281何以见得低，压缩了，As空跑就比人高，理论实际都不是啊

haierccc · 发表于 2018-5-13 08:41

StormBolt 发表于 2018-5-12 21:44
2281何以见得低，压缩了，As空跑就比人高，理论实际都不是啊

因为我用着很快