PCEVA,PC绝对领域,探寻真正的电脑知识
打印 上一主题 下一主题
开启左侧

【PCEVA 玩转SSD】第8期:固态硬盘的4K性能到底重要吗?

[复制链接]
跳转到指定楼层
1#
点击数:6507|回复数:17
由主编@Essence  执笔编写的【PCEVA 玩转SSD】系列节目开播了
深入浅出的了解SSD的各种知识


我们主要投稿网站有优酷、B站和腾讯视频,欢迎大家观看。


优酷视频地址


B站视频地址
另外B站允许外链,如果想在这里看的可以直接点击下方的视频进行观看
PS:Chrome浏览器因为Flash协议问题,播放不了,请进入视频网站或者更换浏览器观看



腾讯视频地址




固态硬盘的4K到底有没有用?


说起固态硬盘的性能指标,很多人都知道持续读写和4K随机性能。这里的4K是指4KB区块的随机读写性能,通常是以IOPS(每秒输入输出次数)表达,也有的地方折算成带宽来展示。


4K高、性能好,这是近几年不少玩家对固态硬盘性能的认识。很多固态硬盘制造商呢也迎合消费者的需求,着重再优化4K随机读写性能。那么4K高了是不是就是好硬盘?4K性能指标对于固态硬盘的使用体验到底有没有用?

正方:4K当然有用,君不见企业级固态硬盘都再拼随机读写IOPS吗?


反方:4K永远吃不满,要来有何用?

家用条件不比企业级应用,通过分析记录硬盘读写活动就会发现,很多时候硬盘每秒完成的读写操作次数不过几十次而已,你给我10万IOPS的能力,我用不上又有什么用?!


好了,正反双方的观点已经亮明了,相信这个话题的观众不会少。前排出售瓜子饮料矿泉水啦!


首先呢我为正方补充一些有利的论据:就以PCEVA最近评测的英特尔傲腾800P来说吧,他呢是一款PCIE 3.0 x2接口的NVMe固态硬盘,单看接口的话非常寒酸,这个时代为什么还要出X2接口的固态硬盘啊,X4都普及了,就等X8、X16出来跟显卡抢速度了是不是?

但是呢这个傲腾800P的4K读写能力暴强,4K读取可以达到200多M每秒,乖乖不得了,这一项就把其他固态硬盘按到地上摩擦了。

从PCMark 8实际应用性能测试来看呢,这款其貌不扬的3D XPoint固态硬盘就以区区118GB的容量,挑落了一众比他容量大很多倍的型号,几乎是棋无对手,很强很暴力啊。

但其实呢仔细看完PCEVA评测的朋友会发现,800P也不是没有弱点,它的爆发写入速度比较低,只有600M左右,所以在重负载Photoshop应用的情况下,速度反而是不如一些带有SLC缓存的3D TLC固态硬盘。所以说固态硬盘的参数中没有哪个是完全没用的。

包括像金士顿那样,只告诉你本SSD比机械盘快多少倍的,简单粗暴但是很有效:你会发现厂商的宣传有时候看上去像是在迷惑你,其实也不是完全没有价值。


我再来举一个支持反方观点的例子:东芝的Q200,很多朋友都比较熟悉了,这款固态硬盘问世时间很长了,一直是原厂MLC闪存固态硬盘中点名率比较高的型号。

Q200有一个非常显著的缺点:它的4K读取速度很一般,可以说随便来一张TLC固态硬盘都能在4K读取这方面暴虐Q200。

但问题是4K不行的它,实际用起来却很溜。这绝对不是说MLC的感觉在作怪,实际上它的确是很快的。我们来看它的PCMark 8存储测试成绩:突破5000分了,已经摸到了NVMe固态硬盘的水平。

这就很邪门了吧?这点拿不出手的4K性能,硬是能追上NVMe固态硬盘的速度。



好了,我也不跟大家绕圈子了,直截了当的说,傲腾800P和东芝Q200他们两个之所以用起来很快是因为它们在延迟上有优势,而4K真的是和家用性能没有必然联系的:家用的使用负载太低了,不像服务器中那样有众多并发的读写请求能够发挥它的作用。


延迟就是从发出请求到收到回应之间的时间延误。


现在的固态硬盘和过去宽带不普及时的网络类似,带宽决定的是容量,延迟才决定速度。

这一点在网吧玩过网游的朋友应该有所体会,ping比带宽重要多了(延迟比带宽更影响在线游戏体验),旁边偷偷看片的那个家伙比苍蝇讨厌多了(带宽不足引起IO阻塞和排队会提升延迟)。


对于电脑开机、游戏加载、程序开启这些用户需要立等可得的情景,延迟直接决定使用体验。而对于挂机下载、视频播放一类的工作,它的完成过程中不需要人与电脑的直接交互,带宽才是最重要的影响因素,IOPS对于BT下载也有一定帮助。

说到交互谈话,突然想起一只延迟非常高的家伙,跟他谈话必然是非常崩溃的感觉……

由于下载和视频播放一类的工作由机械硬盘都可以轻松完成,所以大家购买固态硬盘的主要目标就是为了应对延迟敏感型的应用。硬盘同时能处理多少数据不是最重要的,重要的是你请求的数据它能快速的给到你,低延迟意味着程序秒开。

无论是网络还是存储的带宽都是相对容易提升的,举个最简单的法子,组建一个RAID0阵列就能让带宽成倍增长。

由于NCQ原生命令队列的影响,增高队列深度也能提升硬盘的吞吐带宽,不过坏处同样明显,那就是延迟会更大。


所以现在消费级固态硬盘只标注IOPS,没人会像企业级固态硬盘那样标注延迟。


IOPS与延迟并不是线性关系,随着IOPS提升,当主控处理不过来、纠错引擎达到极限,或者闪存通道等其他地方出现瓶颈之后,延迟就会陡然升高。对于同一时刻应对大量并发读写请求的企业级固态硬盘而言,如果只标IOPS而不谈延迟就是成了耍流氓。


说了这么多有关延迟的重要性,那么如何能够降低延迟呢?一个存储系统的延迟来自多个方面,最主要的有闪存的读写延迟、协议和软件层的延迟等等。


如何能够降低延迟?当然你可以选择釜底抽薪,降低闪存读写延迟,最直接的法子就是买块英特尔的傲腾固态硬盘。3D XPoint的延迟比传统NAND闪存的延迟要低很多倍。


第二就是选择NVMe固态硬盘。NVMe有助于降低协议层面上的延迟开销,但其他部分的延迟依然存在。尤其是一些无外置缓存,固件优化又不够好的入门NVMe固态硬盘,实际使用速度恐怕不一定比SATA接口的Q200快。所以对于NVMe固态硬盘也不能全盘迷信。


第三个呢就是更改系统设置减少不必要的节能延迟。在不需要节能的台式机条件下,关闭SATA固态硬盘的LPM节能、

PCIE固态硬盘的ASPM节能,

能够带来一定的降延迟保性能的效果。

这一期的节目就到这里,关于4K到底有没有用的问题不知道大家心中是否已经有了明确的答案?欢迎关注PCEVA公众号,探寻真正的电脑知识。我们下期节目再见。





2#
Ramaxel 发表于 2018-5-4 14:55 | 只看该作者
一直打开aspm,机器快慢不是一个固盘能决定的,你拿傲腾配奔腾,我拿i7配山寨,谁快谁慢不需要任何讨论,所以配件都差不多,速度自然就有保障了
来自苹果客户端来自苹果客户端
3#
tualatin 发表于 2018-5-4 19:20 | 只看该作者
5K有个30M就够用。低延迟才是真的爽
来自苹果客户端来自苹果客户端
4#
wanfeng304 发表于 2018-5-4 21:03 | 只看该作者
所以要I7甚至I9@4.5G+再配合900P?
5#
wanghuang95 发表于 2018-5-4 21:06 | 只看该作者
LPM和ASPM到底能省多少电。。。。。
6#
蛋炒饭 发表于 2018-5-4 22:02 | 只看该作者
Q200继续使用中,感觉用起来确实不错
7#
Essence 发表于 2018-5-5 15:12 | 只看该作者
wanfeng304 发表于 2018-5-4 21:03
所以要I7甚至+再配合900P?

现在i5也有六核了嘛,而且也没那么拘束,平时谁又能让硬件性能完整发挥。
8#
Essence 发表于 2018-5-5 15:14 | 只看该作者
wanghuang95 发表于 2018-5-4 21:06
LPM和ASPM到底能省多少电。。。。。

暂时没有工具可以测试具体效果。SSD的功耗在整机中占比不算大,对于笔记本续航有一点点的帮助。
NVMe SSD有一点好处,节能做好的话待机温度会比较低,遇到突发写入能多撑几秒吧。没有散热片的话最终都是限速。
9#
红色狂想 发表于 2018-5-5 17:30 | 只看该作者
Q200 EX这么溜?就是外壳不怎么好看,卷边儿到处是窟窿,有点光驱位转接架的味道
10#
PolyMorph 发表于 2018-5-6 08:56 | 只看该作者
文件大小随机4k 随机64kb 连续128k 都很重要,这三个在所有文件大小里占比较大
办公、家用都是浅队列 qd1最多 到qd16比例就很低了
还有他们不同读取比例表现,比如0.8读/0.2写 0.6读/0.4写
11#
wanfeng304 发表于 2018-5-6 09:08 | 只看该作者
Essence 发表于 2018-5-5 15:12
现在i5也有六核了嘛,而且也没那么拘束,平时谁又能让硬件性能完整发挥。
...

主板的pcie不够,所以我强调说要I7甚至I9.
12#
xufeng73 发表于 2018-5-6 13:55 | 只看该作者
那么如何测延迟?就是上面那个访问时间?
来自苹果客户端来自苹果客户端
13#
Essence 发表于 2018-5-6 15:11 | 只看该作者
xufeng73 发表于 2018-5-6 13:55
那么如何测延迟?就是上面那个访问时间?

AS SSD Benchmark的Acc.Time本意是想测延迟,但是它在测读取延迟之前没有对全盘填满数据,因而测出的数值无效。浴室很久之前有帖子说过这个问题,如果请求读取的位置是空的,主控会直接返回零,省去了从闪存实际读取的过程,表面看延迟很低,却并非是真正的延迟。测延迟的话,先填满全盘吧。不同的区块大小、不同的读写混合比例、不同的垃圾回收状态下延迟表现差异是很大的。
14#
StormBolt 发表于 2018-5-7 00:23 | 只看该作者
Essence 发表于 2018-5-6 15:11
AS SSD Benchmark的Acc.Time本意是想测延迟,但是它在测读取延迟之前没有对全盘填满数据,因而测出的数值 ...

这么说我原来的intel  525半满就能测得0.2 0.3的延迟,一查sf2281都这样,别的盘都是0.0x的,那实际差距且多队列时肯定更更更大?难怪我用着有差距原来不是错觉
来自安卓客户端来自安卓客户端
15#
pphiuyt 发表于 2018-5-11 23:55 | 只看该作者
Q200 和MX500  哪个更快呢?
16#
haierccc 发表于 2018-5-12 21:20 | 只看该作者
好文!
看来SF2281和Q200EX都是延迟很低!
17#
StormBolt 发表于 2018-5-12 21:44 | 只看该作者
haierccc 发表于 2018-5-12 21:20
好文!
看来SF2281和Q200EX都是延迟很低!

2281何以见得低,压缩了,As空跑就比人高,理论实际都不是啊
来自安卓客户端来自安卓客户端
18#
haierccc 发表于 2018-5-13 08:41 | 只看该作者
StormBolt 发表于 2018-5-12 21:44
2281何以见得低,压缩了,As空跑就比人高,理论实际都不是啊

因为我用着很快
您需要登录后才可以回帖 登录 | 注册

本版积分规则

快速回复 返回顶部