PCEVA,PC绝对领域,探寻真正的电脑知识
开启左侧

满血PCIe 4.0:三星980PRO固态硬盘评测

[复制链接]
Essence 发表于 2020-11-16 11:13 | 显示全部楼层 |阅读模式
点击数:5049|回复数:9
PCIe 4.0进入个人电脑已有一年半,而而直到现在,它的带宽优势才首次被三星980PRO充分发挥出来。本次PCEVA评测的是三星980PRO的1TB版本,也是目前的最大型号,2TB版本会在稍晚些时候上市。


首个满血PCIe 4.0 SSD
所谓满血状态,主要分两个部分:一是顺序读写速度用满PCIe 4.0带宽极限;二是能够在高队列深度下充分发挥4K随机读写能力。三星980PRO堪称是首个满血状态的PCIe 4.0固态硬盘。



首先来看顺序读写带宽,他主要受到外部PCIe接口以及内部闪存接口的共同制约。

早期的PCIe 4.0固态硬盘(群联PS5016-E16方案)只能提供5000MB/s的顺序读取速度,这是因为主控使用800MT闪存接口,800 x 8通道再除以经验倍率(通常在1.25到1.35之间),最终可提供的带宽介于 4740MB/s到5120 MB/s之间。E16受限于闪存接口速率,无法更充分地利用PCIe 4.0的带宽。而三星980Pro使用1200MT闪存接口,理论带宽在7111MB/s到7680MB/s之间。


通常来说,PCIe 4.0的理论带宽为8GB/s。但实际上8GB/s只是物理层的电气传输能力,由于128b/130b编码的影响,会损失大约1.538%的带宽,所以PCIe 4.0 x4实际可用带宽为:7.88GB/s。


此外还有更多的额外开销。数据以TLP信息包传输,其中包括了事物层添加的Header和ECRC纠错码、数据链路层添加的Sequence Number和LCRC纠错码等等。而一个TLP包所能承载的有效数据量是有限的。


这部分有效数据(Payload)理论上最长可以达到4096字节,不过通常它会受到设备以及主板支持的共同限制,多数情况下被限制在256字节。按照下图中的情况,我们可以计算一下数据包的效率是:256/(256+4+2+12+4+4)=90.8%。

用7.88GB/s乘以90.8%,结果是7.15GB/s,也就是说,三星980Pro的7000MB/s已经非常接近PCIe 4.0 x4的带宽上限。三星尚未宣布980PRO 2TB版本的性能指标,我们拭目以待。

接下来看高队列深度下的4K随机读写IOPS,它主要受到主控硬件支持以及闪存访问延迟两个因素的影响。

在SATA时代,受AHCI协议的影响,4K随机读写IOPS通常在100K以内,也就是10万IOPS。



NVMe协议针对闪存等新型非易失性存储介质进行了大量优化,理论上可支持最多65535个队列,每个队列支持65536长度,但实际上主控并不能支持这么多。好消息是技术在进步,从近几代三星NVMe主控的发展可以看到,Elpis已经能够支持128个队列。不过我们目前没有其他主控的队列支持数据,无法进行更多的比较。



除了主控,闪存自身存取延迟也是一个重要影响因素。980PRO使用的三星第六代V-NAND闪存相比上代产品的存取延迟降低10%以上,同时功耗也降低了15%,从而可以更快、更高效地应对数据存取。



硬件拆解部分
980PRO使用了三星全新设计的ELPIS主控,支持128个队列,每队列可包含64000个命令,共计超过800万个命令,为4K随机读写效能的提升奠定了坚实的基础。另外,ELPIS还采用了三星自家8nm工艺制造,相比同类主控的12nm工艺更为先进,在功耗控制上也会具备一定优势。



DRAM缓存特写:三星LPDDR4(编号K4F8E3D4HF-BGCH),容量1GB。三星是当前少有的集主控、DRAM、NAND设计制造能力于一身的企业,使用LPDDR4作为DRAM缓存有助于降低整体功耗,减少发热。



NAND闪存特写:三星第六代V-NAND 3D TLC(编号K9DUGY8J5C-DCK0),1xx层堆叠相比上代9x层提升40%,读写延迟降低10%,功耗降低15%。关于这代闪存的具体堆叠层数一直是一个谜,三星官网上将其标为1xx层(即100多个层),所以我们采用这一写法。



三星980PRO在增强散热方面的努力包括主控表面的镍涂层,以及PCB背面的由多层铜箔堆叠而成的散热标签。这些举措使得980PRO可以无需接触外部散热片的帮助,就能在重负载使用下保持合理的温度,而不致过热限速。



可能有朋友会问,能加个散热片就解决的事情,有必要这样费力去优化吗?答案是肯定的,PCIe 4.0固态硬盘不仅应用在高性能台式机上,同样也会有在笔记本电脑(如英特尔Tiger Lake平台)中使用的需求,后者的安装和散热空间远比台式机恶劣。就空间限制来说,多数轻薄笔记本电脑的M.2安装位仅能容纳单面PCB设计的NVMe固态硬盘,无论底部还是顶部均没有多余空间去安装附加的金属散热片。镀镍层可以帮助980PRO的主控温度下降约7度,降温效果明显,同时不会影响空间兼容性。



980PRO是三星第一次在PRO系列上使用3D TLC闪存。从读取效能来看,TLC(三星称3bit MLC)闪存并未影响到980PRO成为有史以来最快的三星PRO固态硬盘,但一些玩家可能会对写入寿命有所疑虑。相比采用3D MLC闪存的970PRO,600TBW的官标写入量低了一半,但环顾当代旗舰级固态硬盘,980PRO的600TBW(未来2TB版本为1200TBW)的写入量指标依旧属于第一梯队,只不过是970PRO过于耀眼了。


根据三星的调研统计数据,5年内NVMe SSD用户写入量在156TB以内的占99%以上。并且600TBW的写入量指标是根据JESD218标准测试得出,实际闪存磨损程度还和写入使用方式有关(写放大不定)。并且TBW指标只是一个影响保修的指标,超出后并不会影响SSD的继续使用。从历史来看,三星主控的数据纠错能力强悍,即便在闪存磨损极为严重的情况下也有能力确保用户数据的完整,超期服役的案例有很多。在家用领域,对980PRO的耐久度担心是没有必要的。

测试平台及信息识别

测试平台:
CPU:AMD Ryzen 9 3900X / Ryzen 7 5800X
主板:技嘉X570 AORUS ELITE WIFI
内存:HyperX Fury DDR4 3200MHz 16GB
硬盘:建兴ZETA 256GB(系统盘)
          三星980PRO 1TB(FW:1B2QGXA7)
系统:Windows 10 20H2
驱动:Samsung NVMe Driver 3.3.0.2003
设置:除特别说明以外,关闭ASPM及APST节能

本次评测在同个平台上使用到了两个CPU,一方面是因为时间有限,我们不得不赶在Ryzen 7 5800X可用之前先完成部分测试,另一方面Ryzen 5000上市时间不长,个别测试软件还存在一些小问题,所以我们保留了部分早些时候在Ryzen 9 3900X上测得的数据。

CrystalDiskInfo信息识别:
CrystalDiskInfo(CDI)是通用的固态硬盘SMART信息检测工具,三星980PRO具备和其他NVMe固态硬盘相同的SMART定义,简单的信息识别可以无需借助三星Magician工具箱软件。



Smartmontools信息识别:
Smartmontools是一个开源工具软件,可以识别NVMe固态硬盘的温度限制信息以及APST预设,这些信息同NVMe固态硬盘的节能及热管理策略有关,下文中会有进一步的解读和测试。



NVMe在发展的过程中不断加入各种先进节能和热管理特性,通过smartmontools和AIDA64对980PRO的识别结果整理如下。



三星Magician工具箱:
6.2版本的Magician工具箱具备全新的界面,但左侧功能菜单有部分尚未完成汉化。


工具箱自带的测速功能可以用于验证980PRO的顺序读写性能,但随机读写IOPS由于测试算法的原因,不能充分展现980PRO的全部性能。1000K IOPS的正确测试姿势会在下文中介绍。

三星Magician提供了创建可引导U盘版工具箱的功能,用以实现对SSD的安全擦除。在挂副盘并且安装了三星NVMe驱动程序的前提下,也可以通过Ochkin Vadim编写的nvme-se工具在Windows系统内实现。

Encrypted Drive提供了TCG Opal加密功能开关,如果你希望实现eDrive(硬件加速的BitLocker),则需要提前打开它,然后对SSD进行一次安全擦除,并进行全新系统安装。由于时间关系,PCEVA评测室本次没有尝试。

上方的PSID Revert功能可以利用产品标签上的PSID(下图红色圈内所示)解除980PRO的加密状态,并删除全部数据。


基准测试
基准测试1:理论带宽测试
三星980PRO的性能指标是以IOMeter 1.1进行测试的,为了测试方便,多数朋友会用CrystalDiskMark来检验。我们需要使用CrystalDiskMark,并对测试参数进行一些修改,顺序读写的队列深度加大到128,4K随机读写修改为Q32T16,即可得到以下成绩:顺序读取7129.3MB/s,顺序写入5164.1MB/s,超过官标7000/5000 MB/s性能指标。


4K队列随机读写带宽换算后相当于1039800/1082675 IOPS,超过官标的1000K IOPS指标。4K单线程随机读写带宽换算后相当于23842/66475 IOPS,同样超过官标的22K/60K IOPS指标。如果大家在测试中无法实现官标性能,可能需要换一颗CPU试试,最好是单CCD的型号,尽可能降低核心间延迟。此外,CPU手动超频并不总是对存储性能有帮助,某些情况下会起到反作用。AMD锐龙的机制同英特尔平台有很大不同,C State等节能特性并不是简单的一关了之,此外电源计划也会影响到测试成绩,复杂性较英特尔平台高出许多。

基准测试2:PCMark 8测试

三星980PRO在PCMark 8存储性能测试中获得5099分,比采用群联PS5016-E16主控方案的紫光P400 2TB高出20分之多。由于测试平台的差异,这里不能直接同英特尔平台上的成绩直接对比。



在英特尔Core i9-9900K测试平台上,三星980PRO以PCIe 3.0速率工作,PCMark 8存储测试得分为5114分。小编非常期待明年第一季度的英特尔Rocket Lake平台,CPU节能特性更容易控制的英特尔平台在对延迟敏感的存储测试中通常会有更好的表现。



基准测试3:PCMark 10完整系统盘基准
PCMark 10完整系统盘基准针对当代最新固态硬盘的广泛测试,涵盖了系统开机启动、Adobe设计套件应用、Office办公套件应用、图片/ISO文件拷贝复制、多个游戏加载过程等测试内容。测试需要至少80GB的硬盘空间,单次测试产生的写入量达到204GB,复杂度超过了PCMark 8存储测试。在这个测试中三星980PRO 1TB的成绩更是大幅超越采用群联PS5016-E16方案的紫光P400 2TB,领先幅度高达50%以上。


需要指出的是,目前PCMark 10在Ryzen 5000处理器上存在一些兼容性问题,会严重影响测试结果。故本测试的数据基于Ryzen 9 3900X,和紫光P400相同。

基准测试4:温度压力测试
三星980PRO具备两个温度传感器,Drive Temperature温度数据来自闪存颗粒,也是CrystalDiskInfo和工具箱软件直接展示的温度。Drive Temperature 2第二温度需要使用HWiNFO64等软件读取,它是Elips主控的温度数据。


一般来说,主控芯片能够承受近100度的高温,而非车规级的NAND闪存只能承受不超过85度的温度。由于主控的发热量较闪存芯片更高,所以三星980PRO将电源管理元件置于主控和NAND闪存颗粒之间,尽可能拉开二者的距离,尽量避免NAND闪存受到主控的影响而过热。PCB背面的多层铜箔散热标签对准闪存颗粒而非主控,大约也是出于照顾闪存温度限制的原因。虽然车规级闪存能够承受高达105度的工作环境,但通常会有性能等方面的限制,并不符合家用固态硬盘的需求。


本测试在关闭一切SSD节能、无主动散热措施的条件下进行,测试时室温22度。温度压力测试使用IOMeter进行,测试方法为128KB QD128T1顺序读取,每秒记录。利用Hard Disk Sentinel和HWiNFO64查看温度变化。经过10分钟持续满载之后,三星980PRO的默认温度度数为64度,距离85度限制尚有很大距离,未触及温度上限。



IOMeter记录的读取速度数据也表明,测试过程中没有过热限速事件发生。



由于北方已经入冬,环境温度比夏季低很多,我们没能触发980PRO的温度管理。据三星提供的资料显示,980PRO在温度管理上相比上代产品也有很多改进,在动态热防护(DTG)介入之后,读写性能相比970EVO PLUS更高。



980PRO主控的动态热防护技术可以避免SSD工作在过高的温度下,保障硬件和用户数据的安全。如果你依然不放心在无金属散热片的情况下高负载使用对性能的影响,可以通过三星Magician工具箱查看980PRO的SMART信息,其中的Warning Composite Temperature Time和Critical Composite Temperature的数据为零,表示没有发生过DTG介入和限速的事件。



基准测试5:NVMe节能特性
技嘉X570 AORUS ELITE WIFI主板的BIOS中没有提供PCIE ASPM节能设定,默认就是开启状态。要启用深度的L1.2节能,台式机需要在Windows电源选项中将PCI Express-链接电源管理修改为“最大电源节省量”。笔记本电脑在未接AC电源时默认就会开启它。



APST自动电源状态转换是NVMe协议提供的另一种节能特性,共有3个活动状态和2个不活动状态。根据微软的信息,APST会根据电源选项设定而有不同的作用机制,较低功耗的电源设定倾向于允许NVMe固态硬盘进入更深度的节能状态。


结合我们通过smartmontools识别到的APST预设,除高性能电源计划外,三星980PRO都能在闲置时间条件具备后进入到最深的PS4不活动电源状态,功耗低至35mW,若同时进入ASPM L1.2状态,功耗进一步降低到5mW以内。


在22度室温、无主动散热措施条件下,三星980PRO的待机温度从关闭节能前的29度下降到26度,主控温度从关闭节能前的36度下降到25度,效果出色。



三星980PRO的节能表现十分出色,当然用户还希望在节能降温的同时,更好地维持性能不下降。我们将ASPM功能打开、使用平衡电源预设(200ms超时进入,15ms进出延迟限制)。CrystalDiskMark测试结果,仅有4K单线程随机读取略低,影响不是很大。


PCMark 8存储测试完全没有受到影响,说明980PRO在日常使用中能够很好地兼顾节能与性能发挥。


进阶测试:
进阶测试项目1:SLC缓存及过半盘使用性能
三星在980PRO上启用了全新的TurboWrite 2.0智能SLC算法,将SLC缓存的容量提升了5倍。对于980PRO 1TB来说,它具备基础的6GB固定SLC缓存(位于OP预留空间,始终可用),和额外的108GB动态SLC缓存(临时借用未使用的空白闪存空间),总SLC缓存容量达到了114GB。按照三星提供的数据,980PRO在30秒内可写入131GB数据,是970EVO Plus及970PRO的两倍左右,爆发写入能力优势显著。


从上图中我们还可以得到一个信息,970EVO PLUS的缓存内写入速度高未使用SLC缓存的970PRO,这解释了在一些测试项目中为何TLC闪存的970EVO PLUS能够战胜MLC闪存的970PRO。智能的SLC缓存算法能有效地提升SSD性能表现,我们不应从内心中去抵触它。

HDTune文件基准提供了一个SLC缓存容量的简易测定方法,确认了空盘状态下980PRO 1TB拥有总计114GB的写入缓存。由于测试方法的原因,HDTune文件基准测得的读写速度可能与理论最大带宽有一定差距(队列深度不够)。



利用IOMeter向盘内填充465.5GB的不可压缩数据后,重新测试HDTune文件基准,50%空间使用率下依然有114GB的写入缓存可用:


CrystalDiskMark测得的半盘性能基本无衰减:

PCMark 8存储测试表明,半盘使用率下980PRO的使用性能无衰减:

根据三星提供的数据,TuboWrite 2.0始终尝试提供108GB的动态SLC缓存,当SSD中的可用空白块不足(少于108x3=324GB)时,动态SLC缓存将不可用。这里提到的少于324GB空间,指的是包括OP预留空间在内的空白闪存容量,而非格式化后盘内剩余的用户可用空间。也就是说,直到盘内空间使用超过700GB(盘内剩余231GB左右)才会禁用动态SLC缓存,只余6GB的固定SLC缓存。实际上,我们通过实际测试发现,在盘内填充701GB数据之后,盘内空间使用率达到75%,此时依然有超过12GB的SLC缓存可用,并且实用性能基本无衰减。




进阶测试项目2:4KB QD32 随机写入离散度测试

无文件系统下使用IOMeter进行128K QD32持续写入30分钟。 SLC缓存用尽之后,写入速度经历了短暂低于2000MB/s的过程后,很快又恢复到2000MB/s以上。



结束后空闲15分钟,然后改用4K QD32随机写入10000秒并每秒记录。



最后500秒平均IOPS:64174。波动不大,离散度表现非常出色。



进阶测试项目3:PCMARK 8扩展存储测试之性能一致性部分(稳定态家用环境性能)

这个测试主要是给家用最恶劣环境下的性能参考(全盘不留任何剩余空间,禁用了Windows文件系统缓存跑纯RAW模式)。由于测试时间紧张,本项成绩基于Ryzen 9 3900X,和对照用的紫光P400(群联PS5016方案)使用相同测试平台。


3D TLC闪存没有阻碍980PRO成为我们测试过的所有SSD中,抗压能力第二强的产品——仅次于傲腾900P。考虑到傲腾900P是一款使用3D XPoint闪存、略带奢侈属性的产品,三星980PRO的性价比显然更高。

总结
PCIe 4.0不仅给固态硬盘带来了广阔的性能提升空间,也为PC游戏架构带来了新的变革机会。微软提出的DirectStorage技术可以借助PCIe 4.0固态硬盘的超高读写带宽,实现部分类内存应用,在未来的8K材质贴图时代能够对游戏性能产生深远影响。

凭借980PRO的出色发挥,三星重新定义了高性能固态硬盘。Elpis主控从制造工艺、队列深度支持等方面出发,提升了数据吞吐能力并改善了发热控制。第六代V-NAND闪存提高堆叠层数的同时进一步降低延迟和功耗,充分展现了三星在全硬件生态系统中的强大实力。

PCEVA的评测较其他媒体晚一些,因此有机会用上本月新上市的ZEN3架构锐龙平台,从测试成绩来看,三星980PRO在家用领域发挥出了堪称全能的表现,常规理论读写速度以及实用效能创造了多个新纪录。明年第一季度,英特尔首个支持PCIe 4.0的桌面平台Rocket Lake也将问世,将为980PRO带来更为广阔的应用舞台。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?注册

x
gloobox 发表于 2020-11-16 12:16 | 显示全部楼层
上次lin大做了4个这样型号的盘组raid0能有2w多速度,但5个就瓶颈了,总的来说看着都兴奋
来自安卓客户端来自安卓客户端
gloobox 发表于 2020-11-16 12:17 | 显示全部楼层
另外,pcie3.0的话依然是三星制霸,但到了4.0已经有不少主控能跟三星并驾齐驱了。说多一句,这玩意相关oem版本已经出来,叫做pm9a1,我估计是980 evo(如果有)的换名字版本
来自安卓客户端来自安卓客户端
StormBolt 发表于 2020-11-16 12:45 | 显示全部楼层
1××层才是关键,看来和日常最相关的4kq1t1和低深度队列的读是和层数正相关,这才是民用意义所在
来自安卓客户端来自安卓客户端
nighttob 发表于 2020-11-16 13:29 | 显示全部楼层
StormBolt 发表于 2020-11-16 12:45
1××层才是关键,看来和日常最相关的4kq1t1和低深度队列的读是和层数正相关,这才是民用意义所在
...

啥道理?解释解释?
nighttob 发表于 2020-11-16 13:52 | 显示全部楼层
tR=45µs
tPROG=450µs
这是TLC Array的Elec. Characteristics?
TLC要是能有这等参数,应该就不需要SLC mode了。
StormBolt 发表于 2020-11-16 18:38 | 显示全部楼层
nighttob 发表于 2020-11-16 13:29
啥道理?解释解释?

没有道理,我要说的道理是q1t1和低qd才是家用关键
层数那个是现象,不限于三星,各种4K被三星吊打的其他品牌,随着层数增长4K都起来了
nighttob 发表于 2020-11-16 20:14 | 显示全部楼层
StormBolt 发表于 2020-11-16 18:38
没有道理,我要说的道理是q1t1和低qd才是家用关键
层数那个是现象,不限于三星,各种4K被三星吊打的其他 ...

我想要你解释的道理是层数和Q1T1的关系
而你看到的Q1T1速度提升只是闪存接口速度提高的结果,只不过闪存接口速度提高恰好跟工艺进步一样是单调递增的
yhhuada66 发表于 2020-11-16 21:59 | 显示全部楼层
平台合适,性能发挥地很不错,仅次于傲腾900p,厉害了
admdf123 发表于 2020-11-17 19:25 | 显示全部楼层
下一步就是SN850 VS 980PRO了,SN850也很强
您需要登录后才可以回帖 登录 | 注册

本版积分规则

快速回复 返回顶部