Essence 发表于 2021-4-15 11:57

技嘉AORUS Gen4 7000s SSD评测

在AMD与Intel相继支持PCIE4.0之后,能充分发挥PCIE4.0 x4速率的固态硬盘也在逐渐增多。要想实现7GB/s以上的顺序读取速率,需要两个关键要素,一是主控,二是颗粒。主控8通道是必须的,颗粒必须支持1200MT/s或更高的闪存接口。


首先梳理下技嘉的固态硬盘的产品线划分。与主板产品类似,技嘉SSD的高端型号归属AORUS系列,而其中最高端的PCIe 4.0产品目前包含了三种不同型号:黑雕AORUS Gen4(PS5016主控无散热片)、金雕AORUS Gen4(PS5016主控带金色散热片)和最新的钛雕AORUS Gen4 7000s(PS5018主控带黑色散热片)。京东上钛雕和金雕的性能对比图如下:



本次PCEVA评测的是技嘉的第二代AORUS Gen4——钛雕AORUS Gen4 7000s 1TB。




和第一代AORUS Gen4金雕相比,第二代AORUS Gen4 7000s钛雕(以下简称钛雕)的变化很大。除了主控从群联PS5016-E16升级至PS5018-E18之外,闪存也从铠侠BiCS4变换为美光B27B,虽然二者堆叠层数都是96层,但美光的闪存接口速度更快(800MT/s->1200MT/s)。



群联PS5018主控使用台积电12nm工艺取代了原来在PS5016上使用的28nm工艺,CPU核心数量从2个增加到3个(Cortex R5架构,运行频率1000MHz),仍搭配2个CoXProcessor,其中一个负责闪存管理,另一个负责处理主机和FTL,为主控CPU减负。



通过phison_nvme_flash_id2工具查询,钛雕使用1200MT/s接口速率的美光闪存。PS5018-E18主控CPU运行频率达到1000MHz,高于群联PS5012-E12的667MHz和群联PS5016-E16的733MHz。



测试平台及信息识别:
测试平台:

CPU:Intel Core i9-11900K@5.1GHz
主板:技嘉Z590 AORUS PRO AX
内存:DDR4-3600 8GBx2
硬盘:OCZ VT150 240GB(系统盘)
         技嘉AORUS Gen4 7000s SSD 1TB(FW:EIFM21.1)
系统:Windows 10 20H2
驱动:微软默认stornvme
设置:除特别说明以外,关闭ASPM及APST节能

CrystalDiskInfo信息识别:
CrystalDiskInfo已经可以满足我们对NVMe SSD健康信息的全面识别需求。


本次测试的钛雕SSD搭载有EIFM21.1固件,单从数字来看要比上次我们测试的速柏CP5000上搭载的固件略新一些。由于测试平台软硬件环境均发生变化,测试成绩无法直接比较,不过有些固件特性可以通过测试找到其中的变化。

Smartmontools信息识别:
Smartmontools是一个开源工具软件,可以识别NVMe固态硬盘的温度限制信息以及APST预设,这些信息同NVMe固态硬盘的节能及热管理策略有关。



NVMe在发展的过程中不断加入各种先进节能和热管理特性,通过smartmontools和AIDA64对钛雕的识别结果整理如下。



基准测试
基准测试1:理论带宽测试
这个测试是为了验证SSD能否达到其标称的性能指标。顺序测试修改为Q128T1(128K区块),随机测试修改为Q32T16(4K区块)。实际测得顺序读取7104.5MB/s,超过标称值7000MB/s,顺序写入5445.1MB/s,略低于标称值5500MB/s。


4K随机读写速度需要进行一下转换,随机读取1466.9MB/s相当于366725 IOPS,随机写入5446.0MB/s相当于1361500 IOPS,超过标称值的顺序读350000 IOPS、顺序写入700000 IOPS。

英特尔和AMD平台在PCIe TLP数据包Maximum Payload Size的支持上存在一些差异。就目前我测过的几个平台来说,英特尔平台最大支持256字节、AMD平台最大支持512字节。这个Payload Size可以通过HWiNFO64查看(下图红框内),它会对NVMe固态硬盘的极限传输带宽(主要体现为顺序读取速度)产生影响。


在Payload Size为256字节时,PCIe 4.0 x4接口的理论传输带宽大约为7.15GB/s,而当Payload Size为512字节时,PCIe 4.0 x4接口的理论传输带宽大约为7.50GB/s。钛雕的顺序读取速度已经非常接近Payload Size=256字节时的上限,所以英特尔平台下的顺序读取速度是会比AMD平台下略低一点点的(大约43MB/s)。如果排除顺序读取的话,其他CrystalDiskMark测试项目大都是英特尔平台更优。

在当前闪存接口1200MT/s的情况下,闪存传输带宽也会制约SSD的顺序读取速度,所以当前英特尔11代酷睿平台Maximum Payload Size=256字节不会有太大的问题。美光下一代176层堆叠B47R闪存将采用1600MT/s闪存接口,闪存传输带宽瓶颈解除,届时可能就会有较为明显的影响。不过到时候大家有可能已经用上第12代酷睿了吧。

基准测试2:PCMark 8测试
钛雕的PCMark 8存储测试成绩为5108分。


英特尔平台测试PCMark 8存储成绩有天然的性能加成(CPU节能容易关死,延迟更低更稳定),相比AMD平台有明显优势。不过这次使用的英特尔11代酷睿临时测试平台未经极致优化,这个分数应该说还是有一定成长潜力的。

基准测试3:游戏加载测试
我们通过Final Fantsy XIV的Benchmark对比测试了SATA系统盘和技嘉钛雕的游戏加载时长。SATA固态硬盘用时16.945秒,钛雕用时12.334秒,加载用时缩短27%。



接下来是王老师的亚洲园林demo测试,这是一个采用8K材质贴图的场景,SATA固态硬盘加载用时19秒,钛雕用时10秒,加载用时缩短47%。



基准测试4:温度压力测试
在室温23.6度、被动散热、关闭ASPM及APST节能的条件下,钛雕报告的待机温度为35度。



使用IOMeter进行8GB范围的128KB QD128顺序读取,测试开始263秒后IOMeter记录到SSD开始出现比较温和的限速行为,测试开始515秒后开始出现剧烈的限速行为。



我们同时还做了拆除钛雕自带散热片后使用主板M.2散热片,以及完全裸盘状态的对比测试。技嘉Z590 AORUS PRO AX的自带散热片也是能同时照顾底部和顶部的三明治结构,上下都有导热垫同SSD接触。


装好主板散热片后的状态,外观和谐统一:


同等室温和被动散热条件下,钛雕报告的待机温度数据为34度,和钛雕自带散热片的效果大体上相同。



使用IOMeter进行8GB范围的128KB QD128顺序读取,测试开始76秒后IOMeter记录到SSD开始出现比较温和的限速行为,测试开始298秒后开始出现剧烈的限速行为。



最后是不使用任何散热片的裸盘状态对比测试,同等室温和被动散热条件下,钛雕报告的待机温度数据为40度,比带有散热片时高出5~6度。



使用IOMeter进行8GB范围的128KB QD128顺序读取,全速状态仅维持26秒即开始限速,并且一上来就是剧烈的限速。



通过对比测试可以发现,钛雕自带的散热片作用非常大,满负载连续读取的情况下全速状态维持时间是无散热片情况的10倍、是使用主板散热片情况的3.5倍,对性能的影响更低。

基准测试5:NVMe节能特性
NVMe固态硬盘支持ASPM和APST两套节能机制,它们可以协同工作,降低空闲时段内的功耗和温度。



ASPM是PCIe设备的活动状态电源管理(Active State Power Management),它通过在空闲时将PCIe链路置于电气空闲状态来实现降低功耗目的。NVMe固态硬盘支持L1待机模式,需要在Windows电源选项-PCI Express-链接状态电源管理中选择“最大电源节省量”才能启用。在一些平台上,主板BIOS设置拥有最高优先级,能够无视Windows电源选项中的设置直接对ASPM节能进行管理。



设置后可通过HWiNFO64来确认NVMe SSD已开启ASPM节能(下图中显示L1 Entry)。



APST是NVMe协议中的自动电源状态切换(Autonomous Power State Transition)功能。NVMe固态硬盘的主控可以通过模块化设计,针对不同电源状态关闭一些功能模块来降低空闲时段的功耗,并由此带来更低的待机温度。



从NVMe 1.2开始,NVMe固态硬盘可以定义3个活动电源状态(PS0/PS1/PS2)和两个非活跃电源状态(PS3/PS4),并根据需要在它们之间自动转换。下表中技嘉钛雕的最大功耗数据源自smartmontools读出值,功耗数据并不一定准确,我们只需关心进入延迟和退出延迟两项信息,二者相加后需小于等于指定范围方能进入该电源状态。


我们通过修改注册表解锁电源计划中相关设置项,手动设定200ms超时、15ms延迟限制,这样一来技嘉钛雕在连续空闲超过200ms后就可以自动进入PS3电源状态。如果将延迟限制修改为50ms或更高,钛雕就能在空闲超过200ms后自动进入PS4电源状态,但从PS4唤醒时的延迟也会比PS3更高。

APST就是在闲置功耗和使用性能之间的一个均衡,多数情况下,这些设定无需用户亲自干预,因为Windows已经为不同电源计划提供了一套预设:



为了展现钛雕在开启节能特性之后的表现,我们手动设置了200ms超时和15ms延迟约束进行开启节能后的性能测试。钛雕的闲置待机温度从36度下降到25度,11度的降温效果还是非常明显的。



由于APST是有空闲超时机制的(默认从50ms到200ms不等,数值越大,越不易进入节能),所以CrystalDiskMark这类连续测试、成绩取最大值的软件不会体现其影响。



在空闲超时200ms、延迟约束≤15ms的设定下,PCMark 8存储测试成绩从5108下降至5098,依然是旗舰级的性能水准,而待机状态功耗则有了更优秀的表现。


节能特性是在待机温度和使用性能之间的一个均衡。对于非连续满载的使用方式来说,较低的待机温度意味着更大的温度上升空间,短时间的突发读写活动就不易触发严重的过热限速。笔记本电脑默认会启用ASPM和APST两种节能特性,台式机的话选择高性能或卓越性能电源计划可以自动禁用ASPM节能,并限制APST节能,以便更充分地发挥钛雕的性能。

进阶测试:
进阶测试项目1:SLC缓存及过半盘使用性能
钛雕没有使用CP5000那样的全盘SLC模式,在空盘条件下拥有大约100GB容量的SLC缓存。



使用IOMeter填充466GB容量的不可压缩数据并充分闲置之后,可用SLC缓存容量依然是100GB左右,CrystalDiskMark理论带宽测速成绩基本保持不变。


在填充半盘之后钛雕的PCMark 8存储测试成绩为5109分,和空盘时的5108分相比属于正常误差范围之内,性能和空盘时一致。


进阶测试项目2:4KB QD32 随机写入离散度测试
无文件系统下使用IOMeter进行128K QD32持续写入30分钟。 SLC缓存用尽前大约写入了100GB数据,之后开始强制垃圾回收,边释放缓存边写入的速度大约700MB/s,最后是TLC直写阶段,速度大约1100MB/s。



结束后空闲15分钟,然后改用4K QD32随机写入5000秒并每秒记录。



最后500秒平均IOPS:20442



进阶测试项目3:PCMARK 8扩展存储测试之性能一致性部分(稳定态家用环境性能)
这个测试主要是给家用最恶劣环境下的性能参考(全盘不留任何剩余空间,禁用了Windows文件系统缓存跑纯RAW模式)。



总结:
钛雕是技嘉推出的第二代AORUS Gen4固态硬盘,具备超过7000MB/s的高速读取能力。在升级群联最新一代PS5018-E18主控和美光1200MT/s高速闪存之外,还优化了散热片结构,略微缩小了体积占用,提升和临近位置PCIe板卡的安装空间兼容性。技嘉的数据显示,采用碳纳米涂层的新款散热片将散热效能提升了20%,温控机制介入更少,全速运行时间更长。


另外一个改变是,新一代AORUS Gen4在改用美光B27B闪存(512Gb die)后,钛雕1TB版本的闪存die数量减少一半,数据存取的并发度有所下降,随机读取IOPS指标相比金雕1TB有所下滑(750K IOPS->350K IOPS),如果希望获取最顶级存储性能可以考虑钛雕的2TB版本,效能更强大更完美。目前京东上钛雕1TB和2TB的售价分别为1799元和3699元。

konglang_616 发表于 2021-4-16 22:22

SSD和HDD涨价预警!!!

贰佰塊 发表于 2021-4-18 00:01

啥都猛涨,今年618没消费欲望了{:1_457:}

arc100 发表于 2021-4-21 13:40

群联PS5018的性能看起来不错。公版PCIe 4.0主控现在好像就差慧荣SM2264没出现了吧?
页: [1]
查看完整版本: 技嘉AORUS Gen4 7000s SSD评测