PCEVA,PC绝对领域,探寻真正的电脑知识
打印 上一主题 下一主题
开启左侧

重新定义SLC缓存:Solidigm P41 Plus 1TB评测

[复制链接]
跳转到指定楼层
1#
Essence 发表于 2022-10-21 11:59 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
点击数:5517|回复数:10
SLC缓存是当前所有消费级SSD都会具备的功能,在提升写入性能上它的作用不可或缺,但先写入缓存再释放的过程也增加了一重闪存磨损。今天我们要评测的Solidigm P41 Plus将重新定义SLC缓存,彻底改变SLC缓存“华而不实的形象”。


Solidigm是SK海力士收购英特尔的NAND闪存与SSD业务而来,品牌色从包装盒、说明书一直贯穿到SSD标签,整体上给人清新明快的感受。



Solidigm成立后继承了原英特尔SSD产品体系,而P41 Plus则是全新推出的一款消费级PCIe 4.0 SSD,它和670p不存在取代关系,二者将会共存。Solidigm母公司SK海力士有一款叫Platinum P41的SSD,不过P41 Plus和它也没有直接关系。


得益于3D QLC极高的闪存密度,P41 Plus 1TB只用到1颗闪存颗粒,单面PCB布局使得它能够适应轻薄笔记本等安装空间受限的使用环境。


Solidigm P41 Plus提供了512GB、1TB和2TB三种容量选项,本次评测的1TB版本具备400TBW标称写入耐久度,相当于5年内每天可写入219GB数据,充分保障了日常使用需求。



硬件方案分析:
Solidigm P41 Plus使用慧荣SM2269XT主控,搭配浮栅结构的144层堆叠3D QLC闪存。SM2269XT是慧荣推出的第二代PCIe 4.0 DRAMLess主控。相比之前的SM2267XT,SM2269XT升级到12纳米制程,依然是四通道设计,不过闪存I/O接口提速至1600MT/s。


在P41 Plus中同SM2269XT主控搭配的是Solidigm 144层堆叠3D QLC闪存,单die容量1Tb,一颗8 die封装的闪存颗粒即可提供1TB存储容量。该闪存也曾应用在670p固态硬盘当中,其85微秒的读取延迟和40MB/s的编程带宽在QLC闪存中表现非常出众。由于闪存I/O接口速度为1200MT/s,P41 Plus能够实现的顺序读取速度在4125MB/s以上。


Solidigm 144层堆叠闪存是由3组deck组成,每一组都可以单独执行擦除而不会影响到另外两组。


4个闪存Plane被分成两组,一组plane可以独立于另一组异步执行读取操作,从而提升闪存性能。

以上就是硬件层面的信息,P41 Plus在固件及软件方面的创新才是本文的重点,它让原本只起“欢乐表”的作用的持久SLC缓存算法真正实用化,下文会有深入解读。

测试平台和软件信息:

测试平台:
CPU:AMD Ryzen 9 5900X
主板:X570
内存:DDR4-3200 8GBx2
硬盘:Plextor M6Pro 128GB(OS)
         Solidigm P41 Plus 1TB
系统:Windows 11
驱动:Solidigm NVMe Driver

CrystalDiskInfo信息识别:
CDI能够识别NVMe固态硬盘的传输模式和标准SMART健康信息。1024GB足容设计、采用DRAMLess方案,Solidigm P41 Plus态度鲜明,就是要充分展现3D QLC在容量和性价比上的优势。



Solidigm Synergy:
由于NTFS等文件系统的限制,不管是SATA还是NVMe固态硬盘,都要兼容过去机械硬盘的使用方式,并为实现逻辑地址和物理地址转换而增加了闪存翻译层(Flash Translation Layer)。由于闪存翻译层的存在,操作系统无法掌握数据在SSD内的实际存储位置,而SSD也无法了解数据的特性,不能精确管理垃圾回收等工作。为了让闪存管理更加透明化,企业级SSD有Open-Channel、ZNS等诸多尝试,但因系统集成和兼容性等原因并不适合消费级应用。



在升级到PCIe 4.0接口之余,Solidigm拿出了杀手锏Synergy,实现消费级SSD的SLC缓存透明化,提供主机管理SSD缓存的能力。


Synergy包含了专有NVMe驱动程序和Solidigm Storage Tool工具箱两部分。Solidigm的专有NVMe驱动可以取代Windows自带的stornvme驱动程序,架起SSD固件和操作系统之间的桥梁。


Solidigm表示Synergy 存储驱动程序相比系统自带NVMe驱动可以带来多达21%的性能提升。由于Synergy是一项软硬件结合的新技术,目前只有P41 Plus这款SSD能够支持,并且目前也只能在Windows操作系统下使用。


在SSD工具箱同质化、形式化的今天,Solidigm Storage Tool能够额外提供两个完全不同的功能:性能助推器和主机托管缓存开关。性能助推器是一个可以手动执行的SLC缓存清空按钮,运行后可以通过进度条看到SLC缓存彻底释放完毕的过程。当代SSD可以提供上百GB的SLC缓存,它起到了提升SSD写入爆发力的作用,但缓存释放过程会提高SSD写入放大率,增加闪存磨损。


P41 Plus的SLC缓存还可以作为一个“宝藏”,将常用的有价值热数据保留在SLC缓存内暂不释放为QLC,即可在未来需要读取它们时获得SLC级别的低延迟和高性能。接下来大家看到的“主机托管缓存”就是为了确保这些暂不释放的持久SLC缓存都是真正有用的热数据:



PCEVA评测室在《“打酱油”解读SLC缓存新技术》一文中解读过持久SLC缓存的作用,但它自发明至今都只能暂存刚写入的新数据,而无法将盘内频繁访问的热数据主动加载到SLC缓存内,所以持久SLC缓存一直被视为“跑分作弊利器”,而不是真正提升用户体验的神器。直到Solidigm Synergy横空出世,这一情况终于发生改变!


过去“傲腾内存”做的是将HDD/SSD里的热数据缓存到高速3D XPoint存储介质中。而Synergy做到了依靠单一闪存介质,软硬件结合实现数据在QLC状态和SLC状态之间的转换。没有傲腾内存的额外硬件成本和硬件平台限制,同时还比Enmotus FuzeDrive软件方案更安全更方便。下面的基准测试将对Solidigm P41 Plus的空盘性能进行评估,进阶测试部分涵盖SLC缓存分析、Solidigm Synergy及主机托管缓存效果验证。

基准测试:
基准测试1:理论带宽测试
Solidigm P41 Plus 1TB标称顺序读写4125/2950 MB/s,顺序读取速度是由闪存I/O接口速度和闪存通道数量决定的。Solidigm没有提供4K随机读写IOPS,实际上QLC SSD几乎都不提供这一性能指标。



基准测试2:PCMark 10完整系统盘基准测试
PCMark 10完整系统盘基准针对当代最新固态硬盘的广泛测试,涵盖了系统开机启动、Adobe设计套件应用、Office办公套件应用、图片/ISO文件拷贝复制、多个游戏加载过程等测试内容。测试需要至少80GB的硬盘空间,单次测试产生的写入量达到204GB,复杂度超过了PCMark 8存储测试。


上图中我们对比了采用相同主控但搭配美光176层3D TLC闪存的雷克沙NM760 1TB,结果使用QLC闪存的Solidigm P41 Plus成绩更高。该测试体现的是空盘条件下SLC缓存内性能。

基准测试3:3DMark存储性能测试
3DMark存储基准测试涵盖了战地5、使命召唤15:黑色行动4、守望先锋三款游戏的启动加载过程、在运行守望先锋的同时通过OBS记录1080P游戏视频、从EPIC平台安装天外世界、天外世界游戏进度保存以及将Steam游戏反恐精英:全球攻势从移动硬盘拷贝到系统盘的过程,涵盖了PC游戏玩家所能遇到的方方面面。


Solidigm P41 Plus 1TB在测试中获得3447分,而雷克沙NM760 1TB的成绩是2425分。QLC闪存模拟SLC的性能并不差。

当然,不管如何模拟SLC,大家买到手的依然是TLC或QLC闪存SSD,受到SLC缓存影响的各种基准测试成绩都可以当作“欢乐表”对待,看看就好。重头戏还是要看下面的进阶测试部分。

进阶测试:
进阶测试项目1:SLC缓存测试
SLC缓存最早是应用在MLC闪存SSD上(OCZ Vertex 4鸡血固件为了掩盖美光闪存写入慢弊端),但是真正发扬光大是在TLC闪存时代(提升爆发写入能力,简化TLC编程写入)。SLC缓存对于自身写入性能较低的QLC闪存意义更为重大,Solidigm P41 Plus 1TB在空盘时能够提供大约130GB容量的SLC写入缓存。



在盘内空间使用率达到90%的情况下,Solidigm P41 Plus能提供多达27GB容量的SLC写入缓存。但需要注意的是P41 Plus所能提供的SLC写入缓存容量跟使用情况有关,下图是在通过Solidigm Storage Tool性能助推器主动清空缓存内容后测得的。



SLC缓存容量之所以不固定就是因为有持久SLC缓存的存在。持久SLC缓存最早是出现在TLC SSD上(Intel 760p提升4K跑分),这次它将由Solidigm P41 Plus重新定义(从跑分欢乐表到真正有价值的实用性能提升)。空盘条件下向P41 Plus盘内写入一个30GB的文件,空闲一段时间后运行HDTune文件基准测试会发现,SLC缓存可用容量还剩余100GB。说明之前写入的30GB文件被“持久化”了,没有主动进行空闲释放。


SLC缓存持久化可以带来两个好处,其一是提升这部分数据的读取性能,其二是控制SSD的写入放大率。

进阶测试项目2:主机托管缓存
传统的持久SLC缓存只能暂存新写入的数据,写满了就释放。持久SLC缓存的容量可以应付各种常见的跑分软件,但是大家不可能每次玩游戏前都先卸载重装一遍,所以这种只是跑分快,没有实用价值,而且SSD在需要大量写入时还可能面临SLC容量不足的问题。



而Solidigm主机托管缓存由专用NVMe驱动和P41 Plus固件配合,分析出热数据后将其留存在持久SLC缓存中,甚至还能将已经被释放成QLC状态的数据重新加载回SLC缓存内。



我们可以通过IOMeter来验证。测试借助了QLC和SLC模式下4K QD1随机读取性能不同的特征,来检验测试文件在SSD中的存储状态。


这个测试第一步先验证了SLC持久缓存的存在:空闲过后4K QD1随机读取性能依旧。第二步通过Solidigm Storage Tool工具箱性能助推器将缓存强制清空,第三步重新读取可以看到一个短暂的性能爬坡,说明SSD正在将已经释放成QLC的数据重新吸收进SLC缓存。

让已释放数据重新回到SLC缓存当中,看似是SLC缓存技术的一小步,实际却有非常重大的意义。Solidigm创新的主机托管缓存让持久SLC缓存真正实用化。

进阶测试项目3:有效性验证
上一节中我们利用IOMeter对Solidigm Synergy进行理论测试,接下来我们通过最终幻想14 Benchmark来验证它在实际使用中的有效性。



空盘状态下将最终幻想14测试程序拷贝到P41 Plus当中,在持久SLC缓存的帮助下测得游戏加载时间为6.904秒。利用Solidigm Storage Tool性能助推器手动清空缓存后首次测试时间为10.501秒。



清空缓存后首次测试的成绩实际上受到了SSD从QLC迁移数据到SLC的影响。但这个影响是一过性的,第二次测试成绩为6.956秒,数据已经重新回到SLC状态。



如果关闭主机托管的缓存功能并手动排空缓存,首次测试的成绩为7.747秒,这是QLC状态的游戏加载成绩,多次测试基本维持在相同水平,主机托管缓存功能关闭后,已经释放的数据无法再“吸”回缓存内。



简单对比一下不同情况下的最终幻想14 Benchmark游戏加载测试成绩:虽然P41 Plus使用QLC闪存,但它在读取密集型应用中的性能表现不输TLC。



接下来我们逐渐向盘内拷贝更多数据,分别测试P41 Plus在不同空间使用率下的表现。结果如下:


这个测试说明,Solidigm Synergy的主机托管缓存功能在全盘范围内有效,多次读取的数据会被加热并在SLC缓存内取得更高的留存优先级,从而为常用软件提供更迅捷的加载速度。

总结:
Solidigm的研究数据表明,日常应用情况下92%的IO队列深度小于等于2。多数生产力、游戏和内容创作应用对硬盘的读写活动以读取为主,随机存取多过顺序存取。


Solidigm P41 Plus在高队列深度下的性能表现一般,但出色的低队列深度4K随机读取效能使得它非常适合家用日常应用。Solidigm Synergy是具有划时代意义的SLC缓存创新技术,搭载它的P41 Plus从中获益良多,在提升跑分的同时更加务实地注重提升实际使用性能。

P41 Plus使用的很多技术脱胎于英特尔,比如专用nvme驱动程序,英特尔在这方面就非常有经验。而脱离英特尔又给Solidigm带来了更大的自由度。过去一些技术可能需要服从全局而不能自由发挥,比如说英特尔有傲腾混合SSD,可能就不便再推出具有自我热数据分层能力的SSD。青出于蓝而胜于蓝,这就是我们给Solidigm P41 Plus的评价。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?注册

x
2#
yhhuada66 发表于 2022-10-21 19:38 | 只看该作者
slc 缓存玩出花了,有新意,但qlc本身的直写性能还是弱了点(看测试1t盘只有200-250MB/s),如果这部分能提高就真不错了
3#
xiaokey 发表于 2022-10-21 21:59 | 只看该作者
QLC的盘写入寿命到底有多少呢?
4#
Ramaxel 发表于 2022-10-21 22:36 | 只看该作者
p44 plus上市就打算来一发试试
5#
丶Ning 发表于 2022-10-22 12:29 | 只看该作者
p44 pro 赶紧上了吧
6#
doymll 发表于 2022-10-22 14:41 | 只看该作者
看起来不错的样子
7#
Darkteeth 发表于 2022-10-30 22:12 | 只看该作者
海外的海力士P41?
8#
xdd6622 发表于 2022-11-5 12:52 | 只看该作者
p44 pro应该也是QLC,京东都不敢写啥颗粒
9#
haierccc 发表于 2022-11-15 23:02 | 只看该作者
本帖最后由 haierccc 于 2022-11-15 23:07 编辑

我马上去看INTEL 的670P,随机读取延迟为45us。本产品为其85us。
还是慢点。
我一直关注670P。
10#
wujiwu 发表于 2022-12-19 08:02 | 只看该作者
xdd6622 发表于 2022-11-5 12:52
p44 pro应该也是QLC,京东都不敢写啥颗粒

写了tlc ,而且 1t 750 tdw。比传统1t  600tdw 多25%

反而2t 还是1200tdw,搞不清楚为什么
11#
bssharp 发表于 2023-3-27 15:43 | 只看该作者
果然存储系统分层是永恒真理
不过普通 SLC cache 也没那么不堪吧,毕竟头一道 SLC 写入基本上不消耗耐久,加上释放也就相当于一个 1.1 倍的写放大(反正远远不到两倍)
您需要登录后才可以回帖 登录 | 注册

本版积分规则

快速回复 返回顶部