PCEVA,PC绝对领域,探寻真正的电脑知识
开启左侧

三款采用长江存储闪存固态硬盘横评

[复制链接]
Essence 发表于 2021-4-20 14:29 | 显示全部楼层 |阅读模式
点击数:2067|回复数:13
本帖最后由 Essence 于 2021-4-20 15:09 编辑

一、前言
长江存储的闪存颗粒正式发售已经有1年多了,去年我们有测试过两个产品,一是紫光提供的工程样品,二是由速柏提供的大货CS500。对后者我们还进行了耐久度测试,连续写入一个月后再进行烘烤,表现依旧良好,说明长江存储颗粒已经完全能满足零售市场需求。大家都应该知道,一种新的NAND从量产到固态硬盘方案的应用,需要经过长时间严谨的工厂测试与市场验证过程,那么经过这一年多,长存NAND是否经得起考验呢?所以我们组织了此次横评。

这次专题,共挑选了3款典型产品。分别是致钛PC005 Active、速柏CP2000长存版和Starblaze忆芯科技提供的工程样品。


二、长江存储闪存介绍
长江存储的Xtacking技术让世界见证了中国原创。3D闪存中除了存储阵列之外还有一些外围电路会占据相当大的芯片面积,在长江存储之前,美光、三星和SK Hynix它们是将外围电路放到存储单元下方。而长江存储的Xtacking是把存储阵列和外围电路分开来做,分别在两个晶圆上加工,然后通过垂直互联通道把它们键合、接通电路。


长江存储这一招高明在哪儿呢?外围电路和存储阵列分开做,就能用上不同的制程节点。就像AMD在锐龙处理器中那样,针对不同功能,选择合适的制程去加工,最后给它整合起来。而且在闪存制造里边,这样做的好处还不单单是降低成本。


NAND闪存它有一个特性,就是不能用特别先进的制程去加工。因为制程节点小了之后,每个存储单元能容纳的电子数量就会变少,发展到一定阶段之后,闪存就很容易因为电子流失而丢失其中保存的数据。就目前来看,3D闪存最适合的制程节点是20nm。铠侠用的是19纳米,美光和英特尔是20纳米,长江存储用的也是20纳米。

但从另一个方面来看,闪存对先进制程的不适应性就成了灾难。因为闪存中存储阵列之外的外围电路,它是很适合采用先进制程来加工的,结果却被存储阵列给拖了后腿,只能跟着用比较老的节点。这对它提高闪存接口传输速度、开发高级功能来说是不利的。

长江存储的Xtacking把两部分分开来加工,这样外围电路那部分就可以应用比较先进的制程,可以说是一个非常有远见的技术。长江存储在它的官网上这么写:“这种模块化的方式也为引入NAND外围电路的创新功能以实现NAND闪存的定制化提供了可能”。

现在大家都在讲边缘计算、片上处理、机器学习,我们可以大开脑洞想象一下,利用先进制程的优势在闪存外围电路中给闪存增加一些原本没有的功能,会产生怎样的科幻效果?比如说,闪存具备了芯片内数据处理能力,自动识别和压缩数据,降低闪存写放大,提高闪存使用寿命。再比如说,闪存结合主控芯片通过机器学习,主动发现写入到特定逻辑地址的数据特点,写入后经常很快就被删除的,那后边这里的闪存做磨损均衡以及垃圾回收的时候可以相对懒一些,这样就能控制写放大。当然这些都是我们现阶段的想象,并不是已经实现的功能。

据我们了解到的信息,目前长江存储已经获得了数十家固态硬盘以及手机品牌的订单。

三、参测品牌与产品方案介绍
我们今天凑到了三款使用长江存储颗粒的NVMe固态硬盘,分别是致钛PC005 Active、速柏CP2000长存版和Starblaze的工程样品。

致钛
致钛是长江存储的自有品牌,目前已推出SATA和NVMe各一款型号,今天我们测试的是NVMe协议的PC005 Active 1TB,保修5年。


致钛PC005 Active使用的是台湾慧荣的SM2262EN主控,这是一个比较成熟的公版主控方案,支持2K LDPC纠错引擎,内置双核心Cortex R5 CPU,运行频率625MHz,拥有8个闪存通道,最高支持800MT/s闪存接口,是一个自带DRAM缓存的PCIe 3.0旗舰级解决方案。

作为长江存储的原厂SSD,致钛采用了定制版本的固件,搭配长江存储原片64层堆叠3D TLC闪存。

速柏CUBEX
速柏是江苏芯盛推出的SSD品牌。去年我们测试过了速柏CP2000的铠侠颗粒版本,今天测试的是新推出的CP2000长江存储颗粒版本,保修和之前的铠侠颗粒版本一样,都是5年。


速柏CP2000使用的是台湾群联的PS5013-E13T主控,台积电28纳米工艺制造,内置单核心Cortex R5 CPU(运行频率667MHz)加2个CoXProcessor,具备2K LDPC纠错引擎。CoXProcessor可以通过硬件宏高效地替代常见的重复固件代码,并降低主控CPU负担。

速柏CP2000长存版使用的是长江存储Client客户级3D TLC闪存,相比普通Consumer消费级的定位更高。和其他速柏/龟甲SSD一样,CP2000长存版支持微信小程序扫码查询颗粒信息。在第三方SSD厂商中能做到如此贴心的确实少见。


再看这个主控。群联PS5013-E13T支持HMB主机内存缓冲,可以利用最多64MB的主机内存来存储FTL闪存表,提升固态硬盘的随机读写效能。PS5013-E13T能够支持800MT/s闪存接口,在四通道配置下顺序读取速度能够达到2500MB/s这样一个水平,相比慧荣的SM2263XT要高出一截,这是它的一个后发优势。从群联官网的图片来看,Co-P 0显然在进行闪存管理,而Co-P 1处理主机和FTL,硬件I/O offload。



Starblaze 北京忆芯科技
Starblaze北京忆芯科技是专门以主控芯片研发为核心的一家企业,已经推出的两款SSD主控产品STAR1000和STAR1000P,都是PCIE Gen3,4通道,支持NVMe协议,后端支持8通道闪存。今天我们测试的STAR1000P是STAR1000的升级版,性能更高,是忆芯科技现阶段的旗舰主控。



STAR1000P基于台积电28nm工艺制造,支持4K LDPC纠错技术,是一款高端消费级以及入门企业级主控芯片,可搭配DDR4/LPDDR3 DRAM缓存。除了支持支持国际AES加密算法,还支持中国商密(SM2/3/4)安全方案。使用新思科技高性能ARC CPU。主控具备8个闪存通道,支持ONFI 4.0/Toggle 3.0接口。

和慧荣SM2262EN一样,STAR1000P也是面向PCIe 3.0接口旗舰级SSD的解决方案。这块样品盘使用的是长江存储原片64层3D TLC闪存。

除了常规的闪存通道数量、闪存通道速率之外,LDPC码长也是一个主控的重要参数,它影响着主控的闪存纠错能力。在同等的原始误码率(RBER)下,4K LDPC的纠错失败概率(UFER)相比2K LDPC大幅下降,这意味着4K LDPC纠错技术可以大大延长闪存的使用寿命,同时也推迟了SSD生命后期因闪存错误率上升而开始产生掉速的时间点。


Starblaze的STAR1000P主控支持4K LPDC纠错,在理论上拥有一定领先优势,当然具体的实现效果还要看固件和颗粒的适配。

三款产品规格汇总



这三块固态硬盘中,致钛PC005 Active定位于PCIE3.0接口的高端,慧荣方案,带有独立DRAM缓存;速柏CP2000 1TB是无独立缓存的中端定位,群联方案;Starblaze的样品则是我们主动找到忆芯科技申请的,目的想了解内陆主控企业的技术实力。

下面就看看这三个方案的表现吧。

四、测试结果
由于不涉及PCIe 4.0,本次横评的硬件测试平台依旧是英特尔Z390与Core i9-9900K平台(关闭CPU节能),运行Windows 10 LTSB操作系统,使用微软系统自带stornvme驱动,关闭APSM和APST节能。测试的项目都是PCEVA评测中的标准化项目。

CrystalDiskMark是测试NVMe固态硬盘理论性能的首选工具。和AS SSD Benchmark相比,CDM的顺序和随机读写都是队列测试,能够充分发挥NVMe固态硬盘的并发存取优势。为了测出固态硬盘的全部能力,4K随机读写测试我们将它的测试参数设置为Q32T8,也就是8个测试线程,每个测试线程都使用QD32队列深度进行4K读写测试。


顺序读写速度基本是受通道数量和闪存接口速度的影响,致钛PC005 Active和Starblaze工程样品都实现了满速读取,是PCIe 3.0接口下的旗舰产品。速柏CP2000以2496.7MB/s的读取速度居末,但比常见的慧荣SM2263XT方案SSD要快,跟西数蓝盘SN550的表现比较接近。

在闪存相同的情况下,不同主控的4K单线程随机读取速度从59.57MB/s到70.04MB/s,变化范围还是比较大的。致钛使用的慧荣SM2262EN是具备一定的内存加速功能的,它能直接利用一小部分DRAM缓存去优化随机读取,所以它的4K单线程读取成绩最高并不令人意外。虽然Starblaze的4K单线程随机读取成绩不高,但它的4K队列随机读取成绩却是三张盘中最高的:2716.2MB/s相当于679K IOPS,表现出色。

PCMark 8存储测试使用记录-回放式原理,还原SSD对实际应用性能的影响。三块长江存储闪存固态硬盘的成绩分别为,致钛PC005 Active:5084



速柏CP2000长存版:5083



Starblaze:5092


在PCMark 8存储测试这个环节,得分最高的是Starblaze的工程样品,其次是致钛PC005 Active,然后是速柏CP2000,都是各自的正常表现。


SLC缓存是大家关注的重点之一,不同玩家的喜好不同,有些朋友喜欢小缓存、但性能发挥稳定,有些朋友喜欢大缓存,最好是全盘SLC的那种,连续写入大量数据时不容易因SLC缓存用完而出现写入速度滑落。

下面这个图是描述TLC固态硬盘连续写入过程的速度曲线,橙色线是典型的使用SLC缓存后的效果,缓存用尽后会有一段低落区,此时SSD内要同时处理缓存释放和新的写入请求。直到缓存释放完毕后就跟不使用SLC缓存的蓝色线重合了。


而在实际使用中,当SLC缓存没有被一次性写爆的情况下,不同的SSD会有两种不同处理方式,一种是老老实实地抓紧空闲时间将全部SLC缓存释放为TLC状态,准备好迎接新的写入,通常固定SLC模式、SLC缓存容量较小的SSD会选择这样做;另一种处理方式是动态SLC模式SSD经常使用的,空闲时段只释放部分缓存,甚至完全不释放(如果有新数据写入请求,就临时再去借用一部分用户空间,等后边有空闲时再将老的持久缓存释放掉,新生成的持久缓存继续有效),我们将不会自动闲置释放的SLC缓存称为“持久缓存”。

对于使用持久缓存的SSD来说,它在各种测试中有机会获得不对称优势,只要可以保持不释放的SLC缓存空间大到超过了SSD测试软件测试的范围,那么整个测试过程都将是跑在SLC缓存空间内,除了写入速度享受SLC红利之外,读取也将从中受益。大家不要小看这一点,虽然顺序读取速度受到接口限制没有太大区别,但SLC的读取延迟是远小于TLC的,随机存取性能也将从中受益。用SLC缓存加速TLC读取从很久前就是一个常见但是不常为人所知的跑分优化手段,而持久SLC缓存则将这种优化做到了极致。包括PCMark存储测试在内的几乎所有SSD测速工具都会受到持久SLC缓存的不同程度影响。

在本次横评的三块固态硬盘当中,致钛PC005 Active属于小容量固定SLC,全部10GB缓存空间都位于OP预留空间范围内,不占用用户存储空间,不过也因此错失了进一步提高PCMark 8成绩的机会。



速柏CP2000 1TB空盘时拥有大约24GB的SLC缓存:



Starblaze 1TB空盘时拥有大约50GB的SLC缓存:


这三块盘都采用了动态SLC缓存策略,会利用一部分闲置的用户空间去扩大SLC缓存的可用范围,在盘内空间使用情况发生变化后,可用SLC缓存的容量也会随之变化。

总的来说,SLC缓存的容量很多时候取决于固件设计人员的多方面考虑,并不总是越大越好。SLC缓存只是一个临时存储写入数据的空间,它总归是需要释放成TLC状态的,而释放过程会对用户使用性能产生干扰。当然,一味地追求固定小容量SLC缓存也不可取,毕竟现在的趋势是动态缓存,除了写入速度更“持久”,还可以通过延缓释放的形式,利用SLC Cache读取延迟低的特点,对一些近期写入的数据读取性能进行优化。

PCMark 8扩展测试主要是给家用最恶劣环境下的性能参考,测试过程全盘不留任何剩余空间,禁用了Windows文件系统缓存跑纯RAW模式。这个测试对于家用固态硬盘来说属于一种极端重负载挑战,测试的性能降级和稳定态阶段会不停对固态硬盘进行随机写入,每个阶段执行一次取消休息间隔的标准性能测试。


在重负载测试下,不同SLC缓存算法对性能的影响被体现出来。致钛PC005 Active(橘色曲线)起伏很大,说明他的垃圾回收策略激进,导致在写入负载相对较轻的前几个测试环节牺牲了一些性能,但是当测到第四项Photoshop Heavy(也就是上边图表中统计的项目)时,已经释放出了足够的SLC缓存空间可供高速写入,它的成绩就非常亮眼了。

对于没有DRAM缓存的速柏CP2000来说(红色曲线),它设计用来应对轻负载的读写工作,大范围高强度的随机写入下性能一降到底是很正常的。当进入性能恢复过程后,PCMark 8每次测试前留出5分钟空闲时间供SSD完成内部垃圾回收等工作,CP2000抓住机会,马上恢复了性能。

此测试项目整个盘被填满后再进行的写入测试,在普通应用场景中是不可能遇到的,所以不要以此成绩作为你体验的感受。测试目的主要是检验方案的可靠性。这三款产品都能在最极端的情况下正常工作,没有掉链子。

节能测试:
节能对于性能来说是一个debuff,为什么PCEVA还要在评测里加入这个项目呢?节能不光是为了环保,固态硬盘对电脑整机功耗影响是比较小的,它的作用是降低待机状态下的温度。温度低一些不仅仅是数字好看、心里踏实,因为待机温度距离限速温度的距离大了,还能切实地提高突发读写时固态硬盘能够满速工作的时间。

NVMe固态硬盘的节能主要有两种,ASPM基本上所有盘都能支持,并且在笔记本电脑上基本是默认启用的,APST的情况则会复杂一些。按照NVMe 1.1标准的要求,NVMe固态硬盘是应该具备3个活动电源状态和2个非活动状态的,但并不是所有NVMe固态硬盘都严格遵循这一点。


测试环境温度为23度,在无散热片的被动散热条件下进行。节能表现最好的当属速柏CP2000,群联PS5013-E13T对节能特性的支持全面,降温效果显著。Starblaze由于是工程测试样品,测试结果仅供参考,不代表最终产品表现。


五、总结
任何产品只要卖出来,最后的成败还是要看价格。请看下表。



此表价格从京东商城上采集,并未考虑促销特价的因素。从这里可以看到,与其他主流品牌同档次产品相比,致钛与速柏的价格都具有一定的优势。性价比最好的为速柏CP2000系列。致钛PC005 Active的价格据网友观察会经常做活动,各种优惠券累加起来性价比也很高。对于忆芯科技的SART1000P,搭配长存颗粒的方案表现很不错,如果能得到更多品牌的采用或者提供更多适配其他型号闪存的方案,未来是很有前景的。

经过这些测试,我们认为这三款采用长江存储闪存的NVMe固态硬盘都中规中矩,方案表现都趋于成熟。再看售价,也很有竞争力,零售大货可以放心购买,已经与其他老资历的固态品牌能平起平坐了,消费者在选购的时候记得要关注他们。


本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?注册

x
dboy99 发表于 2021-4-20 15:30 | 显示全部楼层
这个starblaze跟memblaze有没有关系?
bvg 发表于 2021-4-21 11:35 | 显示全部楼层
希望长存128层堆叠3D NAND赶紧上市
Essence  楼主| 发表于 2021-4-21 11:36 | 显示全部楼层
dboy99 发表于 2021-4-20 15:30
这个starblaze跟memblaze有没有关系?

有些渊源,不过starblaze现在是独立个体了
string 发表于 2021-4-21 11:40 | 显示全部楼层
看了LDPC纠错码那一段,感觉到未来QLC SSD的掉速前景了...抓住现在的TLC吧
kkess 发表于 2021-4-21 12:16 | 显示全部楼层
速柏经济实惠,致钛原厂加成
pc028 发表于 2021-4-21 13:26 | 显示全部楼层
用SLC缓存加速TLC读取从很久前就是一个常见但是不常为人所知的跑分优化手段,而持久SLC缓存则将这种优化做到了极致。包括PCMark存储测试在内的几乎所有SSD测速工具都会受到持久SLC缓存的不同程度影响。
这优化的结果就是各种跑分软件的成绩都做不得准了...厉害
糊了么 发表于 2021-4-21 13:35 | 显示全部楼层
Xtacking的优势很大啊,希望长江存储也弄个原厂主控出来,让闪存更智能化
arc100 发表于 2021-4-21 13:47 | 显示全部楼层
看了PCMark 8扩展测试这一段我感觉致钛这块盘更适合日常系统盘,SLC容量不大,但是释放的积极性很高。重负载使用的话starblaze看上去做的更好一些。cp2000是DRAMLess的,不方便直接对比了,定位不一样
Total 发表于 2021-4-21 14:09 | 显示全部楼层
starblaze的PCMark 8成绩是最接近进口闪存SSD的,致钛可能是固件背锅吧,毕竟主控也是老主控了,PCMark 8有点低了
tucksky 发表于 2021-4-22 09:31 | 显示全部楼层
感觉SSD最近是不是涨价了。前一阵500多1t随便买,最近都涨到699,799去了。
haierccc 发表于 2021-4-24 10:20 | 显示全部楼层
本帖最后由 haierccc 于 2021-4-24 10:34 编辑

STAR1000P不是光威弈PRO的主控么

tiancai2nd 发表于 2021-4-27 15:49 | 显示全部楼层
tucksky 发表于 2021-4-22 09:31
感觉SSD最近是不是涨价了。前一阵500多1t随便买,最近都涨到699,799去了。

速柏C2000 1T在淘宝上已经没货了
CHIA币这波把大容量硬盘扫了个遍,静静等着吧,看他们过两个月如何甩卖
easports1200 发表于 2021-5-10 22:05 | 显示全部楼层
Xtacking有点类似CMOS上堆栈的概念啊,比方说全画幅的堆栈式,感光层拿个500nm工艺来造都不是问题,目前似乎比较普遍的工艺是90nm和65nm,但数字电路层可以尽情刷工艺无压力,顺便整个CMOS的成本都可能下来,感光层上精细制程对控制成本就是灾难,想想看用7nm工艺造个864平方毫米的芯片多酸爽,但数字电路部分用旧制程那你性能一辈子也别想上去了。
您需要登录后才可以回帖 登录 | 注册

本版积分规则

快速回复 返回顶部