PCEVA,PC绝对领域,探寻真正的电脑知识
开启左侧

Zen2平台Hynix CJR颗粒超频研究

[复制链接]
royalk 发表于 2019-9-9 17:50 | 显示全部楼层 |阅读模式
点击数:1838|回复数:15
Hynix CJR颗粒特性

Hynix CJR颗粒(H5AN8G8NCJR,C Die)是SK Hynix去年开始量产的1x nm内存颗粒,今年开始大规模铺货,许多模组厂频率3000C15/3200C16/3600C17/19的中端产品都用这个颗粒。CJR颗粒特性是放宽TRCD到20-21以上,频率就很容易上到4000以上,吃电压程度一般,缺点是TRFC收不下来。虽然时序表现不如三星B Die,但是价格比较平民,所以CJR颗粒也可以看作让DDR4-4000走向普及的一步(当然现在还有Micron E Die)。另外,CJR颗粒对锐龙平台的兼容性比较友好,这一年以来也受到很多锐龙平台用户的追捧。

锐龙3000系列CPU内存控制器比之前两代有了更大的进步,虽然由于GMI2总线频率瓶颈和IF总线同步的问题存在,甜点性能还是在3600-3800这段频率,但是向上打开更多的空间也为内存超频玩家提供了更多的可玩性。

金士顿给我提供了两套不带灯的HyperX Fury 3200C16 8GB*2套装,用的是Hynix CJR颗粒。


Intel Z390平台测试

首先Intel平台上快速摸底测试,一套4133 17-22-22可以过MT,另外一套是4000 17-21-21过MT,表现都比之前测的RGB那套稍好,对于CJR来讲算是中等Bin等级,对于3200的套条来讲已经是不错的表现,这些就不多说了。关于CJR在Intel平台、锐龙1、2代平台上的超频分享网上有很多,锐龙3代的还比较少,所以后面我们都拿4133那套在锐龙3代平台跑测试。




另外多说一句,Intel平台我使用的主板是MSI Z390 Gaming Pro Carbon,如果你使用Single Rank的内存,而且只打算插两条,建议考虑Daisy Chain走线的主板,如华硕,微星的绝大多数Z370、Z390都是。某些T-Topology走线的主板,对A2板型CJR颗粒BIOS优化得还不够好,有可能跑不上4000频率,但是3866应该OK,插四条的表现可能也会比两条更好。

AMD平台超频内存的注意事项(一)

下面重点说AMD平台。我们使用的是Ryzen 9 3900X处理器和技嘉X570 AORUS PRO WIFI主板,官方标注最大可以支持到DDR4-4400的内存频率。首先还是重复下Zen 2多Die设计架构对内存的影响。

Zen 2 Matisse CPU的GMI2、Infinity Fabric(IF)总线,看下图。


在Zen2架构中,CCD通过GMI2总线连接IOD,之后再由IF总线连接内存控制器。BIOS里只能调IF总线频率,不能调GMI2频率,现在的软件也不能显示GMI2频率。然而实际制约内存效能的就是GMI2总线频率,只要它和内存频率不同步,延迟就会增加,而且频率上不去的也是它。对于GMI2频率是否和IF总线频率联动,就目前我调试的心得来看分两种情况:

A.        IF总线和内存频率同步时,GMI2总线频率和IF联动,此时内存延迟比较小;
B.        IF总线和内存频率异步时,GMI2总线频率强制设定为内存频率/2,即便IF频率高于内存频率。

例如,在内存跑在DDR4-3200 16-18-18时:IF频率1867MHz,内存延迟80ns,此时GMI2频率可能只有800MHz;IF频率1600MHz,内存延迟73.5ns,此时GMI2频率和IF一样1600MHz。

(并且技嘉X570 AORUS PRO主板BIOS里,清CMOS不会重置AGESA里的设置值,所以IF频率可能要你手动改回Auto,其他主板是不是这样不清楚)

HyperX Fury DDR4-3200 16-18-18内存在XMP模式下的效能:


拉高IF总线频率会减轻GMI2异步带来的效能损失,在技嘉X570 AORUS PRO WIFI主板上,内存频率超过3600之后,BIOS会自动把IF总线频率设置在1800MHz,绝大部分CPU在1800MHz还能往上一点点,需要你自己摸索。根据不同CPU的体质,根据我自己测试和网上观察的情况,IF总线的极限频率分布情况大约是:

1933MHz=5%的极品能上
1900MHz=30%体质好的能上,而且跟核心体质无关
1867MHz=60%,大部分都能上
1833MHz=90%,极少数不能上
1800MHz=98%,算是保底了
1800MHz以下的渣渣=2%,算你脸黑,不知道买3600的内存开XMP点不亮能RMA不?

并且加任何电压基本都不管用。

这就直接决定了你这颗CPU能达到的最大甜点内存频率,得到开头我们说的锐龙三代甜点内存频率是3600-3800MHz的结论。

另外,关于IF总线的CLDO_VDDG电压,可能在内存频率超过4500以后加一下会管用,目前我是没有碰到需要加的情况。同时,这个电压和SOC电压、VDDG电压都有联动关系,加CLDO_VDDG电压也要跟着加VDDG电压,VDDG电压必须要高于CLDO_VDDG电压。

AMD平台超频内存的注意事项(二)

不得不说现在的主板影响内存超频很大。和Intel平台类似的,4 DIMM主板的内存走线分Daisy Chain和T-Topology走线两种,华硕、微星大多在用Daisy Chain,技嘉、华擎有些还在用T-Topology。但是近两年的情况来看,随着内存频率的提升,技嘉和华擎也在逐步改走Daisy Chain,毕竟这样频率能上得更高,东西好不好卖,不看疗效看广告。哦,讲得好听点叫适应市场定位,同一家厂商两种走线都会做,毕竟做出了4DIMM的板子就要考虑到有些人需要插两根内存,有人需要插四根内存,还要满足他们跑高频的(无礼)要求。

当然不是说Daisy Chain就一定比T-Topology好。对于4DIMM的主板来讲,我们知道内存一个通道两个DIMM线路要求等长,所以对于一根信号线来说,从CPU出来后到两个不等距离的DIMM,需要出现分叉的情况。所谓Daisy Chain,就是先直连远的那个DIMM,再折返到另一个DIMM,因此就是把一条线尽量拉直,另外一个分叉弯折得比较多;而T-Topology就是T字形,把线拉到两个DIMM中间,再两边等长弯折。而内存频率受到走线影响的一个关键因素就是走线的弯折情况。所以Daisy Chain在插两条内存时优先选择DIMM2、4,可以得到最好的信号完整度,而插四条内存时就要用到弯折得比较多的那条线,能上到的最高频率会有所下降。T-Topology走线在使用两根内存时,信号可能会出现弯折,插四根内存时,一条线两个DIMM就可以达成完美的并联。

如果觉得上面那段关于走线的文字看不懂,我建议你边看下面的图边看上面那段话。懒得画了,嫖老外的一张图来辅助说明下:


所以简单来说,你要插两条内存且要追求极致高频,就选Daisy Chain走线的主板,如果要插四条内存且上高频,那你可以考虑T-Topology。至于某家的Daisy Chain会不会比另一家的T-Topology更好或更坏,我只能告诉你凡事皆有可能,毕竟走线方式只是其中一个因素,主板本身的电气性能,PCB层数等对频率也会有影响。你拿个2DIMM直连的丐版B350上5000给我试试?

再者,主板规格表标注的频率是一定能上的,但不是什么内存都能上。你要看它测试这个频率用的是什么颗粒,不能光看主板规格表里标注能支持到多少频率,还要仔细看一下内存的QVL文档,看看厂商是用什么颗粒上的,上去的时序是多少,你手上的内存是不是这个颗粒。

不同内存颗粒对主板走线的敏感度也不太一样,现在的情况好像是Micron E Die < Hynix CJR < Samsung B Die,也就是说Micron E Die在T-Topology走线主板上也能上很高的频率,例如华擎X570太极就是这个情况。当然我手上的内存和主板资源都很有限,因此不太确定。

超频效能测试


好了,说完架构问题,下面开始超内存。既然锐龙三代的甜点频率已经在4000以下,那超到4000以上还有什么用呢?玩呗。

先看效能。

Hynix CJR 3733 C16-19-19,甜点效能,读写速度可观,延迟最低。


三星B Die 4333 C17-19-19(之前测的,BIOS和AIDA64版本比较老一点,但不影响),三星B Die还是非常强,4333都可以1T。但是IF总线异步抹杀了一切优势。


Hynix CJR 4400 C18-25-25,内存的读写性能受制于IF总线,基本和3733一样,延迟反而还高了10ns。


可以看到,延迟3733表现最好。如果是玩游戏的,这对你来说是重大利好,因为跑3733难度最低,带宽不差,延迟还最好,你完全可以把原本投入内存和主板的钱投入到显卡和SSD上。

超频稳定性测试

下面是摸极限频率和实际超频稳定性测试。

现在三大家的颗粒都已经有了上4000+的潜质,毕竟已经到了DDR4后期,其实上不去除了平台限制外,大多数情况是主板走线和BIOS的问题。

我们手里比较好的那套HyperX Fury 3200C16在Ryzen 9 3900X平台上1.45V DDR4-4333 18-24-24-41 Memtest,二三时序看Ryzen Master,VDDG电压不需要动。值得一提的是,tRRD_S设为7有助于稳定性提升和上高频,CR在4133以上不能1T,ProcODT设为53.3稳定性是最好的,tRFC2/4不用管。这个时序还是有优化空间的,但是你IF都异步了,还谈什么效能呢。


四根一起上,最多可以跑到4000的频率,4133跑测试也可以,但Memtest过不了。Gear Down Mode不能关,关了点不亮,所以只能CL18,电压1.45V轻松过。当然,如果你舍得加电压,也可以考虑CL16,我这里1.5V可以点亮,进系统蓝屏,1.55V跑到44%报错,再继续加电压应该可以过,时间关系我就不想跑了。


四根一起,3733C16-19-19,关闭Gear Down Mode的效能,和Intel平台一样,四根弥补了Single Rank先天性复制缺陷,然而复制61318MB/S已经超出理论值了?


总结

好了,以上就是全部心得,总结来说就三点:
1、Ryzen 3000系列处理器最佳甜点内存频率大约在DDR4-3600至3800,取决于你的IF总线能上多高;
2、DDR4-4000以上虽然很容易,但娱乐成分多,实际效能不会得到太多提升。
3、X570平台和Hynix CJR颗粒的超频调教过程总体还是比较舒服的,不折腾。虽然Hynix CJR时序和三星B Die差距较大,但实际效能不会差多少,考虑到价格差距和三星B Die停产,还是值得购买的。

最后再说一下HyperX这个Fury内存,它其实就是之前评测那套Fury RGB的无灯版本。HyperX其实之前就有3200频率的Fury内存,现在更新到CJR颗粒,CL值也由原来的18下降到16,没有了自动超频功能,却把手动超频的空间彻底打开了。对于一个可以取代三星B Die的亲民颗粒,这套HyperX Fury内存是一个好选择。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?注册

x
忘世 发表于 2019-9-9 17:55 | 显示全部楼层
现在更新到CJR,之前用的是什么颗粒?
来自苹果客户端来自苹果客户端
royalk  楼主| 发表于 2019-9-9 17:55 | 显示全部楼层
忘世 发表于 2019-9-9 17:55
现在更新到CJR,之前用的是什么颗粒?

AFR吧
羽落风尘 发表于 2019-9-9 22:18 | 显示全部楼层
之前买的3200 C18是镁光E



现在通过金士顿外包装的标签还能看出是用的哪种颗粒不?
taitan001 发表于 2019-9-9 23:04 | 显示全部楼层
我看老外好几个性能测试都有出现4G*4>8G*2的情况,这个是在T走线才会出现的情况吗
royalk  楼主| 发表于 2019-9-10 10:34 | 显示全部楼层
taitan001 发表于 2019-9-9 23:04
我看老外好几个性能测试都有出现4G*4>8G*2的情况,这个是在T走线才会出现的情况吗 ...

single rank的问题
royalk  楼主| 发表于 2019-9-10 10:34 | 显示全部楼层
羽落风尘 发表于 2019-9-9 22:18
之前买的3200 C18是镁光E

能的
aaaaaa889 发表于 2019-9-10 14:54 | 显示全部楼层
R大,打扰啦。最近换了8g单条的ddr4内存,发现同样频率和小参下面,8g双通道速度比4g双通道要快不少,其他配置和平台完全一样。难道内存和固态一样,有颗粒密度或者通道数的区别?或者我的主板默认参数是对8g有优化?内存条都是bdie,4g和8g单面条子。
SSD考察团 发表于 2019-9-10 14:56 | 显示全部楼层
之前的是镁光E,JEDEC就有3200参数,XMP 1.2v
新的马甲也变了吧
royalk  楼主| 发表于 2019-9-10 15:10 | 显示全部楼层
SSD考察团 发表于 2019-9-10 14:56
之前的是镁光E,JEDEC就有3200参数,XMP 1.2v
新的马甲也变了吧

变了,之前那个有SPD开机直接是3200,早期AFR,后面换micron
royalk  楼主| 发表于 2019-9-10 15:10 | 显示全部楼层
aaaaaa889 发表于 2019-9-10 14:54
R大,打扰啦。最近换了8g单条的ddr4内存,发现同样频率和小参下面,8g双通道速度比4g双通道要快不少,其他 ...

4G的B die,只有4个Bank?
aaaaaa889 发表于 2019-9-10 17:55 | 显示全部楼层
本帖最后由 aaaaaa889 于 2019-9-10 21:13 编辑
royalk 发表于 2019-9-10 15:10
4G的B die,只有4个Bank?

应该是的,4 banks是指单面四颗粒吗?

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?注册

x
547737657 发表于 2019-9-10 18:00 | 显示全部楼层
不知上6G的DJR在农企平台又能有怎样的表现,Intel那边总算达成5000亮机了
royalk  楼主| 发表于 2019-9-11 10:05 | 显示全部楼层
aaaaaa889 发表于 2019-9-10 17:55
应该是的,4 banks是指单面四颗粒吗?

是的,这种16bit 4bank的颗粒性能肯定是低的
aaaaaa889 发表于 2019-9-11 14:32 | 显示全部楼层
本帖最后由 aaaaaa889 于 2019-9-11 14:39 编辑
royalk 发表于 2019-9-11 10:05
是的,这种16bit 4bank的颗粒性能肯定是低的

哦哦,我去搜了一下颗粒的datasheet,不知道是不是bank group 4 和 2 的数量差距造成的性能差距?这个好像是ddr4的新特性?

搜到一段博客:越多越好,加速读写能力

家用电脑的内存控制器已经进入双通道内存控制器多年,加速原理为增加位宽,达到同时读写更多资料的能力。

另一种增加频宽的方法就是减少延迟,利用多个chip或是bank达成。一般的内存读取延迟为 命令下达 + 内存读取延迟 + 输出内容,如果命令下达延迟为2ns,内存读取延迟为10ns,输出内容延迟为2ns,那么读取两笔资料的延迟就是 (2+10+2) × 2 = 28ns。

如果能够将资料拆分到2颗内存颗粒上,那么这两笔读取延迟将降低至2+2+10+2=16ns,因为不需要等到前面一笔资料的读取完成才发出下一笔的读取命令,在第一笔资料进入内存读取时就可发出。这种概念也可应用到目前的SSD上,较多的ce分装的快速记忆芯片,通常都比较少ce封装的芯片来得快。

由时序图可以知道,下凡此种尽量拆分内存空间的作法,可以大幅减少延迟。







本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?注册

x
royalk  楼主| 发表于 2019-9-11 15:05 | 显示全部楼层
aaaaaa889 发表于 2019-9-11 14:32
哦哦,我去搜了一下颗粒的datasheet,不知道是不是bank group 4 和 2 的数量差距造成的性能差距?这个好像 ...

我觉得两者皆有原因,但是bankgroup的影响在台式机上没有办法比对。DDR3的时候16bit颗粒4个物理bank性能也是会低一些的,从笔记本内存也看得出。就好像1Rx8总是比2Rx8要慢一点同样道理。
您需要登录后才可以回帖 登录 | 注册

本版积分规则

快速回复 返回顶部