Zen2平台Hynix CJR颗粒超频研究

royalk · 发表于 2019-9-9 17:50

Hynix CJR颗粒特性

Hynix CJR颗粒（H5AN8G8NCJR，C Die）是SK Hynix去年开始量产的1x nm内存颗粒，今年开始大规模铺货，许多模组厂频率3000C15/3200C16/3600C17/19的中端产品都用这个颗粒。CJR颗粒特性是放宽TRCD到20-21以上，频率就很容易上到4000以上，吃电压程度一般，缺点是TRFC收不下来。虽然时序表现不如三星B Die，但是价格比较平民，所以CJR颗粒也可以看作让DDR4-4000走向普及的一步（当然现在还有Micron E Die）。另外，CJR颗粒对锐龙平台的兼容性比较友好，这一年以来也受到很多锐龙平台用户的追捧。

锐龙3000系列CPU内存控制器比之前两代有了更大的进步，虽然由于GMI2总线频率瓶颈和IF总线同步的问题存在，甜点性能还是在3600-3800这段频率，但是向上打开更多的空间也为内存超频玩家提供了更多的可玩性。

金士顿给我提供了两套不带灯的HyperX Fury 3200C16 8GB*2套装，用的是Hynix CJR颗粒。

Intel Z390平台测试

首先Intel平台上快速摸底测试，一套4133 17-22-22可以过MT，另外一套是4000 17-21-21过MT，表现都比之前测的RGB那套稍好，对于CJR来讲算是中等Bin等级，对于3200的套条来讲已经是不错的表现，这些就不多说了。关于CJR在Intel平台、锐龙1、2代平台上的超频分享网上有很多，锐龙3代的还比较少，所以后面我们都拿4133那套在锐龙3代平台跑测试。

另外多说一句，Intel平台我使用的主板是MSI Z390 Gaming Pro Carbon，如果你使用Single Rank的内存，而且只打算插两条，建议考虑Daisy Chain走线的主板，如华硕，微星的绝大多数Z370、Z390都是。某些T-Topology走线的主板，对A2板型CJR颗粒BIOS优化得还不够好，有可能跑不上4000频率，但是3866应该OK，插四条的表现可能也会比两条更好。

AMD平台超频内存的注意事项（一）

下面重点说AMD平台。我们使用的是Ryzen 9 3900X处理器和技嘉X570 AORUS PRO WIFI主板，官方标注最大可以支持到DDR4-4400的内存频率。首先还是重复下Zen 2多Die设计架构对内存的影响。

Zen 2 Matisse CPU的GMI2、Infinity Fabric（IF）总线，看下图。

在Zen2架构中，CCD通过GMI2总线连接IOD，之后再由IF总线连接内存控制器。BIOS里只能调IF总线频率，不能调GMI2频率，现在的软件也不能显示GMI2频率。然而实际制约内存效能的就是GMI2总线频率，只要它和内存频率不同步，延迟就会增加，而且频率上不去的也是它。对于GMI2频率是否和IF总线频率联动，就目前我调试的心得来看分两种情况：

A． IF总线和内存频率同步时，GMI2总线频率和IF联动，此时内存延迟比较小；
B． IF总线和内存频率异步时，GMI2总线频率强制设定为内存频率/2，即便IF频率高于内存频率。

例如，在内存跑在DDR4-3200 16-18-18时：IF频率1867MHz，内存延迟80ns，此时GMI2频率可能只有800MHz；IF频率1600MHz，内存延迟73.5ns，此时GMI2频率和IF一样1600MHz。

（并且技嘉X570 AORUS PRO主板BIOS里，清CMOS不会重置AGESA里的设置值，所以IF频率可能要你手动改回Auto，其他主板是不是这样不清楚）

HyperX Fury DDR4-3200 16-18-18内存在XMP模式下的效能：

拉高IF总线频率会减轻GMI2异步带来的效能损失，在技嘉X570 AORUS PRO WIFI主板上，内存频率超过3600之后，BIOS会自动把IF总线频率设置在1800MHz，绝大部分CPU在1800MHz还能往上一点点，需要你自己摸索。根据不同CPU的体质，根据我自己测试和网上观察的情况，IF总线的极限频率分布情况大约是：

1933MHz=5%的极品能上
1900MHz=30%体质好的能上，而且跟核心体质无关
1867MHz=60%，大部分都能上
1833MHz=90%，极少数不能上
1800MHz=98%，算是保底了
1800MHz以下的渣渣=2%，算你脸黑，不知道买3600的内存开XMP点不亮能RMA不？

并且加任何电压基本都不管用。

这就直接决定了你这颗CPU能达到的最大甜点内存频率，得到开头我们说的锐龙三代甜点内存频率是3600-3800MHz的结论。

另外，关于IF总线的CLDO_VDDG电压，可能在内存频率超过4500以后加一下会管用，目前我是没有碰到需要加的情况。同时，这个电压和SOC电压、VDDG电压都有联动关系，加CLDO_VDDG电压也要跟着加VDDG电压，VDDG电压必须要高于CLDO_VDDG电压。

AMD平台超频内存的注意事项（二）

不得不说现在的主板影响内存超频很大。和Intel平台类似的，4 DIMM主板的内存走线分Daisy Chain和T-Topology走线两种，华硕、微星大多在用Daisy Chain，技嘉、华擎有些还在用T-Topology。但是近两年的情况来看，随着内存频率的提升，技嘉和华擎也在逐步改走Daisy Chain，毕竟这样频率能上得更高，东西好不好卖，不看疗效看广告。哦，讲得好听点叫适应市场定位，同一家厂商两种走线都会做，毕竟做出了4DIMM的板子就要考虑到有些人需要插两根内存，有人需要插四根内存，还要满足他们跑高频的（无礼）要求。

当然不是说Daisy Chain就一定比T-Topology好。对于4DIMM的主板来讲，我们知道内存一个通道两个DIMM线路要求等长，所以对于一根信号线来说，从CPU出来后到两个不等距离的DIMM，需要出现分叉的情况。所谓Daisy Chain，就是先直连远的那个DIMM，再折返到另一个DIMM，因此就是把一条线尽量拉直，另外一个分叉弯折得比较多；而T-Topology就是T字形，把线拉到两个DIMM中间，再两边等长弯折。而内存频率受到走线影响的一个关键因素就是走线的弯折情况。所以Daisy Chain在插两条内存时优先选择DIMM2、4，可以得到最好的信号完整度，而插四条内存时就要用到弯折得比较多的那条线，能上到的最高频率会有所下降。T-Topology走线在使用两根内存时，信号可能会出现弯折，插四根内存时，一条线两个DIMM就可以达成完美的并联。

如果觉得上面那段关于走线的文字看不懂，我建议你边看下面的图边看上面那段话。懒得画了，嫖老外的一张图来辅助说明下：

所以简单来说，你要插两条内存且要追求极致高频，就选Daisy Chain走线的主板，如果要插四条内存且上高频，那你可以考虑T-Topology。至于某家的Daisy Chain会不会比另一家的T-Topology更好或更坏，我只能告诉你凡事皆有可能，毕竟走线方式只是其中一个因素，主板本身的电气性能，PCB层数等对频率也会有影响。你拿个2DIMM直连的丐版B350上5000给我试试？

再者，主板规格表标注的频率是一定能上的，但不是什么内存都能上。你要看它测试这个频率用的是什么颗粒，不能光看主板规格表里标注能支持到多少频率，还要仔细看一下内存的QVL文档，看看厂商是用什么颗粒上的，上去的时序是多少，你手上的内存是不是这个颗粒。

不同内存颗粒对主板走线的敏感度也不太一样，现在的情况好像是Micron E Die < Hynix CJR < Samsung B Die，也就是说Micron E Die在T-Topology走线主板上也能上很高的频率，例如华擎X570太极就是这个情况。当然我手上的内存和主板资源都很有限，因此不太确定。

超频效能测试

好了，说完架构问题，下面开始超内存。既然锐龙三代的甜点频率已经在4000以下，那超到4000以上还有什么用呢？玩呗。

先看效能。

Hynix CJR 3733 C16-19-19，甜点效能，读写速度可观，延迟最低。

三星B Die 4333 C17-19-19（之前测的，BIOS和AIDA64版本比较老一点，但不影响），三星B Die还是非常强，4333都可以1T。但是IF总线异步抹杀了一切优势。

Hynix CJR 4400 C18-25-25，内存的读写性能受制于IF总线，基本和3733一样，延迟反而还高了10ns。

可以看到，延迟3733表现最好。如果是玩游戏的，这对你来说是重大利好，因为跑3733难度最低，带宽不差，延迟还最好，你完全可以把原本投入内存和主板的钱投入到显卡和SSD上。

超频稳定性测试

下面是摸极限频率和实际超频稳定性测试。

现在三大家的颗粒都已经有了上4000+的潜质，毕竟已经到了DDR4后期，其实上不去除了平台限制外，大多数情况是主板走线和BIOS的问题。

我们手里比较好的那套HyperX Fury 3200C16在Ryzen 9 3900X平台上1.45V DDR4-4333 18-24-24-41 Memtest，二三时序看Ryzen Master，VDDG电压不需要动。值得一提的是，tRRD_S设为7有助于稳定性提升和上高频，CR在4133以上不能1T，ProcODT设为53.3稳定性是最好的，tRFC2/4不用管。这个时序还是有优化空间的，但是你IF都异步了，还谈什么效能呢。

四根一起上，最多可以跑到4000的频率，4133跑测试也可以，但Memtest过不了。Gear Down Mode不能关，关了点不亮，所以只能CL18，电压1.45V轻松过。当然，如果你舍得加电压，也可以考虑CL16，我这里1.5V可以点亮，进系统蓝屏，1.55V跑到44%报错，再继续加电压应该可以过，时间关系我就不想跑了。

四根一起，3733C16-19-19，关闭Gear Down Mode的效能，和Intel平台一样，四根弥补了Single Rank先天性复制缺陷，然而复制61318MB/S已经超出理论值了？

总结

好了，以上就是全部心得，总结来说就三点：
1、Ryzen 3000系列处理器最佳甜点内存频率大约在DDR4-3600至3800，取决于你的IF总线能上多高；
2、DDR4-4000以上虽然很容易，但娱乐成分多，实际效能不会得到太多提升。
3、X570平台和Hynix CJR颗粒的超频调教过程总体还是比较舒服的，不折腾。虽然Hynix CJR时序和三星B Die差距较大，但实际效能不会差多少，考虑到价格差距和三星B Die停产，还是值得购买的。

最后再说一下HyperX这个Fury内存，它其实就是之前评测那套Fury RGB的无灯版本。HyperX其实之前就有3200频率的Fury内存，现在更新到CJR颗粒，CL值也由原来的18下降到16，没有了自动超频功能，却把手动超频的空间彻底打开了。对于一个可以取代三星B Die的亲民颗粒，这套HyperX Fury内存是一个好选择。

忘世 · 发表于 2019-9-9 17:55

现在更新到CJR，之前用的是什么颗粒？

royalk · 发表于 2019-9-9 17:55

忘世发表于 2019-9-9 17:55
现在更新到CJR，之前用的是什么颗粒？

AFR吧

羽落风尘 · 发表于 2019-9-9 22:18

之前买的3200 C18是镁光E

现在通过金士顿外包装的标签还能看出是用的哪种颗粒不？

taitan001 · 发表于 2019-9-9 23:04

我看老外好几个性能测试都有出现4G*4>8G*2的情况，这个是在T走线才会出现的情况吗

royalk · 发表于 2019-9-10 10:34

taitan001 发表于 2019-9-9 23:04
我看老外好几个性能测试都有出现4G*4>8G*2的情况，这个是在T走线才会出现的情况吗 ...

single rank的问题

royalk · 发表于 2019-9-10 10:34

羽落风尘发表于 2019-9-9 22:18
之前买的3200 C18是镁光E

能的

aaaaaa889 · 发表于 2019-9-10 14:54

royalk 发表于 2019-9-10 10:34
能的

R大，打扰啦。最近换了8g单条的ddr4内存，发现同样频率和小参下面，8g双通道速度比4g双通道要快不少，其他配置和平台完全一样。难道内存和固态一样，有颗粒密度或者通道数的区别？或者我的主板默认参数是对8g有优化？内存条都是bdie，4g和8g单面条子。

SSD考察团 · 发表于 2019-9-10 14:56

之前的是镁光E，JEDEC就有3200参数，XMP 1.2v
新的马甲也变了吧

royalk · 发表于 2019-9-10 15:10

SSD考察团发表于 2019-9-10 14:56
之前的是镁光E，JEDEC就有3200参数，XMP 1.2v
新的马甲也变了吧

变了，之前那个有SPD开机直接是3200，早期AFR，后面换micron

royalk · 发表于 2019-9-10 15:10

aaaaaa889 发表于 2019-9-10 14:54
R大，打扰啦。最近换了8g单条的ddr4内存，发现同样频率和小参下面，8g双通道速度比4g双通道要快不少，其他 ...

4G的B die，只有4个Bank？

aaaaaa889 · 发表于 2019-9-10 17:55

本帖最后由 aaaaaa889 于 2019-9-10 21:13 编辑

royalk 发表于 2019-9-10 15:10
4G的B die，只有4个Bank？

应该是的，4 banks是指单面四颗粒吗？

发表于 2019-9-10 18:00

不知上6G的DJR在农企平台又能有怎样的表现，Intel那边总算达成5000亮机了

royalk · 发表于 2019-9-11 10:05

aaaaaa889 发表于 2019-9-10 17:55
应该是的，4 banks是指单面四颗粒吗？

是的，这种16bit 4bank的颗粒性能肯定是低的

aaaaaa889 · 发表于 2019-9-11 14:32

本帖最后由 aaaaaa889 于 2019-9-11 14:39 编辑

royalk 发表于 2019-9-11 10:05
是的，这种16bit 4bank的颗粒性能肯定是低的

哦哦，我去搜了一下颗粒的datasheet，不知道是不是bank group 4 和 2 的数量差距造成的性能差距？这个好像是ddr4的新特性？

搜到一段博客：越多越好，加速读写能力

家用电脑的内存控制器已经进入双通道内存控制器多年，加速原理为增加位宽，达到同时读写更多资料的能力。

另一种增加频宽的方法就是减少延迟，利用多个chip或是bank达成。一般的内存读取延迟为命令下达 + 内存读取延迟 + 输出内容，如果命令下达延迟为2ns，内存读取延迟为10ns，输出内容延迟为2ns，那么读取两笔资料的延迟就是 (2+10+2) × 2 = 28ns。

如果能够将资料拆分到2颗内存颗粒上，那么这两笔读取延迟将降低至2+2+10+2=16ns，因为不需要等到前面一笔资料的读取完成才发出下一笔的读取命令，在第一笔资料进入内存读取时就可发出。这种概念也可应用到目前的SSD上，较多的ce分装的快速记忆芯片，通常都比较少ce封装的芯片来得快。

由时序图可以知道，下凡此种尽量拆分内存空间的作法，可以大幅减少延迟。

royalk · 发表于 2019-9-11 15:05

aaaaaa889 发表于 2019-9-11 14:32
哦哦，我去搜了一下颗粒的datasheet，不知道是不是bank group 4 和 2 的数量差距造成的性能差距？这个好像 ...

我觉得两者皆有原因，但是bankgroup的影响在台式机上没有办法比对。DDR3的时候16bit颗粒4个物理bank性能也是会低一些的，从笔记本内存也看得出。就好像1Rx8总是比2Rx8要慢一点同样道理。

发表于 2019-9-28 22:55

R大，在此阐述，CJR不“吃压”仅表像

CJR需更高的电压方可收紧CL
假设3866C15>>C14: B die +0.05v, C9BJZ +0.1v, CJR +0.15v

而常规用户的电压范围普遍在1.4~1.5v，不“吃压”在1.35~1.45v
0.05v可能决定一个CL，乃至几个小参的差异。如 tRFC在1.35~1.4时比1.5~1.55v更高

最近已知的几款DDR4颗粒，可长期运行于标准DDR3的电压下：
即将正式铺开的DJR 1.5~1.55v，上限预计1.65附近
美光E die 1.5v，上限同DJR。分大S，美光的D9VPP，英睿达的C9BJZ

royalk · 发表于 2019-9-29 10:04

547737657 发表于 2019-9-28 22:55
R大，在此阐述，CJR不“吃压”仅表像

我没说CJR不吃压。。CL值给电压就能上，4000C16在1.5v左右日常还是可以用的。

发表于 2019-9-30 08:01

理解了，不过很多人将“不吃压”理解成“不耐压”

陈佳鑫陈帆 · 发表于 2021-2-3 09:55

现在2021年了求R大推荐性价比高的超频内存

Zen2平台Hynix CJR颗粒超频研究

本帖子中包含更多资源

本帖子中包含更多资源

本帖子中包含更多资源