PCEVA,PC绝对领域,探寻真正的电脑知识
开启左侧

AMD Ryzen 7 1800X评测直播帖

[复制链接]
royalk 发表于 2017-3-13 12:53 | 显示全部楼层 |阅读模式
点击数:240355|回复数:396
4.12更新 Ryzen 5的评价及Win 10 RS2年度更新后测试对比
4.10更新 多线程编译测试,单CCX和双CCX对并行计算的影响(356楼)。
3.20更新 线程调度改进后对性能的影响
3.17更新 内存单双面、单通道双通道对性能的影响
3.14更新 4GHz同频对比6900K

------------------------

许多精华内容在后头,请耐心爬楼。

------------------------
写在开头:

1、现在Windows 10操作系统无法正确识别Ryzen的核心与线程,似乎是识别成16C16T,且每个core有独立的L3...

2、现有跑分软件,很多无法正确识别Ryzen处理器,导致所使用的指令集不正确,进而性能也不正常。

3、目前主板BIOS和相关调试软件对Ryzen的支持程度有限,Ryzen的可玩性还未完全发挥。

据说,微软的17年年度更新,就是因为Ryzen而延期,所以,你现在所看到的Ryzen在Windows系统下的跑分数据,以及使用情况,都有可能在下个月微软发布年度更新后有很大改变。PCEVA这次没有赶首发评测,也正是出于这些问题的考虑,但最近大家的呼声越来越高,因此我先开此直播帖,诚邀大家共同解决问题并分享解决问题的方法。



就目前看来,三星14nm LPP工艺是限制Ryzen频率提升的一大关键,基本上能稳定工作的主频都卡在4.0-4.1G,包括1800X XFR频率最大也是到这个数,此时电压已经接近或达到1.5V。超频同时会禁用XFR,Ryzen内置的电路调整模块dLDO也会改变控制VID的策略,禁用vDroop,大概1.35v可以跑到3.8G的水平,无论是1700还是1800X差异都不大。所以综上所述,论Ryzen 7最值得买的型号,我认为是Ryzen 7 1700。

现有测试数据对比


分析:

1、SuperPI虽然表面上看1800X和5960X、6950X表现差不多,但考虑到1800X的主频要高,所以还是Haswell-E/Broadwell-E架构更快一些,猜想可能是Ryzen的内存延迟高导致。

2、3DMark FireStrike物理分,16线程收益有限,高主频更能拉分,所以7700K也就比1800X少了2000分,而1800X也因为频率的缘故,比5960X多了2000分。

3、WinRAR,主要看内存速度,双通道还是不如四通道,核心多也用不上,跑分接近7700K的双通道。

4、国际象棋,表示Ryzen的整数还差一些,估计接近Nehalem的水平。

5、内存读写复制:表现不错,比7700K的IMC好些,但延迟高,导致一些测试会吃亏。AIDA64表示对Ryzen的内存性能衡量是正确的,所以延迟高。

6、L1读写复制:AIDA64同样表示对Ryzen的性能衡量是正确的,看来AVX2的速度是跑不出来了。

7、Cinebench、x264 FHD Benchmark:Ryzen的强项,可以打败5960X。

8、功耗:表现还不错,但没想象中的那么好,估计1700频率低电压低,会好一些。


Ryzen的出现对现有处理器及平台的影响


X99
对6800K、5820K这类6核CPU来讲,Ryzen 7 1700因为核心数量优势,会对前两者造成不小的冲击,尤其是渲染、视频转码,是Ryzen的强项。但对于行业客户来讲,出于可靠性的考虑,我仍然不建议使用Ryzen这个不成熟的平台。

对于囤X99等洋垃圾的用户来讲,我认为Ryzen对你们的影响并没有想象中的那么大,首先E5v3、v4的核心数会更多,多线程在渲染上收益也更大,可以反杀Ryzen,例如E5-2683v3的Cinebench R15成绩基本上是和Ryzen 7 1800X打平。另外,X299很可能像Skylake一样,从ME上禁止桌面主板使用Xeon处理器了,方便性可能还不如X99。

Z170/Z270
很多人问,我到底是该选7700K还是该选Ryzen 1700。我觉得这个问题很好解决,7700K核心数少,但单线程能力强,在绝大多数游戏、日常工作上肯定占优,而Ryzen 7反过来,核心数多一倍,但单线程能力较弱,适合处理多线程多任务的工作。



以下目录是本次直播帖要做的事情,大家如有需要补充,可跟帖说明。

一、基本概念
      1.Ryzen型号√
      2.关键技术√
      3.选购分析:Ryzen的出现对现有处理器及平台影响√

二、基准性能测试
      1.默频√
      2.超到4G,同频对比6950X、7700K√
      3.内存2133和3200、Data Fabric(100GB/s,内存足够,未来APU可能才有用)√
      4.内存4条和2条,单面和双面√
      5.Win10下线程分配、缓存映射问题对性能的影响√
      6.Ryzen的目前优化得比较好的进阶测试项目,Blender、Handbrake等;
      7.Ryzen的弱项,DrawCall,Adobe软件,游戏FPS

三、超频研究
      1.三星14nm LPP工艺之电压、频率、温度和功耗的关系
      2.发热量、测温准确度
      3.12V输入功率及主板供电负载压力情况
      4.现有烧机软件对ryzen指令集的支持情况
      5.1.5V超到4.1G的稳定性

四、PPT信息兑现情况
      1.神经网络判断
      2.SenseMI
      3.XFR工作机制验证

五、Ryzen的最佳工作状态

收费计划:本帖拟于4月15日后收费10阅读券,之前免费,能提供优秀回复内容的可奖励10阅读券。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?注册

x
royalk  楼主| 发表于 2017-3-13 12:53 | 显示全部楼层
Ryzen型号

AMD首发的Ryzen处理器,只有Ryzen 7系列的三款,1800X、1700X和1700,都是8核16线程。其中1800X和1700X的TDP为95W,1700的TDP为65W。它们除了默认频率外无其他规格上的区别,且三颗处理器都不锁倍频。


国行售价分别为人民币3999、3099和2499元,按AMD官方信息来讲,对标Intel的型号分别为6900K、6800K和7700K。


型号命名含义,取自官方资料,一些有意思的信息透露出来,第二位8上头还有9,第三四位除了00还有20和50,所以或许后期会有Ryzen 7 1950X之类的东西。另外,APU的命名,应该是在数字后边加上字母G。


OPN编号解读,之前Ryzen正式发布前已经介绍过,正式版果然又有所变动。以1800X为例,YD180XBCM88AE


第一位,Y表示正式版Ryzen,而Z表示QS,1和2都是ES。
第二位D,表示Desktop,即桌面处理器,另外还有S表示服务器,M表示移动版。
3-6位,表示型号,180X就是1800X,如果是Ryzen 7 1700则是1700。
第7-8位,BC,表示TDP值,BC为95W,BB为65W,之前ES的时候是BA,也是95W。
第9位M,表示封装,M为AM4,V为SP3。
第10位8,表示核心数,8核。
第11位8,表示缓存容量。8为4MB L2+16MB L3,K为2MB L2+8MB L3,H为16MB L2+64MB L3,六核的情况,还不得而知。
第12、13位是步进,目前正式版应该都是AE,即ZP-B1步进。

关键技术

XFR
1.即Extended Frequency Range,它是在Boost频率基础上进一步自动超频的技术,中文名叫“自适应动态扩频”。
2.会根据你的CPU工作情况,如负载、工作温度等,自动判定是否激活,以及XFR的高度。
3.并非带X的型号才有XFR,1700也是有的,但据说只有50MHz,手上有处理器的各位可以验证一下。
4.XFR不需要X370才能激活,B350一样可以,但总归来说,空间有限。
5.当手动超频时,XFR会自动禁用。

SenseMI
1.这是一个包装词汇,里边包含了好几个功能。
2.精准功耗控制、精准智能超频,分别实现限制TDP和以25MHz为步进自动超频的功能。据说AMD在每个CCX里埋下了1000多个传感器,随时感知这些变化。
3.XFR,上面说过了。
4.神经网络预测,智能数据预读。这个东西就复杂了,可以根据程序代码和用户使用习惯自动重构L1缓存内部的临时映射,以提高预判的成功率。吐个槽,这东西现阶段实在有点多余,看看以后谁会为这功能单独写代码吧。

dLDO
这是AMD在Ryzen处理器里设计的一个电压管理模块,类似Intel的FIVR,但区别是,Intel是把12V输入由主板降压至1.8V的Input电压,再由FIVR接管分配到CPU各区域不同的电压,而Ryzen不一样,dLDO是让主板12V输入降压至Vcore值,再由Vcore值转换到各个区域的电压,这样的好处是把需求电流最大的Core电压无需转换直出了,可以提高不少效率。所以AMD在PPT里说,FIVR最多90%的效率,而我们的dLDO有95%。另外dLDO还可以分别控制每个core的VDD,体质好的core降低电压以让出TDP Cap,达到不损失性能而节约能源的目的。

CCX
AMD自从收了ATI那帮人后,模块化设计就玩得很6,推土机如此,Ryzen也不例外。每个模块叫一个CCX,包含4个Zen Core、L1、L2和8MB的L3缓存,CCX之间通过Data Fabric连接。两个CCX之间是可以互通访问的,但是延迟会比较大,在一些多线程任务处理上,例如编译代码,会有点影响。

Data Fabric
类似Intel的QPI总线,除了连接CCX之间外,还连接内存,SoC部分,甚至以后APU当中CPU与GPU之间,AMD给出的带宽是100GB/s,速度是内存频率的一半,例如内存在2133MHz时,Data Fabric频率就是1066MHz,它可以从CPU-Z中内存项那里看到。超频内存可以提升它的频率,可以进一步扩大带宽。另外许多人口中传的22GB/s的带宽,是法国佬的猜想,并无实际测试数据支持,请大家看清原文,不要再以讹传讹了。

P-State
不是新概念了,P就是Performance,顾名思义,就是控制频率影响性能的状态。P0状态下,CPU以默频运行,P1状态应该是表示Throttle,也就是要么过热要么功耗超TDP而降频了,1800X频率会低至3.2GHz,而P2状态是待机状态,频率为2.2GHz。但是AMD又说了,我们的精准智能超频不仅有这3个P-State,而是以25MHz为步进的无数个!...听着乐呵乐呵就好了。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?注册

x
royalk  楼主| 发表于 2017-3-14 16:35 | 显示全部楼层
1800X超到4G,随便设的offset +0.072v,大约是1.42v的电压,内存可以直接开XMP到3200。

Intel平台,6950X关掉2个核心,8C16T,基本等效于6900K,主频4G,Ring 3.6G,内存开XMP 3200,平台分别测试四通道和双通道。


同频下,结论和AMD之前演示的差不多,浮点战平Broadwell-E没什么问题,也基本达到大家的预期。

几个分析点提一下:
1.内存频率的提升,对Ryzen整数性能有较为明显的提升,从国际象棋可以明显看出来。
2.整数方面,即使是内存同频,还是比Intel弱10%。
3.AVX效能,AIDA64只跑出Intel平台的一半,也就是AVX128的吞吐量。关于这个问题后面会做更深入的测试。
4.WinRAR,之前在楼层答复网友的解释有误,不是看内存带宽,而主要看内存延迟,Intel平台就算拿掉两根内存也还是占优,当然可能跟L3缓存速度也有一定关系。
5.功耗方面,待机如果开启节能,两者不会差太多,如果关了节能,那么AMD平台由于PCIE控制器规模没那么大,待机功耗占优;满载功耗,跑整数大家都差不多,跑浮点,由于Prime95无法正确支持Ryzen,用的还是K10的SSE指令集,所以最大功耗跑不出来。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?注册

x
royalk  楼主| 发表于 2017-3-17 12:38 | 显示全部楼层
再来看下Ryzen对内存单双面、两条四条及单通道的影响。BIOS设置默认,仅更换内存,内存都跑在2133C15。




可以看到,Ryzen使用单双面内存对性能影响比较小,不像之前的APU对核显的影响那么大,但双面内存由于rank数增加,寻址延迟会进一步加大,超频起来也会更困难。鉴于内存超频对Ryzen DF频率的提升,对整体性能也有一定提升,建议还是优先考虑单面内存。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?注册

x
royalk  楼主| 发表于 2017-3-20 17:09 | 显示全部楼层
好了,对比一下打补丁前后的最后两列,同时功耗更新Prime 95 29.1。发现SuperPI 32M、AIDA64内存延迟、x264FHD这类CPU不完全满载的应用,提升还是有的。相信游戏测试方面应该也有了一定的提升。


然而,新的线程调度机制似乎也没有完美解决问题,国际象棋4个线程,自动分配,还是跑到了两个CCX里。所以猜测这只是微软出的一个临时解决问题的机制,把Ryzen变成和Intel一样的调度方式了。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?注册

x
royalk  楼主| 发表于 2017-4-10 18:00 | 显示全部楼层
今天系统的跑了一下编译测试,这是一个使用VC++并行编译的脚本,编译3000个CPP文件,用满16线程。
测试发现2+2和4+0的差别并没有想象中的大,当然总体来说4+0还是更好,但第一次跑或多或少都会出现用时偏久的情况(这个情况在国际象棋、superpi等也会出现),随着跑的次数增加,成绩趋于变好,趋于稳定,且4+0和2+2的差距也逐渐缩小。

现在ASUS的BIOS加入了Performance Bias功能,似乎可以改善分支预测,我推测在ASUS主板上这种情况可能会得到一定缓解。

2+2,第一次跑的截图




4+0,第一次跑的截图


4+4的对比参考


成绩统计,每个设定各跑10次,没统计到小数点后面,误差1秒内我都忽略了。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?注册

x
royalk  楼主| 发表于 2017-4-12 12:53 | 显示全部楼层
今天满大街都在测Ryzen 5,有没有忽略Win10的年度更新?

Ryzen 5其实没什么可测的,基本上都可以通过1800X关核心模拟出来,剩下的就是频率差别。260楼已经有模拟测试。

既然Ryzen 5开卖了,那就说两句。
1. Ryzen 5 1600X,除了砍掉两个核心外所有规格和1800X一样,价格减半,性价比凸显,而Ryzen 5 1600和带X的只差250元,频率降低至3.2/3.6G,相比1700X和1700的600元差价,Ryzen 5 1600定价偏高,应该有一定的降价空间,现阶段着实不太值得考虑。

2. Ryzen 5 1500X继续砍到4C8T,售价1499,砍了两个核心,价格又是差了250元,而Ryzen 5 1400在1500X的基础上进一步降低频率,砍了一半的L3缓存,售价1299。对于游戏用户来讲4C8T和6C12T、8C16T区别不大,加上现在Windows的补丁已经修正了Ryzen的线程调度问题,相信4C8T的Ryzen会是游戏用户的一个不错的选择。

3. 对于Ryzen 5 1400的L3缓存对性能的影响,我个人推测影响不大,260楼的测试显示,在关闭一个CCX(4+0)后L3缓存也是减半的,但部分测试项目表现比起2+2不降反增。目前说法比较倾向于1400还是2+2的配置,所以我认为1400的性能会比我们模拟的4+0稍差,和2+2差不多。

4. 超频方面,Ryzen 5全部不锁倍频,但三星14nm LPP还是首要制约因素,所以超频能力应该都会在3.9-4.0G的水平,4.1G是风冷极限。

综上所述,定位最高的Ryzen 5 1600X和最低的Ryzen 5 1400是比较值得购买的对象。

--------------
3月16日,Windows悄悄推出了一个补丁,同时AMD给厂商推了AGESA 1.0.0.3,这两个都打上后修正了Win 10下Ryzen的线程调度问题,几天后,Prime 95更新29.1,正确支持Ryzen的FMA3指令集,所有的这些,198楼都已有测试。又过了几天,AIDA64更新5.90,可正确测得Ryzen的L2、L3缓存速度,奇点灰烬更新补丁,提升Ryzen的性能,这些大家都已经知道。

4月6日,微软发布Win 10 RS2年度更新ISO(即Build 15063.13),4月11日,Windows Update开始推送这个更新。这个版本累积了之前3月16日的更新,解决了Ryzen的线程调度问题,我们更新了系统后再次对Ryzen进行测试。




可以看到,3月16日之后的更新(第三列)已经解决线程调度问题,基准测试项目该提升的已经提升了,4月11日的RS2大更新并没有继续获得性能的提升,反而是SuperPI 32M的性能有较大幅度的倒退,原因我们还在排查中。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?注册

x
waterlau 发表于 2017-3-13 13:05 | 显示全部楼层
板凳已经留好,等待开播!
gtx9 发表于 2017-3-13 13:21 | 显示全部楼层
建议测试一下RYZEN的两个CCX的两种4核模式2+2/4+0

看看性能是否有区别


本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?注册

x
Phil_Libra 发表于 2017-3-13 13:30 | 显示全部楼层
建议加入ryzen超频和7700k超频的对比,同频说实话意义不大,谁买个7700k回来会降到4.1用啊,默认的都很少大部分还是想超的吧。
tujj99 发表于 2017-3-13 13:31 | 显示全部楼层
搬好小板凳!
gtx9 发表于 2017-3-13 13:33 | 显示全部楼层
Phil_Libra 发表于 2017-3-13 13:30
建议加入ryzen超频和7700k超频的对比,同频说实话意义不大,谁买个7700k回来会降到4.1用啊,默认的都很少大 ...

同频对比意义很大,能看出架构的差距


royalk  楼主| 发表于 2017-3-13 15:19 | 显示全部楼层
Phil_Libra 发表于 2017-3-13 13:30
建议加入ryzen超频和7700k超频的对比,同频说实话意义不大,谁买个7700k回来会降到4.1用啊,默认的都很少大 ...

连7700K的默频都超不到怎么办
royalk  楼主| 发表于 2017-3-13 15:20 | 显示全部楼层
gtx9 发表于 2017-3-13 13:21
建议测试一下RYZEN的两个CCX的两种4核模式2+2/4+0

看看性能是否有区别

基本上是核心间和缓存延迟的影响,可能大部分跑分看不出来
小夜叉 发表于 2017-3-13 15:28 | 显示全部楼层
X99洋垃圾党和X99 I7党等牙膏厂降价也得两年时间,出掉换RYZEN目前其实也是好选择,JS洋垃圾E5不降价也真没性价比,2683V3那些有磕碰暗病的实在还是需要点勇气,主频高点的E5V3 V4太过昂贵,便宜的都是ES版,总是RYZEN正式版来的靠谱多了
中华田园犬 发表于 2017-3-13 15:59 | 显示全部楼层
目前因为win10部分成绩可能不正常,会在年度补丁更新后再测一次么?
yeyehehe 发表于 2017-3-13 16:15 | 显示全部楼层
占个位置观望,我是Ryzen的潜在购买者
royalk  楼主| 发表于 2017-3-13 16:30 | 显示全部楼层
中华田园犬 发表于 2017-3-13 15:59
目前因为win10部分成绩可能不正常,会在年度补丁更新后再测一次么?

肯定要再测
royalk  楼主| 发表于 2017-3-13 16:31 | 显示全部楼层
小夜叉 发表于 2017-3-13 15:28
X99洋垃圾党和X99 I7党等牙膏厂降价也得两年时间,出掉换RYZEN目前其实也是好选择,JS洋垃圾E5不降价也真没 ...

洋垃圾这东西也不知道哪天说来就来的,ES是要碰运气,但我觉得QS还是OK的了,V3/V4的QS,应该都是一个步进,不像V1那么复杂。
quamtum 发表于 2017-3-13 16:48 | 显示全部楼层
建議可以跑multipar做大檔(total 20G)測試
https://www.livebusinesschat.com/smf/index.php?topic=6106.0
此程式是把一堆檔案做完整度的檢查,在有錯時可以回復
可選擇是否支援SSSE3或是CLMUL這種avx指令,也可以測試不同threads時的效能落差
royalk  楼主| 发表于 2017-3-13 16:55 | 显示全部楼层
为什么说Windows调度有问题,如果说两个CCX,那么优先调度前8个Threads还有理由,现在是4+0模式,跑4个线程,继续3核有难1核围观。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?注册

x
royalk  楼主| 发表于 2017-3-13 16:55 | 显示全部楼层
quamtum 发表于 2017-3-13 16:48
建議可以跑multipar做大檔(total 20G)測試
https://www.livebusinesschat.com/smf/index.php?topic=6106.0
...

好的,下下来了,明天跑。
eraser666 发表于 2017-3-13 17:03 | 显示全部楼层
这调度,锤地```````````
haomingci3 发表于 2017-3-13 17:45 | 显示全部楼层
建议加入游戏功耗测试和视频功耗测试,预见一下移动端zen与bw和kbl的实力对比
来自苹果客户端来自苹果客户端
qsmcomp 发表于 2017-3-13 18:52 | 显示全部楼层
本帖最后由 qsmcomp 于 2017-3-13 18:57 编辑

不知道有没有能力做Linux性能测试,类似Phoronix这种
http://www.agner.org/optimize/blog/read.php?i=49
另外这里介绍了用虚拟化技术把AMD CPU伪装成Intel CPU的方法。
https://github.com/jimenezrick/patch-AuthenticAMD
这是把用Intel优化编译器编译出来的程序中性化的工具。
您需要登录后才可以回帖 登录 | 注册

本版积分规则

快速回复 返回顶部