PCEVA,PC绝对领域,探寻真正的电脑知识
打印 上一主题 下一主题
开启左侧

AMD Ryzen 7 1800X评测直播帖

  [复制链接]
81#
wltzwr 发表于 2017-3-14 14:43 | 只看该作者
种种迹象表明 AMD确实有了巨大进步   然而这代ryzen感觉还是不适合入手     各种奇奇怪怪的问题 层出不穷
现在入ryzen感觉是在给AMD当小白鼠
82#
tomoyo 发表于 2017-3-14 16:14 | 只看该作者
有bug正常。。毕竟架构大改。。关键是以后搭配的软件到底能不能释放性能。。
83#
tx97 发表于 2017-3-14 16:28 | 只看该作者
比较关心功耗。目前自己有两个方案:1、1700+370,小超;2、1700x+350默频。前段时间看测试ryzen貌似超频后功耗暴涨,怕主板撑不了多久。
另外可以测试一下waifu2x,这个程序貌似支持avx、avx2、fma,还可以指定用什么指令集。
84#
royalk  楼主| 发表于 2017-3-14 16:35 | 只看该作者
1800X超到4G,随便设的offset +0.072v,大约是1.42v的电压,内存可以直接开XMP到3200。

Intel平台,6950X关掉2个核心,8C16T,基本等效于6900K,主频4G,Ring 3.6G,内存开XMP 3200,平台分别测试四通道和双通道。


同频下,结论和AMD之前演示的差不多,浮点战平Broadwell-E没什么问题,也基本达到大家的预期。

几个分析点提一下:
1.内存频率的提升,对Ryzen整数性能有较为明显的提升,从国际象棋可以明显看出来。
2.整数方面,即使是内存同频,还是比Intel弱10%。
3.AVX效能,AIDA64只跑出Intel平台的一半,也就是AVX128的吞吐量。关于这个问题后面会做更深入的测试。
4.WinRAR,之前在楼层答复网友的解释有误,不是看内存带宽,而主要看内存延迟,Intel平台就算拿掉两根内存也还是占优,当然可能跟L3缓存速度也有一定关系。
5.功耗方面,待机如果开启节能,两者不会差太多,如果关了节能,那么AMD平台由于PCIE控制器规模没那么大,待机功耗占优;满载功耗,跑整数大家都差不多,跑浮点,由于Prime95无法正确支持Ryzen,用的还是K10的SSE指令集,所以最大功耗跑不出来。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?注册

x
85#
royalk  楼主| 发表于 2017-3-14 16:36 | 只看该作者
tx97 发表于 2017-3-14 16:28
比较关心功耗。目前自己有两个方案:1、1700+370,小超;2、1700x+350默频。前段时间看测试ryzen貌似超频后 ...

功耗数据出来了。在楼下。
waifu2x我试试吧,现在只要能支持Intel AVX的都不一定能正确跑出AMD的AVX。。。
86#
royalk  楼主| 发表于 2017-3-14 17:23 | 只看该作者
tx97 发表于 2017-3-14 16:28
比较关心功耗。目前自己有两个方案:1、1700+370,小超;2、1700x+350默频。前段时间看测试ryzen貌似超频后 ...

对了,waifu2x有没有最新的版本下载链接?网上版本太多都不知道哪个是最新的
87#
tx97 发表于 2017-3-14 17:45 | 只看该作者
royalk 发表于 2017-3-14 17:23
对了,waifu2x有没有最新的版本下载链接?网上版本太多都不知道哪个是最新的
...

http://pan.baidu.com/s/1dEJOMsx
我找的支持opencl、avx的版本,也不知道是不是最新的
88#
royalk  楼主| 发表于 2017-3-14 20:40 | 只看该作者
tx97 发表于 2017-3-14 17:45
http://pan.baidu.com/s/1dEJOMsx
我找的支持opencl、avx的版本,也不知道是不是最新的
...

跑了一下你提供的这个版本,Ryzen 8C16T 4G峰值可以达到400GFLOPS,记得当时跑6700K 4G默认频率是302GFLOPS。这么算下来Ryzen多一倍的线程,假设AVX效率是Skylake的一半,那么算力应该是接近Skylake的值。至于超过Skylake的原因,我认为两点可能性,一是超线程效率,二是Ryzen AVX2还是发挥了作用。明天换6700K和6950X再试试。
之前和chungexcy商量后跑的,不确定版本一不一样:http://bbs.pceva.com.cn/thread-122586-1-1.html


89#
sfdm 发表于 2017-3-14 21:11 | 只看该作者
royalk 发表于 2017-3-14 16:35
1800X超到4G,随便设的offset +0.072v,大约是1.42v的电压,内存可以直接开XMP到3200。

Intel平台,6950X ...

r大  你试试跑OCCT 的linpack模式。。最新版本是4.5


这个测试好像压力挺大的  你试试你的电压跑稳不稳
90#
chungexcy 发表于 2017-3-14 23:29 | 只看该作者
本帖最后由 chungexcy 于 2017-3-14 23:40 编辑
royalk 发表于 2017-3-14 20:40
跑了一下你提供的这个版本,Ryzen 8C16T 4G峰值可以达到400GFLOPS,记得当时跑6700K 4G默认频率是302GFLOP ...

如下图和我的对比,他那个版本是后来更新的,再次优化了fma3的性能,速度有大幅提升,skylake能跑出理论极限(aida64 gpgpu 32位浮点)的86%。你之前在84楼里帮我测试过的。


这软件只看支持的最高指令集,ryzen用的是fma3,效率和haswell的一样,大约算出来是78%。你的6700k在4.5g时,能跑到499gFLOPS。

我专门做了一个测试用图(根据程序算出来的图片特定大小),400gflops要跑两分钟,理论上可以跑出最高效率。开一个命令行运行run.bat。链接:http://pan.baidu.com/s/1eSJxbKu 密码:u8av

89楼有我双路的运行效率可供对比。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?注册

x
91#
chungexcy 发表于 2017-3-14 23:37 | 只看该作者
tx97 发表于 2017-3-14 17:45
http://pan.baidu.com/s/1dEJOMsx
我找的支持opencl、avx的版本,也不知道是不是最新的
...

你这个程序是最新的,但模型还是以前的,现在的新模型一直都不支持。你可以对比一下我90楼里面的那些提到的成绩。

92#
royalk  楼主| 发表于 2017-3-15 10:26 | 只看该作者
sfdm 发表于 2017-3-14 21:11
r大  你试试跑OCCT 的linpack模式。。最新版本是4.5

好的,回头试试,昨天试了LinX 0.71,跑不了。。。不过我的4相供电,linpack只敢跑4G
93#
royalk  楼主| 发表于 2017-3-15 10:27 | 只看该作者
chungexcy 发表于 2017-3-14 23:29
如下图和我的对比,他那个版本是后来更新的,再次优化了fma3的性能,速度有大幅提升,skylake能跑出理论极 ...

好的,一会下载你这个版本再试试
94#
txgy 发表于 2017-3-15 11:18 | 只看该作者
本帖最后由 txgy 于 2017-3-15 14:56 编辑
chungexcy 发表于 2017-3-14 23:29
如下图和我的对比,他那个版本是后来更新的,再次优化了fma3的性能,速度有大幅提升,skylake能跑出理论极 ...

双精度浮点计算的公式如下:
Num cores * Core clock (base clock) * 8 (for AVX2) * 2 (for FMA3)
6700k双精度浮点:
4  * 4 * 8 * 2 = 256 GFLOP/s
参见:
https://www.pugetsystems.com/lab ... 23-Much-Better-711/

haswell的浮点翻倍应该是FMA的效果,毕竟AVX2是伴随FMA出现的。
但是ryzen是用128bit的浮点单元,理论上每周期浮点数也能达到8,如果ryzen的FMA也能实现翻倍的效果,那么ryzen的理论浮点性能是和haswell相同。
没有指令集优化的ryzen不可能跑出接近理论的计算效能,6700k在mkl11.2和mkl11.3版本测试差异也挺大,希望openblas等一众开源库能做优化吧。
95#
royalk  楼主| 发表于 2017-3-15 11:52 | 只看该作者
chungexcy 发表于 2017-3-14 23:29
如下图和我的对比,他那个版本是后来更新的,再次优化了fma3的性能,速度有大幅提升,skylake能跑出理论极 ...

406GFLOPS,看来都差不多。。。
96#
chungexcy 发表于 2017-3-15 12:16 | 只看该作者
royalk 发表于 2017-3-15 11:52
406GFLOPS,看来都差不多。。。

嗯,这个值是filter的话,算出来是79%的理论极限效率,ipc=1.6,略好于haswell一点点

97#
chungexcy 发表于 2017-3-15 12:20 | 只看该作者
本帖最后由 chungexcy 于 2017-3-15 12:31 编辑
txgy 发表于 2017-3-15 11:18
双精度浮点计算的公式如下:
Num cores * Core clock (base clock) * 8 (for AVX2) * 2 (for FMA3)
6700k ...

嗯。这程序是单精度计算,6700k的理论值是512gflops,1800x@4g也是这个。

至于优化,这位大神是专门针对里面大量的3x3矩阵计算优化的,效率比mkl还好一大截。。。不过现在mkl 2017了。

感觉那个网站测试的有点怪,intel自己的成绩都没有这么高。

https://software.intel.com/en-us/intel-mkl/benchmarks#DGEMM
98#
hyno111 发表于 2017-3-15 12:22 | 只看该作者
本帖最后由 hyno111 于 2017-3-15 12:28 编辑
chungexcy 发表于 2017-3-14 23:29
如下图和我的对比,他那个版本是后来更新的,再次优化了fma3的性能,速度有大幅提升,skylake能跑出理论极 ...

1700X,默频(XFR 3.5G),win10,357FLOPS左右,对于这种全程满载的应用,电源模式和调度应该没有太大影响。
华硕AI Suite显示的功率在77W左右。

99#
royalk  楼主| 发表于 2017-3-15 12:36 | 只看该作者
sfdm 发表于 2017-3-14 21:11
r大  你试试跑OCCT 的linpack模式。。最新版本是4.5

跑了3分钟(其中第一分钟还是idle),12v input超过200w了,4相供电真扛不住,热成像录得113度,VRM显示122度,不过没有黑屏死机。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?注册

x
100#
royalk  楼主| 发表于 2017-3-15 12:38 | 只看该作者
chungexcy 发表于 2017-3-15 12:16
嗯,这个值是filter的话,算出来是79%的理论极限效率,ipc=1.6,略好于haswell一点点

...

是filter,浮点ipc基本达到broadwell的水平吧,与跑渲染的结果基本吻合。
您需要登录后才可以回帖 登录 | 注册

本版积分规则

快速回复 返回顶部