AMD Ryzen 7 1800X评测直播帖

wltzwr · 发表于 2017-3-14 14:43

种种迹象表明 AMD确实有了巨大进步然而这代ryzen感觉还是不适合入手各种奇奇怪怪的问题层出不穷
现在入ryzen感觉是在给AMD当小白鼠

tomoyo · 发表于 2017-3-14 16:14

有bug正常。。毕竟架构大改。。关键是以后搭配的软件到底能不能释放性能。。

tx97 · 发表于 2017-3-14 16:28

比较关心功耗。目前自己有两个方案：1、1700+370，小超；2、1700x+350默频。前段时间看测试ryzen貌似超频后功耗暴涨，怕主板撑不了多久。
另外可以测试一下waifu2x，这个程序貌似支持avx、avx2、fma，还可以指定用什么指令集。

royalk · 发表于 2017-3-14 16:35

1800X超到4G，随便设的offset +0.072v，大约是1.42v的电压，内存可以直接开XMP到3200。

Intel平台，6950X关掉2个核心，8C16T，基本等效于6900K，主频4G，Ring 3.6G，内存开XMP 3200，平台分别测试四通道和双通道。

同频下，结论和AMD之前演示的差不多，浮点战平Broadwell-E没什么问题，也基本达到大家的预期。

几个分析点提一下：
1.内存频率的提升，对Ryzen整数性能有较为明显的提升，从国际象棋可以明显看出来。
2.整数方面，即使是内存同频，还是比Intel弱10%。
3.AVX效能，AIDA64只跑出Intel平台的一半，也就是AVX128的吞吐量。关于这个问题后面会做更深入的测试。
4.WinRAR，之前在楼层答复网友的解释有误，不是看内存带宽，而主要看内存延迟，Intel平台就算拿掉两根内存也还是占优，当然可能跟L3缓存速度也有一定关系。
5.功耗方面，待机如果开启节能，两者不会差太多，如果关了节能，那么AMD平台由于PCIE控制器规模没那么大，待机功耗占优；满载功耗，跑整数大家都差不多，跑浮点，由于Prime95无法正确支持Ryzen，用的还是K10的SSE指令集，所以最大功耗跑不出来。

royalk · 发表于 2017-3-14 16:36

tx97 发表于 2017-3-14 16:28
比较关心功耗。目前自己有两个方案：1、1700+370，小超；2、1700x+350默频。前段时间看测试ryzen貌似超频后 ...

功耗数据出来了。在楼下。
waifu2x我试试吧，现在只要能支持Intel AVX的都不一定能正确跑出AMD的AVX。。。

royalk · 发表于 2017-3-14 17:23

tx97 发表于 2017-3-14 16:28
比较关心功耗。目前自己有两个方案：1、1700+370，小超；2、1700x+350默频。前段时间看测试ryzen貌似超频后 ...

对了，waifu2x有没有最新的版本下载链接？网上版本太多都不知道哪个是最新的

tx97 · 发表于 2017-3-14 17:45

royalk 发表于 2017-3-14 17:23
对了，waifu2x有没有最新的版本下载链接？网上版本太多都不知道哪个是最新的
...

http://pan.baidu.com/s/1dEJOMsx
我找的支持opencl、avx的版本，也不知道是不是最新的

royalk · 发表于 2017-3-14 20:40

tx97 发表于 2017-3-14 17:45
http://pan.baidu.com/s/1dEJOMsx
我找的支持opencl、avx的版本，也不知道是不是最新的
...

跑了一下你提供的这个版本，Ryzen 8C16T 4G峰值可以达到400GFLOPS，记得当时跑6700K 4G默认频率是302GFLOPS。这么算下来Ryzen多一倍的线程，假设AVX效率是Skylake的一半，那么算力应该是接近Skylake的值。至于超过Skylake的原因，我认为两点可能性，一是超线程效率，二是Ryzen AVX2还是发挥了作用。明天换6700K和6950X再试试。
之前和chungexcy商量后跑的，不确定版本一不一样：http://bbs.pceva.com.cn/thread-122586-1-1.html

sfdm · 发表于 2017-3-14 21:11

royalk 发表于 2017-3-14 16:35
1800X超到4G，随便设的offset +0.072v，大约是1.42v的电压，内存可以直接开XMP到3200。

Intel平台，6950X ...

r大你试试跑OCCT 的linpack模式。。最新版本是4.5

这个测试好像压力挺大的你试试你的电压跑稳不稳

chungexcy · 发表于 2017-3-14 23:29

本帖最后由 chungexcy 于 2017-3-14 23:40 编辑

royalk 发表于 2017-3-14 20:40
跑了一下你提供的这个版本，Ryzen 8C16T 4G峰值可以达到400GFLOPS，记得当时跑6700K 4G默认频率是302GFLOP ...

如下图和我的对比，他那个版本是后来更新的，再次优化了fma3的性能，速度有大幅提升，skylake能跑出理论极限（aida64 gpgpu 32位浮点）的86%。你之前在84楼里帮我测试过的。

这软件只看支持的最高指令集，ryzen用的是fma3，效率和haswell的一样，大约算出来是78%。你的6700k在4.5g时，能跑到499gFLOPS。

我专门做了一个测试用图(根据程序算出来的图片特定大小)，400gflops要跑两分钟，理论上可以跑出最高效率。开一个命令行运行run.bat。链接：http://pan.baidu.com/s/1eSJxbKu 密码：u8av

89楼有我双路的运行效率可供对比。

chungexcy · 发表于 2017-3-14 23:37

tx97 发表于 2017-3-14 17:45
http://pan.baidu.com/s/1dEJOMsx
我找的支持opencl、avx的版本，也不知道是不是最新的
...

你这个程序是最新的，但模型还是以前的，现在的新模型一直都不支持。你可以对比一下我90楼里面的那些提到的成绩。

royalk · 发表于 2017-3-15 10:26

sfdm 发表于 2017-3-14 21:11
r大你试试跑OCCT 的linpack模式。。最新版本是4.5

好的，回头试试，昨天试了LinX 0.71，跑不了。。。不过我的4相供电，linpack只敢跑4G

royalk · 发表于 2017-3-15 10:27

chungexcy 发表于 2017-3-14 23:29
如下图和我的对比，他那个版本是后来更新的，再次优化了fma3的性能，速度有大幅提升，skylake能跑出理论极 ...

好的，一会下载你这个版本再试试

txgy · 发表于 2017-3-15 11:18

本帖最后由 txgy 于 2017-3-15 14:56 编辑

chungexcy 发表于 2017-3-14 23:29
如下图和我的对比，他那个版本是后来更新的，再次优化了fma3的性能，速度有大幅提升，skylake能跑出理论极 ...

双精度浮点计算的公式如下：
Num cores * Core clock (base clock) * 8 (for AVX2) * 2 (for FMA3)
6700k双精度浮点：
4 * 4 * 8 * 2 = 256 GFLOP/s
参见：
https://www.pugetsystems.com/lab ... 23-Much-Better-711/

haswell的浮点翻倍应该是FMA的效果，毕竟AVX2是伴随FMA出现的。
但是ryzen是用128bit的浮点单元，理论上每周期浮点数也能达到8，如果ryzen的FMA也能实现翻倍的效果，那么ryzen的理论浮点性能是和haswell相同。
没有指令集优化的ryzen不可能跑出接近理论的计算效能，6700k在mkl11.2和mkl11.3版本测试差异也挺大，希望openblas等一众开源库能做优化吧。

royalk · 发表于 2017-3-15 11:52

chungexcy 发表于 2017-3-14 23:29
如下图和我的对比，他那个版本是后来更新的，再次优化了fma3的性能，速度有大幅提升，skylake能跑出理论极 ...

406GFLOPS，看来都差不多。。。

chungexcy · 发表于 2017-3-15 12:16

royalk 发表于 2017-3-15 11:52
406GFLOPS，看来都差不多。。。

嗯，这个值是filter的话，算出来是79％的理论极限效率，ipc＝1.6，略好于haswell一点点

chungexcy · 发表于 2017-3-15 12:20

本帖最后由 chungexcy 于 2017-3-15 12:31 编辑

txgy 发表于 2017-3-15 11:18
双精度浮点计算的公式如下：
Num cores * Core clock (base clock) * 8 (for AVX2) * 2 (for FMA3)
6700k ...

嗯。这程序是单精度计算，6700k的理论值是512gflops，1800x@4g也是这个。

至于优化，这位大神是专门针对里面大量的3x3矩阵计算优化的，效率比mkl还好一大截。。。不过现在mkl 2017了。

感觉那个网站测试的有点怪，intel自己的成绩都没有这么高。

https://software.intel.com/en-us/intel-mkl/benchmarks#DGEMM

hyno111 · 发表于 2017-3-15 12:22

本帖最后由 hyno111 于 2017-3-15 12:28 编辑

chungexcy 发表于 2017-3-14 23:29
如下图和我的对比，他那个版本是后来更新的，再次优化了fma3的性能，速度有大幅提升，skylake能跑出理论极 ...

1700X，默频（XFR 3.5G），win10，357FLOPS左右，对于这种全程满载的应用，电源模式和调度应该没有太大影响。
华硕AI Suite显示的功率在77W左右。

royalk · 发表于 2017-3-15 12:36

sfdm 发表于 2017-3-14 21:11
r大你试试跑OCCT 的linpack模式。。最新版本是4.5

跑了3分钟（其中第一分钟还是idle），12v input超过200w了，4相供电真扛不住，热成像录得113度，VRM显示122度，不过没有黑屏死机。

royalk · 发表于 2017-3-15 12:38

chungexcy 发表于 2017-3-15 12:16
嗯，这个值是filter的话，算出来是79％的理论极限效率，ipc＝1.6，略好于haswell一点点

...

是filter，浮点ipc基本达到broadwell的水平吧，与跑渲染的结果基本吻合。

AMD Ryzen 7 1800X评测直播帖

本帖子中包含更多资源

本帖子中包含更多资源

本帖子中包含更多资源