Ryzen AVX高性能计算部分

chungexcy · 发表于 2017-3-3 01:26

Ryzen的L1缓存带宽是2*128bit，果然是intel的一半，同时AVX指令集也是128位的，cpu内部兼容intel的256位avx/avx2/fma3，这里兼容代表能正常运行，不过性能依然受制于128位的avx，不会有变。

y-cruncher 是一个专门优化了avx2的一个圆周率计算程序，可以作为衡量avx2性能表现。

下图LinuxTechTips测试的1800X的表现

顺便我截取了官网的成绩对比。avx2在haswell上的优势几乎翻倍了。

另外一个用avx2很多的是x265视频编码器。具体可参考此帖。

实际测试差距小了不少，相对haswell只有很小的的差距。
1800X 2.69fps
2683 v3 3.49fps

一是说明用两个128位来模拟256位，至少自己的性能能跑满，二是因为intel也优化的不是特别好。skylake就比haswell快15%，y-cruncher里面的测试也是这样。

gtx9 · 发表于 2017-3-3 06:42

chungexcy · 发表于 2017-3-3 06:53

gtx9 发表于 2017-3-3 06:42

这个测试已经过时了，里面的编码器是1.4版本，发布时间是2015年初，当时几乎没有avx2优化，多核优化也不行，Haswell和ivy bridge成绩符合本身的IPC提升了。

贴吧里面提到的测试，x265是2.3版，上个月的更新。现再测试x265，至少得要hwbot里面的x265 2.0版。就算是那个，也只更新到2016年下旬才发布的2.0版本。

gtx9 · 发表于 2017-3-3 07:33

chungexcy 发表于 2017-3-3 06:53
这个测试已经过时了，里面的编码器是1.4版本，发布时间是2015年初，当时几乎没有avx2优化，多核优化也不 ...

目前1800X/5960x/6900K最高成绩

blackdove · 发表于 2017-3-3 07:45

15%差不多了，只是算法部分用到avx而已，又不是所有运算基于avx指令。
所以ryzen在这里也没什么问题，不会弱势到哪里去。

chungexcy · 发表于 2017-3-3 09:03

gtx9 发表于 2017-3-3 07:33
目前1800X/5960x/6900K最高成绩

同频居然有15%的差距。之前按照贴吧成绩算以为是10%。看来AMD兼容256位的效率还是很好了，算是把128位的avx的性能极限，发挥的很充分了。Haswell比ryzen快了15%，比ivy bridge可是快了大概50%的。

chungexcy · 发表于 2017-3-3 09:07

blackdove 发表于 2017-3-3 07:45
15%差不多了，只是算法部分用到avx而已，又不是所有运算基于avx指令。
所以ryzen在这里也没什么问题，不会 ...

现在看来，ryzen兼容性很不错了，Haswell可比ivy bridge快了50%

royalk · 发表于 2017-3-3 09:12

如果是兼容模式做到差15%的性能那也是不错了，但估计aida64缓存测不出…

里奥 · 发表于 2017-3-3 10:50

阉割居然有这种成绩，还求什么

chungexcy · 发表于 2017-3-3 11:34

royalk 发表于 2017-3-3 09:12
如果是兼容模式做到差15%的性能那也是不错了，但估计aida64缓存测不出…

我觉得amd这步棋走得不错，放弃了原生256位带来的高功耗和高发热，用128位来兼容，然而还能把128位本身的性能发挥满。

连x265这种生产力软件优化都不够，估计现在只有y-cruncher和我之前90楼的那个神经网络图像放大程序，能跑满intel的256位指令集的全部性能。

royalk · 发表于 2017-3-3 11:46

chungexcy 发表于 2017-3-3 11:34
我觉得amd这步棋走得不错，放弃了原生256位带来的高功耗和高发热，用128位来兼容，然而还能把128位本身的 ...

因为AMD把电压拉得很高，基本接近了三星LPP工艺的漏电能承受的极限，现在发热已经很大了，原生256位估计TDP和发热量都吃不住。

chungexcy · 发表于 2017-3-3 11:59

royalk 发表于 2017-3-3 11:46
因为AMD把电压拉得很高，基本接近了三星LPP工艺的漏电能承受的极限，现在发热已经很大了，原生256位估计T ...

不过我看3dm的评测，p95的烤机功耗和6900k差不多？看来之前是我想错了？兼容fma3，还是一样的功耗？

royalk · 发表于 2017-3-3 12:02

chungexcy 发表于 2017-3-3 11:59
不过我看3dm的评测，p95的烤机功耗和6900k差不多？看来之前是我想错了？兼容fma3，还是一样的功耗？

...

AMD的TDP墙貌似在128w，跑FMA应该可以轻松达到。

小夜叉 · 发表于 2017-3-3 12:08

问一下牙膏厂马上要祭出的AVX512目前阶段是不是更没卵用了？

gloobox · 发表于 2017-3-3 12:11

royalk 发表于 2017-3-3 12:02
AMD的TDP墙貌似在128w，跑FMA应该可以轻松达到。

闻说AMD用图形技术跟Intel交换AVX512，不知是否

royalk · 发表于 2017-3-3 12:12

gloobox 发表于 2017-3-3 12:11
闻说AMD用图形技术跟Intel交换AVX512，不知是否

这换法，AMD还是亏。。

Mufasa · 发表于 2017-3-3 12:49

我个人更关心 CPU Queen ，FPU Julia ，FPU sin Julia 的性能。

特别是FPU sin Julia ，使用X87指令进行浮点运算。
对于某些优化渣一般的应用程序，和网游，这个参数很重要。

推土机在这个项目上，渣一般，被酷睿2吊打。
Ryzen在这个项目上，可以和 Xeon E5 持平，这就足够了。

gtx9 · 发表于 2017-3-3 12:55

gloobox 发表于 2017-3-3 12:11
闻说AMD用图形技术跟Intel交换AVX512，不知是否

x86 cpu上amd和intel是有交叉专利协议额，根本不需要拿图形专利来换avx512

chungexcy · 发表于 2017-3-3 13:23

royalk 发表于 2017-3-3 12:02
AMD的TDP墙貌似在128w，跑FMA应该可以轻松达到。

看来就算压低绝对性能到一半，也不是很省电啊

chungexcy · 发表于 2017-3-3 13:30

小夜叉发表于 2017-3-3 12:08
问一下牙膏厂马上要祭出的AVX512目前阶段是不是更没卵用了？

avx2在13年中就全面铺开了，到15年中，x265的优化才有了明显的提升。avx512除非专门优化，估计x265想支持估计还得花很久。

Ryzen AVX高性能计算部分

本帖子中包含更多资源