PCEVA,PC绝对领域,探寻真正的电脑知识
打印 上一主题 下一主题
开启左侧

Ryzen AVX高性能计算部分

[复制链接]
跳转到指定楼层
1#
chungexcy 发表于 2017-3-3 01:26 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
点击数:11954|回复数:31
Ryzen的L1缓存带宽是2*128bit,果然是intel的一半,同时AVX指令集也是128位的,cpu内部兼容intel的256位avx/avx2/fma3,这里兼容代表能正常运行,不过性能依然受制于128位的avx,不会有变。

y-cruncher 是一个专门优化了avx2的一个圆周率计算程序,可以作为衡量avx2性能表现。

下图LinuxTechTips测试的1800X的表现


顺便我截取了官网的成绩对比。avx2在haswell上的优势几乎翻倍了。



另外一个用avx2很多的是x265视频编码器。具体可参考此帖

实际测试差距小了不少,相对haswell只有很小的的差距。
1800X 2.69fps
2683 v3  3.49fps

一是说明用两个128位来模拟256位,至少自己的性能能跑满,二是因为intel也优化的不是特别好。skylake就比haswell快15%,y-cruncher里面的测试也是这样。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?注册

x
2#
gtx9 发表于 2017-3-3 06:42 | 只看该作者

3#
chungexcy  楼主| 发表于 2017-3-3 06:53 | 只看该作者

这个测试已经过时了,里面的编码器是1.4版本,发布时间是2015年初,当时几乎没有avx2优化,多核优化也不行,Haswell和ivy bridge成绩符合本身的IPC提升了。

贴吧里面提到的测试,x265是2.3版,上个月的更新。现再测试x265,至少得要hwbot里面的x265 2.0版。就算是那个,也只更新到2016年下旬才发布的2.0版本。
4#
gtx9 发表于 2017-3-3 07:33 | 只看该作者
chungexcy 发表于 2017-3-3 06:53
这个测试已经过时了,里面的编码器是1.4版本,发布时间是2015年初,当时几乎没有avx2优化,多核优化也不 ...

目前1800X/5960x/6900K最高成绩










5#
blackdove 发表于 2017-3-3 07:45 | 只看该作者
15%差不多了,只是算法部分用到avx而已,又不是所有运算基于avx指令。
所以ryzen在这里也没什么问题,不会弱势到哪里去。
6#
chungexcy  楼主| 发表于 2017-3-3 09:03 | 只看该作者
gtx9 发表于 2017-3-3 07:33
目前1800X/5960x/6900K最高成绩

同频居然有15%的差距。之前按照贴吧成绩算以为是10%。看来AMD兼容256位的效率还是很好了,算是把128位的avx的性能极限,发挥的很充分了。Haswell比ryzen快了15%,比ivy bridge可是快了大概50%的。

7#
chungexcy  楼主| 发表于 2017-3-3 09:07 | 只看该作者
blackdove 发表于 2017-3-3 07:45
15%差不多了,只是算法部分用到avx而已,又不是所有运算基于avx指令。
所以ryzen在这里也没什么问题,不会 ...

现在看来,ryzen兼容性很不错了,Haswell可比ivy bridge快了50%
8#
royalk 发表于 2017-3-3 09:12 | 只看该作者
如果是兼容模式做到差15%的性能那也是不错了,但估计aida64缓存测不出…
来自安卓客户端来自安卓客户端
9#
里奥 发表于 2017-3-3 10:50 | 只看该作者
阉割居然有这种成绩,还求什么
10#
chungexcy  楼主| 发表于 2017-3-3 11:34 | 只看该作者
royalk 发表于 2017-3-3 09:12
如果是兼容模式做到差15%的性能那也是不错了,但估计aida64缓存测不出…

我觉得amd这步棋走得不错,放弃了原生256位带来的高功耗和高发热,用128位来兼容,然而还能把128位本身的性能发挥满。

连x265这种生产力软件优化都不够,估计现在只有y-cruncher和我之前90楼的那个神经网络图像放大程序,能跑满intel的256位指令集的全部性能。

11#
royalk 发表于 2017-3-3 11:46 | 只看该作者
chungexcy 发表于 2017-3-3 11:34
我觉得amd这步棋走得不错,放弃了原生256位带来的高功耗和高发热,用128位来兼容,然而还能把128位本身的 ...

因为AMD把电压拉得很高,基本接近了三星LPP工艺的漏电能承受的极限,现在发热已经很大了,原生256位估计TDP和发热量都吃不住。
12#
chungexcy  楼主| 发表于 2017-3-3 11:59 | 只看该作者
royalk 发表于 2017-3-3 11:46
因为AMD把电压拉得很高,基本接近了三星LPP工艺的漏电能承受的极限,现在发热已经很大了,原生256位估计T ...

不过我看3dm的评测,p95的烤机功耗和6900k差不多?看来之前是我想错了?兼容fma3,还是一样的功耗?

13#
royalk 发表于 2017-3-3 12:02 | 只看该作者
chungexcy 发表于 2017-3-3 11:59
不过我看3dm的评测,p95的烤机功耗和6900k差不多?看来之前是我想错了?兼容fma3,还是一样的功耗?

...

AMD的TDP墙貌似在128w,跑FMA应该可以轻松达到。
14#
小夜叉 发表于 2017-3-3 12:08 | 只看该作者
问一下牙膏厂马上要祭出的AVX512目前阶段是不是更没卵用了?
15#
gloobox 发表于 2017-3-3 12:11 | 只看该作者
royalk 发表于 2017-3-3 12:02
AMD的TDP墙貌似在128w,跑FMA应该可以轻松达到。

  • 闻说AMD用图形技术跟Intel交换AVX512,不知是否

16#
royalk 发表于 2017-3-3 12:12 | 只看该作者
gloobox 发表于 2017-3-3 12:11
  • 闻说AMD用图形技术跟Intel交换AVX512,不知是否

  • 这换法,AMD还是亏。。
    17#
    Mufasa 发表于 2017-3-3 12:49 | 只看该作者
    我个人更关心 CPU Queen ,FPU Julia ,FPU sin Julia 的性能。

    特别是FPU sin Julia ,使用X87指令进行浮点运算。
    对于某些优化渣一般的应用程序,和网游,这个参数很重要。

    推土机在这个项目上,渣一般,被酷睿2吊打。
    Ryzen在这个项目上,可以和 Xeon E5 持平,这就足够了。
    18#
    gtx9 发表于 2017-3-3 12:55 | 只看该作者
    gloobox 发表于 2017-3-3 12:11
  • 闻说AMD用图形技术跟Intel交换AVX512,不知是否

  • x86 cpu上amd和intel是有交叉专利协议额,根本不需要拿图形专利来换avx512
    19#
    chungexcy  楼主| 发表于 2017-3-3 13:23 | 只看该作者
    royalk 发表于 2017-3-3 12:02
    AMD的TDP墙貌似在128w,跑FMA应该可以轻松达到。

    看来就算压低绝对性能到一半,也不是很省电啊
    20#
    chungexcy  楼主| 发表于 2017-3-3 13:30 | 只看该作者
    小夜叉 发表于 2017-3-3 12:08
    问一下牙膏厂马上要祭出的AVX512目前阶段是不是更没卵用了?

    avx2在13年中就全面铺开了,到15年中,x265的优化才有了明显的提升。avx512除非专门优化,估计x265想支持估计还得花很久。

    您需要登录后才可以回帖 登录 | 注册

    本版积分规则

    快速回复 返回顶部