PCEVA,PC绝对领域,探寻真正的电脑知识
打印 上一主题 下一主题
开启左侧

Ryzen 1800X默认状态跑FMA指令集翻车,大家可以试试

[复制链接]
1#
chungexcy 发表于 2017-3-17 00:05 | 显示全部楼层
本帖最后由 chungexcy 于 2017-3-17 03:09 编辑
royalk 发表于 2017-3-16 19:51
关了超线程后,跑出的GFLOPS数惊人。。甚至比waifu2x开超线程跑的还高

那个就是类似aida64的那项gpgpu的浮点峰值测试,你如果能看源码就懂了,纯用寄存器死循环avx单元,没有任何数据交读写,功耗还不如象棋。aida优化的还更好,用寄存器能跑出99%的理论数值。
waifu2x,linpack,以及ychruncher都是实际类HPC应用,有输入输出的。能在各级缓存带宽的制约下跑出高性能才有实际意义。
2#
chungexcy 发表于 2017-3-17 00:12 | 显示全部楼层
本帖最后由 chungexcy 于 2017-3-17 03:06 编辑
overthink 发表于 2017-3-16 20:44
是假相? 还是真的提升了

这就一个寄存器内的死循环,其实就是类似aida64的gpgpu浮点测试,aida64那项也默认不用超线程,能跑出理论99+%的数值,关超线程能减小损失。

评分

参与人数 1绝对值 +1 收起 理由
overthink + 1 很给力!

查看全部评分

3#
chungexcy 发表于 2017-3-17 11:37 | 显示全部楼层
本帖最后由 chungexcy 于 2017-3-17 11:40 编辑
royalk 发表于 2017-3-17 10:26
这样说来就是可以跑出理论最大值的测试吧,现在关了超线程是468GFLOPS,如果开了超线程能通过,那岂不是 ...

不是的,aida64里面的最大值就是基本是理论极限值了。
这种死循环,我之前写的单线程版本,能做到一个核心的100%fma3的理论性能,ipc=2;即使开了超线程,也还是2,因为一共只有两计算单元。
死循环,编译器优化以后也能内部并行的,达不到理论ipc=2,一定是缓存位宽不够你的应用。

4#
chungexcy 发表于 2017-3-17 11:54 | 显示全部楼层
royalk 发表于 2017-3-17 11:43
明白了。。那ryzen出现这个翻车的情况,既然和超线程有关,是不是线程调度的问题导致?
...

不知道了,卡bug这种什么都有可能。既然AMD说找到原因了,那修复起来应该很快。
你试试复制我run.bat里面的那一行,复制个几十上百行,看看这样连续跑waifu2x会不会卡住吧。
5#
chungexcy 发表于 2017-3-17 15:01 | 显示全部楼层
royalk 发表于 2017-3-17 14:18
跑waifu2x跑了三个小时,没问题。。

那就想不通了,waifu2x等一票极高负荷的fma烤鸡软件没事,就那个轻量程序有问题。。。
您需要登录后才可以回帖 登录 | 注册

本版积分规则

快速回复 返回顶部