Ryzen 1800X默认状态跑FMA指令集翻车，大家可以试试

chungexcy · 发表于 2017-3-17 00:05

本帖最后由 chungexcy 于 2017-3-17 03:09 编辑

royalk 发表于 2017-3-16 19:51
关了超线程后，跑出的GFLOPS数惊人。。甚至比waifu2x开超线程跑的还高

那个就是类似aida64的那项gpgpu的浮点峰值测试，你如果能看源码就懂了，纯用寄存器死循环avx单元，没有任何数据交读写，功耗还不如象棋。aida优化的还更好，用寄存器能跑出99%的理论数值。
waifu2x，linpack，以及ychruncher都是实际类HPC应用，有输入输出的。能在各级缓存带宽的制约下跑出高性能才有实际意义。

chungexcy · 发表于 2017-3-17 00:12

本帖最后由 chungexcy 于 2017-3-17 03:06 编辑

overthink 发表于 2017-3-16 20:44
是假相？还是真的提升了

这就一个寄存器内的死循环，其实就是类似aida64的gpgpu浮点测试，aida64那项也默认不用超线程，能跑出理论99+%的数值，关超线程能减小损失。

chungexcy · 发表于 2017-3-17 11:37

本帖最后由 chungexcy 于 2017-3-17 11:40 编辑

royalk 发表于 2017-3-17 10:26
这样说来就是可以跑出理论最大值的测试吧，现在关了超线程是468GFLOPS，如果开了超线程能通过，那岂不是 ...

不是的，aida64里面的最大值就是基本是理论极限值了。
这种死循环，我之前写的单线程版本，能做到一个核心的100%fma3的理论性能，ipc＝2；即使开了超线程，也还是2，因为一共只有两计算单元。
死循环，编译器优化以后也能内部并行的，达不到理论ipc＝2，一定是缓存位宽不够你的应用。

chungexcy · 发表于 2017-3-17 11:54

royalk 发表于 2017-3-17 11:43
明白了。。那ryzen出现这个翻车的情况，既然和超线程有关，是不是线程调度的问题导致？
...

不知道了，卡bug这种什么都有可能。既然AMD说找到原因了，那修复起来应该很快。
你试试复制我run.bat里面的那一行，复制个几十上百行，看看这样连续跑waifu2x会不会卡住吧。

chungexcy · 发表于 2017-3-17 15:01

royalk 发表于 2017-3-17 14:18
跑waifu2x跑了三个小时，没问题。。

那就想不通了，waifu2x等一票极高负荷的fma烤鸡软件没事，就那个轻量程序有问题。。。

Ryzen 1800X默认状态跑FMA指令集翻车，大家可以试试

评分