PCEVA,PC绝对领域,探寻真正的电脑知识
打印 上一主题 下一主题
开启左侧

y-cruncher -0.7.3 发布,对支持 AVX512 的一些重要说明

[复制链接]
21#
gtx9 发表于 2017-7-9 16:09 | 只看该作者
royalk 发表于 2017-7-9 15:03
刚跑了一下build 9471,4G/2.4/3200的时候是1.577s

这时候功耗有多少?
22#
royalk 发表于 2017-7-9 16:14 | 只看该作者
更正一下之前我回帖中的一些错误,我本以为默认状态下GFLOPS低是因为TDP限制,看来其实并不是。
从下面的数据可以看到,由于L3变成排除式,AVX-512 GFLOPS对内存性能的敏感程度远远不止y-cruncher作者说的15%。。

全默认设置,MKL跑出674GFLOPS
以下项目分别为:核心频率/MESH/内存    GFLOPS
3.3/2.4/2133        674
3.6/2.4/2133        683
3.6/2.4/3200        815
3.6/2.4/4000        910
3.6/3.2/4000        936
4.0/2.4/2133        722
4.0/2.4/3200        849
4.0/2.4/4000        965
23#
chungexcy  楼主| 发表于 2017-7-9 16:18 | 只看该作者
royalk 发表于 2017-7-9 15:03
刚跑了一下build 9471,4G/2.4/3200的时候是1.577s

难道官方有特别的跑分方式?
1 billion的表现差异大么?
24#
royalk 发表于 2017-7-9 16:20 | 只看该作者
gtx9 发表于 2017-7-9 16:09
这时候功耗有多少?

1秒多就跑完了,待会跑大点的插功耗表看看。
25#
chungexcy  楼主| 发表于 2017-7-9 16:22 | 只看该作者
本帖最后由 chungexcy 于 2017-7-9 16:25 编辑
royalk 发表于 2017-7-9 16:14
更正一下之前我回帖中的一些错误,我本以为默认状态下GFLOPS低是因为TDP限制,看来其实并不是。
从下面的数 ...

我的天。。。。3.3g下超内存,性能和功耗是不是会比3.6g不超内存高。。。

而且突然意识到,xeon skylake不能超内存,这性能估计是要完。。。
26#
royalk 发表于 2017-7-9 16:27 | 只看该作者
chungexcy 发表于 2017-7-9 16:18
难道官方有特别的跑分方式?
1 billion的表现差异大么?

1 billion 3.8/2.4/3200,20线程是42.981s,介于他给的数据2133和3200之间。。。
27#
royalk 发表于 2017-7-9 16:27 | 只看该作者
chungexcy 发表于 2017-7-9 16:22
我的天。。。。3.3g下超内存,性能和功耗是不是会比3.6g不超内存高。。。

而且突然意识到,xeon skylake ...

应该是会,待会我接上功耗表看看
28#
royalk 发表于 2017-7-9 16:33 | 只看该作者
gtx9 发表于 2017-7-9 16:09
这时候功耗有多少?

50m太快录不出准确值,跑1 billion功耗波动很大,在200-270w之间波动,而linpack轻易去到340w。
29#
chungexcy  楼主| 发表于 2017-7-9 16:42 | 只看该作者
本帖最后由 chungexcy 于 2017-7-9 16:48 编辑
royalk 发表于 2017-7-9 16:33
50m太快录不出准确值,跑1 billion功耗波动很大,在200-270w之间波动,而linpack轻易去到340w。
...

哦对,这个软件的功耗是有波动的,我锁TDP跑,能看到睿频能跳0.2-0.3g的幅度。。。

那个成绩差异,我不知道作者取的是pi的值,还是total computation time的值。HWbot上用的是total computation time。

PS,刚才去网站看了看,成绩用的是total computation time
30#
gtx9 发表于 2017-7-9 16:45 | 只看该作者
chungexcy 发表于 2017-7-9 16:22
我的天。。。。3.3g下超内存,性能和功耗是不是会比3.6g不超内存高。。。

而且突然意识到,xeon skylake ...

xeon虽然不能超内存,不过Xeon有6通道内存
31#
royalk 发表于 2017-7-9 16:51 | 只看该作者
chungexcy 发表于 2017-7-9 16:42
哦对,这个软件的功耗是有波动的,我锁TDP跑,能看到睿频能跳0.2-0.3g的幅度。。。

那个成绩差异,我不知 ...

那就奇怪了,不知道他3.8G的时候睿频有没有关掉,其它还动了什么设置。睿频我是关了的。刚才跑的CPU默认,内存4000,也是42s多。CPU频率在3.3-4G跳。
32#
gtx9 发表于 2017-7-9 16:52 | 只看该作者
royalk 发表于 2017-7-9 16:33
50m太快录不出准确值,跑1 billion功耗波动很大,在200-270w之间波动,而linpack轻易去到340w。
...

这软件还没有linpack压力大。。r大试试7900x默认TDP设置下linpack能有多少gflops看看
33#
chungexcy  楼主| 发表于 2017-7-9 16:52 | 只看该作者
gtx9 发表于 2017-7-9 16:45
xeon虽然不能超内存,不过Xeon有6通道内存

也许2.2g核心主频,内存频率影响小点吧。不过我感觉没了之前的三级缓存做缓冲,6通道真的够28核的avx512吞吐量么。。。
34#
royalk 发表于 2017-7-9 16:52 | 只看该作者
gtx9 发表于 2017-7-9 16:45
xeon虽然不能超内存,不过Xeon有6通道内存

6通道2666刚好相当于四通4000的bandwidth。。但别忘了,28蛋。。
35#
royalk 发表于 2017-7-9 16:53 | 只看该作者
gtx9 发表于 2017-7-9 16:52
这软件还没有linpack压力大。。r大试试7900x默认TDP设置下linpack能有多少gflops看看
...

全默认就是674啊
36#
royalk 发表于 2017-7-9 16:54 | 只看该作者
chungexcy 发表于 2017-7-9 16:22
我的天。。。。3.3g下超内存,性能和功耗是不是会比3.6g不超内存高。。。

而且突然意识到,xeon skylake ...

全默认,只把内存超4000
3.3G,仍然录不出降频
最大功耗录得264w
看来主板默认已经把TDP解了
problem 40000的时候性能是851GFLOPS,对比内存2133其它一样,674GFLOPS,功耗大概200w,主频4G,内存3200,也才是849

我了个去。。跑AVX512还跑什么主频啊。。提内存才是硬道理啊

37#
chungexcy  楼主| 发表于 2017-7-9 17:06 | 只看该作者
royalk 发表于 2017-7-9 16:54
全默认,只把内存超4000
3.3G,仍然录不出降频
最大功耗录得264w

厉害了,我的Intel。。。3.3g+4000MHz>4.0g+3200MHz。。。。。。。

对于超内存,有个疑问,现在都不用按照266或者133一档一档的超么
38#
royalk 发表于 2017-7-9 17:14 | 只看该作者
chungexcy 发表于 2017-7-9 17:06
厉害了,我的Intel。。。3.3g+4000MHz>4.0g+3200MHz。。。。。。。

对于超内存,有个疑问,现在都不用按 ...

超内存从IVB开始就是可以用100/133的分频,SKL/KBL最高到31倍频,也就是133分频可以到4133,100分频是3100。SKL-X改了一下,是133/200的分频,200分频加了4200频率,但好像点不亮,我没有详细试,4000没问题。所以估计再高还是得超外频。。
39#
chungexcy  楼主| 发表于 2017-7-9 17:22 | 只看该作者
royalk 发表于 2017-7-9 17:14
超内存从IVB开始就是可以用100/133的分频,SKL/KBL最高到31倍频,也就是133分频可以到4133,100分频是310 ...

哦哦,理解了
40#
royalk 发表于 2017-7-9 18:17 | 只看该作者

刚才对比了一下6950x平台,50million 单线程
6950x 4G/3.1ring/3200 15.072s
7900x 4G/2.4mesh/3200 10.182s

同时mkl 10线程 设置和上面一样
6950x 549GFLOPS
7900x 849GFLOPS

提升还是很可观的嘛。。。
您需要登录后才可以回帖 登录 | 注册

本版积分规则

快速回复 返回顶部