PCEVA,PC绝对领域,探寻真正的电脑知识
打印 上一主题 下一主题
开启左侧

y-cruncher -0.7.3 发布,对支持 AVX512 的一些重要说明

[复制链接]
1#
royalk 发表于 2017-7-8 18:33 | 显示全部楼层
其他部分的说明基本符合我的测试情况,只是phantom throttling的问题,估计在Intel白皮书vol2出来之前没有办法能知道它的细节,但确实有一种看不见的处理器性能下降情况存在,这种降频不仅表现在运行avx512,也表现在超频后的某些测试中,怀疑FIVR就有一层throttle机制,并且这个情况是目前所有监控软件都抓不到的,只能从满载测试中CPU温度突然往下掉的现象感知到。
来自安卓客户端来自安卓客户端
2#
royalk 发表于 2017-7-8 18:37 | 显示全部楼层
OstCollector 发表于 2017-7-8 17:40
我在想,到时候各种并行算法的benchmark怎么做

目前来说这代频率定的太高,只能是勉强运行avx512,性能还受限。如果我预计的没错7980xe运行avx512的频率大概是2.5-2.8GHz,电压在0.85v或更低,这样可以实现Intel宣传资料里的1TFlops算力,也可以避免了像7900x那样功耗爆炸的情况。

改天我会验证默认频率下使用默认电压和降压对比,看看avx512的性能有无提升。
来自安卓客户端来自安卓客户端
3#
royalk 发表于 2017-7-8 22:02 | 显示全部楼层
gtx9 发表于 2017-7-8 19:30
intel官方测试双路56核的skylake-sp(205w)是 3295.57GFlops(LINPACK)

算下来单路205w功耗下1647GFlop ...

是的,所以7980XE的频率其实也没什么TBA的了,基本就这数,不会再高了。
那就出现一个问题,AMD的Ryzen 16核,3.4G,如果跑AVX256,可能比intel还快。
4#
royalk 发表于 2017-7-9 11:54 | 显示全部楼层
gtx9 发表于 2017-7-8 22:14
目前AVX软件还是很少。。。估计在调教非AVX频率

预计7980XE

非AVX 3.5应该没问题,TB3.0只是双核,应该4.5没问题。
我估计Intel在评估是否还要再放宽TDP。。。

5#
royalk 发表于 2017-7-9 11:56 | 显示全部楼层
haomingci3 发表于 2017-7-9 10:40
我觉得AVX256上ryzen还是跑不过,0.6G频率差弥补不回原生差一半的FMA数,而且还有两个核的差距,AVX1倒是 ...

512的效率是捉急,但是这代渲染和编解码类IPC有小幅提升,大概在7-10%,如果是2.5到3.4G的差距,那么ryzen还是有机会,至少应该能和7960X肛一下
6#
royalk 发表于 2017-7-9 12:25 | 显示全部楼层
chungexcy 发表于 2017-7-9 12:13
这个评测是基于AVX2的,50mililion,默认频率是1.795s。
按照之前贴出的表格,50mililion用avx512,能下 ...

回头我跑一下,这个提升幅度其实已经算是可以了。。毕竟不是linpack纯跑AVX。。
7#
royalk 发表于 2017-7-9 15:03 | 显示全部楼层
chungexcy 发表于 2017-7-9 12:13
这个评测是基于AVX2的,50mililion,默认频率是1.795s。
按照之前贴出的表格,50mililion用avx512,能下 ...

刚跑了一下build 9471,4G/2.4/3200的时候是1.577s
8#
royalk 发表于 2017-7-9 16:14 | 显示全部楼层
更正一下之前我回帖中的一些错误,我本以为默认状态下GFLOPS低是因为TDP限制,看来其实并不是。
从下面的数据可以看到,由于L3变成排除式,AVX-512 GFLOPS对内存性能的敏感程度远远不止y-cruncher作者说的15%。。

全默认设置,MKL跑出674GFLOPS
以下项目分别为:核心频率/MESH/内存    GFLOPS
3.3/2.4/2133        674
3.6/2.4/2133        683
3.6/2.4/3200        815
3.6/2.4/4000        910
3.6/3.2/4000        936
4.0/2.4/2133        722
4.0/2.4/3200        849
4.0/2.4/4000        965
9#
royalk 发表于 2017-7-9 16:20 | 显示全部楼层
gtx9 发表于 2017-7-9 16:09
这时候功耗有多少?

1秒多就跑完了,待会跑大点的插功耗表看看。
10#
royalk 发表于 2017-7-9 16:27 | 显示全部楼层
chungexcy 发表于 2017-7-9 16:18
难道官方有特别的跑分方式?
1 billion的表现差异大么?

1 billion 3.8/2.4/3200,20线程是42.981s,介于他给的数据2133和3200之间。。。
11#
royalk 发表于 2017-7-9 16:27 | 显示全部楼层
chungexcy 发表于 2017-7-9 16:22
我的天。。。。3.3g下超内存,性能和功耗是不是会比3.6g不超内存高。。。

而且突然意识到,xeon skylake ...

应该是会,待会我接上功耗表看看
12#
royalk 发表于 2017-7-9 16:33 | 显示全部楼层
gtx9 发表于 2017-7-9 16:09
这时候功耗有多少?

50m太快录不出准确值,跑1 billion功耗波动很大,在200-270w之间波动,而linpack轻易去到340w。
13#
royalk 发表于 2017-7-9 16:51 | 显示全部楼层
chungexcy 发表于 2017-7-9 16:42
哦对,这个软件的功耗是有波动的,我锁TDP跑,能看到睿频能跳0.2-0.3g的幅度。。。

那个成绩差异,我不知 ...

那就奇怪了,不知道他3.8G的时候睿频有没有关掉,其它还动了什么设置。睿频我是关了的。刚才跑的CPU默认,内存4000,也是42s多。CPU频率在3.3-4G跳。
14#
royalk 发表于 2017-7-9 16:52 | 显示全部楼层
gtx9 发表于 2017-7-9 16:45
xeon虽然不能超内存,不过Xeon有6通道内存

6通道2666刚好相当于四通4000的bandwidth。。但别忘了,28蛋。。
15#
royalk 发表于 2017-7-9 16:53 | 显示全部楼层
gtx9 发表于 2017-7-9 16:52
这软件还没有linpack压力大。。r大试试7900x默认TDP设置下linpack能有多少gflops看看
...

全默认就是674啊
16#
royalk 发表于 2017-7-9 16:54 | 显示全部楼层
chungexcy 发表于 2017-7-9 16:22
我的天。。。。3.3g下超内存,性能和功耗是不是会比3.6g不超内存高。。。

而且突然意识到,xeon skylake ...

全默认,只把内存超4000
3.3G,仍然录不出降频
最大功耗录得264w
看来主板默认已经把TDP解了
problem 40000的时候性能是851GFLOPS,对比内存2133其它一样,674GFLOPS,功耗大概200w,主频4G,内存3200,也才是849

我了个去。。跑AVX512还跑什么主频啊。。提内存才是硬道理啊

17#
royalk 发表于 2017-7-9 17:14 | 显示全部楼层
chungexcy 发表于 2017-7-9 17:06
厉害了,我的Intel。。。3.3g+4000MHz>4.0g+3200MHz。。。。。。。

对于超内存,有个疑问,现在都不用按 ...

超内存从IVB开始就是可以用100/133的分频,SKL/KBL最高到31倍频,也就是133分频可以到4133,100分频是3100。SKL-X改了一下,是133/200的分频,200分频加了4200频率,但好像点不亮,我没有详细试,4000没问题。所以估计再高还是得超外频。。
18#
royalk 发表于 2017-7-9 18:17 | 显示全部楼层

刚才对比了一下6950x平台,50million 单线程
6950x 4G/3.1ring/3200 15.072s
7900x 4G/2.4mesh/3200 10.182s

同时mkl 10线程 设置和上面一样
6950x 549GFLOPS
7900x 849GFLOPS

提升还是很可观的嘛。。。
19#
royalk 发表于 2017-7-9 18:31 | 显示全部楼层
gtx9 发表于 2017-7-9 18:22
跑多线程看看差距有没有拉大

20线程,差距缩小
6950x 1.803s

7900x 1.577s


感觉windows对7900x的线程调度还有些问题,不过对这个程序似乎影响不大,跑了多次误差在30ms以下。

20#
royalk 发表于 2017-7-9 21:04 | 显示全部楼层
gtx9 发表于 2017-7-9 20:44
这差距缩小得有点大啊。。会不会是50million计算规模不够大?

有可能,毕竟一秒多就结束了,可能并非所有浮点单元都参与了整个运算过程,而且内存缓存访问延迟占了很大比重。
来自安卓客户端来自安卓客户端
您需要登录后才可以回帖 登录 | 注册

本版积分规则

快速回复 返回顶部