PCEVA,PC绝对领域,探寻真正的电脑知识
打印 上一主题 下一主题
开启左侧

一张主板两个架构 Intel Core i9 7900X与Core i7 7740X评测

[复制链接]
1#
chungexcy 发表于 2017-7-12 11:34 | 显示全部楼层
本帖最后由 chungexcy 于 2017-7-12 11:42 编辑
royalk 发表于 2017-7-12 08:28
供电还好,毕竟FIVR在那里,500W的承载能力还是有的。目前X299-A是7相,其他大部分至少都是8相,而且每相 ...

Skylake-SP的频率正常多了。为了保持功耗,现在是三挡降频了。。。28c 205w的8180,3.2g->2.8g->2.3g。。。而且这20核到21核直接非渐变,突然降了0.2g是什么意思。。。

不过问题也来了。。。要是一个不像linpack这种并行度很高的程序,原来avx2跑2.8g刚好跑满TDP。现在优化成avx512,结果同频提升才20%(y-cruncher),连下降的频率都追不回来。结果导致性能反而会更低,TDP也跑不满了。。。28核心并行下再要优化avx512实在难度太大。。。

我感觉x264,这两个月盲目替换avx512,结果很可能skylake-sp的性能不升反降。。。








本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?注册

x
2#
chungexcy 发表于 2017-7-12 11:51 | 显示全部楼层
gtx9 发表于 2017-7-12 11:42
所以。。。Skylake-SP不跑AVX512还真打不过EPYC

其实我想说的是,avx512这频率,要是跑了估计就更打不过了
3#
chungexcy 发表于 2017-7-12 12:02 | 显示全部楼层
royalk 发表于 2017-7-12 11:41
这么说,Xeon是区分AVX512指令集直接限死频率?不是看TDP的么?那就亏大了。。如果是y-cruncher那样的TDP ...

我看intel说,linpack跑avx2都能稳定在2.5g,那么合理猜测,别的avx2程序至少能到2.7-2.8g。
如果这ppt功耗属实的话,我感觉intel的频率太保守了。base完全可以直接拿各种指令集的linpack频率-0.1/0.2g来定,相当于超线程的linpack烤机。
我那个2683v3,跑28线程linpack,频率刚好稳定在2.0g,功耗120wTDP,这款avx的base是1.9g。

linpack是双精度科学计算用的。waifu2x跑的是单精度,确实应该就是1000gflops,你那6950x@4g应该是一个性能,可能还更高点?
要是真是4组avx256,我估计就能到2000了。。。

只能支持avx2的linx老版本,我记得是有的,我论坛去找一下。

4#
chungexcy 发表于 2017-7-12 12:31 | 显示全部楼层
本帖最后由 chungexcy 于 2017-7-12 12:33 编辑
gtx9 发表于 2017-7-12 12:19
AVX是浮点256,整数128
AVX2是双256
AVX512就是双512.。。。

amd就俩fma128单元。一个fma单元,可以做add,可以做mul,也可以一步做mul+add。
只不过AMD合起来用效率挺高的,所以即使浮点、整数都能吊打sandy bridge那个架构。


sandy bridge:俩浮点avx256单元,不支持fma;整数依然用sse
haswell:俩fma256单元,浮点性能由于支持fma了翻倍;整数支持原生256,性能提升不到一倍。
skylake:俩fma512单元,感觉单元有改进(个人看法)。浮点性能略有提升3%;整数性能提升15%。
Skylake-sp:理论性能翻倍,实际效率捉鸡
5#
chungexcy 发表于 2017-7-12 13:00 | 显示全部楼层
本帖最后由 chungexcy 于 2017-7-12 13:06 编辑
royalk 发表于 2017-7-12 12:06
是的,这样比较合理,但如果涉及到AVX512就强制offset的话,那就不科学了。

linx刚跑了下0.65的,关到4C ...

LinX_v0.6.8_(11.3.3.010).zip

mkl 2017大版本的上一个11.3 update 3。
最后的修订版本是11.3.4,不过到处都找不到。

6#
chungexcy 发表于 2017-7-13 10:36 | 显示全部楼层
7#
chungexcy 发表于 2017-7-13 12:37 | 显示全部楼层
本帖最后由 chungexcy 于 2017-7-13 12:42 编辑
royalk 发表于 2017-7-13 11:55
这里的0.68好像有问题。。跑完一个回合就报错,4C8T 4G算力只有230GFLOPS左右,还不如6700K。。
...

实在不行,就关超线程直接跑Intel® Linpack 11.3.3.010吧

哦对,你可以把0.7.2里面的mkl,替换回0.6.8里的

PS,突发脑洞,关核有没办法选择mesh下距离最近的4个核心。。。
8#
chungexcy 发表于 2017-7-13 12:40 | 显示全部楼层
据说7800x全程被7700k吊打。。。超频都比不过。。。妥协三换感觉牺牲太大了。。。
https://youtu.be/PKX9Bcxnd7U
9#
chungexcy 发表于 2017-7-13 13:02 | 显示全部楼层
本帖最后由 chungexcy 于 2017-7-13 13:03 编辑
royalk 发表于 2017-7-13 12:55
mkl 11.3.3.010 10C10T 4G 561GFLOPS,好像还是低于6700K?
可以选择关哪个核心,但不知道物理排列是否和c ...


你是说打不过6950x?
4核打不过,那就是退步了吧,内存频率也还是会影响7900x的avx2的发挥吧
10#
chungexcy 发表于 2017-7-13 13:09 | 显示全部楼层
royalk 发表于 2017-7-13 12:55
mkl 11.3.3.010 10C10T 4G 561GFLOPS,好像还是低于6700K?
可以选择关哪个核心,但不知道物理排列是否和c ...

哦对,你之前给我说过6950x的成绩,看来确实相比7700k倒退了。。。
同时mkl 10线程 设置和上面一样
6950x 549GFLOPS
7900x 849GFLOPS


11#
chungexcy 发表于 2017-7-13 23:03 | 显示全部楼层
royalk 发表于 2017-7-13 16:30
是我记错了,都4C4T 4G,7700K和7900X基本上是一样,230GFLOPS左右。说明什么。。i9的512单元没有参与工 ...

那就是证明,avx2代码,不会使用avx512单元
12#
chungexcy 发表于 2017-7-13 23:06 | 显示全部楼层
royalk 发表于 2017-7-13 16:30
是我记错了,都4C4T 4G,7700K和7900X基本上是一样,230GFLOPS左右。说明什么。。i9的512单元没有参与工 ...

你之前说过,3.3g/2.4g/4000MHz,跑avx512功耗是260w左右。那同样设置,linapck跑avx2有少很多么?
13#
chungexcy 发表于 2017-7-14 14:32 | 显示全部楼层
本帖最后由 chungexcy 于 2017-7-14 14:35 编辑
royalk 发表于 2017-7-14 10:15
少很多,大概在210W左右,并且还是睿频跑在3.6G,电压0.983v。
10C全开是507GFLOPS

程序本身没有问题的。avx2.0单元就是俩个,avx512应该只接受avx512的代码,这是cpu内部决定的。

skylake sp,intel说的是,avx512对比avx2,同频1.91x,同功耗1.65x。要是真开启了avx512跑avx2,估计功耗和直接跑avx512没太大区别,性能还低不少。507是3.6g的吧,3.3g的1.5倍应该还要低一点?

同频,avx512肯定怎么都会快的。只不过如果是xeon,提升估计不一定抵得上频率本身的下降的代价。。。

内存看来影响很大了。应该有一个内存频率拐点,低于这个,avx2下,核心内存同频下,7900x就跑不赢6950x了。。。

14#
chungexcy 发表于 2017-7-17 07:28 | 显示全部楼层
royalk 发表于 2017-7-16 10:44
想了想,那也不对啊,P95 27.9之后功耗都差不多,说明AVX单元应该是全部工作了的,但28.9之前都还是不支 ...

对的啊,prime95的fft还是只支持的fma3。

3)  AVX-512 trial factoring support added.
29.1说的是trial factorin支持avx-512了。

虽然local.txt加了这个开关
CpuSupportsAVX512F=0 or 1
但不适用于fft。29.2 build 4依然没提到fft的avx512。

烤机跑的是fft。你可能看出来,输出的信息里面是fma3,而不是avx512什么的。调用avx512,效果就是linpack2017跑满20线程的功耗了。。。
您需要登录后才可以回帖 登录 | 注册

本版积分规则

快速回复 返回顶部