PCEVA,PC绝对领域,探寻真正的电脑知识
打印 上一主题 下一主题
开启左侧

一张主板两个架构 Intel Core i9 7900X与Core i7 7740X评测

[复制链接]
跳转到指定楼层
#
royalk 发表于 2017-7-11 17:19 | 只看该作者 回帖奖励 |正序浏览 |阅读模式
点击数:35332|回复数:113
前言

今年年初AMD发布的Ryzen处理器,正式掀起“核战争”,可谓是打破了处理器市场多年来Intel一家独大的局面,同时也让Intel的产品计划有了一定调整。在2017年Computex上,Intel发布了新的至尊平台X299主板和Core-X系列处理器,这比预定的计划提前了两个多月。

Core ix处理器的命名方式Intel从2008年使用至今,i7一直是代表最高的型号,然而这次Intel首次引入Core i9的系列,产品布局也有了较大调整。首先,Intel这次发布的酷睿X系列处理器覆盖了Core i5/i7/i9产品线,核心数最少4个,最多达到18个,可以说覆盖面是相当的广。另一方面,这次Intel发布的处理器当中包含了Skylake-X和Kabylake-X两种不同架构的产品,但它们的接口都是LGA 2066,使用的都是X299主板,在近年来的CPU市场上还是比较少见的。Intel的这种举措上一次出现应该要追溯到LGA 1156的时候了,当时Clarkdale和Lynnfield的CPU部分架构其实还是比较接近,并没有这次差别那么大。

6月,Intel先行发布三款Skylake-X和两款Kabylake-X处理器,其中Skylake-X是6-10核心的规格,而Kabylake-X是4核心的规格。而传说中的18核Core i9 7980XE,只是纸面发布而已,除了18核和1999美元的价格外其它规格还未确定,产品最快要等到8月份才会面世。

Skylake-X和Kabylake-X除了核心数不同外,架构也是完全不一样。Kabylake-X完全就是Skylake和Kabylake架构,双通道内存和16条PCIE通道,只是接口换成了LGA2066而已,而Skylake-X是重新设计的核心,每核心1MB L2缓存,共享的每核心1.375MB L3缓存,支持四通道DDR4-2666内存,支持AVX512指令集,其中Core i9 7900X有44条PCIE通道,而8核心与6核心的Core i7 7820X、7800X则是28条PCIE通道。

价格方面,10核心Core i9 7900X定价是999美元,相比上代同为10核心规格的i7 6950X便宜了不少,而8核与6核的Core i7,价格也比6代同核心规格的处理器价格有比较大的下降。

Skylake-X和Kabylake-X使用了新的芯片组,代号Basin Falls的X299芯片组的设计大部分与Z270无异。上行DMI3.0总线与CPU连接,相当于PCIE 3.0 X4的速度,下行24条PCIE 3.0 Lanes,10个USB3.0,以及傲腾的支持,不同的是SATA3.0原生支持8个,比Z270多2个。

Skylake-SP架构细节

核心设计:环路变网格
从已经公布的Skylake-SP的Die Shot来看,这次Intel是把两个Die推向桌面产品,其中12核至18核使用HCC Die,而6至10核的使用LCC Die。另外还有28核的Xeon使用XCC Die。叫法和之前有些不一样,但Skylake-SP仍然是3个Die。

这次Intel放弃了Ring总线,而改用类似Knights Landing架构Xeon Phi上使用的Mesh网格总线,大幅降低核心之间的通讯延迟。因此,Skylake-SP的核心的设计也有所改变,以18核的HCC Die为例,我们可以看出一个5x4的网格状结构,其中18个格子是核心,除了第一排和最后一排左数第二个格子,可以看到和其它有些不一样的,是内存控制器,看起来像是一边3个,所以Skylake-SP最高是支持6通道的内存,而桌面级Skylake-X屏蔽了两个。而PCIE、IO及其它东西都在边缘。以此类推,LCC Die就是一个4x3的Mesh,10核心加上2个MC,而XCC则是6x5的Mesh,28核心加上2个MC。

每个核心、MC、PCIE、IO等设备都作为一个节点,Mesh总线把每个节点互相连接成一个网格状。这样一来在核心越来越多的今天,隔得最远的两个核心想要通讯,可以有多条路走,而不像ring总线那样需要排队,甚至像之前那样在MCC、HCC Die还需要多条Ring总线来交接。简单举个例子,在Xeon E5v4上,如果你想让Core 1和Core 10通讯,那么走Ring总线你可能要经过Core 2至Core 9,核心越多会让Ring总线越长,路过的核心越多,造成越来越高的延迟,而Mesh就不一样,它可以跳过一些核心,哪怕是对角线上的两个核心互访,那么最多也就是横竖各一跳就可以到达。

缓存的改动:L2变大,L3变性
Skylake-X核心的L2和L3缓存做了较大的改动。L2缓存,从第一代Core i7开始就是256KB每核心,一直沿用到Kabylake,这次Skylake-X增加到1MB每核心,更大的L2缓存固然会增加命中率,但同时也会加大延迟,这次Skylake-X这1MB的L2缓存,Intel给出的延迟大概是不超过13个周期,而之前256KB的L2设计是11个周期。经过测试,L2缓存大了四倍对普通测试项目的IPC提升并无太大帮助,这样的设计有可能是为了满足AVX512指令的运算需求。

L3缓存从以前的每核心2.5MB变成了现在的每核心1.375MB,形式也变成了排除式缓存。一方面是由于L2缓存的增加,L3缓存做成包含式已经没多大意义,反而要被灌入大量的重复数据,因此做成排除式缓存是明智之举,另一方面是MESH架构的采用,L3无法再像之前那样挂在Ring总线上,因此作为排除式缓存的存在,其角色其实更像是Intel在一些嵌入式封装处理器上所使用的eDRAM。L3排除式缓存就是用来放L2洗出来的数据,在缓存中数据利用率小的时候,L3缓存利用率比较多,如果CPU一直在做重复工作,那么数据就一直在L2中,L3就闲置了。Ryzen有512KB的L2缓存,因此L3缓存也是做排除式的。

AVX-512指令集:可能要摊上大事了……
AVX-512指令集早在Larrabee时代就已经提出,早些时候已经在Xeon Phi X200系列上使用。Skylake-X终于在桌面级平台正式加入了Intel酝酿已久的AVX-512指令集,AVX-512指令集可以让处理器每周期计算512bit位宽的浮点数。Skylake-SP处理器可以通过复用两个256bit AVX单元来实现AVX-512的运算。

但即便都是Skylake-X,Intel这次在AVX-512指令集的支持上也做了区分。在Skylake-SP架构CPU每个核心内部,前端调度器上的0,1端口是具备256bit AVX单元的,而5端口根据目前得到的消息来看,是具备一个512bit的AVX计算单元,也就是这些端口可以运行AVX指令。而AVX-512的实现方式,可以是复用0,1两个端口同时计算256bit的AVX,也可以是用5端口的AVX单元。虽然Intel目前没有正面表态,但有可靠消息称,Intel屏蔽了Skylake-X八核心与六核心处理器上5端口的512bit AVX功能,只留下0和1端口的两个256bit AVX单元。

也就是说,现阶段只有Core i9 7900X处理器每个核心中有完整的两组512bit AVX单元,而Core i7 7820X、Core i7 7800X只有一组两个256bit AVX单元,这与Kabylake/Skylake/Haswell是一样的规格,区别只是前者可以把这两个单元合并起来执行AVX-512,但理论计算位宽还是和Kabylake在一个级别,而只有Core i9 7900X的两组AVX单元才会实现翻倍的理论算力。或许这也是Intel引入Core i9命名并把6核、8核命名成Core i7的原因。类似的,Ryzen通过复用两个128bit的AVX单元实现AVX2.0(256bit),理论算力是Haswell的一半,和Ivy Bridge一个水平。

但是话说回来,理论算力和实际软件效能是两码事,Core i9的两组512bit AVX单元,需要通过软件的优化才能发挥出凌驾于Core i7之上的功效,而Core i7 7820X、7800X虽然算力和Kabylake一样,但反馈到实际软件性能上,实际上在CPU内部就已经做好了“优化”,在支持AVX-512的软件上执行效率比Kabylake会更快。

现阶段AVX-512主要是为大规模的计算应用服务,Intel也一直想要在SIMD并行计算上和GPU叫板,所以在Xeon Phi上寄予厚望,这次居然把两组512bit AVX单元下放到Core i9,比较令人意外。然而民用软件普及AVX-512还需要时间,并且现阶段AVX-512的支持程度并非完整版本,所以可以说Core i9的AVX-512虽然下放到民用产品上,但对用户来讲在未来一段时间内用到的概率还不大,并且几乎可以肯定Intel下一代产品AVX-512的效率还会再次得到提升,因此这一代的Core i9对于AVX-512来讲只是一个过渡。另一方面,CPU片上AVX单元的晶体管密度相当大,所以两组AVX单元在负载时功耗和发热密度会相当之大,在使用Xeon处理器的工作站和服务器平台上遵循严格的TDP限制机制,温度和功耗超出时处理器会降频,所以不会出什么问题。而民用桌面级PC,由于处理器都不锁倍频,主板BIOS可以开放解锁功耗限制,加上FIVR和硅脂的因素,Haswell时代的高温高热量历史会在Core i9上重演,AVX-512是导致目前i9-7900X烤机功耗暴涨的一个原因,也是对主板供电设计的一个巨大考验。

总体来说,现阶段AVX-512的存在对民用级市场来讲还太超前,极少有软件应用会用到,反而还会加大处理器的功耗,并且由于L3缓存改成排除式设计,AVX-512将对内存带宽的需求大幅增加。例如经过我们的测试,Core i9 7900X在默认设置下运行LinX AVX-512时最高只能运行在3.3GHz的频率,完全没有Boost的余地,并且在超频内存之后,Linpack的性能甚至比超主频收益更高。在BIOS中,主板厂商通常会留一个AVX-512倍频offset,必要的时候可以开启此项降低几个倍频,从侧面避免处理器功耗和温度超过规定值。

改进的内存控制器
在Computex 2017上,我们已经见到了风冷DDR4-4800、128GB双面DDR4-4133的内存展示,这都是Skylake-X的CPU跑出来的,由于内存控制器的进步,这次Skylake-X对高频内存的支持进一步提升,对双面内存的频率提升也有了一定帮助,只要你的内存颗粒能超,DDR4-4000很容易就可以跑上去。另外,Intel这次还专门安排了一个内存控制器PLL Trim电压,让高频内存的Training成功率增加。

其他技术
Speedshift:继续沿袭Kabylake的功能,让睿频响应速度更快。

Turbo Boost Max 3.0:简称TBM3,在Broadwell-E时代出现,处理器会选择体质最好的核心来进一步提高Turbo Boost的频率。到了Skylake-X这个功能有所增强,TBM3核心从1个变成2个。另外,6核心的Core i7 7800X不支持TBM3,而8核心、10核心的Core-X处理器,都可以使用TBM3功能让两个核心达到4.5GHz。

FIVR:Intel并没有针对Skylake-X的FIVR是去是留做出明确表态,我就此事问了主板厂商的RD,得到的反馈也是对此不知情,建议我们去问Intel,他们只按Intel给的规范设计主板。以目前的情况来看,Intel的市场策略似乎是打算在Xeon上保留FIVR,以应对未来越来越复杂的CPU内部设计,只是在Skylake、Kabylake和以后的Coffeelake这些相对比较简单的LGA1151接口CPU上去掉FIVR,就主板BIOS情况来看也印证了这一点。FIVR同样会加大CPU的功耗和温度,影响CPU的超频,但好处是面对Core i9的巨大功耗,FIVR输出1.8V的电压,可以在一定程度上减少主板供电的压力。在这里也提醒大家,在更换Skylake-X和Kabylake-X的CPU时,在不确定主板BIOS会重新识别新CPU之前,一定要清空CMOS,否则很可能1.8V的FIVR输出电压会直接加在Kabylake-X处理器上,导致处理器损坏。

VROC:即是Virtual RAID on CPU。这代CPU还支持直出的PCIE RAID功能,终于可以正大光明的把3个NVMe固态硬盘挂在CPU上做硬RAID0了。因此这也催生了一种新的附件——PCIE转多M.2插槽的转接卡。但,目前VROC只支持Intel的SSD,希望以后有大神可以破解支持所有的SSD。

Core i7 7900X与Core i7 7740X实物图及介绍

Core i9 7900X是本次发布的唯一一个Core i9系列,它拥有10核心20线程,基础频率3.3GHz,全核心睿频最大4.0GHz,3-4核睿频4.1G,1-2核睿频4.3G,还有TBM3让最多两个核心睿频至4.5G。Core i9 7900X拥有44条PCIE 3.0通道,支持四通道DDR4-2666内存,最大容量128GB。

我们拿到的是正式版的Core i7 7900X,顶盖样式大体和Broadwell-E相同,原本靠近PCB四个角的部分,斜角变成了圆角,且右上角因为有个芯片的缘故(暂时不知道这芯片的作用),顶盖缺了一角。

背面,LGA 2066触点。核心背后布满了贴片电容。

Skylake-X处理器实际上是两层PCB的封装,从侧面可以看到内层PCB部分。所以虽然是硅脂封装,开盖难度还是比较大的,而且Skylake-X的售价动辄大几千,建议不要轻易尝试。

Core i7 7740X,Kabylake-X架构,可以认为是7700K屏蔽核显,并移植到LGA 2066接口的产品。默认频率4.3G,最大睿频4.5G,112W的TDP,其它规格等同7700K。我们拿到的是ES,顶盖长得像一张护舒宝,和Core i9 7900X有些不一样。吐槽一下,Intel有这闲钱开两个模做顶盖,不如给Skylake-X全部上钎焊。

背后,电容排列方式和Core i9 7900X有些不一样。

参测主板与供电问题

技嘉AORUS X299 Gaming 3
技嘉这次推出三张X299主板,都属于AORUS系列,最高端的是Gaming 9,其次是Gaming 7,而我们手上的Gaming 3属于入门级的一款。关于该主板的介绍,请参考:技嘉AORUS X299 Gaming 3主板开箱

华硕PRIME X299-A
华硕这次发布的X299主板有点多,共7款。其中两款PRIME系列,X299-A和X299-Deluxe,两款TUF系列,TUF X299 Mark 1和Mark 2,以及三款ROG X299主板,RAMPAGE VI EXTREME、RAMPAGE VI APEX和STRIX X299-E Gaming。我们这次收到的仍然是最入门级的PRIME X299-A。

简单过一下X299-A主板的亮点。从今年开始,主板厂商炒作的梗从RGB灯变成M.2散热片,所以这个其实也不算什么亮点。X299-A主板PCH和M.2散热片的一体式设计,让你甚至根本看不到散热片在哪里,只有拆开位于PCH散热片上ASUS LOGO周围的三个螺丝,才会发现下面是M.2散热片。不过这个设计好看是好看了,但拆装略微麻烦,各有利弊。

由于X字头芯片组主板元件非常多,华硕在X99的时候就做了直立的M.2设计以节约空间,X299主板上继续保留下来。另外USB3.1前置面板接口也成为标配,这个值得称赞。

供电7+1相,其中核心的7相,每相一颗IR3555M,最大电流60A,在使用Skylake-X时,如果以1.8V的VCCIN计算,理论上可以顶756W的功率。在使用Kabylake-X时,以1.2V的Vcore计算,理论上可以顶504W的功率。CPU 12V输入端配备8+4Pin,通常认为使用18AWG的线材,一个8Pin可以顶到300W,4Pin则减半。所以CPU 12V端可以支持450W的功率。

对于Core i9 7900X来说,不超频有严格的140W TDP限制,哪怕是以后的Core i9 7980XE也就是165W(待定),这个供电完全没问题,然而在超频之后跑AVX-512,450W的输入功率是很容易就能达到的,因此谨以此主板举例,这类供电规格都不能满足Core i9 7900X超频满负载长期运行需求,为了主板和电源的安全,8+8Pin应该是最基本的配置。

以下是ASUS PRIME X299-A主板在CPU负载达到300W左右时的供电温度情况。左图和中间的图我们只接了一个CPU 8Pin供电,左图是CPU供电的负载温度,为75.7度,对7相供电来说可以接受;中间是线材温度,最高61.8度也还算可以接受;而右图我们把8+4Pin供电都接了,可以看到线材温度已经降到很低,但最热处出现在8Pin和4Pin中间的那个电容和电感,达到110度,这就让人有些担心了,我们猜测这个12V输入的滤波电路并不能满足通过30A以上的电流。

通过实测,再继续提高负载到400W以上,主板就会出现紧急断电的现象,包括技嘉AORUS X299 Gaming 3也是一样的现象,包括别的媒体和个人使用其它型号的X299主板测试也有反馈类似的情况,看起来这个问题在现有的X299主板上非常普遍存在。因此建议在测试X299主板和Core i9 7900X处理器超频时,一定给供电加一个风扇直吹,以确保温度在可控范围内,并且在运行AVX-512时把CPU频率电压降低以免主板过载断电。

技嘉AORUS X299 Gaming 3主板的负载温度由于样品很快就被收回,并未来得及测试,但估计也是大同小异。现在想想,现有的主板都难以满足10核超频满载AVX-512,怪不得18核Core i9 7980XE要延期了……

测试平台介绍

本次我们测试两颗CPU分别是Core i9 7900X和Core i7 7740X,以及两张主板,技嘉AORUS X299 Gaming 3、华硕PRIME X299-A。作为对比组,我们加入Core i7 6950X以及AMD Ryzen 7 1800X的平台。

测试平台:
CPU:
Intel Core i7 7740X
Intel Core i9 7900X
主板:
GIGABYTE AORUS X299 Gaming 3
ASUS PRIME X299-A
内存:G.Skill F4-3200C14Q-32GTZSW
显卡:MSI GTX 960 Gaming 2GB
硬盘:OCZ RD400 256GB
电源:
Enermax Revolution 85+ 1050W
SilverStone ST-1500GS
散热器:Corsair H110i GTX

Core i7 7740X的CPUZ截图:

Core i9 7900X的CPUZ截图:CPU-Z误判技嘉X299主板的CPU电压为Input电压,这种事情在Haswell时代也发生过。

BIOS介绍

我们先看技嘉X299 Gaming 3的BIOS。由于我们这次是一张主板插两个不同架构的CPU,在使用Skylake-X和Kabylake-X处理器时BIOS的功能会有所区别。使用Kabylake-X时,BIOS和Z270基本上是一样的,大家可参考之前的Z270主板评测,BIOS基本上是一样的。这里主要讲使用Skylake-X处理器时BIOS的功能。我们测试时使用的是F5h BIOS,这只是第一版发行之后更新的一个测试版BIOS,相信很多功能还不成熟,需要等待后续进一步完善。

频率部分,首先Skylake-X不支持BCLK外频随便超,和Broadwell-E一样只是100/125/166/250这样的档位,这在BCLK Coarse Ratio里调节,在100外频时,内存最高跑到DDR4-4000的频率都是没问题的。

高级CPU设定,AVX 512和AVX Offset其实可以统一了,在运行AVX指令集时倍频下调的数目,Auto表示不下调。TJ-Max Offset最大可以设置到40,但我们发现并不生效。MC PLL Trim在前面提到过,在高频内存无法开机时可以加一下,但为什么要把电压相关设置的项目放在这里呢……

Turbo Residency Tweak LUT0-3,说明书说法是调节Turbo Boost的功能,但未作详细说明,在超频时通常不用Turbo Bost,所以我们先不管它。另外,以前的Uncore(ring)倍频随着CPU架构的改变,也改成了CPU MESH倍频。

Turbo Boost倍频其实有误,在单核和双核时实际上应该是43,但技嘉的BIOS对Intel TBM3的支持还有些问题,所以干脆直接改到45了,3-4核心负载时是41倍频,在五个核心以上负载都是40倍频,这个没有问题。另外,由于Intel对Skylake-X的规格还没完全放出来,没有给出电流限制,技嘉在BIOS里CPU电流限制的默认值竟然就是1023A的最大值……

内存设置部分。可以开启XMP,没什么区别,也可以手动调节内存频率,我们在100BCLK下最多可调至40倍频,也就是DDR4-4000的频率。

内存时序设置,第一、第二时序:

内存时序设置,第三时序:

CPU电压设定:

内存电压设定:

数字供电相关设定:这些都与之前的主板没什么区别。

再看华硕PRIME X299-A的BIOS,基本格局和华硕前代主板没什么变化。非ROG主板默认还是进到EZ模式。

按F7切换到高级模式,界面大体上还是和前代相同。使用Skylake-X处理器的时候,可以每个核心单独指定倍频,这样你可以设置最好的核心倍频稍微高一些,而体质没那么好的核心倍频低一些,这样可以有助于效能的最大化。但这需要大量的时间摸索并且会造成测试成绩误差加大,所以在测试过程中我们还是使用传统的所有核心统一倍频。

MESH倍频仍然叫做Cache Ratio,内存频率可以在100外频直接上DDR4-4200,但我们尝试只能点亮4000的分频,这已经比Broadwell-E有了很大进步。

电压设置部分,可以看到Input电压又回归了,CPU核心与Cache电压调节的步进变回0.001V,说明FIVR真实存在。这样一来,各项电压的意义基本就和Broadwell-E没区别了。

超频到DDR4-4000的内存参考时序:第一时序

第二时序:

第三时序:确保两个tCCD是0即可。

基准测试

我们沿用之前的测试项目进行基准横向对比。加入7700K、6950X与Ryzen 7 1800X的数据进行对比。

首先看7700K和7740X的对比。可以看到,无论是默频还是超到5G,两者基本没有任何差别,这也完全在意料之中。

然后我们看6950X和7900X和Ryzen 7 1800X的对比。首先7900X和6950X的默认频率相比,7900X由于得益于14nm+工艺,频率提升较多,基本上在大多数单线程与多线程测试中均领先6950X。值得一提的是,WinRAR由于6950X的L3缓存很大,跑分非常占优,而7900X的L3缓存改为排除式,WinRAR不再能够使用L3缓存,因此跑不出6950X的效能。另外,国际象棋我使用红字标明,因为它最大只能支持16个线程,6950X和7900X的20线程无法全部利用。

在与Ryzen 7 1800X的对比中,Core i9 7900X的频率和效率完全碾压,然后又多了两个核心,这两个实在没有可比性。但值得注意的是,Ryzen 7 1800X的功耗表现还是非常不错的,这让我们可以期待16核心Ryzen ThreadRipper在能效比上的表现。

游戏性能测试

游戏测试其实没什么悬念了,现在的CPU玩游戏是完全过剩的,DX12刚推出时号称的多线程利用率由于各种原因,至今也没有能真正实现。然而Core i9的L3缓存变为排除式,有可能会对部分游戏造成小幅的负面影响。本次评测我们不打算加入游戏测试,因为不用测都可以知道绝大多数游戏项目都是个位数百分比的差距范围内,而且随着2K、4K屏幕的普及,CPU对游戏性能的影响将越来越小。

我们使用影驰GTX 1080 HOF显卡,以奇点灰烬2K Crazy画质为例,7900X跑出59.2FPS。

而7700K也跑出58.8FPS,基本上可以认为是一样的效能。

多媒体处理与创作类软件效能测试

我们这次特别增加一些多媒体与创作类软件的测试,让我们挨个分析。

7-Zip
目前比较常用的高效压缩、解压软件,效率超过WinRAR很多,对多线程的利用更好。可以看到,此项目由于7900X的缓存设计有变,同频下应该是比6950X性能要差一些的,但好在频率弥补了这个差距。

Cinebench R15
渲染类软件的代表,直观显示分数,基本上各类软件的渲染用时比率,都不会与Cinebench的分数比率差太多。可以看到,Core i9 7900X相比Core i7 6950X在默认状态下成绩提升16%,渲染已经是Ryzen的强项,而7900X凭借更多的核心、更高的主频,在默认频率也比AMD Ryzen 7 1800X快了34%。

Blender 2.78c
Blender是一个开源的设计软件,可对静态画面和动画进行渲染,它没有3DSMax那么臃肿的体积,相对来说简单易用,因此受到一部分设计师的青睐。2.78c是今年2月底新推出的版本,相对2.78a的性能进行了优化,同时加入了Cycles Render引擎,支持NVIDIA Pascal显卡直接使用CUDA加速。我们继续使用AMD提供的Ryzen Demo素材。可以看到,Ryzen 7 1800X在之前AMD的Demo演示里成绩是34-36s,之后我们进行测试也吻合,而2.78c成绩提升至24.52s,这个幅度还是非常巨大的。另一方面,Intel Core i9 7900X比6950X还是快了不少,别看这Demo几秒钟的差距,反映到真正的工程上,30%的差距可以帮你节约很多时间了。

3DSMax 2016
3DSMax是老牌的3D建模与设计软件,我们针对目前中国市场上应用最多的V-Ray渲染器进行CPU渲染的测试,测试素材仍然使用我们的游泳池素材。但为了节约测试时间,我们将Noise Threshold值从默认的0.01改为0.1。Core i9 7900X对3DSMax的渲染速度在默认频率下相对6950X的提升幅度比较可观,已经超过了6950X超频到4GHz的速度,但7900X想要进一步超频到4.6G跑长时间渲染的工程难度相当大,因为此时CPU的功耗已经超过300W,非但性能提升与频率不成正比,对主板供电也是一个考验。

X264 FHD Benchmark
X264是目前主流的一种视频编码格式,X264 FHD Benchmark代表着1080P X264转码的效能,是影音工作者进行转码工作的一个比较准确的性能参考指标。它可以支持AVX指令集,但目前还未能支持AVX-512。该软件的负载可以超过渲染工作。Core i9 7900X在默认设置下效能略微超过了6950X超频至4G,超到4.6G后性能更是提升了21%之多。

HWBOT X265 Benchmark
X265/HEVC是近两年开始流行的一种高质量格式,被称为是取代X264新技术。目前HWBOT捷克超频玩家开发了一款X265 Benchmark测试,采用HEVC/X265编码输出一个视频,可选1080P和4K模式。测试结果与X264编码类似,7900X在默认全核心4GHz时性能略微超过6950X超频到4G,超到4.6G后提升25%。

AVX-512测试:LinPack

Intel今年3月发布的MKL已经可以支持AVX-512,LinX 0.7.2已经集成了这个最新的MKL,但是LinX的超线程负优化,为了图方便,我们直接跑MKL包里的bat文件,最大Problem Size可以到40000。

测试结果比较出乎我们的意料。可以看到,主频的提升并没有给性能带来多大的提升,但超频内存之后,性能有了巨大的提升。说明Skylake-X的L3缓存改为排除式之后,AVX-512对内存的带宽非常饥渴,内存从2133提升至4000竟然可以带来33%的性能提升。这提醒了今后Skylake-SP Xeon用户,运行AVX-512计算时6通道内存是非常有必要的,并且现有4通道DDR-4000的内存带宽连10核都不能喂饱,28核的内存带宽荒现象应该会更加严重。

同频4GHz测试:6950X与7900X的IPC变化

我们选取SuperPI 1M、32M,Fritz Chess国际象棋、Cinebench R15等软件对比Core i7 6950X和Core i9 7900X的单线程效能。把两个平台都固定主频4GHz,Ring/Mesh默认,节能和睿频均关闭,内存开启XMP 3200C14,其余设置不做改动。

通过测试可以看到,7900X在单线程测试中相对6950X的IPC提升并不大,可以说是整数几乎没有,浮点有小幅提升。看来L2缓存从256KB加大到1MB,带来的收益并没有想象中的大。只有在Linpack的测试中,7900X的AVX512完全虐杀6950X,而y-cruncher 0.7.3由于也加入了AVX-512的支持,7900X的单线程效能也有比较可观的提升。所以,7900X的IPC提升主要表现在浮点计算能力上,并行度越高,提升越大,支持AVX-512的程序,提升越大。

MESH频率对性能的影响

MESH总线和Ring总线类似,连接CPU和内存控制器的通讯总线,类似于以前的北桥总线。对它进行超频,将有助于降低内存延迟,但MESH总线的频率默认只有2.4GHz,可超的空间也不大,大约在3GHz出头就超不上去了,而且超MESH后功耗增加许多,因此我们需要找到一个性能与功耗的平衡点。

我们固定CPU主频4.6GHz,电压1.225V,内存DDR4-3600 16-16-16-36-2T 1.4V,分别测试MESH频率在2.4GHz-3.2GHz范围内的性能变化情况,以0.2GHz为一步进,同时在这个范围内,MESH电压也要逐步提升。

可以看到,对内存延迟较敏感的SuperPI 32M、AIDA64内存测试,在超MESH频率之后有小幅度的提升,以浮点计算为主的Cinebench渲染测试,也有一定的提升,但幅度均不大。另一方面,可以看到在超频MESH后,CPU的待机和满载功耗均有较大幅度增长,这对主板的供电需求也是一个考验。

最终我们发现,MESH电压在0.9v左右可以让MESH频率稳定在3GHz,这时的性能和功耗表现是一个比较好的甜点。

压力测试

现在Prime 95 29.1应该还未能支持AVX 512,但是Core i9 7900X的所有AVX单元也可以全部参与工作,因此功耗还是不小。

我们故意只接一个8PIN,发现在CPU满载时线缆温度达到104度,这已经很不安全了,而主板供电温度倒是还好。所以我们强烈建议至少使用支持8+4Pin的主板和电源。

在接入8+4Pin时,可以看到线路的发热量已经不是问题了,最热大概在60度左右。这时候我们继续超频至4.2GHz,此时CPU供电发热量增加到76.5度。系统最热处出现在8Pin与4Pin中间的电容电感,为83.1度。

在Input电压1.85V,核心电压1.138V,MESH电压0.925V,VCCIO电压1.05V,VCCSA电压0.95V时,CPU超频至4.2GHz通过Prime 95测试,此时CPU核心最高温度已经达到97度,此外我们发现在VCCIO/VCCSA电压越高时,CPU越容易出现负载断电的现象。

等Prime 95正式支持AVX-512的时候,估计功耗会更上一层楼,届时给7900X超频烧机难度会更加大。

我们在华硕PRIME X299-A和技嘉AORUS X299 Gaming 3两张主流主板都达成了DDR4-4000四通道的稳定性测试,Memtest通过,表明Skylake-X的内存控制器确实增强了许多。另外,在Memtest测试的负载中,CPU超频到4.6GHz稳定性都没问题。因此我们建议,日常使用时可以跑4.5-4.6GHz,然后利用AVX Offset把运行AVX指令集时的频率降至4.2G,同时降低一定的电压。

华硕PRIME X299-A上芝奇3200C14四通道套装超频至DDR4-4000通过Memtest,内存电压1.455V。

技嘉X299 AORUS Gaming 3上芝奇3200C14四通道套装超频至DDR4-4000通过Memtest,内存电压稍微高一点,1.475V。

而Core i7 7740X(差点忘了这货了…)在1.31V不用开盖就可以跑稳5GHz,最高温度85度,体质比我们手里两颗7700K都要好些。

总结

Intel Core i9 7900X作为当下最先进的Skylake架构十核心桌面处理器,无疑是代表着桌面平台的最高计算效能。然而,这几年电脑市场趋于饱和,用户对CPU计算能力的需求的两极分化现象也越来越严重,有一类用户对算力的需求是无限的,CPU越快他们就越省时间,能做越多的工作;而另一类人是以庞大的家庭个人用户为代表,他们的应用主要以办公娱乐为主,现在的CPU性能对他们来说早就完全足够使用了。

Core i9 7900X明显是针对第一类用户,因此我们的测试也更偏向他们所使用的多线程应用。在渲染测试中,Core i9 7900X得益于14nm+工艺,全核心4GHz睿频的优势,领先同核心的6950X幅度较大,在压缩、编解码类的测试中,除数据在缓存中较多的WinRAR测试中7900X由于L3缓存的改变,表现不如6950X外,其余项目均有一定提升。

超频方面,14nm+的超频能力也很给力,Core i9 7900X在超频到4.6-4.7GHz时仍然可以跑测试。但是在超频后,由于功耗的原因,会遇到因CPU或主板引起的Throttling,部分测试项目的性能没有与频率同步提升,甚至出现运行过程中主板断电的情况。考虑到对比6950X的价格,7900X在默认状态下的表现还是可圈可点,性能提升幅度不小,同时价格相比6950X还有大幅下降,另外未来软件陆续支持AVX-512之后,或许会让Core i9的效能更上一层楼,对算力有需求的用户值得购买。但是在超频之后,7900X的满载功耗非常恐怖,需要配备两个CPU 8Pin供电的主板和电源才比较稳妥,当然这也和主板BIOS有一定关系,Core i7 3960X/5960X刚出的时候也很多问题,后边通过BIOS的完善,这些问题都会慢慢解决。

同样道理,Core i7 7820X和7800X由于一个AVX512单元被阉割,功耗应该没有那么劲爆,相信提升频率的难度会降低,有更多的超频空间。另外这两款产品性能同样得益于频率和架构的优化,比上代产品会有提升,同时价格比上代同核心产品有所下降,如果你想使用X299平台,预算又相对有限,可以考虑8核心或6核心的Core i7处理器。

对于两颗Kabylake-X的处理器Core i7 7740X和Core i5 7640X,我们并不推荐购买。首先因为它完全是照搬Kabylake架构,可以认为是7700K屏蔽了核显换了LGA2066接口,就插到X299主板上,但是你要为更昂贵的主板买单,却没有得到任何的性能提升,反而还不能使用核显、并浪费主板一侧的内存插槽和一些PCIE插槽。其次,以目前京东的售价来看,Core i7 7800X只比7740X贵350元,多两个核心,一大堆PCIE和四通道内存,何乐而不为?

这次Intel发布X299平台和Skylake-X处理器显得有些仓促,导致主板厂商没有足够的时间准备好,在测试过程中我们还是碰到不少问题,最大的问题就是主板的供电不足以支持超频后的Core i9 7900X稳定运行。面对AMD X399平台和Ryzen ThreadRipper即将向Intel掀起的“核战争”,我们不得不为两个月后上市的18核Core i9 7980XE捏把汗。






本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?注册

x
113#
royalk  楼主| 发表于 2017-7-26 14:48 | 只看该作者
547737657 发表于 2017-7-26 12:56
有人不是没开盖直接搞定5G FMA么?室温20~25,满载也没降频

我这颗也可以啊,没开盖。LGA2066可能电气性能好一些,普遍超5G的电压低一点,而且高温下掉线程现象少一点,我觉得不是die和硅脂的问题。
112#
547737657 发表于 2017-7-26 12:56 | 只看该作者

有人不是没开盖直接搞定5G FMA么?室温20~25,满载也没降频
111#
royalk  楼主| 发表于 2017-7-26 11:55 | 只看该作者
547737657 发表于 2017-7-25 21:29
本人很好奇7740k与7700k的温度差异,换个平台同核心居然强这么多

没多大差别
110#
547737657 发表于 2017-7-25 21:29 | 只看该作者
royalk 发表于 2017-7-16 10:44
所以7980XE跑AVX512频率大概只有2.5G左右。

本人很好奇7740k与7700k的温度差异,换个平台同核心居然强这么多
109#
547737657 发表于 2017-7-25 21:28 | 只看该作者
chungexcy 发表于 2017-7-12 12:02
我看intel说,linpack跑avx2都能稳定在2.5g,那么合理猜测,别的avx2程序至少能到2.7-2.8g。
如果这ppt功 ...

AVX支持的最高Linpack库版本号多少?是否从11.0开始支持4代 AVX2?
108#
royalk  楼主| 发表于 2017-7-19 12:41 | 只看该作者
haomingci3 发表于 2017-7-17 17:00
这样啊,那AVX512的实际影响就降低了,不会像haswell-kabylake跑AVX要与AVX2共用单元那么惨,那样power ga ...

基本没问题,奔腾不就是把AVX单元关了么,所以烤机难度低很多,但是过了烤机用也是OK的。
107#
haomingci3 发表于 2017-7-17 17:00 | 只看该作者
本帖最后由 haomingci3 于 2017-7-17 17:03 编辑
chungexcy 发表于 2017-7-17 07:28
对的啊,prime95的fft还是只支持的fma3。

29.1说的是trial factorin支持avx-512了。

这样啊,那AVX512的实际影响就降低了,不会像haswell-kabylake跑AVX要与AVX2共用单元那么惨,那样power gating起不了作用。不调用AVX512单元来下放跑AVX2的话虽然功耗还是会受到AVX512单元的漏电影响(SIMD不好做power gating,属于核心组成,比关核心效率还低,ARM的精简指令集的能耗优势就来自于其不会上类似于AVX这类应用面低但又庞大耗电的SIMD),但至少不会是共用单元跑满那么严重。
有个构想有待验证:不同的需求跑不同的烤机,26.6对应SSE,27.9对应AVX,28.10对应AVX2,各取所需,我现在的游戏机就使用过26.6电压或+0.01v在跑游戏,基本没有什么问题
106#
haomingci3 发表于 2017-7-17 15:37 | 只看该作者
jerrytsao 发表于 2017-7-15 20:34
根据Wiki, 这两个应该都还是属于AVX-512范畴内的指令集吧

两个主打低精度性能和低延迟,攻深度学习,与avx512f这种堆高性能计算的路子不同,算不上淘汰关系
来自苹果客户端来自苹果客户端
105#
jeffrey913 发表于 2017-7-17 10:34 | 只看该作者
农企刚要冒头,又被牙膏厂踩下去了....长路漫漫啊
104#
royalk  楼主| 发表于 2017-7-17 10:10 | 只看该作者
chungexcy 发表于 2017-7-17 07:28
对的啊,prime95的fft还是只支持的fma3。

29.1说的是trial factorin支持avx-512了。

哦对。。是FMA3,怪不得4.2还能烧,LINX 4.1都没戏
103#
royalk  楼主| 发表于 2017-7-17 10:10 | 只看该作者
ydjj 发表于 2017-7-16 18:55
28核的8180跑AVX512是2.3G
如果INTEL不抠TDP放开超频的话,7980XE全核AVX512跑个2.8~3G以上也许可以期待 ...

你可以参考6150,TDP和核心数都一样。
102#
chungexcy 发表于 2017-7-17 07:28 | 只看该作者
royalk 发表于 2017-7-16 10:44
想了想,那也不对啊,P95 27.9之后功耗都差不多,说明AVX单元应该是全部工作了的,但28.9之前都还是不支 ...

对的啊,prime95的fft还是只支持的fma3。

3)  AVX-512 trial factoring support added.
29.1说的是trial factorin支持avx-512了。

虽然local.txt加了这个开关
CpuSupportsAVX512F=0 or 1
但不适用于fft。29.2 build 4依然没提到fft的avx512。

烤机跑的是fft。你可能看出来,输出的信息里面是fma3,而不是avx512什么的。调用avx512,效果就是linpack2017跑满20线程的功耗了。。。
101#
ydjj 发表于 2017-7-16 18:55 | 只看该作者
royalk 发表于 2017-7-16 10:44
所以7980XE跑AVX512频率大概只有2.5G左右。

28核的8180跑AVX512是2.3G
如果INTEL不抠TDP放开超频的话,7980XE全核AVX512跑个2.8~3G以上也许可以期待……吧?
100#
royalk  楼主| 发表于 2017-7-16 10:44 | 只看该作者
xaaaaaaaaaaaaaa 发表于 2017-7-15 16:40
这个功耗和发热,i9 7980XE 真的还可以超频吗?

所以7980XE跑AVX512频率大概只有2.5G左右。
99#
royalk  楼主| 发表于 2017-7-16 10:44 | 只看该作者
chungexcy 发表于 2017-7-14 14:32
程序本身没有问题的。avx2.0单元就是俩个,avx512应该只接受avx512的代码,这是cpu内部决定的。

skylake  ...

想了想,那也不对啊,P95 27.9之后功耗都差不多,说明AVX单元应该是全部工作了的,但28.9之前都还是不支持AVX512的呢
98#
jerrytsao 发表于 2017-7-15 20:34 | 只看该作者
haomingci3 发表于 2017-7-15 17:14
不叫这个东西了,新一代phi的是QFMA、QVNNI

根据Wiki, 这两个应该都还是属于AVX-512范畴内的指令集吧
QVNNIW, QFMAPS
AVX-512 Vector Neural Network Instructions Word variable precision (QVNNIW) - vector instructions for deep learning, enhanced word, variable precision.
AVX-512 Fused Multiply Accumulation Packed Single precision (QFMAPS) - vector instructions for deep learning, floating point, single precision.

97#
jerrytsao 发表于 2017-7-15 20:30 | 只看该作者
Q4的Knights Mill
To achieve these performance increases, KNM is introducing new instruction sets that improve low-precision computing called Quad Fused Multiply Add(QFMA) and Quad Virtual Neural Network Instruction (QVNNI). The QFMA can up to double the amount of single precision performance KNM can deliver over that of the current Intel Xeon Phi processor and QVNNI, which reduces the precision further, bringing additional performance gains for deep learning workloads. With both QFMA and QVNNI, Knights Mill can deliver significantly higher training performance than today’s Intel Xeon Phi processor, making it a targeted solution for deep learning workloads. The new Knights Mill is expected for production in the fourth quarter of 2017.

96#
haomingci3 发表于 2017-7-15 17:14 | 只看该作者
ydjj 发表于 2017-7-15 01:32
话说AVX512是不是就是AVX指令集的终点了?
ryzen刚出时INTEL的嘴炮说2020年之前有“下一个十年的全新架构” ...

不叫这个东西了,新一代phi的是QFMA、QVNNI
95#
xaaaaaaaaaaaaaa 发表于 2017-7-15 16:40 | 只看该作者
这个功耗和发热,i9 7980XE 真的还可以超频吗?
94#
mercuryfall 发表于 2017-7-15 16:12 | 只看该作者
ydjj 发表于 2017-7-15 01:32
话说AVX512是不是就是AVX指令集的终点了?
ryzen刚出时INTEL的嘴炮说2020年之前有“下一个十年的全新架构” ...

感觉这只是Intel一厢情愿的想法吧,毕竟竞争对手是有高性能GPU产品线的,想要堆性能并不一定就需要死命的往CPU里挤。
而且还有个有意思的事情,目前异构计算接口标准的制定组织有3个(CCIX, OpenCAPI,  Gen-Z),每家都有AMD、IBM和Xilinx,有的还有Google、Nvidia,但都没有Intel。
您需要登录后才可以回帖 登录 | 注册

本版积分规则

快速回复 返回顶部