kunlun1990 发表于 2018-8-14 18:29

阿三总是提反面观点,大家看对不对

大家看对不对
https://www.anandtech.com/show/13124/the-amd-threadripper-2990wx-and-2950x-review/4
谷歌翻译机翻+人肉解释,也不知道对不对。

很多地方说AMD的线程撕裂者效率高、耗电低:32蛋的2990WX连250瓦TDP都跑不满。不过Anand提出了不同的观点:Uncore(非核心)部分的功耗正在超过运算核心的功耗,线程撕裂者非但不节能,而且效率正随核心数量增加而降低。


大概的原理是:核心数量多了,原有的环形总线不好用,AMD用Infinity fabric提供了各个核心之间以及核心与IO设备、内存之间的沟通通道。


但Infinity fabric的效率并不高。低负载下只有两个线程工作时,Infinity fabric一共贡献了整个处理器总功耗的73%(IF功耗56.09瓦,CPU核心功耗20.63瓦)。随着负载的增加,IF占整个处理器的功耗百分比逐渐降低到36%左右,依然不是一个小数字。超过三分之一的电没做正经事儿~


Infinity fabric效率跟核心数量有关,前面的2990WX拥有6条Infinity fabric,而在16核的2950X中只有一条。



低负载下Infinity fabric最高可贡献整个2950X处理器总功耗的59%,比2990WX的73%要低一些。



核心数量比线程撕裂者更多的EPYC处理器中,除了6条Infinity fabric之外,同个4个硅芯片全部启用了DDR和PCIE控制器,Uncore消耗的电能也就更多。



低负载下EPYC 7601中的Uncore部分甚至会贡献高达89%的功耗!!!即便在最理想的情况下,EPYC的功耗/发热里也有超过一半被Infinty fabric白白消耗,这显然是极大的浪费,14nm工艺还不够填这个坑呢。功耗大不要紧,但是同时发热也大,CPU核心就难以跑到更高的Turbo频率。



当然对于服务器来说,CPU不光需要处理密集运算,也会需要提供大带宽的内存控制器、大量的IO扩展能力(比如说更多的PCIE通道支持更多块计算卡/PCIE固态硬盘等等)。对于密集计算应用来说,低效率的Infinty fabric浪费电能增加发热毫无用处;而对于IO密集型应用,这些额外的功耗却也是必须的。

Intel的情况也差不多。用在Skylake-X中的Mesh架构取代原有Ring环形总线,在每个核心间都像有一个小型路由器,可根据需要将数据定向到周围的核心或是自身。



在7980XE中,Mesh贡献的功耗占处理器总功耗的百分比从较低的20%开始,随着负载的核心数量增加,最高可达到25%-30%。也就是说有大约四分之一到三分之一的电在做无用功(没有直接用于核心运算),多耗电的同时还挤占了能用于计算的TDP空间,CPU核心更容易降频。



没想到给CPU里塞蛋并不是那么容易的事儿,看来提高Uncore部分效率刻不容缓。当然,技术难度是一方面,态度是另外一方面。希望Intel别落后,跟AMD一起玩核战吧。你们越战我们越开心~


Apache 发表于 2018-8-14 20:32

核战有点过啊, 8C16T就够普通用户使的了。   手机到8蛋就停止核战了。CPU又要步手机的后尘了

eikeime 发表于 2018-8-14 21:16

Apache 发表于 2018-8-14 20:32
核战有点过啊, 8C16T就够普通用户使的了。   手机到8蛋就停止核战了。CPU又要步手机的后尘了 ...
epyc 毕竟是给服务器用的,arm架构的thunderx2已经干到54核了{:6_267:}

xaaaaaaaaaaaaaa 发表于 2018-8-14 21:22

这不是很正常么,核心越多,总线肯定越复杂

nighttob 发表于 2018-8-14 21:26

阿三这算说到点子上了
EPYC这4个die都是SoC,uncore部分占比很大,就算不用也是会耗电的

沙沙 发表于 2018-8-14 21:53

很正常啊,就像一台电脑待机的时候CPU功耗很低,但是内存,硬盘这些都要耗电,随便加两块硬盘,待机功耗分分钟超过CPU。

NuclearBomb 发表于 2018-8-14 22:18

eikeime 发表于 2018-8-14 21:16 static/image/common/back.gif
epyc 毕竟是给服务器用的,arm架构的thunderx2已经干到54核了

54核的性能咋样?会炸不http://www.pceva.com.cn//mobcent//app/data/phiz/default/03.png

royalk 发表于 2018-8-15 11:01

这就是intel放弃ringbus的原因之一,核心多了之后要增加很多条总线,因为每两个模块都是互联的,延迟和功耗都要增加很多

eikeime 发表于 2018-8-15 15:45

本帖最后由 eikeime 于 2018-8-15 20:20 编辑

NuclearBomb 发表于 2018-8-14 22:18
54核的性能咋样?会炸不
https://www.anandtech.com/show/1 ... -arm-server-reality
这里有个32核版的评测,结论基本上 四分之一的价格买 80%-90% 8176的性能,发稿的时候大数据方向 性能最好的 处理器。{:6_244:}

Apache 发表于 2018-8-15 20:04

eikeime 发表于 2018-8-14 21:16
epyc 毕竟是给服务器用的,arm架构的thunderx2已经干到54核了

arm架构,要是TDP放到台式机的规格,干到100-200核心不成问题吧?

NuclearBomb 发表于 2018-8-15 20:09

eikeime 发表于 2018-8-15 15:45
https://www.anandtech.com/show/12694/assessing-cavium-thunderx2-arm-server-reality

这里有评测,结 ...

这么给力,8176没活路了吧

FlankerWang 发表于 2018-8-15 20:09

Apache 发表于 2018-8-15 20:04
arm架构,要是TDP放到台式机的规格,干到100-200核心不成问题吧?

https://www.anandtech.com/show/12694/assessing-cavium-thunderx2-arm-server-reality/2
32核180w

eikeime 发表于 2018-8-15 20:29

NuclearBomb 发表于 2018-8-15 20:09
这么给力,8176没活路了吧
arm的服务器应该主要还是 简单高并发事务为主的方向吧,google 好多年前 不就一直在 自己搞arm服务器了么。具体的我也不清楚。

FlankerWang 发表于 2018-8-15 21:25

NuclearBomb 发表于 2018-8-15 20:09
这么给力,8176没活路了吧

同样x86,epyc抢xeon的份额还那么累,arm只会更慢

lcy2233064 发表于 2018-8-15 22:13

虽然合情合理,但是不可避免,毕竟单核计算能力因为工艺原因,除了指令集优化提升的性能,提升并不明显,看这几年IPC就知道,这样就只能增加核心,增加核心又会带来连接各个核心之间的问题。看那集群超算一样也要消耗一定的电量给连接总线啊
页: [1]
查看完整版本: 阿三总是提反面观点,大家看对不对