PCEVA,PC绝对领域,探寻真正的电脑知识
打印 上一主题 下一主题
开启左侧

Z*AMD八核“推土机”处理器设计特点探秘

[复制链接]
跳转到指定楼层
1#
点击数:2831|回复数:5
来源:impress.jp 【编译】 2011-03-03 作者:九门奇人 责任编辑:九门奇人


    AMD计划在今年年中的时候正式推出新的处理器架构「Bulldozer」("推土机"),实际的芯片设计目前已经很清楚了。在上周于美国圣弗兰西斯科召开的「ISSCC(IEEE International Solid-State Circuits Conference)」大会上,AMD宣布了其CPU内核心组件的Bulldozer Module的概况。

    每个Bulldozer Module内置有2个CPU核心,基于的是32nm工艺。同时在ISSCC上,我们还得知每个Bulldozer Module将会集成2M L2缓存,核心面积为30.9平方毫米。AMD计划在今年年中面向高端桌面及服务器市场推出内置4个Bulldozer Module,核心数量总计8个的CPU核心「Orochi」。



     Intel同样也计划在今年下半年推出基于Sandy Bridge架构的8核心处理器,包括桌面和移动版产品。这次Intel和AMD在高端桌面处理器市场均没有推出异构(Heterogeneous:异种混合)处理器(CPU+GPU),而是继续走同构(Homogeneous)CPU路线,两家公司所做的都是继续增加处理器的核心数量。

    不过虽然都叫八核心处理器,AMD的Bulldozer系列和Intel的Sandy Bridge系列还是有几处较大的差异,其象征就是核心尺寸。如果通过Bulldozer Module倒过来推算的话,基于Bulldozer架构的Orochi处理器的核心面积大约为300平方毫米,而AMD当前的六核心处理器「Istanbul/Thuban」的核心面积为346平方毫米,因此在生产成本方面,Bulldozer架构的八核心处理器要低于六核心处理器,而这也表示Bulldozer Module的尺寸会更小。







     如果拿Intel的八核心Sandy Bridge处理器与Bulldozer相比,差异就更明显了。此次在ISSCC上Intel也公开了八核心Sandy Bridge的概要。Intel表示将会面向高端桌端高面及服务器市场推出Sandy Bridge-EN,Sandy Bridge-EP和EX系列处理器。这些全都是八核心产品。不过由于PCI Express 3.0推出变更的原因,产品推出计划出现了一定延迟。
2#
世纪冰雷  楼主| 发表于 2011-3-3 22:48 | 只看该作者
本帖最后由 世纪冰雷 于 2011-3-3 22:50 编辑

此次在ISSCC上发布的八核心Sandy Bridge处理器核心的面积约400平方毫米,比AMD的八核心Orochi大了约30%。由于高端处理器往往都伴随着高价格,因此核心尺寸上的成本可以很容易消化掉。同时Intel架构可以通过SMT实现16线程,因此在多线程服务器应用领域有其优点。因此在这里核心尺寸的差别并不是关键,而在于两个架构之间的差异。


    Bulldozer和Sandy Bridge的差异除了CPU核心尺寸以外,Sandy Bridge 八核心的DRAM通道数量更多,PCI Express lane数量也比Orochi多。如果粗略得说,Sandy Bridge单个CPU核心的尺寸非常靠近1个Bulldozer Module的尺寸。相比而言,八核心Sandy Bridge要大一些。

    当然大也有大的理由,Sandy Bridge核心可以实现2线程SMT(Simultaneous Multithreading)的Hyper-Threading。并且每个核心均支持AVX,可实现256-bit SIMD(Single Instruction, Multiple Data)等。



    从CPU资源的分区来看的话理解起来会更容易一些。当前CPU设计的一个关注点就是多线程性能,以及如何提升每个核心的多线程性能。目前在X86处理器设计上,主要采用3种方法。






    如果想要提升CMP单线程的性能,就需要更多的资源;相对的SMT多线程化的资源则最小。而Bulldozer则同时具备了CMP和SMT的优点,能够有效率得增加实际的线程数量。由于可以像SMT相同的实现资源竞争,因此其预期的性能下降也会少很多。对此AMD表示,采用簇架构可以增加50%的CPU核心资源,容许量会提升80%。因此估计AMD 内置4个Bulldozer Module的8核心Orochi处理器可以获得出色的性能。

    因此Bulldozer的优点就是能够有效得增加CPU核心数量。而Orochi核心也确实表现出了这一优点。



    实际上如果拿Sandy Bridge 8核心与Orochi相比的话,Sandy Bridge核心面积使用效率会更出色。比如它连接核心的环形总线与缓存设置在了上部,因此不太占面积。而Orochi则占据了中间位置,从总体来看,其核心的CPU核心面积比率要比Sandy Bridge大。
3#
世纪冰雷  楼主| 发表于 2011-3-3 22:48 | 只看该作者
本帖最后由 世纪冰雷 于 2011-3-3 22:52 编辑

Bulldozer Module在设计上的变化很大,与AMD以前的K10核心有很大的不同,比较Bulldozer Module和K10核心就可以看到明显差异。而AMD低成本低功耗处理器架构「Bobcat」的核心布置也有很大不同。




    在Bulldozer Module的布置上,最突出的就是前端的大型化。与Llano的K10核心相比的话,负责指令fetch&decoding和分支预测的前端均明显大型化。可以看到Bulldozer架构中,2个核心共用一个前端。




L1缓存及整数核心差异
    Bulldozer Module前端配备了2个整数核心,因此融合了2个核心的Bulldozer Module实际上是指拥有2个整数运算核心,这个由Bulldozer Module的布局来看的话,就可以看得很清楚了。
    可以看到整数核心,整数执行块 (Integer Execution),载入/存储模块以及L1缓存。从面积上来说,K10核心面积更大,不过大半都是L1缓存的差异。K10上L1缓存容量为64KB,但是Bulldozer Module每个核心减少至16KB,因此核心面积也就显得更紧凑了。
    整数运算模块的尺寸上,Bulldozer Module与K10差别不大,仅仅只是Bulldozer 载入/存储模块稍大一些。说到原因主要是由于Bulldozer整数核心的执行管线有2个,算上载入/存储模块就共计4个。而K10整数核心的执行管线是3个,载入/存储模块3个,总计6个。不过实际上Bulldozer的整数运算管线完全进行了重新设计,因此执行效率是不同的。






    位于2个整数核心下面的就是浮点(FP)单元。以前K10拥有1个128-bit乘法单元累加单元以及其他处理单元。Bulldozer的128-bit累加单元是1个,其容许量提升了2倍,但是面积却没有因此增加2倍。




位于这些单元的右面,边上就是L2 高速缓存单元(CU)。L2 高速缓存为2MB 6T SRAM。
4#
世纪冰雷  楼主| 发表于 2011-3-3 22:48 | 只看该作者
本帖最后由 世纪冰雷 于 2011-3-3 22:54 编辑

Bulldozer Module周围可以看到被细线包围。这个就是控制组件供电的「VSS power gating (CC6)」。可以根据实际情况完全终止对待机状态处理器核心的供电,同时也可以减少约95%的漏电。Bulldozer可以实现对融合了2个CPU核心的组件以及L2高速缓存进行节能控制,这也使得AMD向Bulldozer进入移动市场的热情相当高。



    Bulldozer的省电性主要通过三种方式实现。一个就是生产工艺,AMD处理器从32nm工艺开始使用的是HKMG(High-K/Metal Gate)技术。而由于使用了High-k材料,可以减少门的电子泄漏。Intel自45nm时代就开始使用HKMG技术,而为AMD代工的GLOBALFOUNDRIES公司从32nm工艺开始也使用了此项技术。因此Bulldozer和Llano等AMD的32nm CPU通过生产工艺就可以实现更好的漏电控制。

    另外就是AMD Bulldozer使用了更多漏电较少的晶体管。到目前为止,AMD在CPU中使用的是不同电压的晶体管,如果想要减少漏电,那么就应该使用高Vt(HVt)晶体管。不过Bulldozer将HVt晶体管的比率下降了,并大量使用了长通道晶体管(LC-RVt)。据说这样可以实现更低的核心电压。此次长通道LC-RVt占据了Bulldozer Module内核心部分晶体管的53%。 另外就是Bulldozer对电路设计以及架构级节电特别重视。



硬派观点:

    AMD的8核心“推土机”,实际上定位并不与intel的8核心产品等同。从设计特点看,它是通过每个Module内置两个整数核心,这样集成4个Module来达到8个核心的,但浮点部分每个Module仍为1个。因此从传统意义讲,它还并非完整的8核心产品,其核心面积也远小于intel的8核心产品。也许我们更愿意叫它“4模块”处理器,对手也应该是intel的4核心产品或者6核心产品。
5#
9550pro 发表于 2011-3-3 22:59 | 只看该作者
先留名,有空看一下
6#
jasu30 发表于 2011-3-3 23:37 | 只看该作者
早上看到了,本来想转过来。。

好难。。看懂。。还是实物出来看评测来的易懂些
您需要登录后才可以回帖 登录 | 注册

本版积分规则

快速回复 返回顶部