PCEVA,PC绝对领域,探寻真正的电脑知识
打印 上一主题 下一主题
开启左侧

[转ZOL] 性能不是唯一 AMD几代旗舰显卡特性点评

[复制链接]
跳转到指定楼层
1#
sapphirex 发表于 2012-2-2 17:41 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
点击数:3395|回复数:6
本帖最后由 jasu30 于 2012-4-21 15:25 编辑




本文转自ZOL


AMD家族一朝天子一朝臣


架构设计+产品特性,AMD已经在统一渲染架构运行6年之后在PC显卡市场走出自己的打法。从Radeon HD 2000系列显卡开始在每一次和NVIDIA的较量中AMD都显得镇定自若,这一点全靠鲜明的产品特色和推广策略。今天我们将带各位读者回顾活跃在市场上的Radeon HD5000到Radeon HD7000系列显卡,特别是每一代单芯旗舰和双芯旗舰的表现特性。
今天将这篇文章的主题定为:性能不是唯一,就是希望传达我们对于显卡选择的观点——使用合理的晶体管数量消耗可控的电力,最终提供较高的性能。在这一点上很多千元级Sweet Spot级别产品表现相当出色,不过旗舰显卡经常显得有一定不足,有的产品过渡追求性能,有的产品则因为架构尚未成熟等原因失去了市场青睐。

会煎蛋的旗舰显卡可不是合理的选择
目前显卡市场上Radeon HD5000已经几乎绝迹,Radeon HD6000产能放大之后很多显卡价格引人关注,而Radeon HD7000则只有HD7970旗舰显卡铺货。不过在淘宝京东等交易平台上,Radeon HD5000依然占据了一定的销售比例。

并行计算性能突飞猛进
上一代顶级显卡Radeon HD5870和Radeon HD5970分别担当当时的卡皇和长期无人超越的双芯王者称号。而HD6970在性能方面无法 和对手GTX580向抗衡,最终使用了较低的定价策略,HD6990在高频和高几何效率帮助下赢得顶级性能之战。HD7970由于全面改进图形架构,在并行计算方面获得了前所未有进展,图形性能也领先GTX580平均20%以上。那么我们应该如何看待几代卡皇的产品定位呢?

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?注册

x
2#
sapphirex  楼主| 发表于 2012-2-2 17:42 | 只看该作者

HD5870突出DirectX10性能

这个标题很奇怪,Radeon HD5870是全球首款DirectX 11显卡,为什么说它所着重的是DirectX10性能呢?实际上这款显卡的1600个庞大流处理器阵列和并不强大的几何单元暴露了它的弊端,也就是支持DX11功能,却无法流畅执行真正的DX11应用

基于DirectX 11的Radeon HD5870采用第二代40nm工艺制造、搭载第四代GDDR5显存、拥有1600个流处理器、Eyeinfinty多屏显示技术、超低待机功耗等。显卡一经发布立刻取得了对NVIDIA上一代顶级单卡Geforce GTX285的全面领先。无论是技术、规格还是性能,AMD用数据说话证明了自己再一次登上GPU王座。

公版HD5870显卡近照
下面就让我们来预览一些AMD的Radeon HD5870产品的重要特性:

第一款支持DX11的GPU,微软的所有要求AMD都非常精准地完成;
第一款制程进入40nm线宽的GPU,晶体管数目突破21亿;
第一款浮点运算能力超过2TeraFlops的GPU,RV770是当时业界第一款超越1TFLOPS大关的GPU;
第一款具备民用级别多屏幕显示能力的GPU,实现3屏甚至6屏显示不再需要代价高昂的专业设备。


Radeon HD5000简单浮点吞吐大幅度增长

HD5870通过暴力扩张流处理器数量的方法,使用了VLIW技术的SIMD结构流处理器以较小的晶体管消耗获得了强大的规模效应。同时虽然这种结构在效率上明显输给MIMD结构,但是它在遇到全4D指令或者大量的4D指令时,可以爆发出澎湃的指令吞吐量,而目前的很多游戏中还是大量掺杂着4D指令,这为SIMD结构的流处理器性能发挥奠定了基础。
不过在几何端,HD5870的弱项使得这款显卡受到不少非议,核心问题就是它能否流畅运行微软DirtctX 11所需的各项要求,经过各大媒体最终测试我们发现Radeon HD5870在曲面细分性能和Shader计算性能方面落后同期旗舰GTX480很多。不过性能功耗方面的优异表现还是让显卡拥有很高的运行效率,总体而言这是一款被市场评价相当高的显卡。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?注册

x
3#
sapphirex  楼主| 发表于 2012-2-2 17:43 | 只看该作者
HD5970长期霸占性能王座

Radeon HD 5970一上市就带来了全新的用户体验,在命名方面虽然这是双芯单卡产品,但是其命名上抛弃了以往标注双芯产品的“x2”后缀,例如早期的Radeon HD 3870 x2和Radeon HD 4870 x2。不过我们可以把Radeon HD 5970看成是Radeon HD 5870和Radeon HD 5850的结合体,Radeon HD 5970在硬件规格上完全采用了两个HD5870的规格,和HD5850的额定频率。

RV870核心
Radeon HD 5970搭载的2颗RV870核心由台积电(TSMC)采用40nm工艺生产,每颗核心拥有1600个流处理器、32个光栅处理器和80个纹理单元。此次AMD的产品线升级,最重要的就是完美支持DirectX 11 API和Shader Model 5.0,而且值得一提的是DirectX 11 API中新加入了Direct Compute Shader,这也是微软在GPU通用计算上的一次大踏步跃进,而且这也证明GPU未来在通用计算领域的重要性。

双核心HD5970显卡设计

在整体性能方面,中关村在线显卡频道当时用性能过剩来形容这款显卡,Radeon HD 5970相对于早期的Radeon HD 5000系列产品来说并无过多新意,这款产品的出现仅是为了让单卡获得更高、更强的性能,而且这种双芯片的设计对于芯片级厂商来说,无疑是一种高效的推新手段。
Radeon HD 5970在HD6990问世之前,都还是相当出色的一款显卡,也是性能无人超越的一款显卡,GTX480发布之后戏剧性的大幅度落后于HD5970也进一步印证了AMD在强力浮点吞吐方面的优势。总而言之这是一款不挖掘热设计极限的显卡,它给用户打造多卡顶级平台创造了更多可能。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?注册

x
4#
sapphirex  楼主| 发表于 2012-2-2 17:44 | 只看该作者

HD6970定位稍显尴尬

到了HD6000时代,AMD可以说思路稍显凌乱,首先是在2010年末Radeon HD 6800登场,这是一代过渡性质产品,其顶级型号HD6870显然性能不及上代HD5870出色,并且在GPU前端的改进也不够明显。

到了2011年HD6900问世才带给我们真正的性能体验,最明显之处在于Cayman架构的GPU在GPU几何端资源加倍,在GPU流处理器部分也终结了使用4年的VLIW-5结构,改为更加高效的VLIW-4结构。

几何端并行化更加透彻

首先Cayman在几何执行端做到了并行处理,这是AMD一直希望自己做到的,也是对当今GPU架构设计最具挑战性的难题。AMD在这颗芯片上使用的双图形引擎设计,不言而喻Tessellation单元将会由此设计倍增,从而更好的适应目前DirectX 11应用。当然加倍的不仅仅是Tessellation单元,在顶点、几何等计算中也会相对老核心架构有双倍提升。

全新的VLIW4线程处理器

本次在Cayman芯片中所采用的VLIW4线程处理器单元中的ALU阵列减为4个(删除了1个较大的ALU.transcendental单元),ALU阵列数量减少了20%,但是这种设计减少了指令调度和寄存器管理,反而提升了利用率。由于取消了原本5-WAY VLIW中带ALU.Trans的1D ALU,现在Cayman将通过占用3个1D ALU的资源来完成特殊函数的运算。
毫无疑问这是一款走上了改进之路的芯片,也是一颗AMD必须通过危险尝试才能提升性能的芯片。不过结果依然是令人满意的,单核心方面Radeon HD6970可以和对手的GTX570不相上下,而1GB版本的HD6950则成功抢占了1000-2000元人民币市场,是目前想要获取高端性能的最佳选择。双核心旗舰卡HD6990依然是性能王者,其基准测试成绩让GTX590望其项背。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?注册

x
5#
sapphirex  楼主| 发表于 2012-2-2 17:45 | 只看该作者
本帖最后由 sapphirex 于 2012-2-2 17:46 编辑


高频高热高噪HD6990塑造性能王者

Radeon HD 6990在产品技术上并没有过多创新,例如其使用了Cayman的核心架构,使用了成熟的单卡双芯PCB技术设计等。不过就是在这样已有技术的前提下,打造了全新的产品,提供了更强的性能,还是让人兴奋的。

在实际产品方面,单张Radeon HD 6990将拥有超过3000个流处理器、64个光栅处理器和192个纹理单元,每颗GPU独享2GB显存。为了满足产品高性能的正常发挥,显卡外接供电搭配2个8pin外接供电,这意味着整卡最高设计了375瓦的功耗。

HD6990已经逼近显卡设计极限

HD6990基于两颗Cayman核心打造,Tessellation单元倍增带来的几何处理能力我们暂且不提,UTDP的仲裁分配能力已经获得了前所未有的提升。因为从R600到R800时代,再到现在的HD6900一直都在使用抢占式多线程分配,而Fermi开始使用了多极多分配式调度单元,表面上看NVIDIA取得了领先,但是NVIDIA忘记了多卡交火模式的特殊需求。

3072个流处理器的卡皇HD6990

单芯片UTDP使用抢占式多线程分配,HD6000系列有两个,分配能力就得到了倍增,而HD6990基于两颗Cayman核心打造,分配能力直接提升4倍。UTDP数量的提升直接导致了处于等待状态的线程得到快速分配可以发放给相关的VLIW Core进行运算,这些原本混乱的线程在得到调配能力之后,交火带来的好处体现得淋漓尽致,卡皇每名在这一代产品身上没有一丝变化。
Radeon HD 6990凭借3072个流处理器和4个几何单元的几大规模,实现了Radeon HD 6990单精度浮点运算能力高达史无前例的6.0TFlops,双精度也有1.5TFlops,不过综合考虑功耗和发热等问题,这款显卡并不适合在机箱内使用,更不能超频使用,其卡皇定位更加注重象征意义。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?注册

x
6#
sapphirex  楼主| 发表于 2012-2-2 17:46 | 只看该作者
HD7970实现单芯旗舰也有代价
关注显卡频道的用户一定知道HD7970基于全新的GCN图形构架,拥有超过43亿的晶体管规模,这是一款我们等了6年的GPU架构,因为NVIDAI从统一渲染架构开始就走上了重视TLP(线程并行度)的路线,其GPU设计考验线程能力和并性能力,而AMD一直坚持使用较为古典的图形单元并且套上了VLIW打包。

在硬件基本规格设计方面,与上代的Cayman构架相比,其运算资源总量提升到了2048个ALU,Texture Fetch Load/Store Unit则提升至恐怖的512个,Texture Filter Unit由Cayman的96个增加到了128个,但同时构成后端的ROP与Cayman维持相同,均为32个。

HD7970采用了更高的额定频率

HD7970的默认核心及显存运行频率为925/5500MHz,默认Pixel Fillrate能力为29.6G/S,默认Texture Fillrate能力为118.4G/S。显存带宽264GB/S。拥有3.79T的单精度浮点运算能力以及947G的IEEE双精度浮点运算能力。HD7970拥有完整的DRAM及SRAM ECC 保护,支持 Open CL 1.2、DirectX 11.1以及C++ AMP。

Tahiti构架特性

高频和28nm工艺相结合,为显卡换取的大幅度性能提升,同时在DirectX 11方面也大幅度领先上代产品,不过HD7970的功耗问题的确不能轻视,这款显卡在全速运行的状态下达到了300W的单卡极限功耗,这是两个辅助供电接口的极限供电能力。

公版HD7970拆解

由于较大的晶体晶体管集成度和频率关系,HD7970散热器为左侧为真空腔均热板,右侧为最高转速可达6000转/分的离心式风扇,外加塑料导流罩,由于均热板的厚度过大,暴力风扇也需要一个支架去固定,所以还有一个底盘支架去固定两者。
编辑点评:

尽管是旗舰显卡产品,这些活跃在市场上的高端AMD显卡依然有着自己的特色,也不免拥有很多细节方面的不合理之处。笔者个人倾向于将高端显卡的性能压力更多地转嫁在架构设计方面,而不是通过运行高频或者堆砌重复电路实现性能提升,一款平衡设计的千元级显卡是用户希望看到的,而高端卡皇同样需要平衡合理的显卡整体设计


本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?注册

x
7#
无道刹那 发表于 2012-2-2 22:29 | 只看该作者
总的来说当年买5870的人一定都会觉得太值了。现在7970还不好说哦
您需要登录后才可以回帖 登录 | 注册

本版积分规则

快速回复 返回顶部