PCEVA,PC绝对领域,探寻真正的电脑知识
打印 上一主题 下一主题
开启左侧

[转驱家] 开普勒架构全解析 GeForce GTX 680震撼首测

[复制链接]
跳转到指定楼层
1#
sapphirex 发表于 2012-3-22 21:25 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
点击数:10575|回复数:21
本帖最后由 sapphirex 于 2012-3-22 22:33 编辑

http://hardware.mydrivers.com/2/222/222289_all.htm


内容导航:


序言:翘首以盼的“开普勒”终于来了

[/url]

“终于……Fermi来了、GF100来了、GeForce GTX 480/470来了……”,这是我们在Fermi架构问世,GeForce GTX 480到来之际喊出的第一句话。不知不觉已近两年,一样的的阳春三月,值此GeForce GTX 680发布之际,我们不禁同样要感慨一声:“Kepler,你终于来了!

之所以发出这样的感慨,是因为此情此景与当时是那么的相似。彼时AMD凭借Radeon HD 5870在DX11上夺得先手,在半年内陆陆续续发布了近20款新品之多,从高端到低端、从移动到桌面布置了一道完整的DX11产品阵线。而NVIDIA紧赶慢赶才在半年之后拿出当时纸面上已经放置很久的Fermi架构,让众多N饭甚是苦等一番。此役过后,NVIDIA虽然凭借GF100庞大的规模、出色的曲面细分和通用计算稳定住军心,但随之而来就是玩家对GeForce GTX 400骇人的高温高耗怨声连连。


留给NVIDIA的任务还很多,拥有美好憧憬的GF100并未实现叫好又叫座的目标,直到其简化版本GF104 GeForce GTX 460问世后,凭借极佳的性价比,才帮助NVIDIA扳回一城。但此时的AMD已经在迅速着手第二代DX11产品的布局,Radeon HD 6000又如洪水般一并泄来。好在此时NVDIIA已经准备好应对措施,吸取了上次的经验教训,加快了研发步伐。随着台积电良品率的提高,GF100将512个CUDA核心补充完整,经过优化之后变衍生出了Fermi第二代产品:GeForce GTX 580,并一举超越对手,顺利登上单芯显卡王座。


虽然之后的一年左右时间内两家都未有换代产品的出现,但在去年年底新官上任三把火的AMD CEO一到任就迅速拿出了全面革新的GCN架构,而传闻已久的“南方群岛”以及Radeon HD 7970正式到来。此招一出,又将数个“第一”的称号加冕。之后的两个月里又接连推出了Radeon HD 7950、HD 7800以及HD 7700系列等数款型号。面对如此狂轰滥炸,NVIDIA显然又处在了十分被动的境地,没有新产品予以应对,新一代Kepler架构很长时里都是神龙见首不见尾,像极了当初Fermi发布之前的情景。


好在,经过一番苦等和召唤之后,Kepler终于来到我们面前。今天晚上21点整,代表着NVIDIA新一代最新图形架构Kepler GK104核心的GeForce GTX 680正式发布。设计目标上,NVIDIA称之为史上最快、最有效率的GPU。而设计初衷上,GeForce GTX 680将会以最低的功耗代价换来最为极致的性能。但无论如何,经历长时间的闭关修炼,摆在GeForce GTX 680面前的任务依然比较艰巨,除了要成功打败对手Radeon HD 7970之外,还要让世人看到Kepler较Fermi架构的提升和改进之处,而更重要的是它将决定NVIDIA今后是否能重新夺回市场主动权,甚至会影响到未来A/N两家的竞争势态走向。


好了,说了这么多,话归正题。在下面的文章里,我们会用较多的篇幅深入解析Kepler全新架构的细枝末节以及全新特性的点点滴滴,之后则是最直接的性能测试和游戏比拼,一起见证吧!



开普勒的蜕变:更快、更平滑、更丰富

在正式进入架构解析和性能实测之前,这里有必要介绍一下两个代号。正如上一代“Fermi”,“Kepler”同样是NVIDIA最新CUDA图形计算架构的开发代号,它的取名来自16世纪德国著名的物理学家、数学家、哲学家约翰尼斯•开普勒(Johannes Kepler)。开普勒是把力学的概念引进天文学的第一人,并且是是现代光学的奠基者,制作了著名的开普勒望远镜,发现了行星运动三大定律,为哥白尼创立的“太阳中心说”提供了最为有力的证据,被后世誉为“天空的立法者”。连续以两位拥有伟大成就的科学家作为自己GPU架构的代号,也充分显示了NVIDIA对自己产品的信心。

[url=http://hardware.mydrivers.com/picture/222289/222289_2.html]

同样的,“GK104”和之前的“GF100”一样为NVIDIA下一代GPU图形处理器核心代号,其中G代表GPU、K代表Kpler、104代表该系列的中端产品,对应显卡型号GeForce GTX 680。和Fermi首发之时以最高端型号GF100打头阵不同的时,Kepler则是以104这样一个相对主流的型号作为先锋。按照以往的经验,再次之后还会陆陆续续分别衍生出数款针对高端以及低端市场的产品。NVIDIA这里将旗舰级产品雪藏,究竟适合缘故?是良品率不行,是Radeon HD 7970性能低于预期,是用来对付对手下一代Radeon HD 8000系列,亦或是有其它更为深谋远虑的打算?各位看官不妨自己揣摩一番。


当然,经历长时间的酝酿之后选择GK104作为排头兵,NVIDIA自然是有足够的信心。GK104在个人桌面级消费领域最重要的使命依然是在DX11市场上跃马扬鞭、大步前进,不仅性能方面要全面超过竞争对手,在新特性上也要带来上代产品前所未有的体验。为此,GK104采用了以第二代Fermi为基础全面革新的Kepler架构,以及专为游戏性能和视觉体验优化的新特性,包括SMX架构、GPU动态提速技术(GPU Boost)、全新的抗锯齿技术TXAA、自适应垂直同步(Adapitive Vsync)以及单芯3D立体幻镜环绕等等。

据NVIDIA称,GK104的设计初衷主要包括以下三个方面:速度更快(Faster)、图像更光滑(Smoother)、画面效果更丰富(Richer)。这里仅作简单介绍,下面的文章会一一详细阐述。



1、 速度更快:SMX架构、GPU动态提速技术

[/url]

对于显卡来说速度更快就意味着性能更强,这是每一代新架构产品都要完成的使命,所以提供最顶级的游戏性能自然是GK104的首要任务。为此,GK104采用了全新的SMX架构,装备多达1536个CUDA核心。相比之前的SM架构,SMX架构在指令吞吐、纹理渲染以及几何处理、曲面细分性能等方面都更进一步。同时,GK104特别强调了“能耗比”,即以最小的功耗代价换来最为出色的性能。此外,GK104还增加了一项全新的技术:GPU动态提速(GPU Boost),可使显卡GPU核心频率根据实际负载情况动态提速,在每一款游戏中都表现到最好。



2、图像更光滑:TXAA全新抗锯齿、自适应垂直同步

[url=http://hardware.mydrivers.com/picture/222289/222289_4.html]

除了更好的性能表现之外,GK104还带来了全新的抗锯齿技术TXAA,该技术可看做原有MSAA的加强版本,不仅可提供更加出色的抗锯齿效果,还能将抗锯齿的代价降到最低。另一方面,GK104还将为游戏实际的流畅度做出优化,提出了全新的自适应垂直同步(Adapitive Vsync)技术,该技术会根据游戏运行的实际情况,动态开启或关闭垂直同步,最大程度的减小游戏画面的撕裂、跳帧和延迟问题,保证游戏画面的流畅度。



3、画面效果更丰富:单芯三屏3D立体幻镜环绕

[url=http://hardware.mydrivers.com/picture/222289/222289_5.html][/url]

GeForce 500系列及之前的产品因为核心集成的显示输出芯片问题,一张单芯显卡最多只能实现两屏输出,要想组建卡三屏系统只能通过SLI或者双芯显卡,这一点跟对手AMD的Eyefinity技术相比逊色不少。不过这一局面已经改观,GK104可以原生支持单芯三屏3D立体幻镜环绕,并可通过DisplayPort接口另外连接一台显示器独立于三屏之外,从而实现“3+1”四屏输出系统。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?注册

x
2#
sapphirex  楼主| 发表于 2012-3-22 21:36 | 只看该作者



开普勒排头兵:GK104架构深入解析(1)

虽然之前有Kepler、GK104零零星星的测试成绩和少量细节曝光,不过作为NVIDIA未来1-2年最重要的新图形架构,鉴于保密协议对外公开的资料非常有限,很多报道都是基于早先费米架构猜想以及延伸推理而来,不够全面也没有丝毫的准确性。如今开普勒正式面世,诸多有关GPU架构的细节和全新特性都已正式公布,所以下面我们会用较大的篇幅,进一步全面系统地介绍一下有关开普勒的点点滴滴,看看它和之前的费米到底有何相同和不同之处。

[/url]

1、 设计目标

作为NVIDIA两年磨一剑的全新图形架构,Kepler的目标就是继续突破图形计算性能的极限,打造出世界上最有效率的GPU。从架构设计上来看,Kepler是在上代Fermi架构上全面优化而来。众所周知,两年前的Fermi堪称NVIDIA图形架构历史上最重要的变革之一,使得图形渲染和通用计算都到了一个全新高度。而Kepler会在此基础上更进一步,除了更强的性能表现,还将辅以诸多前所未有的新特性,为玩家提供“更快”、“更平滑”、“更丰富”的游戏体验。当然,只有实际表现才能说明一切,我们十分期待。



2、突出能耗比

按照NVIDIA的说法,在设计上一代Fermi架构之时,NVIDIA工程师的主要精力大部分都放在了较Tesla(GT200)的性能提升方面,包括几何处理、曲面细分以及通用计算等DX 11的主要几个部分。尽管功耗管理在Fermi研发过程中同样是一个重要问题,但提升显卡DX 11的性能表现才是主要目标。(ps:的确,性能是大幅提升了,但庞大的核心规模也让我们也见识了GTX 400系列恐怖的功耗和发热量,尽管在GTX 500系列所有改善,但这一点一直是NVIDIA近两代显卡的软肋之一,也是Fermi最为人诟病的地方,看来NVIDIA也非常有自知之明,接着往下说。)


到了最新的Kepler,NVIDIA设计之处选择了一条不同的道路。提供顶级的性能表现依然是主要任务,但Kepler更加着重性能/功耗比,也就是现在比较流行的“能耗比”。降低功耗方面,台积最新的28nm工艺也扮演了重要角色,但在降低功耗的同时提升性能还是要看核心架构。主要是指Kepler吸取了Fermi研发上的经验和教训,从而改进和优化。NVIDIA方面也非常强调,Kepler的每一个硬件单元都是为最大程度地提升能耗比而设计的。

[url=http://hardware.mydrivers.com/picture/222289/222289_7.html]

[/url]

设计方面,对于提升功耗比最为明显的例子就是新架构中的新一代SM(Streaming Multiprocessor,流式多处理器),NVIDIA称之为SMX(Streaming Multiprocessor Extreme,极致流式多处理器),每个SMX有192个CUDA核心,8组SMX为GK104提供了多达1536个CUDA核心,详细内容下文会具体讲解。根据NVIDIA官方提供的数据,基于GK104核心的GTX 680平均能耗比可达上一代旗舰级GF110 GTX 580的2倍。


开普勒排头兵:GK104架构深入解析(2)

3、GK104架构概览

和Fermi一样,Kepler核心架构同样由众多不同的功能单元组成。首款型号GK104核心主要包括主接口(Host Interface,已升级到PCI-E 3.0)、GigaThread引擎、四个图形处理器集群(GPC)、四个64位GDDR5显存控制器、四个ROP分区(包含32个ROP单元)、512KB二级缓存。其中每个GPC包含两组极致流式多处理器(SMX)、两个PolyMorph 2.0引擎、一个Raster引擎。而SMX内又有多达192个CUDA核心(相比之下Fermi中的SM仅有32个),8组SMX共计提供1536个CUDA核心

[url=http://hardware.mydrivers.com/picture/222289/222289_9.html]
GK104核心架构图

8组SMX都是高度并行的多处理器,1536个CUDA核心都是统一的处理器核心,能够执行顶点、像素、几何学和计算内核等不同任务。32个ROP单元可用于像素混合、抗锯齿、原子存储等操作,每组8个由一个64位显存控制器进行控制。统一的二级缓存则能够提供载入、存储、纹理操作等服务。


GPU工作方式上也和Fermi一脉相承,首先通过主接口读取中央处理器指令,GigaThread引擎从系统内存中获取特定的数据并拷贝到显存中,为显存控制器提供数据存取所需的高带宽。GigaThread引擎随后为各个SMX创建和分派线程块(Wrap),SMX则将多个Warp调度到各CUDA核心以及其他执行单元。在图形流水线出现工作超载的时候,GigaThread引擎还负责进行工作的重新分配。


下面我们会详细讨论有关SMX、ROP以及其它一些运算单元的细节,要想了解以下内容,建议首先参看我们之前Fermi架构的详细讲解,因为很多部分都是由Fermi继承改进而来,架构原理方面都是想通的。



开普勒排头兵:GK104架构深入解析(3)

4、极致流式多处理器(SMX)

在正式介绍新一代极致流式多处理器(SMX)之前,还是先说一下GPC。从Fermi第一代GF100开始,GPC的概念正式引入。到了Kepler,GPC被完整继承下来。和GF100、GF110一样,GPC依然是GK104中处于支配地位的主要高级硬件模块,整个核心架构由四组GPC构成。每个GPC包含两组SM,此外还拥有两个独特功能的引擎,分别是用于顶点属性提取与曲面细分等功能的可扩展PolyMorph引擎(安置在SM中),以及用于三角形设置、光栅化以及Z轴压缩(Z-Cull)的可扩展Raster引擎(驻留在GPC中)。除此之外,GPC还囊括了着色、纹理以及计算等处理资源,除了ROP功能之外,GPC还完全可以看作是一个自给自足的GPU。


从DX10时代开始,位于GPC(Fermi之前为TPC)之下、CUDA单元之上的SM就一直是NVIDIA统一渲染GPU架构的核心模块,它囊括了大部分起到关键作用的图形硬件单元,从G80、GT200到Fermi一共经历了三代演变。在Fermi GF100/110架构中,每个SM都包含32个CUDA处理器核心、2个Wrap调度器(包含4个指令分派单元)、16个载入与存储单元(LD/ST)、4个指令特殊功能单元(SFU)、1个PolyMorph引擎单元、4个纹理单元以及64KB片上存储。


而对于GK104核心来说,其中的一个关键部分就是SM将会升级到全新的SMX (Streaming Multiprocessor Extreme,极致流式多处理器),SMX包含了许多非常重要的架构转变,而这些都与GK104的性能表现和效率息息相关,堪称Kepler架构的精髓所在。

[/url]
SMX架构图

可以看到,和SM类似,SMX同样包含了计算和功能单元,但这些单元的数量和安置方式有了很大变化。具体来说,每个SMX包含192个CUDA核心,是SM的六倍;4个Wrap调度器(包含8个指令分派单元),是SM的两倍;32个载入与存储单元(LD/ST),是SM的两倍;32个指令特殊功能单元(SFU),是SM的八倍;1个PolyMorph 2.0引擎,和SM相同,不过已经升级到第二代;16个纹理单元,是SM的四倍;64KB片上存储和SM一致,可配置为48KB共享存储器加16KB一级高速缓存,或者16KB共享存储器加48KB一级高速缓存。


具体分工方面,CUDA核心负责像素、顶点、几何着色、物理计算等处理,指令分配单元负责线程群组的调度以及指令发射,载入与存储单元负责为线程计算源地址和目标地址,特殊功能单元负责执行抽象的指令,比如正弦、余弦、倒数和平方根,还有图形插值指令,PolyMorph 2.0引擎单元负责顶点拾取、曲面细分、视口转换、属性设定以及流输出等功能,纹理单元则负责纹理过滤、纹理采样、计算纹理地址并将数据输出至显存,而共享存储器和一级缓存是互补的作用,能够广泛地重复利用片上数据而减少片外通信量,从而提高工作效率。

[url=http://hardware.mydrivers.com/picture/222289/222289_11.html]
SMX和SM对比(图片来自Pcinlife),单元数量和排列方式都放生了改变

为了显示SMX的改进,NVIDIA在白皮书中特别加入了GK104(8组SMX)和GF110(16组SM)“芯片级别”的具体功能单元的对比

[/url]

从上面的对比不难看出,有关显卡每时钟周期所能提供的吞吐量中,其中几项关键的操作比如FMA32(32bit单精度积和熔加运算)、SPU特殊功指令以及纹理处理等,GK104都全面领先GF110,而其它几项操作也至少等同于GF110。另外,GK104在核心时钟频率上有明显优势,这就为其运算能力进一步添砖加瓦。

[url=http://hardware.mydrivers.com/picture/222289/222289_13.html]

[url=http://hardware.mydrivers.com/picture/222289/222289_14.html][/url]
图中GF110 SM SPU数量应为4个

另外,考虑到效率的原因,NVIDIA选择将以上运算功能单元平均分配到GK104的8个SMX中,而非GF100/110的16个SM。综合以上结果,毫无疑问的是单个SMX处理能力更强,而且更有效率。


本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?注册

x
3#
sapphirex  楼主| 发表于 2012-3-22 21:42 | 只看该作者


开普勒排头兵:GK104架构深入解析(4)

5、SMX的设计细节

以上我们从宏观视角了解了SMX的功能单元数量、排列方式以及和上一代SM的差别,下面我们从更加微观的底层角度一探究竟。以下内容比较晦涩难懂,但只有了解这些才能真正看到Kepler的改进之处。

[/url]

正如上图所示,为了安排SMX的执行单元,每个SMX都配备了4个Wrap调度器[url=http://hardware.mydrivers.com/2/159/159714_3.htm]具体概念可参看这里),每个调度器在单位时钟每可以处理两路指令,而且可以并行执行。相比之下之前的SM仅有2个Wrap调度器,每个调度器只能处理一路指令,显然在指令调度方面SMX更有效率。

[/url]
Kepler和Fermi调度流程对比示意

在指令调度分配上,Kepler和Fermi拥有功能类似硬件单元,包括用于高延迟操作(纹理和载入)记录的寄存计数器、内部Wrap调度决策单元(比如在待选Wrap之中选择最佳候补者)以及线程群组级别的调度单元(比如GigaThread引擎)。但是,Fermi用于防止数据通道意外的硬件调度流程过于复杂,多端口寄存计数器会对任何寄存器进行追踪,即便那些还未填充合法数据的也不例外,而之后的附属检测模块会再次基础上通过大量完全编码的Wrap指令流分析该寄存器的用途,最终才决定哪一个会被合法利用。


一般来说,数据管线的延迟不会改变,那么就有可能在指令排队等待之前就利用编译器去确定该指令的去留,并且可以将该信息标记到该指令上。这样以来,就能使用简单的硬件模块去摘取事先决定的延迟信息,利用它在内部Wrap调度阶段就挑选出来合法的Warp,从而省去了许多复杂而且耗费功耗的硬件模块,大大提升调度效率,而这就是Kepler相对Fermi在调度过程中的改进之处


此外,根据NVIDIA的说法,在提升能耗比方面Kepler也针对处理执行单元进行了全新的优化,每一个处理单元都是为最大化频率处理效率和最小化电路和延时消耗而精心设计的。最明显的改进之处就是取消了我们以往常见的Shader频率,Shader频率在DX10 G80时代随着统一着色器架构的到来而出现,成为继核心频率、显存频率之外的另外一个性能指标,后来一直延续到Fermi架构(近两年一般为核心频率的两倍)。(限于时间关系,有关Shader频率的来龙去脉这里就不在过多介绍,感兴趣的玩家通过参考之前的文章研究。)


一般来说Shader频率越高,象征着执行单元的频率越高,在有限数量的执行单元下可实现既定目标的数据吞吐量。但与此同时,更高的Shader频率也意味着需要更多的功耗消耗,频率变为两倍意味着管线阶段也变为两倍,如果每一个执行单元都以两倍的频率运行,那功耗将变为原来的四倍。在这种情况下,即便既定吞吐量只需要半数的执行单元,那管线阶段依然会消耗原来两倍的功耗。


上文中我们就提到,Kepler设计之初就优先考虑能耗比的问题。所以在架构设计上,Kepler进行了诸多关于功耗方方面的优化,即便是在多耗费一些逻辑核心面积(并非实际核心面积)的情况下。下面这个例子就是很好的说明。(ps.关于更多的细节NVIDIA没有过多透露,仅有图示一张。)

[url=http://hardware.mydrivers.com/picture/222289/222289_17.html]

就目前来说,Kepler架构设计上相比Fermi的重大改进可以简单归纳为两点:1、性能/功耗比值大幅提升;2、执行和调度效率上大幅提升



开普勒排头兵:GK104架构深入解析(5)

6、升级PolyMorph 2.0引擎

在前面的章节我们就提到Kepler SMX中的PolyMorph 引擎已经升级到第二代,这也是另外一个改进之处。两年前,随着DX11将曲面细分纳入规范,加之新型图形处理流水线的迫切需求,Fermi GF100架构设计了一种可扩展几何引擎PolyMorph,并为其配备专用的顶点拾取单元和曲面细分单元(Tessellator),从而极大地提升了几何性能。而GF100之所以拥有出色的曲面细分性能,主要就归功于多达16个PolyMorph引擎。

[/url]

PolyMorph引擎工作流程可分为五个阶段:顶点拾取、曲面细分、视口转换、属性设置、流式输出。每个阶段中的运算结果都会被发送到一个SM,由其执行游戏的着色程序并将结果返回到引擎中的下一个阶段,而五个阶段全部完成后结果就会发送到Raster引擎。

[url=http://hardware.mydrivers.com/picture/222289/222289_19.html]

到了Kepler,GK104架构共计设计了8个PolyMorph引擎,每个SMX分配一个,虽然数量上相比GF100/110减少了一半,但这8个PolyMorph引擎都经过重新设计(NVIDIA称之为PolyMorph 2.0),处理性能方面每时钟周期可达上代的两倍。另外,得益于GK104 GTX 680超出约30%的时钟运行频率,在曲面细分性能上将会有显著提升。

[/url]

根据NVIDIA提供的数据,GTX 680在曲面性能方面大幅超过GTX 580,并将对手HD 7970遥遥甩在身后,而且随着曲面细分系数的提高,领先幅度也随之拉大。在此,除了游戏之外,NVIDIA特别强调了曲面细分性能对于开发者的重要性,尤其是那些经常需要使用曲面细分以及编写有关曲面细分API的开发人员。



7、更高速的二级缓存

除了前面说的64KB片上存储(可配置为48KB共享存储器加16KB一级高速缓存,或者16KB共享存储器加48KB一级高速缓存)之外,Kepler还提供了大小为512KB的统一二级高速缓存,既能读又能写,为所有载入、存储、纹理请求提供服务,可在整个GPU中提供高效、高速的数据共享。

虽然容量不及Fermi GF100/110(768KB),但GK104的二级缓存带宽提升了近73%,而且原子存取操作吞吐量同样有大幅提高,尤其表现在单一普通地址的原子操作。下面的图标就简单概括了GK104二级缓存较GF110的提升。

[url=http://hardware.mydrivers.com/picture/222289/222289_21.html]



开普勒排头兵:GK104架构深入解析(6)

8、更加灵活的纹理

在Kepler架构之前,GPU要想引用一个纹理,需要事先在固定“列表”里安排一个“位置”,而“列表”中“位置”的数目从根本上限制了Shader着色器能够实时读取纹理的数量。这就是为什么Fermi架构中最多只能同时访问128个纹理的原因。(当然这也与DX11 API的限制保持一致有关系)

[/url]

在Kepler架构中,纹理访问就要灵活多了,不在需要事先在固定“列表”里安排一个“位置”,Shader着色器可以在显存中直接引用纹理,这样以来就有效解除了渲染一个场景时纹理数量的限制。NVIDIA也调侃说,如果需要的话,100万个也是有可能。除了大幅提升可用纹理的数量外,这一改进还有另外一个好处,那就是减少对CPU的利用率。

[url=http://hardware.mydrivers.com/picture/222289/222289_23.html]

遗憾的是,目前这种更加灵活的纹理机制还只能出现在OpenGL API中,不过NVIDIA称未来很有可能通过NVAPI在DirectX API中实现,或者在后续版本的DirectX API中或许能够看到

9、最快的GDDR5显存

[/url]

值得一提的是,在以往的GF100/110产品中,受限于显存控制器的设计问题,显卡的显存频率一直比较保守,比如上代GeForce GTX 580只有等效4008MHz,而且超频幅度也相当有限,相比对手差距相当明显。而Kepler的显存设计团队采用了全新了I/O设计,可实现GDDR5的理论最高频率。为了达成这一目标,最底层的物理电路经过了大量改进,最终反映到实际频率上也非常可观,GTX 680默认等效6008MHz的显存频率在历史上算是头一回。虽然显存控制器由GF100/110的六组缩减到四组,位宽由384-bit减少到256-bit,但是较高的显存频率却弥补了显存带宽的劣势。而之所以减少显存控制器数量,估计也是为了在有限的核心面积下容纳更多的计算单元。

开普勒全新特性:GPU动态提速技术

在开始这一章节之前,有必要提及几个相对陌生的名词:基础频率(Base Clock)、GPU动态提速(GPU Boost)以及动态提速频率(Bost clock)。首先是基础频率,它代表GPU核心的基本频率,是NVIDIA能够保证的GPU在TDP APP(能使GPU达到TDP的应用程序)中最低的运行频率,跟目前的核心频率并无差异(上文中我们已经说到Kepler架构中不再有Shader频率之说,原来的核心频率现在也将统一称之为基础频率)。

在衡量新一代GK104 GTX 680 TDP的时候,NVIDIA的工程师在极高的负载下测试了一系列3D程序,并对此时显卡的功耗进行实时监控,而显卡的基础频率也基于以上测试结果最终才得以确定。以首款GTX 680为例,显卡默认的基础频率为1006MHz。

[url=http://hardware.mydrivers.com/picture/222289/222289_25.html]

根据NVIDIA的说法,不同3D游戏需要不同的功耗负载,但用户遇到极限负载的情况并不多见,事实上,对于现在的GPU来说目前的3D游戏很难使其接近真实的TDP。既然GPU在大多数情况下没有被完全利用,那么完全可以进一步提升运行频率以求得更好的性能表现。针对提升GPU的实际性能,NVIDIA除了在架构上做出优化以外,还推出了名为GPU动态提速(GPU Boost)的全新技术

顾名思义,GPU动态提速是一项为GPU动态超频的技术,原理类似于目前处理器中Intel的睿频加速(Turbo Boost)以及AMD的动态加速(Turbo Core)。不过对于显卡来说,GPU动态提速算是头一遭,NVIDIA也算是开创了这方面的先河。

[/url]

那么GPU动态提速技术是如何实现的呢?可能很多人认为是驱动或者第三方软件提供软件解决方案,但NVIDIA已经明确表示,该技术是通过硬件底层和BIOS得以实现的,为此还在显卡设计线路中加入了专门的电路芯片模块,用以监测GPU的实时功耗以及温度等,并通过芯片实时调整GPU所能达到的最高运行频率,以达到动态提速的效果。只要显卡的实际负载功耗未到达预订功耗的值(即TDP),就会触发动态提速机制

[url=http://hardware.mydrivers.com/picture/222289/222289_27.html]

而开头提到的动态提速频率就表示经过GPU动态提速之后的运行频率,由于该频率会不断变化,所以动态提速频率没有设定任何绝对值。不过NVIDIA提供了一个动态提速频率的平均值作为参考(在典型环境下运行典型3D游戏的动态提速频率)。比如GTX 680的动态提速频率平均为1058MHz,相比基础频率提升了5%左右。不过NVIDIA也指出,实际情况中会遇到实际负载功耗和TDP之间还有较大差距,这时GPU会继续自动提速,可能会达到1.1GHz或者更高。

关于不同负载功耗下动态加速的幅度差异,我们经过测试后发现,在负载较高的3DMark 11 X级别中,动态加速频率在1058MHz上下浮动,而诸如《使命召唤》中动态加速频率一般在1100MHz以上。不过,即便使用相同测试软件也会出现较大误差,很难重现上次的效果。按照理论来说,负载功耗越低超频幅度应该越大,是实际测试中并没有严格遵循这一规律。当然,由于测试时间紧迫,也可能是误差等多种原因造成的,日后会专门针对这一部分进行详细测试。

[/url]

或许会有玩家问,GPU动态提速能关闭吗?答案是不能,由于属于硬件级别控制,GPU动态提速不受运行程序以及用户的干预,只要显卡正常运行与3D图形有关的程序,就会生效。即便是显卡超频,GPU动态提速也不受影响,二者可同时实行,动态提速可在超频频率之上再做动态调整,但前提是实际负载不能超过TDP。

[url=http://hardware.mydrivers.com/picture/222289/222289_29.html]
EVGA Precision是率先支持Kepler的第三方软件之一

目前,NVIDIA已经向合作伙伴提供了专门的API,让第三方软件新增更多关于动态提速的相关选项,玩家们甚至可以调高TDP的值,以获得更为出色的加速效果。

[url=http://hardware.mydrivers.com/picture/222289/222289_30.html][/url]
在NVIDIA的天堂演示中,GTX 680稳定运行在1.2GHz毫无压力。

另外有个问题值得关注,由于只要是3D应用程序就会触发动态提速,而对于一些要求不高的3D游戏,如果用户不需要过高帧数,以便更好的节能又该如何呢?NVIDIA方面也给出了解答,今后用户可以通过第三方软件提供的帧数锁定功能来限制显卡的输出帧率,从而达到节省功耗的目的。目前提供帧数锁定功能的软件仅有EVGA Precision,而NVIDIA会陆续向合作伙伴提供API,以便推出更多不同类型的第三方软件。


本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?注册

x
4#
sapphirex  楼主| 发表于 2012-3-22 21:52 | 只看该作者



开普勒全新特性:TXAA、自适应垂直同步

1、FXAA和全新TXAA抗锯齿

说起AA(Anti-Aliasing)抗锯齿,只要玩过游戏的人都不会陌生,反映到实际中的作用就是将游戏图像边缘及其两侧的像素颜色进行混合,然后用新生成的具有混合特性的点来替换原来位置上的点以达到柔化物体外形、消除锯齿的效果,是物体边缘看起来更加平滑。


经过数十年的发展,AA也衍生出了各种各样的形态。主要可以分为Hardware AA(硬件AA)和Post Process AA(后处理AA)这两大类,而这两种又分别演变中各种子集形态。一般来说,硬件AA要十分依赖于硬件性能,而后处理AA则要轻的多。

[/url]

硬件AA中比较有代表性的就是比较通用的MSAA(MultiSampling Anti-Aliasing)多重采样抗锯齿(其余还有SSAA、CSAA,这里限于篇幅就不再介绍了)。相比之下,FXAA (Fast Approximate Anti-Aliasing)快速近似抗锯齿就算是后处理AA中的后起之秀了,直到去年NVIDIA才将之公之于众。它是MSAA的一种高性能近似值,从实际效果上来看甚至比MSAA更为出色。但相比MSAA,FXAA对硬件的依赖度更小,资源消耗更低速度更快

[url=http://hardware.mydrivers.com/picture/222289/222289_32.html]

说了这么多,究竟和Kepler有啥关系呢?说来是个好消息,在支持Kepler的R300系列驱动控制面板已经加入了FXX的开关选项,支持的游戏达上百款之多,以后想用FXAA的玩家不再需要额外打补丁了。不过先别急,NVIDIA还为Kepler加入了另一项全新的抗锯齿技术:TXAA



按照NVIDIA的说法,TXAA是“CG电影”风格的AA解决方案,属于硬件AA的一种(FXAA是后处理AA),算是MSAA的加强版本。但和MSAA不同的是,TXAA在提供优秀抗锯齿效果的同时,消耗的硬件资源成本却十分低廉。TXAA暂时属于GeForce GTX 680的独有技术,但NVIDIA也表示未来会提供对GeForce GTX 500系列的支持。

[/url]

[url=http://hardware.mydrivers.com/picture/222289/222289_34.html]

按照等级划分,TXAA目前分为TXAA 1和TXAA 2两种级别。简单来说,TXAA 1即可提供相当于8x MSAA的抗锯齿效果,而消耗的资源仅相当于2x MSAA;TXAA 2的抗锯齿效果要在8x MSAA之上,不过也仅相当于4x MSAA的代价。不过,TXAA需要游戏支持才能使用,而支持TXAA的游戏估计至少要到下半年才会露面。


不过据NVIDIA透露,目前《机甲战士Online》、《神秘世界》、《星战前夜Online》、《无主之地2》几款游戏以及虚幻4、BitSquid、Slant Six Games以及Crytek等游戏引擎开放商已经确定将会提供对TXAA的支持。



2、自适应垂直同步(Adapitive Vsync)

除了增加新的抗锯齿技术提升游戏画面的平滑度之外,Kepler还将对游戏的流畅度和实际视觉体验进行优化,推出了全新的自适应垂直同步(Adapitive Vsync)技术。众所周知,垂直同步在几乎每款游戏中都能见到,开启该垂直同步之后可将游戏帧数锁定在与主流显示器刷新率相同的60FPS,主要目的就是减少显卡输出画面在不同FPS时所发生撕裂以及跳帧的情况,保持游戏画面更为稳定流畅。

[/url]

不过在实际情况中,并不一定会按照事前预想的情况发生。一般来说,显卡输出画面的帧数会收到游戏场景变化的影响,比如实际输出帧数低于60FPS,如果此时开启垂直同步就会将FPS直接降低到30FPS、20FPS或者15FPS等(一般可被60整除)。而当在从60FPS突然降到30FPS(或者更低)的瞬间,游戏画面就会出现明显卡顿的现象,从而大大影响到游戏的流畅度和视觉体验,相信不少玩家都遇到过类似的情况。

[url=http://hardware.mydrivers.com/picture/222289/222289_36.html]

而自适应垂直同步技术的推出可有效改善这一问题,当用户开启自适应垂直同步功能后,系统会自动侦测实时的FPS,当帧数高于60FPS时便将帧数锁定在60FPS进行输出,而低于60FPS时,自适应垂直同步会自定关闭,并以实际的帧数进行输出,减弱从60FPS突然将至30FPS大跨度的帧数暴跌出现了画面卡顿现象,对于喜欢开启垂直同步功能对游戏流畅度要求较高的玩家非常实用。

[url=http://hardware.mydrivers.com/picture/222289/222289_37.html][/url]

和FXAA一样,自适应垂直同步功能也将出现在R300系列驱动的控制面板中。


本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?注册

x
5#
sapphirex  楼主| 发表于 2012-3-22 21:53 | 只看该作者

开普勒全新特性:单芯3屏3D立体环绕

GeForce 500系列及之前的产品因为核心集成的显示输出芯片问题,一张单芯显卡最多只能实现两屏输出,这一点跟对手AMD的Eyefinity技术相比逊色不少。


不过NVIDIA也有也有自己的独特武器,那就是“3D Vision Surround(3D立体幻镜环绕)”。它基于此前已有的3D Vision立体幻镜,配合3D立体眼镜能在三台显示器上实现3D立体效果,其中显示器分辨率单台最高1920×1080(全高清)、刷新率120Hz,每秒钟需要渲染的像素值高达1920×1080×120×3=7.46亿个。NVIDIA宣称,这种系统可以呈现出完全身历其境、足以媲美IMAX 3D的游戏效果。

[/url]

但要想实现三屏3D立体幻镜环绕系统就必须实用两块单芯显卡或者一款双芯卡(比如之前的GTX 590)。不过这一局面已经改观,GK104已经可以原生支持单芯三屏3D立体幻镜环绕

[url=http://hardware.mydrivers.com/picture/222289/222289_39.html]

GTX 680可以通过的两个DVI接口以及一个HDMI接口进行三屏输出,并以3D立体环绕方式显示,从实现单芯3D立体幻镜环绕系统。

[/url]

当然,用户还是通过另一个DisplayPort接口连接一台显示器独立于三屏之外,在玩游戏的同时用于邮件、聊天以及网络浏览等,从而实现“3+1”四屏输出系统(独立屏为非3D)。

[url=http://hardware.mydrivers.com/picture/222289/222289_41.html]

为了更好的配合用户使用多屏系统,驱动控制面板中可对窗口以及任务栏进行设定。

[/url]

显示方式上也将更加灵活,比如可将Windows任务栏放到中间的显示器中显示、单独最小化一个窗口等,操作方式更加人性化。

[url=http://hardware.mydrivers.com/picture/222289/222289_43.html]

值得一提的是,以往的的多屏边框修正是将边框占据画面的一部分隐藏到显示器边框之后,使其成为游戏的一部分,这样在某些时候(比如上图的物品栏)可能会造成不便。而这里的边框补偿会将边框占据画面完成显示出来,更利于玩家在游戏中进行操作

[url=http://hardware.mydrivers.com/picture/222289/222289_44.html][/url]

如果想提升游戏的帧速和流畅度,还可关闭另外两个屏幕对中间屏幕进行加速。三屏环绕的支持的分辨率也更加广泛,玩家可根据喜好自行在驱动面板中设定。

此外,Kepler的全新显示输出引擎还将支持下一代4K分辨率、3GHz HDMI输出、多音频流以及增强视频编码等。



开普勒全新特性:NVENC视频编码引擎

最后,Kepler还将提供一个全新的H.264硬件视频编码引擎:NVENC。在Kepler之前,GeForce显卡在处理视频编码时主要将工作交由CUDA核心进行处理,这种方式可大大减轻CPU的负担,不过却产生了一个问题,那就是GPU将会消耗更多功耗。为此,NVIDIA在kepler架构GPU中增加了专门的硬件芯片:NVENC视频编码引擎,相比之前的CUDA编码H.264更快(据称可达四倍以上),而且有效减少了显卡功耗消耗。

在实际的编码软件中可以选择NVENC和CUDA编码共同协作,而且两种方式互不影响。不过,一些视频预处理算法可能会需要用到CUDA核心,这可能会降低CUDA编码的效率。NVIDIA建议先使用NVENC引擎进行视频预处理,然后选择合作方式进行并行编码,从而实现最佳性能。

就目前来说,NVENC视频编码引擎可以提供以下支持:

(1) 支持1080P视频8倍速率完全编码,比如一部16分钟的1080P 30FPS视频大约只需要2分钟;

(2) 支持基础、主流以及高等级(比如蓝光标准)的H.264格式视频编码;

(3) 支持3D立体视频的MVC(多视角视频编码);

(4) 支持高达4096x4096分辨率的编码。

除此之外,NVENC视频编码引擎还可为消费者提供以下用途:

(1) 在主流的笔记本上实现高清视频会议;

(2) 通过无线网络将显示器画面(游戏、视频)输出到大屏幕电视上;

(3) 从高清摄像机上刻录高质量蓝光碟片。

据称,NVIDIA已经向合作开发厂商提供NVENC专用的API以及SDK,预计今年下半年就能看到很多支持该引擎的软件了。目前,Cyberlink MediaEspersso已经提供了一个Beta版本进行支持,而不久之后Cyberlink PowerDrector以及Arcsoft MediaConverter也会加入对NVENC的支持。


本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?注册

x
6#
sapphirex  楼主| 发表于 2012-3-22 22:04 | 只看该作者

GeForce GTX 680规格、设计及概况

作为kepler的首款产品,GeForce GTX 680随着新架构的面世正式发布。说起GeForce GTX 680的命名还别有一番小插曲,倒不是说这个命名和之前的产品有何不同之处,而是在有关其命名的流言蜚语算一波三折吧,就有人戏称GTX 680的命名可谓“谍战剧般精彩”。


早期人们普遍认为NVIDIA将跳过GTX 600命名,GK110将直接进入GTX 700序列,后来流言不攻自破。后来又有人GK104将命名为GTX 660 Ti,并有衍生版本GTX 660,但是后来又被证实不靠谱。进入2月之后,GK104的具体名称锁定在了GTX 670 Ti身上,随着实物图的曝光以及GTX 670 Ti印记,开始有越来越多的人信以为真,认为这就是GK104的首款产品。但是到了最后,我们才发现大家都错了,原来它叫GTX 680。至于它为何叫680,而不叫670 Ti、660 Ti之类,这里借用一句话:“Radeon HD 7970性能低于预期。


话归正题,有关架构解析以及特性介绍前面的文章已经讲的比较详细了,这里主要看一下GeForce GTX 680显卡设计方面有哪些改进之处。首先值得一提的是,伴随着Kepler全新架构的发布,此前已经沿用多年的GeForce显卡Logo从此旧貌换新颜,象征着GeForce GTX 600家族的全新面貌。

[/url]
全新的GeForce Logo

[url=http://hardware.mydrivers.com/picture/222289/222289_46.html]
此前的GeForce Logo

定位方面,GeForce GTX 680将取代上代单芯旗舰GeForce GTX 580的位置,成为NVIDIA目前性能最想的单芯显卡。规格上,GeForce GTX 680基于台积电28nm全新工艺的GK104核心打造,内建1536个CUDA核心,默认基础频率为1006MHz,动态提速频率为1058MHz(参考值),配备2GB 256-bit GDDR5显存,显存频率高达6008MHz。显卡TDP设定为195W,相比上代GTX 580已经省电太多了。

[/url]

输出接口方面提供了2个双链接DVI接口、1个HDMI接口以及1个DisplayPort接口,可以实现单卡3屏3D立体环绕(包括3+1),总线接口方面也和对手HD 7970一样升级到PCI-E 3.0。

[url=http://hardware.mydrivers.com/picture/222289/222289_48.html]

另外,辅助供电接口为双6pin,不过设计方式上发生了一些变化,不再是之前普遍的一字排开,而是两个供电接口一上一下,至于为何这么设计,NVIDIA官方给出的说明是可以缩短PCB长度。

[/url]

[url=http://hardware.mydrivers.com/picture/222289/222289_50.html]

虽然表面看来,GeForce GTX 680采用的双槽散热设计和之前的GeForce GTX 580真空腔均热板搭配涡轮风扇的方案没有太大不同,但事实上内藏玄机。按照NVIDIA说法:GeForce GTX 680专门为静音游戏设计。为了在高负载游戏下的静音表现,显卡散热器采用的7cm涡轮风扇使用了特别的降噪材料,而且在散热鳍片下内置了三根纯铜热管,另外专门定制的散热鳍片也将更加利于散热气流流通。






GeForce GTX 680


GeForce GTX 580


Radeon HD 7970


核心代号


GK-104


GF-110


Tahiti XT


核心架构


Kepler


Fermi 2.0


GCN


工艺制程


28nm


40nm


28nm


晶体管数量


3.54 billion


3.0 billion


4.31 billion


核心面积


294mm


520mm


365mm


预设频率


1,006MHz


772MHz


925MHz


流处理器单元


1,536


512


2,048


纹理单元


128


64


128


ROP单元


32


48


32


像素填充率(GTexel/s)


128.8


52.4


115.6


显存位宽


256bit GDDR5


384bit GDDR5


384bit GDDR5


显存容量


2GB


1.5GB


3GB


显存频率


6.0Gbps


4.0Gbps


5.5Gbps


显存带宽


192.26GB/s


192.384GB/s


264GB/s


PCI-Express


3


2


3


最大功耗


195W


244W


250W


辅助供电接口


2x 6-pin


6+8-pin


6+8-pin


DirectX


11


11


11.1


OpenGL


4.1


4.1


4.1


通用计算


CUDA, OpenCL


CUDA, OpenCL


OpenCL 1.2


默认多屏输出


4


2


4




GeForce GTX 680做工用料介绍

[/url]

[url=http://hardware.mydrivers.com/picture/222289/222289_52.html]

GeForce GTX 680整卡长度为10英寸(约25.4厘米),比GeForce GTX 580略短(10.5英寸,约26.7厘米),整体风格较上代GeForce变动不大。从背部PCB来看,相比以往的高端卡用料要逊色一些。

[/url]

拿掉导风罩后可以看到,GeForce GTX 680和上代GTX 580一样采用了大尺寸真空腔均热板,搭配了一体化的致密散热鳍片以及一枚7cm PWM涡轮风扇。上面我们也提到了,显卡散热器涡轮风扇使用了特别的降噪材料,而且在散热鳍片下内置了三根纯铜热管,另外专门定制的散热鳍片也将更加利于散热气流流通,在静音和降噪两方面都有进步

[url=http://hardware.mydrivers.com/picture/222289/222289_54.html]

PCB整体布局,核心及显存供电集中在PCB右侧,正面安置八颗显存,双6pin外接辅助供电设计了一颗扼流电感,DVI接口也采用全封闭试。

[/url]

GK104核心,编号为“GK104-400-A2”,产自台湾。核心面积由GF 110的520平方毫米锐减到294平方毫米,开始走小核心战略,将更加突出能耗比。核心默认基础频率为1006MHz,成为历史上首款默认频率超过1GHz的显卡。

[url=http://hardware.mydrivers.com/picture/222289/222289_56.html]

海力士H5GQ2H24MFR-R0C GDDR5显存,单颗规格容量为256MB,正面八颗共同组成2GB/256-bit的显存规格。为了弥补位宽上的劣势,GK104的显存控制器重新设计,从而使得等效频率高达6008MHz。

[/url]

核心供电主控为RT8802A PWM芯片,最多可支持5相供电回路管理,输出电压为0.375V-1.6V,具备过电压保护,保证显卡稳定运行。

[url=http://hardware.mydrivers.com/picture/222289/222289_58.html]

4相核心+2相显存的供电方案,客观来说比较普通。不过正是应为GK104核心着重了功耗优化,所以4+2相即可满足峰值负载,过度供电反而会消耗更多功耗,浪费成本。不过我们注意到,PCB开始设计了5想核心供电,不过这里空焊了一相,不知道是不是为更强的型号预留的。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?注册

x
7#
sapphirex  楼主| 发表于 2012-3-22 22:13 | 只看该作者
本帖最后由 sapphirex 于 2012-3-22 22:15 编辑



NVIDIA官方GTX 680高清大图赏

前面的架构分析和特性介绍稍显枯燥,下面来点轻松的。每次NVIDIA给出的官方产品图都赏心悦目,此次GeForce GTX 680也不例外,以下为无码高清大图,未经压缩,喜欢的朋友可以收藏作为桌面壁纸使用。


[/url]

[url=http://hardware.mydrivers.com/picture/222289/222289_60.html]

[/url]




[url=http://hardware.mydrivers.com/picture/222289/222289_63.html]

[/url]

[url=http://hardware.mydrivers.com/picture/222289/222289_65.html]

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?注册

x
8#
sapphirex  楼主| 发表于 2012-3-22 22:19 | 只看该作者



测试平台配置及测试说明

为了保证系统没有瓶颈,最大程度的发挥GeForce GTX 680和对比测试显卡的性能,我们选择了目前综合性能最为加强悍的SNB-E平台进行测试,具体测试平台如下:


测试平台配置


处理器


Intel Core i7-3960X OC 4.2GHz


主板


技嘉X79-UD7


内存


海盗船DDR3 1600 2GB x 4


显卡


AMD Radeon HD 7970(925/5500MHz)
AMD Radeon HD 7970 OC (1100/6000MHz)
技嘉GV-N580SO-15I(调至公版的772/4008MHz)
NVIDIA GeForce GTX 680(1006/6002MHz,具备动态提速)


硬盘


希捷7200.12 1T


电源


酷冷至尊GX 750


散热器


超频三深蓝W120


操作系统


Microsoft Windows 7 64bit SP1中文版


测试项目


3DMark Vantage
3DMark 11
Unigine Heaven 2.5
《使命召唤7:黑色行动》
《星际争霸2》
《孤岛惊魂2》
《孤岛危机》
《鹰击长空2》
《孤岛危机2》
《尘埃3》
《潜行者:普里皮亚季的呼唤》
《战地3》
《异形大战铁血战士》
《地铁2033》
《失落星球2》
Comepute Mark运算测试
微软DX11 SDK曲面细分测试
温度、功耗测试
超频测试


驱动程序


AMD催化剂8.95.5 For Win7 64bit
NVIDA显卡驱动程序300.99 For Win7 64bit


www.mydrivers.com


软硬件安装完成以后,正确的测试方法是:开机进入到桌面上以后,待系统准备就绪后,才开始运行测试(关闭UAC、屏幕保护程序、系统还原、自动更新等对测试得分有干扰的系统任务)。所有测试项目都运行三遍,在测试成绩稳定、可靠的情况下,我们以其中最好的一次成绩为准。

[/url]
GTX 580

[url=http://hardware.mydrivers.com/picture/222289/222289_67.html]
Radoen HD 7970

[/url]
Radeon HD 7970 OC 1100/6000MHz

[url=http://hardware.mydrivers.com/picture/222289/222289_69.html]
GTX 680

由于GeForce GTX 680具备GPU动态提速功能,而且不可关闭亦不受人为控制,提速后的频率随时变化,所以之前很多玩家呼声很高的和Radeon HD 7970同频对比并不能客观的进行测试。不过我们在测试中发现在大多数情况下,GeForce GTX 680都可动态提速到1100MHz以上,所以这里加入了Radeon HD 7970 OC至1100/6000MHz频率的成绩对比,仅供参考。

DX10理论性能测试:3DMark Vantage

3DMark Vantage能全面支持多核心处理器、发挥多路显卡的优势,能在当前和未来一段时间内满足PC系统游戏性能测试的需求。它包括两个图形测试项目、两个处理器测试项目、六个特性测试项目。借助于DX10 API的新技术和高效能,它为玩家带来了一场绚丽逼真的视觉特效盛宴。并且,3Dmark Vantage还特别加入了对人工智能(AI)和物理加速的专门测试。作为业界采用最多的DX10综合性基准测试工具,3DMark Vantage必不可少。

[/url]

3DMark Vantage中,DX10、SM4.0、物理加速这些新技术第一次得以展现得淋漓尽致,3DMark Vantage还为我们带来了很多新颖的东西,它把测试结果按照画质等级预设划分成了入门级(Entry,E)、性能级(Performance,P)、高端级(High,H)、极限级(Extreme,X)四类,测试必须严格运行在这四套预设模式下;测试结果得分表达方式也改成了字母加数字的组合形式,从而更细致地反映系统性能等级,可以更对位、更公平地进行比较,省去了很多对测试结果再进行说明的麻烦。在本次的测试中,我们选用了性能级(Performance,P)、高端级(High,H)以及极限级(Extreme,X)三项项进行测试.结果如下:

[url=http://hardware.mydrivers.com/picture/222289/222289_71.html]

3DMark Vantage方面,GTX 680顺利登顶,领先默认频率下的HD 7970接近10%左右。但在HD 7970超频至1.1GHz以后,这种优势荡然无存,GTX 680仅能在P模式中领先1.1GHz的HD 7970 8%左右,但在负载更高一些的H以及X模式中略微落后于后者。

DX11理论性能测试:3DMark 11

3DMark 11是Futuremark在DX11显卡全面上市一年之后才推出的DX11显卡性能测试工具。3DMark 11基于原生DX11引擎,全面使用DX11 API的所有新特性,包括曲面细分、计算着色器、多线程。3DMark 11继承并改良了3DMark Vantage的统计方式,尤其是去掉了较少用户使用的高端级(H),其他三种也有了新的变化:

[/url]

- 极限级(X):分辨率固定为全高清的1080p 1920×1080,支持极高负载,适用于高端游戏PC,尤其是Radeon HD 5970、GeForce GTX 580这种顶级显卡,并且按照设计在未来几年内也不会辱没“显卡杀手”的荣誉。

- 性能级(P):分辨率固定为高清的720p 1280×720,支持中等级别负载,适用于绝大多数主流游戏PC,比如Radeon HD 5770、GeForce GTX 460之类的显卡,不过发布初期仍然需要高端卡才能跑出流畅的帧率。很显然,这个级别在今后将依然是我们最常见的评定标准。

- 入门级(E):分辨率固定为标清的1024×600,支持低负载,适用于大多数笔记本和上网本,特别是集成显卡。结果如下:

[url=http://hardware.mydrivers.com/picture/222289/222289_73.html]

3DMark 11测试中,GTX 680优势更加明显一些,能够领先默认频率下的HD 7970达到16%,在HD 7970超频至1.1GHz以后也能够继续保持领先优势。

DX11理论性能测试:Unigine Heaven 2.5

游戏引擎开发商Unigine推出的DirectX 11 GPU测试程序Heaven Benchmark自去年10月推出以来,就凭借对曲面细分等新特性应用的深度和广度成为媒体和玩家测试DX11显卡的重要工具,无论AMD还是NVIDIA都对其成绩相当看重。其2.0版对测试程序进行了升级改进,增加了更多的DX11特效以及对原有引擎进行优化。而之后的Heaven 2.1又加入了对OpenGL 4.0标准规范的支持,包括OpenGL模式下的硬件曲面细分技术。前不求,最新的2.5版本也伴随着少许更新正式发布。

[url=http://hardware.mydrivers.com/picture/222289/222289_74.html][/url]

测试方法:内建Benchmark。

测试选项:分辨率为1920x1200,开启8AA 16AF,曲面细分级别设定为Extreme。结果如下:

曲面细分能力一直N卡的强项,Fermi的曲面细分能力本来就十分强劲,经过优化之后的Kepler自然会更上一层楼。GTX 680大幅领先于默认频率下的HD 7970,在HD 7970超频至1.1GHz以后依然能够领先10%。


本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?注册

x
9#
sapphirex  楼主| 发表于 2012-3-22 22:23 | 只看该作者
本帖最后由 jasu30 于 2012-3-22 22:24 编辑


DX9游戏性能测试:《星际争霸2》

《星际争霸2》历经数次跳票,终于来到大家面前。作为《星际争霸》的续篇,3D化的《星际争霸2》继续讲述了人族、星灵和异虫三族的故事,将以三部曲的形式推出,即Wings of Liberty(自由之翼)、Heart of the Swarm(虫群之心)和Legacy of the Void(虚空之遗),目前,Wings of Liberty(自由之翼)已经正式发售。虽然仅基于DX9技术,但《星际争霸2》在高画质下的画面效果依然相当出色,并且对硬件的要求也不算太高。

[/url]

测试方法:播放录像,利用Fraps记录激烈片段200秒片段内的平均帧数。

测试设置:分辨率设定为1920x1200,超高画质,关闭垂直同步。结果如下:

[url=http://hardware.mydrivers.com/picture/222289/222289_76.html]

《星际争霸2》对GPU的要求并不高,参测四款显卡均能够达到100帧以上,画面十分流畅。因此单纯的成绩对比并没有什么太大的意义。但值得一提的GTX 680的平均帧数居然是参测四款显卡最低的,应该是驱动程序还没有优化到位的缘故。

DX9游戏性能测试:《使命召唤 黑色行动》

本次测试的DX9游戏项目中,我们用热门FPS作品《使命召唤 黑色行动》,仍然沿用原有引擎,但在画面上又有了进一步优化,使用新作测试也更加符合玩家们的实际应用环境。

[/url]

测试方法:选择U.S.D.D.关卡中开始场景,用Fraps记录游戏开始后200秒内的帧数。

测试选项:所有画质均设置最高,分辨率1920x1200,开启4AA 16AF,关闭垂直同步。结果如下:

[url=http://hardware.mydrivers.com/picture/222289/222289_78.html]

《使命召唤7:黑色行动》情况与《星际争霸2》类似,参测四款显卡平均帧数都在87帧左右,达到了瓶颈值。但GTX 580与GTX 680在最低帧数方面摇摇领先于HD 7970,即使是HD 7970在超频至1.1GHz以后也依然不够看。

DX10游戏性能测试:《Crysis》

《Crysis》游戏发生在一个如史前公园般美轮美奂的热带小岛上,如画般的沙滩,细致得令人心动的丛林,清澈得让人情不自禁想跳下去的水,都在向我们展示着下一代游戏应有的样子。《CRYSIS》的游戏场景,是在夏威夷群岛实地取景创作而来。Crytek以毫不吝啬硬件资源的坚持精神,在这款大作中挥毫泼墨,为我们展现了一幅足以乱真、犹如亲历的细腻热带丛林游戏场景,并在DX10效果、物理技术、枪械系统的合力支持下,将自然还原到了每一个细节。它将灵活刺激的游戏体验与惊人的视觉效果相结合,轻松成为有史以来最好的射击游戏之一。但是它也使广大玩家的游戏平台饱受折磨,轻松入选有史以来最变态的“机器杀手”排行榜。

[/url]

测试方法:官方BenchmarkTool。

测试选项:分辨率为1920x1200,4AA,关闭垂直同步,最高画质,DX10模式。结果如下:

[url=http://hardware.mydrivers.com/picture/222289/222289_80.html]

《Crysis》一向都是A卡的强项,这次也不例外,GTX 680落后于默认频率下的HD 7970接近10%。

DX10游戏性能测试:《FarCry 2》

相比上代《FarCry》的热带风情,《FarCry 2》游戏场景设定在了广阔的非洲草原,整个游戏世界面积达到50平方公里,玩家可以自由在其中驰骋,而游戏的结局也是开放的。游戏中的环境可以动态变化,玩家甚至能体验到一年四季的变化。加上支持DX10 API的DUNIA引擎,令游戏特效细节表现的非常真实出色,如动态天气效果、24小时日夜循环以及动态火焰已经成为游戏中的基本配置。

[/url]

测试设置:分辨率为1920x1200,8AA,关闭垂直同步,DX10模式,最高画质。

测试方法:游戏内置测试工具,多次测试选取平均值。结果如下:

[url=http://hardware.mydrivers.com/picture/222289/222289_82.html]

《FarCry 2》中GTX 680轻松取得了领先,最低帧数方面参测四款显卡差距都不大,但在平均帧数方面GTX 680领先超频至1.1GHz的HD 7970超过10%。

DX11游戏性能测试:《潜行者:COP》

随着新世代显卡的发布,游戏的画质终点将逐渐转向DX11,《潜行者》最新的资料片《Call of Pripyate》就是其中的代表。《潜行者》系列游戏对最新的3D技术支持一向很迅速,第一部资料片《切尔诺贝利的阴影》是最早支持DX10特效的游戏之一,之后的资料片《晴空》又率先垂范DX10.1,而最新的《普里皮亚季的召唤》迅速靠拢DX11规范。

[/url]

《普里皮亚季的召唤》游戏采用基于X-Ray 1.6引擎,支持DX1110.110中的大量画质增强技术,比如硬件细分曲面(Hardware Tessellation)、接触硬化阴影(Contact Hardened Shadows)、高清环境光遮蔽(HDAO)、后期处理(Post Processing)、陡峭视差贴图(Steep Parallax Mapping)、湿滑表面、动态延迟光照(阳光散射泛光调和映射)、日夜循环等等。

测试方法:游戏内建测试程序。

测试选项:分辨率1920x1200,4AA,所有画质最高,DX11模式,开启Tessellation选项,记录Rain场景下的平均帧数。结果如下:

[url=http://hardware.mydrivers.com/picture/222289/222289_84.html]

《潜行者:COP》A卡也比较占优势,但成绩方面GTX 680平均领先默频HD 7970高达20%,与超频至1.1GHz的HD 7970持平,但在最低帧数方面领先超频后的HD 790依然超过10%。

DX11游戏性能测试:《异形大战铁血战士》

由Rebellion开发、世嘉发行的科幻射击游戏《异形大战铁血战士》是世界上已经发售的支持DX11的第3款PC单机游戏,前2款分别为《科林麦克雷的拉力赛尘埃2》和《潜行者:普里皮亚季的召唤》。《异形大战铁血战士》也是根据电影改编的游戏。与其它粗制滥造骗钱的同名电影改编游戏不同,《本作不仅在剧情和游戏可玩性方面下足了功夫,而且在游戏画面方面将取得突破,AVP将会完全采用DX11引擎设计,大量使用最新的技术和特效,力图营造出接近电影品质的电脑游戏。

[/url]

测试方法:《异形大战铁血战士》测试程序。

测试选项:分辨率为1920x1200,4AA 16AF,所有画质均调至最高,同时关闭垂直同步选项。开启Tessellation。 结果如下:

《异形大战铁血战士》测试中GTX 680与默认频率下的HD 7970成绩相差无几,自然也就落后于同频下的HD 7970。

DX11游戏性能测试:《鹰击长空2》

作为育碧飞行模拟流行作品的正统续作,《H.A.W.X 2》延续了第一代追求爽快感的空战游戏定位,驾乘战机鸟瞰依据真实卫星地图打造的广阔大地也成为了许多玩家的独特趣味。二代作品通过引入DX11曲面细分技术,大幅度提升了蜿蜒曲折的地形特效,进一步增加了游戏画面的真实性。

[url=http://hardware.mydrivers.com/picture/222289/222289_86.html]

测试设置:所有画质均设置最高,分辨率为1920x1200,8AA,关闭垂直同步,DX11模式。

测试方法:使用游戏自带测试程序。结果如下:

[/url]

《鹰击长空2》中,各款显卡帧数都比较高,相对来说GTX 680和HD 7970 OC至1.1GHz比较接近,不过100帧以上也就没有太大差别了。

DX11游戏性能测试:《尘埃3》

《Dirt 3》是刚刚发布不久DX11游戏的典型作品,基本涵盖了DX11的各种代表性技术,如硬件曲面细分、多线程、高清环境光遮蔽以及计算着色器等。但其DX11技术应用大多都点到为止,应用范围也仅限于画面中的少部分元素,因此对DX11显卡的要求并不算太高,但是略高于《Dirt2》。

[url=http://hardware.mydrivers.com/picture/222289/222289_88.html]

测试方法:游戏内建测试程序。

测试选项:分辨率为1920x1200,8AA,所有画质均设置高等,DX11模式。结果如下:

[/url]

《尘埃3》是去年AMD的主打游戏,但A卡在此游戏中的表现也强不到哪里去。成绩方面GTX 680在平均帧数以及最低帧数方面都领先默认频率下的HD 7970达到15%左右,与超频至1.1GHz的HD 7970相持平。

DX11游戏性能测试:《战地3》

由EA DICE工作室开发的《战地3》采用了最新的“寒霜2”引擎,完美支持DirectX 11,并且拥有强大的物理效果,最大的亮点还是光照系统,其渲染的场景已近乎乱真的地步,视觉效果堪称绝赞。游戏还支持即时昼夜系统,为玩家营造一个亲临现场的真实环境。

[url=http://hardware.mydrivers.com/picture/222289/222289_90.html]

《战地3》的PC版多人模式支持高达64人网络对战,主机版则最大支持24人。而且将带来更多种多样的武器以及解锁内容,成为《战地》系列武器数量之最。另外游戏的单人战役模式同样支持合作模式。

测试方法:使用Fraps记录游戏关卡《碎剑者行动》过场动画帧数。

测试选项:1920×1200,4AA,最高画质。结果如下:

[/url]

《战地3》无愧于新一代显卡杀手的称号,两款新一代的单芯卡皇在最高画质下成绩均不足60帧。从数据方面来看GTX 680在最低帧数与平均帧数方面与默认频率下的HD 7970相差无几,距离超频至1.1GHz的HD 7970还有一定的差距。

DX11游戏性能测试:《地铁2033》

《地铁2033》(Metro 2033)是俄罗斯工作室4A Games开发的一款新作,也是DX11游戏的新成员。该游戏的核心引擎是号称自主全新研发的4A Engine,支持当今几乎所有画质技术,比如高分辨率纹理、GPU PhysX物理加速、硬件曲面细分、形态学抗锯齿(MLAA)、并行计算景深、屏幕环境光遮蔽(SSAO)、次表面散射、视差贴图、物体动态模糊等等。

[url=http://hardware.mydrivers.com/picture/222289/222289_92.html]

测试方法:选择游戏开场的一段动画,用Fraps记录游戏开始至人物可以自由活动之间的帧数。

测试选项:分辨率1920x1200,所有画质调至最高,DX11模式,4AA 16AF选项。结果如下:

《战地3》无愧于新一代显卡杀手的称号,两款新一代的单芯卡皇在最高画质下成绩均不足60帧。从数据方面来看GTX 680在最低帧数与平均帧数方面与默认频率下的HD 7970相差无几,距离超频至1.1GHz的HD 7970还有一定的差距。

DX11游戏性能测试:《失落星球2》

卡普空的《失落星球》曾是最早提供DX10支持的游戏之一,因此也成为热门的评测用游戏。而在DX11时代,《失落星球2》虽然没有拔得头筹,但对DX11技术的应用也丝毫不落人后。DX11技术将帮助该作提供烟雾容积和景深效果,更真实的爆炸、火焰和液体特效,关卡Boss还会依靠细分曲面技术呈现更多的细节。另外,和NVIDIA一向关系良好的卡普空还会在该作中提供3D Vision和3D Vision Surround立体技术支持。

[/url]

测试方法:自带Benchmark。

测试选项:分辨率1920x1200,最高画质开启4xMSAA。结果如下:

[url=http://hardware.mydrivers.com/picture/222289/222289_94.html]

《失落星球2》对显卡频率不是十分的敏感,HD 7970在超频后平均帧数提升不大,最低帧数居然有了一定程度的下降。数据方面,GTX 680与HD 7970相持平,差距都在误差之内。


本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?注册

x
10#
sapphirex  楼主| 发表于 2012-3-22 22:28 | 只看该作者



运算能力测试:DX11 SDK

运算测试方面,我们选用了微软DX11 SDK开发资源正式版中附带的DirectX 11 Compute Fluid Simulation(流体模拟测试)工具进行测试。

[/url]

结果如下:

[url=http://hardware.mydrivers.com/picture/222289/222289_96.html]

DX 11 SDK CS流体模拟测试中的网络搜素是微软基于早期的CUDA而来的,因此在测试中N卡明显占据优势,GTX 680相对于GTX 580有了10%左右的提升,领先HD 7970超过30%。



运算能力测试:Compute Mark

ComputeMark由捷克硬件和游戏网站CzechGamer.com的Robert Varga开发完成,技术上基于Jan Vlietinck的Fluid3D Demo,号称是“第一个百分之百的DX11 Compute Shader基准测试工具”,一般情况下能够调动99%的GPU资源,CPU占用率只有0-1%,因此在考察GPU通用计算性能的同时,也能考验显卡的稳定性,对超频亦有所帮助,另外测试的时候还可以自行选择运行时间(单位秒)。

[/url]

结果如下:

Compute Mark测试中,GTX 680表现有些不给力,比不过默认频率下的HD 7970,同频下就更不用说了。



曲面细分能力测试

曲面细分能力除了上文中我们测试的Unigine Heaven 2.5之外,我们还加入了微软DX11 SDK开发包中的细节纹理采样测试。曲面细分是NVIDIA宣传所谓真DX11的利器,AMD也在不断改进,宣称Radeon HD 7970性能是上代的四倍。在这个项目中,normal、max级别的曲面细分因素分别是7、15,其中前者是比较正常的普通情况,而后者就比较极限了。

[url=http://hardware.mydrivers.com/picture/222289/222289_98.html]

结果如下:

[/url]

经过多次测试后仍然出现上面的结果,有些让人大跌眼镜,着重强调曲面细分性能升级的GTX 680居然不敌上代的GTX 580,跟HD 7970差距就更大了。这里猜测应该是驱动方面的原因。



温度、功耗测试

温度测试方面,选取显卡待机、游戏满载(Furmark极限拷机)两种状态,利用GPU-Z实时监控,待连续运行10分钟峰值温度稳定后,记录此时各款显卡核心的最高温度。(室温10℃)

[url=http://hardware.mydrivers.com/picture/222289/222289_100.html]

温度方面,GTX 680公版还算可以,室温为10度左右,测试平台为开放环境,测得的数据和上代GeForce GTX 560 Ti等主流型号表现相近。而且实测过程中表现相对安静,即便满载也没有明显的噪音,这一点值得肯定。


功耗测试部分利用功耗仪直接测量整套平台的总功耗,其中包括CPU、主板、内存、硬盘、显卡、电源以及电路损耗所有在内的整机功耗(不包含显示器)。选择显卡运行3DMrak 11测试,游戏(Crysis)和满载(Furmark拷机)三种状态,稳定运行10分钟选取期间最大值,测试结果如下:

[/url]

功耗测试方面GTX 580依然是最猛的,随着制造工艺的不断提升,单芯显卡想要打破这个记录是真的很难的,或许传说中TDP接近300W的GK110能够接过大旗,不过那是今年底甚至明年初的事情了。GTX 680的TDP官方宣称为195W,但从实际测试中来看其高负载下的功耗比250W TDP的HD 7970低不了多少,基本上处于同一个档次。



超频能力测试

[url=http://hardware.mydrivers.com/picture/222289/222289_102.html]

超频能力测试方面首先需要说明的是GTX 680在超频之后动态加速依然存在,首先我们在默认电压下将GTX 680超频至1.1GHz,从软件监控中发现GTX 680在测试中可以动态加速最高至1.2GHz以上,但耐人寻味的是3DMark 11相比基础频率时的成绩(此时同样也有动态提速效果)却丝毫没有提升。

[/url]

随后我们加压,将GTX 680默认频率提升至1.15GHz,此时动态加速最高频率最高已经达到了1.3GHz左右,但3DMark X模式成绩居然出现了接近10%下降,难道GTX 680也有所谓的"频率墙"?不过按说28nm的能耐不该限于此,目前笔者也未能找到合理的解释。



总结:开普勒的反击 NVIDIA的开始

[url=http://hardware.mydrivers.com/picture/222289/222289_104.html]

如果单从架构方面来看,Kepler相对于Fermi的变革,并没有当初Fermi较GT200来得彻底。经过一些系列的深入分析之后,我们发现Kepler更像是第二代费米的优化升级版本。很多功能模块单元都十分类似,有些则是完全继承,只是设计方式上有了很大不同。当然,这并不意味着Kepler的改进不够明显,简单来说可以归纳为以下几点:1、核心规模更为精简,开始走小核心战略;2、性能/功耗比值大幅提升,功耗管理有所改善;3、执行和调度效率上大幅提升;4、曲面细分引擎、纹理单元以及显存控制器有较大改进



相比架构,Kepler带来的全新特性似乎更能让人印象深刻,GPU动态提速、自适应垂直同步、TXAA全新抗锯齿、单芯3屏3D立体环绕、NVENC视频编码引擎中的每一项技术都为产品附加值增光添彩。其实仔细来看,这些技术都从侧面透露出NVIDIA的对于玩家的用心之处:GPU动态提速用来提升显卡在游戏中的性能表现、自适应垂直同步以及TXAA全新抗锯齿分别用来改善游戏的流畅度和以最小的代价换来更为出色的画面平滑度、而单芯3屏3D立体环绕弥补了以往GeForce显卡在多屏输出领域的软肋,至于NVENC视频编码引擎则为用户提供了一项在显卡较低功耗的条件下效率的编码途径。


不过,其中的一些技术都是前所未有首次露面,成熟度和完善度上还稍有欠缺。比如,最为抢眼的GPU动态提速目前客观来说还不够人性化,如果能让玩家参与其中或者能够根据需要开启关闭似乎更加合理,所以我们十分期待未来后续产品带来的改进版本。

[url=http://hardware.mydrivers.com/picture/222289/222289_105.html][/url]

说完架构特性,下面就是玩家们最为关心的性能、功耗以及温度问题了。事实上,在设计之初,Kepler的目标就是继续突破图形计算性能的极限,打造出世界上最有效率的GPU,而且相比前代产品额外强调了性能/功耗比率。在实际测试过程中,GeForce GTX 680综合性能领先AMD Radeon HD 7970约10-15%左右,而相比自家上代单芯旗舰性能飙升达35-40%。总得来说这一性能表现基本符合预期目标,毕竟GK104放在以往来说只能算是主流级别的核心,核心规模相比前二者都要小的多,从这一点来说Kepler的架构优化和设计初衷是成功的。


不过对于功耗表现来说,GeForce GTX 680并没有达到我们理想的状况。虽然NVIDIA一再说到GK104中的单元设计和电源管理都为优化功耗而来,但从实际测得的数据来看相比Radeon HD 7970并没有非常明显的优势(前后二者的TDP相差55W之多)。当然,相比上代GeForce GTX 580,GeForce GTX 680的功耗已经改善了太多;而发热量部分还算不错,即便核心频率如此之高,而且存在实时动态提速,测得的数据也大致和之前测过的GeForce GTX 560Ti相差不多,高负载下也没有明显的噪音。看来核心面积的减小、28nm工艺的助阵以及散热器的改进确实起到了不小的作用。


最后说一下价格,直到今天中午,NVIDIA才公开了GeForce GTX 680最终的国内官方定价:3999元。相比Radeon HD 7970发布之时4299-4699的定价已经便宜了不少。当然,这一定价仅针对公版GTX 680,未来更强的非公版则没有具体价格限制。可以确定是,GeForce GTX 680全面上市之后,Radeon HD 7970估计会有一定价格下调。


不管怎样,GeForce GTX 680已经实现了世界最快显卡的目标,也吹响了Kepler全新架构的反击号角。但是我们要说的是,这对于目前的NVIDIA来说只能算是一个开始,一个全新的开始,不是吗?


本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?注册

x
11#
无道刹那 发表于 2012-3-22 23:41 | 只看该作者
老黄之前说GK104将不可战胜,结果貌似性能和7970差不多,貌似同频下3D11还会略差?功耗也不是标称的190对250的差距。这个完全对不起将不可战胜级别啊。不过比费米卡还是进步不小,能耗比比原来高不少了。不过那寒酸的散热实在让人提不起胃口啊
12#
sapphirex  楼主| 发表于 2012-3-23 01:26 | 只看该作者
无道刹那 发表于 2012-3-22 23:41
老黄之前说GK104将不可战胜,结果貌似性能和7970差不多,貌似同频下3D11还会略差?功耗也不是标称的190对25 ...

那就坐等超公版显卡吧
13#
kyzhuang 发表于 2012-3-23 09:26 | 只看该作者
世界最快显卡?看公版还真的不敢苟同。还得看哪个厂家能把GK104发挥到极致吧。希望看到PCEVA的评测!
14#
无道刹那 发表于 2012-3-23 09:38 | 只看该作者
sapphirex 发表于 2012-3-23 01:26
那就坐等超公版显卡吧

680不是我的菜,我的菜大概是660,我喜欢的必须是单6pin最强游戏显卡,目前当然是7850.但是价格还太高
15#
海洋之心 发表于 2012-3-23 11:01 | 只看该作者
680的显存规格提升到384bit就不错了,哈哈
16#
zxy356 发表于 2012-3-23 11:50 | 只看该作者
384bit是留给下代旗舰的
17#
zxy356 发表于 2012-3-23 11:50 | 只看该作者
无道刹那 发表于 2012-3-22 23:41
老黄之前说GK104将不可战胜,结果貌似性能和7970差不多,貌似同频下3D11还会略差?功耗也不是标称的190对25 ...

新出的显卡,驱动还有待优化呢
18#
sapphirex  楼主| 发表于 2012-3-23 12:00 | 只看该作者
海洋之心 发表于 2012-3-23 11:01
680的显存规格提升到384bit就不错了,哈哈


实际上GK104这规格是上一代GTX 560 Ti的替代品,但是性能超给力,秒了AMD卡皇,外加NV新一代卡皇GK100难产,干脆改名叫680上市了。。
19#
ssssqs 发表于 2012-3-23 12:55 | 只看该作者
其实还不如叫660Ti呢  气死AMD  中端卡秒了高端卡
20#
nuclear 发表于 2012-3-23 13:00 | 只看该作者
强大得令人肝颤
您需要登录后才可以回帖 登录 | 注册

本版积分规则

快速回复 返回顶部