PCEVA,PC绝对领域,探寻真正的电脑知识
开启左侧

引爆中端战场——Kepler甜点GTX660浅析

[复制链接]
hyenax1950xtx 发表于 2012-9-16 21:14 | 显示全部楼层 |阅读模式
点击数:11474|回复数:58
本帖最后由 hyenax1950xtx 于 2012-9-18 22:08 编辑

前言:

    随着GeForce GTX 660的上市,我们看到了一款全新的Kepler核芯——GK106,和GK104不同的是这一款不折不扣的原生甜点级核芯,官方参考价格1799元,而发布后就已经开始上架销售,不过一些型号在大零售商上市就推出返券优惠活动,小零售商也通过降价、团购等活动,实际成交价格均低于官方参考价格比如本站评测的三款GeForce GTX 660,其中微星N660 TwinFrozr 2GD5 OC在淘宝上面为1699元本站团购价格1599元、技嘉GV-N660OC-2GD和映众GTX 660冰龙在淘宝上面则分别为1660和1566元,性价比很高。GeForce GTX 660上市后将接替自家GeForce GTX 560TI/560TI 448/570的阵地直接与AMD Radeon HD 7870/7850展开竞争,由于GeForce GTX 660和iPhone 5一起上市,关注度受到影响,故以此贴同各位玩家交流。
本站有关GeForce GTX 660链接:
Geforce 660显卡团购试用+免费升级超值活动
Kepler下放中端市场:微星N660 TwinFrozr 2GD5/OC评测
GTX 660点燃中端战火:技嘉GV-N660OC-2GD评测
GTX 660非公版第三弹:映众GTX 660冰龙版测试


一、GK106芯片说明





GeForce GTX 660的官方规格,核心采用28nm工艺制造,Kepler架构,960个CUDA处理器,公版基础频率980MHz,Boost频率1033MHz,2GB/192bit GDDR5显存,显存频率6008MHz。外接单6pin供电,官方TDP 140W,比GeForce GTX 660 Ti低10W,标准输出接口为2x DL-DVI、HDMI和DisplayPort 1.2。显卡完整的继承了Kepler的特性,支持GPU Boost功能、支持PCI Express 3.0、支持PhysX、支持SLI、支持DirectX 11.1、支持3+1 1080p显示器输出(英伟达环绕技术)、支持3D立体幻镜、支持新的自适应垂直同步功能、支持新的抗锯齿模式TXAA。

GK106核心的结构看起来没有对称的美感,因为通常NVIDIA都是按4:2:1的方式削减核心规格,原本认为GK106应该是半个GK104的规格,也就是2xGPC(Graphics Processing Clusters,图形处理集群)、4xSMX(Streaming Multiprocessors,流式多处理器)和2xMC(Memory Controller,显存控制器)、2xROPs(光栅单元)、2xL2 Cache(二级缓存)。但GK106核心除了两个完整的GPC之外,还有第三个GPC,不过它只有一组SMX,同时L2 Cache、ROPs和MC也同时增加了一个,晶体管数相比GK104减少了大约1/3,为25.4亿。

GK106核心原生拥有3个GPC、5组SMX群,每个GPC由一个专门的RE(Raster Engline,光栅引擎)和两个SMX组成,3个GPC就构成了6个SMX(每组SMX含192CUDA Core,总共960个CUDA Core),MC为3个(每个MC提供64bit,总共为192bit)。5组SMX则意味着TMUs(纹理单元)减少到80个,GK106核心的每个MC连接128KB的L2 Cache和8个ROPs(光栅单元),8个光栅单元中每个可处理一个单一的色样,一个完整的GK106核心由于具有3个MC,所以共拥有384KB L2 Cache和24个ROPs(即可处理32个色样),三个MC合成一个192bit的GDDR5显存接口,3个GPC拥有3个Raster Engines(光栅引擎),5个SMX则有5个PolyMorph Engines。SMX相较于GK104没有变化,每组SMX包含CUDA Core可以执行pixel(像素)、vertex(顶点)、geometry shading(几何着色)、physics(物理)以及compute(运算)等工作;而纹理单元则可以执行texture filtering(纹理过滤)的加载/存储以及读取和保存数据到显存等工作;另外,SFU(Special Function Units,特殊功能单元)可处理transcendental(先验)和graphics interpolation(图形插值)指令;PolyMorph 2.0引擎可用于处理vertex fetch(顶点获取)、tessellation(曲面细分)、viewport transform(视点变换)、attribute setup(属性设置)、和stream output(流输出);Warp Scheduler和Dispatch Unit(指令分发器)负责指令调度。

我们对于GeForce GTX 660最大的疑惑在于原生的24ROPs和192bit的显存位宽,和GeForce GTX660TI的阉后不同660是原生的,参考660TI的192 bit 2GB的显存控制器配置,NVIDIA能够用3个64bit的MC实现这一目标,唯一的办法是使用mixed-density ICs。它的工作原理是这样的:3个64bit的MC分别对应各自的显存为512 MB​​,加起来就是1.5GB,这是完整的192位访问。剩余的512 MB解决的只需要提供完全独立的1个64位的控制器,其实现无疑是有延迟的。 由于Nvidia不透露任何实现的原因,以上仅为个人的理解,24ROPs是否够用?非原生的512MB显存是否会造成瓶颈?下面会通过一些测试来说明问题。

二、GTX660游戏性能对比



上图我们可以看到A/N的各个芯片关于工艺、面积、晶体管和引擎的对比。



这是GTX660和其竞争对手的数据对比。




以上为各个网站对GTX660的性能汇总后的对比,我们可以看到公版GTX660的性能全面优于公版HD7850和GTX570,基本接近公版7870的表现,不仅功耗全面超越自家上代的GeForce GTX 560TI/560TI 448/570,就连性能也完美拿下。



以上是通过3D Center汇总各大网站测试的出来的成绩而制作的表格,参照的是大众最常见的1920x1080 4xMSAA下的性能,而功耗数据则来自ITOCP。

市场的上GTX660和HD7870/7850绝大多数为非公版,性能还会超过表中的数据,各位可以参考本站有关微星/技嘉/映众的三款GTX660测试(链接已经在楼上)和TPU的测试
通过横向数据汇总的情况来看:
微星N660 TwinFrozr 2GD5 OC比公版GTX660约强5%
技嘉GV-N660OC-2GD比公版GTX660约强6%
映众GTX 660冰龙比公版GTX660约强8%
迪兰HD7850 PCS+ 2GB比公版HD7850约强8%
微星HD7850 HAWK比公版HD7850约强7%
迪兰HD7870 PCS+ 2GB比公版HD7870约强6%
微星HD7870 HAWK比公版HD7870约强5%



这是一份从ComputerBase收集来的索泰660的Boost频率,索泰660默认频率比公版稍微高一点点约1%,但平均Boost频率最低/最高分别为1021.8/1054.6均低于标称数值的,TDP Limit对性能有不少影响,打开110%以后,Boost频率达到平均最低/最高1075.4/1086均高于标称数值,性能提升约3%,功耗上浮20W左右。

三、GTX660通用性能对比

随着OpenCL和DirectCompute 5.0的广泛运用,我们的显卡不仅可以用于游戏,还能够对我们的其它使用起到更好的帮助,由于没有汇总,我也就只能一个一个的贴了

1、OpenCL的基础测试




2、OpenCL的Basemark CL测试




3、OpenCL的Basemark CL图片处理能力测试




4、OpenCL的Basemark CL视频处理能力测试




5、OpenCL的FLACCL音频编码压缩能力测试



6、OpenCL的开源免费3D渲染光线追踪LuxRender测试



7、OpenCL的密码恢复工具oclHashcat lite测试



得益于强大的OpenCL,一些基础的OpenCL运用就算不需要专业卡,我们也能获得很好的体验,而GTX660在视频处理方面表现优秀,甚至视频降噪能力超过了GTX660TI,这里要说明下Tom's Hardware的图中的GTX660有一个跟了OEM GK104后缀的,这是GK104核心OEM版本的GTX660,不是我们零售中能买到的卡

四、GTX660抗压能力测试

Tom's Hardware用Batman: Arkham City对GTX660的抗压能力进行了测试





通过Tom's Hardware的测试可以看出,GK106核心的抗压能力虽然不及Radeon来得更平滑,但是相较于两款GK104版阉到24ROPs和192bit的GTX660/660TI来说,表现相当优秀,最后512MB的利用损耗并没有它们那么大。

五、GTX660的功耗、温度、噪音和超频



这是汇总本站和TPU的数据后制作的的图表,由于TPU没有测试映众GTX 660冰龙,所以缺少冰龙的功耗和噪音数据
三款GTX660均非常安静,功耗也足够低
GTX660整体虽然不如7850/7870能超,但小幅超频后也能获得更高的性能提升

六、GTX660的市场关注

目前虽然AMD已经调整了自己产品线的价格,但是一直反应慢半拍的国内市场并没有见到动静,那么GTX660作为新鲜血液的杀入无疑是非常具有性价比的选择,凭借不俗的性能、功耗和高于GTX660TI的抗压表现,以及低价让路的公版GTX660,尤其是大量非公高频版的铺货,基本填满1500~1800元的价格区间,可以预见GTX660已经完美的接替GeForce GTX 560TI/560TI 448/570的阵地。GK106预计会出三款核芯,应该是以阉SMX为主的方式出现GTX 655和GTX650TI,价格自然会向下填补市场,感兴趣的朋友可以持续关注。



以上是目前搜索到的一些GeForce GTX 660和AMD Radeon 7850/7870的价格对比,你又会选择哪些你心仪的显卡呢?
多选投票: ( 最多可选 3 项 ), 共有 150 人参与投票
您所在的用户组没有投票权限

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?注册

x

评分

参与人数 2活跃度 +10 收起 理由
ylb2008 + 5 很给力!
仙賢戀軒 + 5 很给力!

查看全部评分

仙賢戀軒 发表于 2012-9-17 11:50 | 显示全部楼层
才仨选项 略不够哇

顺便,tom's的图表越来越带感了
hyenax1950xtx  楼主| 发表于 2012-9-17 11:58 | 显示全部楼层
仙賢戀軒 发表于 2012-9-17 11:50
才仨选项 略不够哇

顺便,tom's的图表越来越带感了

三项够了。。。

Tom's的660抗压表现比GK104的660/660TI优秀哇,看来GK106的最后512MB的实现和他们不一样
61x7 发表于 2012-9-17 12:13 | 显示全部楼层
终于编辑完了么
ccqsk 发表于 2012-9-17 13:04 | 显示全部楼层
6870 167W   560 192W  这么高的功耗?数据怎么来的?
hyenax1950xtx  楼主| 发表于 2012-9-17 13:07 | 显示全部楼层
ccqsk 发表于 2012-9-17 13:04
6870 167W   560 192W  这么高的功耗?数据怎么来的?

ITOCP
zxcbahamut 发表于 2012-9-17 14:31 | 显示全部楼层
感觉7870和7850不跌到一个合适价位的话就选660了
大D来了 发表于 2012-9-17 15:30 | 显示全部楼层
我还是选购7770吧。。。
aria503 发表于 2012-9-17 15:32 | 显示全部楼层
其实选78070和660的之一就是看按摩店到底多久降价 降多少的问题。国内迟迟不表态,那观望的人也就越来越多。
jazy1377777 发表于 2012-9-17 16:12 | 显示全部楼层
感觉还是7870给力
HiTom 发表于 2012-9-17 16:39 | 显示全部楼层
7870 VS660  2选一 那个降多选哪个
tsy1gogogo 发表于 2012-9-17 20:05 | 显示全部楼层
给力
durui0926 发表于 2012-9-17 20:14 | 显示全部楼层
看了这帖我顿时觉得A卡好给力。。。尤其7950和7870。。。
ylb2008 发表于 2012-9-17 21:05 | 显示全部楼层
写的比较实际,也很详细。
PS:功耗图那里,7870写成7750了

评分

参与人数 1活跃度 +10 收起 理由
hyenax1950xtx + 10 感谢提醒,已经修改

查看全部评分

qhx 发表于 2012-9-17 22:45 | 显示全部楼层
显卡性能参照图的价钱我看了下……好像跟市场差距不小……是国外的价钱吧……
hyenax1950xtx  楼主| 发表于 2012-9-18 00:23 | 显示全部楼层
qhx 发表于 2012-9-17 22:45
显卡性能参照图的价钱我看了下……好像跟市场差距不小……是国外的价钱吧…… ...

图表写了是美元的。。。因为A卡已经全线调价了,而国内的反应慢半拍,只好用美刀了
pcevaxsx 发表于 2012-9-18 00:29 | 显示全部楼层
460和660可以组SLI吗?可以就入个,不然460浪费了
hyenax1950xtx  楼主| 发表于 2012-9-18 00:43 | 显示全部楼层
pcevaxsx 发表于 2012-9-18 00:29
460和660可以组SLI吗?可以就入个,不然460浪费了


不能。。。。最多只能460作为PhysX to GPU的子卡
pcevaxsx 发表于 2012-9-18 00:46 | 显示全部楼层
hyenax1950xtx 发表于 2012-9-18 00:43
不能。。。。最多只能460作为PhysX to GPU的子卡

是所有不同代的都组不了吗
hyenax1950xtx  楼主| 发表于 2012-9-18 00:50 | 显示全部楼层
pcevaxsx 发表于 2012-9-18 00:46
是所有不同代的都组不了吗

SLI必须同核芯,阉掉都不行,比如同为GK104的680就不能和670组
CF可以同核芯,比如7950和7970,但7970的性能只按7950算
您需要登录后才可以回帖 登录 | 注册

本版积分规则

快速回复 返回顶部