PCEVA,PC绝对领域,探寻真正的电脑知识
打印 上一主题 下一主题
开启左侧

浅析kepler现象

  [复制链接]
1#
hyenax1950xtx 发表于 2012-8-7 01:13 | 显示全部楼层
本帖最后由 hyenax1950xtx 于 2012-8-7 01:20 编辑
Asuka 发表于 2012-8-6 21:53
看来我还有点没叙述清楚

应该说 高端难产了


我到不觉得GK104是本该的中端,也许大家这么认为是和GF104/114命名相似导致的,其实是NV的双线策略。

我觉得GK104就是这代NV原本的高端货,先拿GF104/114和GF100/110的核芯对比就知道,这完全是两种架构的产品:
GF104的GPC比GF110的少一半,但是每组SM的CUDA Core数量却从32增大到48,
每组SM,GF104包含了8个Tex(纹理单元)8个SFU,GF100则为4个Tex 4个SUF,使得图形性能能暴增;
GF104总共包含4个指令分发单元,GF100的为2个;
GF104的双精度仅为单精度的1/12,GF110的为1/8;
而且GF104还改进了Warp,当低负载时会有1个Warp闲置,而GF110的却不会。
以上充分说明GF104是一款游戏核芯,而GF110是一款通用计算核芯同事兼顾游戏。

大家留意一下就会发现GTX560TI和HD5870(Cypress也是一款不折不扣的游戏核芯)的性能很相近,如果当时重心放到GF104上面,首发的GTX480是GF104(其实GTX560TI没有碰到EDA电路设计问题的话,第一款就应该是完整核芯的)去对阵HD5870,就会发生和现在GTX680 VS HD7970一模一样的情况。
Fermi时代,因为老黄需要Tesla去开拓市场,所以必须首发GF110,才变成现实中这个版本。
到了Kepler时代,老黄算死了AMD的HD7970空有一身通用计算的武艺,却没有类似于Tesla的产品,所以重心就放到GK104上面,专心研发GK110。
在对比一下GK104和GF104,就会发现GK104是GF104的规格翻倍版:
GK104的GPC比GF104的多了一倍,GK104是4个,GF104是2个;
而Raster也随GPC扩了一倍,GK104是4个,GF104是2个;
Polymorph的数目一样,GK104的也升级到了2.0版本;
每组SM数量从GF104的48 CUDA Core增大四倍到192 CUDA Core,
每组SM,GK104包含了16个Tex,GF104则为8个,SFU更是夸张的从GF104的8个扩充四倍到32个,使得图形性能达到128TMUs,游戏性能暴增;
GK104包含8个指令分发单元,GF104是4个;
GF104更是达到了双精度仅为单精度的1/24,GF104的为1/12;
GK104的SMX所包含的任务调度单元(Warp Scheduler)也扩充到了4个,而GF104是2个。
再加上Boost,别看它编号低、晶体管少,核芯小,GK104就是不折不扣的旗舰拳头产品,对照GF100的情况,Tahiti的设计为了通用计算性能在核芯面积和晶体管上面是付出了正常代价的,其实就是新版的GF104 VS GF110缩小版。反观HD7000系列,Tahiti、Pitcairn、Cape Verde根本没有在架构上有实质性的变化。

其实老黄的双线设计,并不只是从GF104和GF110开始的,G92和GT200就是很明显的一对,G71和G80其实也是一对只是时间跨度稍微长了一点点,按照老黄双架构的市场更早去追述:
NV 5(Riva TNT2)和NV 10(Geforce 256,现在GTX680的祖宗)是在一个时期市场上的双架构产品;
NV 15(Geforce 2也就是后来的Geforce 4 MX系列)作为NV 10的改进型和NV 20(Geforce 3 TI)的改进型NV 25(Geforce 4 TI)也是在一个时期市场上的双架构产品;
NV 30(Geforce FX)、NV 35(Geforce FX)、NV 40(Geforce 6)和G70(Geforce 7)则是比较少见的但架构产品线,这个可能和NV30的失利有关。

综上所述,双线双架构的分布让老黄可以在兼顾游戏的方面,同时鞭及更加专业化的市场,ATI/AMD则一直都是单线单架构,这也是FirePro竞争不过Quadro的重要原因之一。
所以我认为GK104就是老黄这代的高端,至于GK110会不会出现在民用市场上,我觉得要看甜头有多少了,GK110民用光是供电和PCB设计就要花掉很多很多的成本,算上AIC的意见(GK104真的利润很高),GK104表现如此出色,个人认为GTX780是再次扩充两组GPC到2304SP的GK114也很有可能,位宽也会上升到人民群众喜闻乐见的384bit和3GB显存。

虚心交流,欢迎指正,不喜勿喷
2#
hyenax1950xtx 发表于 2012-8-7 16:38 | 显示全部楼层
Asuka 发表于 2012-8-7 09:28
双(多)架构产品线是老黄的固有手段毋庸置疑
我和你的理解差异仅仅存在于GK104是不是被逼上梁山充高端这 ...

先谢谢回复

我认为GK104并不存在被逼上梁山充高端的条件:
1. Asuka认为GK104是惯例中端的话就会后于GK100流片,而实际情况是GK104比GK100先流片,不同于Fermi时代GF100先于GF104流片的情况。我们再来看看GF100的开发周期,TSMC的40nm晶圆产出的第一片显卡是09年初的AMD的HD4770,老黄的第一片是09年底和HD5970同一天发布的GT240,而GF100是则到了10年4月,GF110更是到了10年底,时间跨度接近两年,而GK104的28nm从GF100发布起就开始了,再看看AMD,依靠Cypress的小核心优势,09年9月就发布了HD5870,这说明老黄在Kepler时代不会再去冒险搞大核心了,这很吃亏,因为之前大家都是先用小核芯试水新工艺后才开始在新工艺上研发新架构,自Cypress开始,AMD很快就能在新工艺上研发新的芯片(HD4770试水工艺、HD4890试水架构),为了不在28nm上再次吃亏,老黄果断启动GK104来挑大梁才不至于被AMD领先过多时间,事实我们看到的A/N首发28nm工艺的芯片都是旗舰级。
2. GK100消息一直在,但GK100的架构明显不是只为游戏而纯在的,甚至更过分的会缩减游戏性能提高通用计算性能,如果我是老黄,相同70亿晶体管的情况下,我会选择像HD5870一样胶水两颗GK104,而不是推GK100到游戏市场,从GF110的表现就可以发现,GF110/GF114单位晶体管对应游戏性能的比例明显GF114强很多,频率相对更高,做工更能缩减。

而流片的速度,其实很符合现在的定位,GK104→GK107→GK100→GK106,首发GK104主打桌面PC,其次GK107主打移动领域,都是和AMD一样抢占市场先机的利器,GK100主打计算卡领域,必须面对Intel的Xeon PHi和AMD的Tahiti,这个也是高利润领域。而GK106的市场,其实Fermi一家应付一年多完全没有压力,从老黄发布GF114的GTX560SE,我就知道GK106不会很早来,TSMC的28nm晶圆很贵的,而老黄又是全要模式的采购,用来大量铺货GK106明显没有Fermi一家划算。
3#
hyenax1950xtx 发表于 2012-8-7 20:39 | 显示全部楼层
nighttob 发表于 2012-8-7 20:02
同意你的说法。
NV现在已经不是只造图形卡了,很大部分精力已经放在通用计算和高性能计算上了。至于GK100 ...

谢谢支持

个人觉得通用计算领域的GK100走向民用的可能性极低,如果说GF114/GF110的相差不算太悬殊的话,互相向两个极端发展的GK104/GK100一定会在架构上很悬殊,扔掉那些通用计算并不需要的图形单元,会使得GK100在计算卡市场上更加如虎添翼,把一块并不适合图形计算的卡投放到民用图形市场的话会相当变扭,而且还得为了这个巨无霸配上极好的用料和PCB。
个人更倾向于GTX780是GK114,如果不再变动架构的话,在极低研发成本的情况下把GK104的规模放大1.5倍,达到50亿晶体管,扩充两组GPC,CUDA Core达到2304,再加两组64bit的显存控制器,达到384bit 3GB,面积控制在400mm²内,一定能让GCN 2.0的HD8970相当头疼。
4#
hyenax1950xtx 发表于 2012-8-7 21:47 | 显示全部楼层
FlankerWang 发表于 2012-8-7 21:21
个人对上次发布的GK110结构理解,这代110扔掉通用计算不需要的图形单元约=104规模放大? ...



GK110的SMX增加了4个额外的16-block双精度浮点单元
但是重点在于,15组SMX没有看到GPC组合也就是Raster引擎没了、然后SMX里面的PolyMorph引擎和包含的Vertex Fetch、Tessellator、Viewport Transform、Attribute Setup、Stream Output也全不见了

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?注册

x
您需要登录后才可以回帖 登录 | 注册

本版积分规则

快速回复 返回顶部