本帖最后由 hyenax1950xtx 于 2012-8-7 01:20 编辑
Asuka 发表于 2012-8-6 21:53
看来我还有点没叙述清楚
应该说 高端难产了
我到不觉得GK104是本该的中端,也许大家这么认为是和GF104/114命名相似导致的,其实是NV的双线策略。
我觉得GK104就是这代NV原本的高端货,先拿GF104/114和GF100/110的核芯对比就知道,这完全是两种架构的产品:
GF104的GPC比GF110的少一半,但是每组SM的CUDA Core数量却从32增大到48,
每组SM,GF104包含了8个Tex(纹理单元)8个SFU,GF100则为4个Tex 4个SUF,使得图形性能能暴增;
GF104总共包含4个指令分发单元,GF100的为2个;
GF104的双精度仅为单精度的1/12,GF110的为1/8;
而且GF104还改进了Warp,当低负载时会有1个Warp闲置,而GF110的却不会。
以上充分说明GF104是一款游戏核芯,而GF110是一款通用计算核芯同事兼顾游戏。
大家留意一下就会发现GTX560TI和HD5870(Cypress也是一款不折不扣的游戏核芯)的性能很相近,如果当时重心放到GF104上面,首发的GTX480是GF104(其实GTX560TI没有碰到EDA电路设计问题的话,第一款就应该是完整核芯的)去对阵HD5870,就会发生和现在GTX680 VS HD7970一模一样的情况。
Fermi时代,因为老黄需要Tesla去开拓市场,所以必须首发GF110,才变成现实中这个版本。
到了Kepler时代,老黄算死了AMD的HD7970空有一身通用计算的武艺,却没有类似于Tesla的产品,所以重心就放到GK104上面,专心研发GK110。
在对比一下GK104和GF104,就会发现GK104是GF104的规格翻倍版:
GK104的GPC比GF104的多了一倍,GK104是4个,GF104是2个;
而Raster也随GPC扩了一倍,GK104是4个,GF104是2个;
Polymorph的数目一样,GK104的也升级到了2.0版本;
每组SM数量从GF104的48 CUDA Core增大四倍到192 CUDA Core,
每组SM,GK104包含了16个Tex,GF104则为8个,SFU更是夸张的从GF104的8个扩充四倍到32个,使得图形性能达到128TMUs,游戏性能暴增;
GK104包含8个指令分发单元,GF104是4个;
GF104更是达到了双精度仅为单精度的1/24,GF104的为1/12;
GK104的SMX所包含的任务调度单元(Warp Scheduler)也扩充到了4个,而GF104是2个。
再加上Boost,别看它编号低、晶体管少,核芯小,GK104就是不折不扣的旗舰拳头产品,对照GF100的情况,Tahiti的设计为了通用计算性能在核芯面积和晶体管上面是付出了正常代价的,其实就是新版的GF104 VS GF110缩小版。反观HD7000系列,Tahiti、Pitcairn、Cape Verde根本没有在架构上有实质性的变化。
其实老黄的双线设计,并不只是从GF104和GF110开始的,G92和GT200就是很明显的一对,G71和G80其实也是一对只是时间跨度稍微长了一点点,按照老黄双架构的市场更早去追述:
NV 5(Riva TNT2)和NV 10(Geforce 256,现在GTX680的祖宗)是在一个时期市场上的双架构产品;
NV 15(Geforce 2也就是后来的Geforce 4 MX系列)作为NV 10的改进型和NV 20(Geforce 3 TI)的改进型NV 25(Geforce 4 TI)也是在一个时期市场上的双架构产品;
NV 30(Geforce FX)、NV 35(Geforce FX)、NV 40(Geforce 6)和G70(Geforce 7)则是比较少见的但架构产品线,这个可能和NV30的失利有关。
综上所述,双线双架构的分布让老黄可以在兼顾游戏的方面,同时鞭及更加专业化的市场,ATI/AMD则一直都是单线单架构,这也是FirePro竞争不过Quadro的重要原因之一。
所以我认为GK104就是老黄这代的高端,至于GK110会不会出现在民用市场上,我觉得要看甜头有多少了,GK110民用光是供电和PCB设计就要花掉很多很多的成本,算上AIC的意见(GK104真的利润很高),GK104表现如此出色,个人认为GTX780是再次扩充两组GPC到2304SP的GK114也很有可能,位宽也会上升到人民群众喜闻乐见的384bit和3GB显存。
虚心交流,欢迎指正,不喜勿喷 |