PCEVA,PC绝对领域,探寻真正的电脑知识
开启左侧

GV100发布,815平方毫米巨兽,12nm??

[复制链接]
haomingci3 发表于 2017-5-11 10:34 | 显示全部楼层 |阅读模式
点击数:3815|回复数:8
专业领域老黄号称能提升一倍的速度(专业软件),单精度浮点15,与上代的10.6刚好强41%,与GV100 5120CUDA 对上代 3584CUDA提升的43%非常近似,应该是做了底层优化来降低延迟,而浮点这种硬指标主要靠规模来提升,功耗上看起来非常强劲,能耗比提升完全不逊于之前两代的提升。
GV100这种核心用12nm我很意外,不过这个12nm(12FFN)是否就是早期曝光的12nm(12FFC?/16FFC+)存在疑问,晶体管密度上GV100比GP100仅提升3.22%,甚至比不上GM200对GK110的3.3%的密度提升,与GP100对GM200 88.4%的提升完全不在一个量级上。而早前曝光的12nm比16ffc工艺密度都大25%,台积电官网称16ffc是16+的缩小版,理论上来说这个12nm对晶体管密度的提升应该很大才是(大致应当是650mm2)。不过密度大不一定都是好事,性能强就好,至于能耗比提升是否来自这个12FFN也有待观察,架构本身带来能耗比飞跃可是有先例的(麦克斯韦)

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?注册

x
haomingci3  楼主| 发表于 2017-5-11 10:49 | 显示全部楼层
从anandtech那里得到了部分解释,
“ In terms of die size and transistor count, NVIDIA is genuinely building the biggest GPU they can get away with: 21 billion transistors, at a massive 815mm2, built on TSMC’s still green 12nm “FFN” process (the ‘n’ stands for NVIDIA; it’s a customized higher perf version of 12nm for NVIDIA).”
这个12FFN是为NVIDIA定制的一个12nm,与之前的12nmFFC完全不同,在密度上与16+工艺非常接近(甚至可能可以说是一样,3.2%是不是架构造成的还不一定呢),很可能是通过加高鱼鳍的办法对导通和漏电控制进行了强化,或者是在16+基础上专门针对伏特架构进行了适应性调整
PC_MasterRace 发表于 2017-5-11 12:37 | 显示全部楼层
期待GTX2080,期待GV104
小夜叉 发表于 2017-5-11 13:00 | 显示全部楼层
GV都拍了,AV啥时候拍.........AMD家的AV
飞翔的企鹅 发表于 2017-5-11 13:34 | 显示全部楼层
haomingci3 发表于 2017-5-11 10:49
从anandtech那里得到了部分解释,
“ In terms of die size and transistor count, NVIDIA is genuinely bu ...

intel不是说三星和台积电1Xnm虚标么?按这说的没有差异那12NM怎么来的
haomingci3  楼主| 发表于 2017-5-11 15:44 | 显示全部楼层
本帖最后由 haomingci3 于 2017-5-12 04:24 编辑
飞翔的企鹅 发表于 2017-5-11 13:34
intel不是说三星和台积电1Xnm虚标么?按这说的没有差异那12NM怎么来的

就目前的信息来看这个12FFN与16+密度差异不大,就算是换作小核心密度其实也不会有巨大差距,多数小核心密度反而有所下降:
GCN1.0:7900-0.1182亿/mm2,7800-0.1179亿/mm2,7700-0.1220
开普勒:GK110-0.1289亿/mm2,GK104-0.1204,GK106-0.1149,GK107-0.1102
麦克斯韦:GM200-0.1331亿/mm2,GM204-0.1307,GM206-0.1289,GM107-0.1264
帕斯卡:GP100-0.2508亿/mm2,GP102-0.2548,GP104-0.2293,GP106-0.2200,GP107-0.2500(用的是14nm)
北极星:北极星10-0.2457亿/mm2,北极星11-0.2439
伏特:GV100-0.2589亿/mm2
密度没逃脱16nm+的范围

厂商对于同代工艺会根据芯片定位进行密度调整,高性能芯片一般用的工艺密度都较小(高性能是根据频率来说的,不涉及规模),叫12nm有两种推想:
1、市场营销更顺利,因为实际密度较低,高性能表现比真正的12FFC高,营销和口碑双赢。看着intel傻傻的在那里14+完再++,市场还以为你万年14nm没差别。
2、10nm/12FFC因为密度微缩会需要改进3D晶体管高度等底层项目来避免高密度带来的性能损失,12FFN密度与16+接近基本不存在密度带来的性能损失,此时又加上10nm/12nm的底层优化项目那么性能提升和功耗下降都是可行的,也就是说12FFN的命名可能是根据底层优化级别来判定而非根据密度判定。

PS:一般越是高频率、高ipc架构设计的芯片其晶体管密度就可能越低,因为有流水线设计和其他一系列复杂的项目要占用空间,SNB E-0.0521亿/mm2,IVB E-0.0723亿/mm2,HASWELL E-0.0730亿/mm2,skylake-0.1552亿/mm2(处理器这部分不是我总结的,数据可能存在误差),对比上面的GPU密度要差不少,haswell对比传说中的苹果A7-0.098亿/mm2都有差距。。不同芯片对于高性能工艺的需求也是不同的,如nand芯片对工艺性能的要求就很低,intel 730的超频nand也不过500mhz,所以早前NAND一直都领先用着密度最大的工艺;而桌面CPU则是对工艺性能要求非常高,因为其原生频率要求很高,GPU对高性能工艺的需求反而低一些,因为GPU的原生频率低,又能够堆砌规模涨性能。
而就目前看,伏特的频率并未提升,单精度浮点提升基本符合CUDA数量增加量,即ipc没增加,架构本身吃掉密度的可能性较小(当然不排除老黄有黑科技,但上次黑科技麦克斯韦也没去吃密度啊)。




tsammammb 发表于 2017-5-11 19:27 | 显示全部楼层
难道也学intel把skylake refresh叫成kabylake
GeForceTi4200 发表于 2017-5-11 21:05 | 显示全部楼层
815,  这真是一个大核心。
haomingci3  楼主| 发表于 2017-5-12 17:32 | 显示全部楼层
tsammammb 发表于 2017-5-11 19:27
难道也学intel把skylake refresh叫成kabylake

就工艺上来说这个12FFN和14nm+的路线很像,但这本身就是对的路线,intel自己那个初代14nm在中低性能平台(3.5ghz以下)表现优秀,而且是频率越低越优秀,进步可以打90分;但是对于高性能平台而言,初代14nm就顶多能打60分,因为它本身只有一半高性能工艺的特点(好的一半是性能高时功耗下降),但其频率“甜点”太低,高频加压太严重,导致初代14nm在性能上甚至还不如22nm。14nm+作为高性能工艺对比上代的话高性能能打90分,对比22nm的话也能打80分。那个12FFC是16+的低功耗高密度版,拿来用最好情况就是个intel初代14nm(就台积电的定位来说12FFC根本无法上这个性能级别的产品),差的情况是不止频率低功耗还高。基于16+的密度进行底层优化12FFN比真正去用12FFC强多了。

您需要登录后才可以回帖 登录 | 注册

本版积分规则

快速回复 返回顶部