GV100发布，815平方毫米巨兽，12nm？？

haomingci3 · 发表于 2017-5-11 10:34

专业领域老黄号称能提升一倍的速度（专业软件），单精度浮点15，与上代的10.6刚好强41%，与GV100 5120CUDA 对上代 3584CUDA提升的43%非常近似，应该是做了底层优化来降低延迟，而浮点这种硬指标主要靠规模来提升，功耗上看起来非常强劲，能耗比提升完全不逊于之前两代的提升。
GV100这种核心用12nm我很意外，不过这个12nm（12FFN）是否就是早期曝光的12nm（12FFC?/16FFC+）存在疑问，晶体管密度上GV100比GP100仅提升3.22%，甚至比不上GM200对GK110的3.3%的密度提升，与GP100对GM200 88.4%的提升完全不在一个量级上。而早前曝光的12nm比16ffc工艺密度都大25%，台积电官网称16ffc是16+的缩小版，理论上来说这个12nm对晶体管密度的提升应该很大才是（大致应当是650mm2）。不过密度大不一定都是好事，性能强就好，至于能耗比提升是否来自这个12FFN也有待观察，架构本身带来能耗比飞跃可是有先例的（麦克斯韦）

haomingci3 · 发表于 2017-5-11 10:49

从anandtech那里得到了部分解释，
“ In terms of die size and transistor count, NVIDIA is genuinely building the biggest GPU they can get away with: 21 billion transistors, at a massive 815mm2, built on TSMC’s still green 12nm “FFN” process (the ‘n’ stands for NVIDIA; it’s a customized higher perf version of 12nm for NVIDIA).”
这个12FFN是为NVIDIA定制的一个12nm，与之前的12nmFFC完全不同，在密度上与16+工艺非常接近（甚至可能可以说是一样，3.2%是不是架构造成的还不一定呢），很可能是通过加高鱼鳍的办法对导通和漏电控制进行了强化，或者是在16+基础上专门针对伏特架构进行了适应性调整

PC_MasterRace · 发表于 2017-5-11 12:37

期待GTX2080，期待GV104

小夜叉 · 发表于 2017-5-11 13:00

GV都拍了，AV啥时候拍.........AMD家的AV

飞翔的企鹅 · 发表于 2017-5-11 13:34

haomingci3 发表于 2017-5-11 10:49
从anandtech那里得到了部分解释，
“ In terms of die size and transistor count, NVIDIA is genuinely bu ...

intel不是说三星和台积电1Xnm虚标么？按这说的没有差异那12NM怎么来的

haomingci3 · 发表于 2017-5-11 15:44

本帖最后由 haomingci3 于 2017-5-12 04:24 编辑

飞翔的企鹅发表于 2017-5-11 13:34
intel不是说三星和台积电1Xnm虚标么？按这说的没有差异那12NM怎么来的

就目前的信息来看这个12FFN与16+密度差异不大，就算是换作小核心密度其实也不会有巨大差距，多数小核心密度反而有所下降：
GCN1.0：7900-0.1182亿/mm2，7800-0.1179亿/mm2，7700-0.1220
开普勒：GK110-0.1289亿/mm2，GK104-0.1204，GK106-0.1149，GK107-0.1102
麦克斯韦：GM200-0.1331亿/mm2，GM204-0.1307，GM206-0.1289，GM107-0.1264
帕斯卡：GP100-0.2508亿/mm2，GP102-0.2548，GP104-0.2293，GP106-0.2200，GP107-0.2500(用的是14nm）
北极星：北极星10-0.2457亿/mm2，北极星11-0.2439
伏特：GV100-0.2589亿/mm2
密度没逃脱16nm+的范围

厂商对于同代工艺会根据芯片定位进行密度调整，高性能芯片一般用的工艺密度都较小（高性能是根据频率来说的，不涉及规模），叫12nm有两种推想：
1、市场营销更顺利，因为实际密度较低，高性能表现比真正的12FFC高，营销和口碑双赢。看着intel傻傻的在那里14+完再++，市场还以为你万年14nm没差别。
2、10nm/12FFC因为密度微缩会需要改进3D晶体管高度等底层项目来避免高密度带来的性能损失，12FFN密度与16+接近基本不存在密度带来的性能损失，此时又加上10nm/12nm的底层优化项目那么性能提升和功耗下降都是可行的，也就是说12FFN的命名可能是根据底层优化级别来判定而非根据密度判定。

PS：一般越是高频率、高ipc架构设计的芯片其晶体管密度就可能越低，因为有流水线设计和其他一系列复杂的项目要占用空间，SNB E-0.0521亿/mm2，IVB E-0.0723亿/mm2，HASWELL E-0.0730亿/mm2，skylake-0.1552亿/mm2（处理器这部分不是我总结的，数据可能存在误差），对比上面的GPU密度要差不少，haswell对比传说中的苹果A7-0.098亿/mm2都有差距。。不同芯片对于高性能工艺的需求也是不同的，如nand芯片对工艺性能的要求就很低，intel 730的超频nand也不过500mhz，所以早前NAND一直都领先用着密度最大的工艺；而桌面CPU则是对工艺性能要求非常高，因为其原生频率要求很高，GPU对高性能工艺的需求反而低一些，因为GPU的原生频率低，又能够堆砌规模涨性能。
而就目前看，伏特的频率并未提升，单精度浮点提升基本符合CUDA数量增加量，即ipc没增加，架构本身吃掉密度的可能性较小（当然不排除老黄有黑科技，但上次黑科技麦克斯韦也没去吃密度啊）。

tsammammb · 发表于 2017-5-11 19:27

难道也学intel把skylake refresh叫成kabylake

GeForceTi4200 · 发表于 2017-5-11 21:05

815，这真是一个大核心。

haomingci3 · 发表于 2017-5-12 17:32

tsammammb 发表于 2017-5-11 19:27
难道也学intel把skylake refresh叫成kabylake

就工艺上来说这个12FFN和14nm+的路线很像，但这本身就是对的路线，intel自己那个初代14nm在中低性能平台（3.5ghz以下）表现优秀，而且是频率越低越优秀，进步可以打90分；但是对于高性能平台而言，初代14nm就顶多能打60分，因为它本身只有一半高性能工艺的特点（好的一半是性能高时功耗下降），但其频率“甜点”太低，高频加压太严重，导致初代14nm在性能上甚至还不如22nm。14nm+作为高性能工艺对比上代的话高性能能打90分，对比22nm的话也能打80分。那个12FFC是16+的低功耗高密度版，拿来用最好情况就是个intel初代14nm（就台积电的定位来说12FFC根本无法上这个性能级别的产品），差的情况是不止频率低功耗还高。基于16+的密度进行底层优化12FFN比真正去用12FFC强多了。

GV100发布，815平方毫米巨兽，12nm？？

本帖子中包含更多资源