转自腾讯快报PCEVA:http://kuaibao.qq.com/s/20170620A0565000
8月初,AMD就将借RX Vega重新杀回高性能显卡市场。不过等待Vega的将不光是16nm Pascal显卡,还有新一代12nm FFN制程NVIDIA Volta显卡。今天英伟达公开了Volta核心的架构,确认了完整版Volta核心将拥有84组SM单元,共5376个CUDA核心,并且SM单元性能相比当代Pascal架构暴增50%。 Volta的每个SM单元具有64组FP32浮点单元、64组INT32整数单元、32组FP64双精度浮点单元、9个用于深度学习的Tensor单元、4个纹理单元以及8组512bit显存控制器。每个HBM2堆栈搭配2组显存控制器,总共有5376个CUDA核心(FP32、INT32)、2688个FP64单元、336个纹理单元、672个Tensor单元,还有4096bit的等效带宽、16GB HBM2显存,显存带宽达到900GB/s。 Volta将使用台积电为NVIDIA定制的12nm FFN制程,相比当前的16nm制程性能可提升10%,核心面积减少20%。使用Volta架构GV100核心的Tesla V100因而可以在相同TDP下相比前代计算卡Tesla P100(Pascal架构)大幅提升浮点运算性能。 GV100主要用作计算卡,而在游戏卡当中NVIDIA势必会砍去对游戏没有价值的Tensor深度学习单元,并减少L2缓存、重组SM单元,游戏用的GV102的游戏性能相比Pascal架构势必会再上一个新的高度。
|