PCEVA,PC绝对领域,探寻真正的电脑知识
开启左侧

NVIDIA解密Volta显卡,完整5376核心,性能暴增50%

[复制链接]
绝对有料 发表于 2017-6-20 15:26 | 显示全部楼层 |阅读模式
点击数:6747|回复数:12
转自腾讯快报PCEVA:http://kuaibao.qq.com/s/20170620A0565000

8月初,AMD就将借RX Vega重新杀回高性能显卡市场。不过等待Vega的将不光是16nm Pascal显卡,还有新一代12nm FFN制程NVIDIA Volta显卡。今天英伟达公开了Volta核心的架构,确认了完整版Volta核心将拥有84组SM单元,共5376个CUDA核心,并且SM单元性能相比当代Pascal架构暴增50%。
image1.jpeg
Volta的每个SM单元具有64组FP32浮点单元、64组INT32整数单元、32组FP64双精度浮点单元、9个用于深度学习的Tensor单元、4个纹理单元以及8组512bit显存控制器。每个HBM2堆栈搭配2组显存控制器,总共有5376个CUDA核心(FP32、INT32)、2688个FP64单元、336个纹理单元、672个Tensor单元,还有4096bit的等效带宽、16GB HBM2显存,显存带宽达到900GB/s。
image2.jpeg
Volta将使用台积电为NVIDIA定制的12nm FFN制程,相比当前的16nm制程性能可提升10%,核心面积减少20%。使用Volta架构GV100核心的Tesla V100因而可以在相同TDP下相比前代计算卡Tesla P100(Pascal架构)大幅提升浮点运算性能。
image3.jpeg
GV100主要用作计算卡,而在游戏卡当中NVIDIA势必会砍去对游戏没有价值的Tensor深度学习单元,并减少L2缓存、重组SM单元,游戏用的GV102的游戏性能相比Pascal架构势必会再上一个新的高度。

短毛神拳 发表于 2017-6-20 16:37 | 显示全部楼层
沙发,坐等矿难
小钻风 发表于 2017-6-20 16:40 | 显示全部楼层
关键不是这个GV100,而是之后会用在显卡上的GV104这种,会不会大幅超越GP核心
440BX 发表于 2017-6-20 16:45 | 显示全部楼层
5376个CUDA核心。 啥时候能堆到一万个
tokimemo 发表于 2017-6-20 18:13 | 显示全部楼层
怪不得老黄做矿卡,看来真的是要清货了
熊苯熊 发表于 2017-6-20 20:25 | 显示全部楼层
并且SM单元性能相比当代Pascal架构暴增50%   我只好奇还是不是拉频率提升的性能
mustardgs 发表于 2017-6-20 21:18 | 显示全部楼层
老黄表示amd是啥能吃么
donnyng 发表于 2017-6-20 22:47 | 显示全部楼层
mustardgs 发表于 2017-6-20 21:18
老黄表示amd是啥能吃么

不能吃。能吃,吃了可能还要吃反垄断法。过…
来自安卓客户端来自安卓客户端
twilight_SQ 发表于 2017-6-21 08:50 | 显示全部楼层
游戏卡啥时候出?明年的三四月份?
飞翔的企鹅 发表于 2017-6-21 15:42 | 显示全部楼层
twilight_SQ 发表于 2017-6-21 08:50
游戏卡啥时候出?明年的三四月份?

按照以前的惯例应该是GP204的帕斯卡马甲,但这代volta大核心已经出来了打破惯例了?
FlankerWang 发表于 2017-6-21 16:02 | 显示全部楼层
飞翔的企鹅 发表于 2017-6-21 15:42
按照以前的惯例应该是GP204的帕斯卡马甲,但这代volta大核心已经出来了打破惯例了? ...

哪来的惯例?770之后还有马甲?
topsky 发表于 2017-6-21 16:08 | 显示全部楼层
仰望高端卡, 买不起啊
aibo 发表于 2017-6-23 09:30 | 显示全部楼层
熊苯熊 发表于 2017-6-20 20:25
并且SM单元性能相比当代Pascal架构暴增50%   我只好奇还是不是拉频率提升的性能 ...

当然不是。

就是跑相同频率,功耗减少1/3左右。同功耗可以多堆40~50%的规模。
就像v100的5120sp和p100的3584sp差不多同功耗能跑一样的频率
您需要登录后才可以回帖 登录 | 注册

本版积分规则

快速回复 返回顶部