PCEVA,PC绝对领域,探寻真正的电脑知识
打印 上一主题 下一主题
开启左侧

NVIDIA发布12nm GV100核心

[复制链接]
跳转到指定楼层
1#
奇趣怪谈 发表于 2017-5-11 11:51 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
点击数:3835|回复数:8
本帖最后由 奇趣怪谈 于 2017-5-11 11:54 编辑


老黄在昨天的GTC2017上发布了Tesla V100计算卡,搭载最新的Volta架构GV100核心,采用台积电12nm FNN工艺,拥有5120个CUDA核心,210亿晶体管,核心面积815mm² ,核心频率1455MHz,配备16GB HBM2显存,显存带宽可达900GB/s,单精度浮点性能15 TFLOPs,采用NVLink2.0接口,带宽可达300GB/s。


全新的GV100核心在架构上还增加了全新的Tensor核心,主要用于深度机器学习方面的计算,类似于谷歌的AI神经网络,估计消费级是没这东西了。


Tesla V100完整规格表。


全新的Volta架构GV100核心完整规格有6组GPC单元,每组GPC单元有14组SM单元,每组SM单元里有64个CUDA核心,所以完整GV100核心是有5376个CUDA核心,但在Tesla V100中只启用其中80组SM单元,所以只有5120个CUDA核心。从上面规格可以看到GV100有5120个FP32单元,2560个FP64单元,640个Tensor处理器,大概是8:4:1的比例。Tesla V100将首先用在深度学习超级计算机DGX-1上,内部拥有8张Tesla V100计算卡,峰值计算性能高达960 TFLOPS,号称用8个小时就能完成TITAN X八天的工作量。
价格方面,DGX-1的售价为14.9万美元,约合人民币102万元。






本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?注册

x
2#
飞翔的企鹅 发表于 2017-5-11 13:31 | 只看该作者
这代Gv100居然都不是完整核心?是准备以后出个V100 X么

这个用上12nm是不是意味着volta桌面版也会上12NM
3#
aibo 发表于 2017-5-11 16:34 | 只看该作者
飞翔的企鹅 发表于 2017-5-11 13:31
这代Gv100居然都不是完整核心?是准备以后出个V100 X么

这个用上12nm是不是意味着volta桌面版也会上12NM ...

上一代GP100也不是完整的,而且从现在来看也没有完整的啊

4#
tsammammb 发表于 2017-5-11 19:20 | 只看该作者
本帖最后由 tsammammb 于 2017-5-11 19:29 编辑

感觉12nm比16nm数字上的变化远大于实际尺寸的变化
5#
atmosphere 发表于 2017-5-11 20:49 | 只看该作者
tsammammb 发表于 2017-5-11 19:20
感觉12nm比16nm数字上的变化远大于实际尺寸的变化

就是数字的变化。。12FFN是台积电给NV做的16NM改良定制版

6#
GeForceTi4200 发表于 2017-5-11 21:08 | 只看该作者
aibo 发表于 2017-5-11 16:34
上一代GP100也不是完整的,而且从现在来看也没有完整的啊

大核心,良率肯定低的可怜。
7#
dogbear 发表于 2017-5-12 15:53 | 只看该作者
感觉这个volta更多的是量变,不是质变
8#
dosmatters 发表于 2017-5-13 23:45 | 只看该作者
Tensor消费级肯定被砍,比FP64还多余的东西,估计功耗也不低
9#
黄进平1953 发表于 2017-5-17 23:22 | 只看该作者
Tensor单元本质就是经过优化int8整数计算单元,按照NV的架构设计,每个SM里以前主要是FP32计算单元,GP10x里增加FP16和FP64单元,GV10x里增加的int8计算单元。对于AI这种逻辑计算,浮点是大材小用,只需要整数计算单元即可,而整数计算所需的晶体管要比浮点少得多
您需要登录后才可以回帖 登录 | 注册

本版积分规则

快速回复 返回顶部