本帖最后由 奇趣怪谈 于 2017-5-11 11:54 编辑
老黄在昨天的GTC2017上发布了Tesla V100计算卡,搭载最新的Volta架构GV100核心,采用台积电12nm FNN工艺,拥有5120个CUDA核心,210亿晶体管,核心面积815mm² ,核心频率1455MHz,配备16GB HBM2显存,显存带宽可达900GB/s,单精度浮点性能15 TFLOPs,采用NVLink2.0接口,带宽可达300GB/s。
全新的GV100核心在架构上还增加了全新的Tensor核心,主要用于深度机器学习方面的计算,类似于谷歌的AI神经网络,估计消费级是没这东西了。
Tesla V100完整规格表。
全新的Volta架构GV100核心完整规格有6组GPC单元,每组GPC单元有14组SM单元,每组SM单元里有64个CUDA核心,所以完整GV100核心是有5376个CUDA核心,但在Tesla V100中只启用其中80组SM单元,所以只有5120个CUDA核心。从上面规格可以看到GV100有5120个FP32单元,2560个FP64单元,640个Tensor处理器,大概是8:4:1的比例。Tesla V100将首先用在深度学习超级计算机DGX-1上,内部拥有8张Tesla V100计算卡,峰值计算性能高达960 TFLOPS,号称用8个小时就能完成TITAN X八天的工作量。
价格方面,DGX-1的售价为14.9万美元,约合人民币102万元。
|