英伟达图灵核心架构公布

奇趣怪谈 · 发表于 2018-9-12 16:42

本帖最后由奇趣怪谈于 2018-9-12 16:47 编辑

Videocardz大佬拿到了将在9月14日公布的图灵核心白皮书，也为我们解释了为啥老黄把图灵核心称之为飞跃的进步。

图中这张图是小编做的，可放大对比，从左到右分别是TU102、GP102、GP100核心的SM单元架构图，可以看到图灵核心的结构相比帕斯卡核心有了显著大改。首先在执行单元部分，加入INT32和Tensor核心，去掉原本的SFU（ Special Function Units）单元，单精度单元部分保持不变，和GP102一样，砍掉全部的双精度单元（不知道图灵核心有没有双精度单元，按规格可能会有TU100，但按老黄现在分开图灵和伏特核心的设计，未必会有双精度单元），加入INT32单元的设计可以让图灵核心并行执行浮点运算和非浮点运算，提高运行效率，LD/ST加载储存单元不变，调度器和分发单元也保持不变，寄存器因为没有标示，不知道数量，再下边的缓存部分，不再单独设立L1/纹理缓存，SM单元和纹理单元共享L1/共享缓存，英伟达声称 INT32/FP32核心的设计以及其他针对并行处理的新设计，将会让CUDA的性能提升50%。至于Tensor Core和RT Core就不用多说了，它们是实现光线追踪技术最重要的一环结构。

除此之外还首次公布了RTX 2070的核心为全新的TU106核心，并非是从TU104上屏蔽而来，基本就是TU102规格砍半而来，核心面积445mm²，依然比GP104大131mm²。

TU102、TU104、TU106的完整架构示意图。

wsy2220 · 发表于 2018-9-12 20:09

双精度砍光？那还玩个p

440BX · 发表于 2018-9-12 20:56

wsy2220 发表于 2018-9-12 20:09
双精度砍光？那还玩个p

玩游戏

fanli1230 · 发表于 2018-9-12 21:38

游戏和其它用途分开，这个做法个人很支持

atmosphere · 发表于 2018-9-12 22:25

fanli1230 发表于 2018-9-12 21:38
游戏和其它用途分开，这个做法个人很支持

目测图灵挖矿速度依然不会低

atmosphere · 发表于 2018-9-12 23:09

本帖最后由 atmosphere 于 2018-9-12 23:11 编辑

wsy2220 发表于 2018-9-12 20:09
双精度砍光？那还玩个p

正常了，从maxwell开始NV就开始砍游戏卡的双精度了，帕斯卡就已经砍光了

luciferdd · 发表于 2018-9-12 23:53

atmosphere 发表于 2018-9-12 23:09
正常了，从maxwell开始NV就开始砍游戏卡的双精度了，帕斯卡就已经砍光了

10系跟9系一样是1/32的双精度

atmosphere · 发表于 2018-9-13 01:10

luciferdd 发表于 2018-9-12 23:53
10系跟9系一样是1/32的双精度

我意思是没有独立的双精度浮点单元

redyan9985 · 发表于 2018-9-13 08:21

还会有矿卡吗？

bikkibakki · 发表于 2018-9-13 11:13

显卡挖矿已经无利可图了，即使出了矿卡也没人买
所以不会出了

txgy · 发表于 2018-9-13 17:42

INT32加入好评
tensor cores 和 RTX cores 占用的晶体管全部换成FP32和INT32才是我想要的图灵啊

Apache · 发表于 2018-9-13 22:48

不错，游戏玩家很稀饭

atmosphere · 发表于 2018-9-14 01:12

txgy 发表于 2018-9-13 17:42
INT32加入好评
tensor cores 和 RTX cores 占用的晶体管全部换成FP32和INT32才是我想要的图灵啊 ...

你要这么多低精度的晶体管干啥。。。

txgy · 发表于 2018-9-15 20:23

atmosphere 发表于 2018-9-14 01:12
你要这么多低精度的晶体管干啥。。。

有些计算单精度足够了

atmosphere · 发表于 2018-9-16 12:42

txgy 发表于 2018-9-15 20:23
有些计算单精度足够了

就是要来干啥啊。。。渲染画面基本都是浮点吧。