本帖最后由 奇趣怪谈 于 2018-9-12 16:47 编辑
Videocardz大佬拿到了将在9月14日公布的图灵核心白皮书,也为我们解释了为啥老黄把图灵核心称之为飞跃的进步。
图中这张图是小编做的,可放大对比,从左到右分别是TU102、GP102、GP100核心的SM单元架构图,可以看到图灵核心的结构相比帕斯卡核心有了显著大改。首先在执行单元部分,加入INT32和Tensor核心,去掉原本的SFU( Special Function Units)单元,单精度单元部分保持不变,和GP102一样,砍掉全部的双精度单元(不知道图灵核心有没有双精度单元,按规格可能会有TU100,但按老黄现在分开图灵和伏特核心的设计,未必会有双精度单元),加入INT32单元的设计可以让图灵核心并行执行浮点运算和非浮点运算,提高运行效率,LD/ST加载储存单元不变,调度器和分发单元也保持不变,寄存器因为没有标示,不知道数量,再下边的缓存部分,不再单独设立L1/纹理缓存,SM单元和纹理单元共享L1/共享缓存,英伟达声称 INT32/FP32核心的设计以及其他针对并行处理的新设计,将会让CUDA的性能提升50%。至于Tensor Core和RT Core就不用多说了,它们是实现光线追踪技术最重要的一环结构。
除此之外还首次公布了RTX 2070的核心为全新的TU106核心,并非是从TU104上屏蔽而来,基本就是TU102规格砍半而来,核心面积445mm²,依然比GP104大131mm²。
TU102、TU104、TU106的完整架构示意图。
|