PCEVA,PC绝对领域,探寻真正的电脑知识
开启左侧

从GTX980/970/960差异看 MAXWELL 2.0 NV显卡变革

[复制链接]
bz_neo 发表于 2014-11-21 12:38 | 显示全部楼层 |阅读模式
点击数:3126|回复数:0
GTX980/970上市有一段时间了,从参数来看,这两张卡的参数确实很接近,打开GTX980和GTX970的GPU参数信息,可以发现 大体规格一模一样 有区别的地方只有三个  ROPs/TMUs  Shaders 核心频率。频率的区分很小。差别主要在Shaders。ROPs/TMUs 和 Shaders。
DSC02911.jpg



DSC02912.jpg



DSC02915.jpg



DSC02925.jpg



DSC02927.jpg

GTX970 GPU信息 970基础.jpg

GTX980 GPU信息
980_GPU.jpg

频率的差别在100MHZ之内 主要差别其实就在 970比980少三组 SMM (ROPs/TMUs有争议,根据资料970的 ROPs应该可以980是一样的)
970_JX.jpg

通过测试,同平台下,少三组SMM 的970 的性能只有980的 75%左右 无论是跑分 还是游戏都有印证这一点。
980 跑分测试截图 980_3D13_P.jpg

980_3D13_X.jpg

970 跑分测试截图 9703DFS.jpg

970FS_e.jpg

980孤岛危机3游戏帧数测试截图
孤岛 FPS 测试.jpg


970孤岛危机3游戏帧数测试截图
孤岛危机3_帧数.jpg

MAXWELL 1.0核心是NV变革的开始,在MAXWELL核心NV引入了能耗比的概念。能耗比其实说白了就是能耗的降低和执行效率的提升。
kp.jpg

最近GTX960的消息很多,有一条消息引起了大家的注意就是GTX960将不会子在显存及位宽上进行阉割仍然是保持 256bit 4G DDR5的格局。网上GTX960的 参数也已经曝光,同样的显存大小 和位宽,差异也仅仅是 Shaders 单元  ROPs/TMUs。

gm206.jpg

可见NV变革的重点就恰恰在这Shaders 和 ROPs/TMUs 上。细心的人会发现,这一代MAXWEll的 Shaders 命名有所不同,上一代叫SMX “Streaming Multiprocessor Xtreme”(极致流式多处理器),麦克斯韦上则是SMM,全称为“Streaming Multiprocessor of Maxwell”(麦克斯韦流式多处理器) SMX 其实就是SMM的改进和精简版,新的SMM单元仅包含2组共计8个Texture Array,所以Kepler相对而言是一个更偏重于图形操作的架构,而Maxwell则将注意力更多地集中在了运算和任务效率层面 smm.jpg

NV尽了很多努力通过对控制逻辑分区、负荷均衡、时钟门控粒度、编译器调度、每时钟周期发出指令条数等方面的优化改进每个SM的尺寸得到大幅缩减,而性能却能够达到一个Kepler核心 SM的90%多。更小的晶体管消耗让NVIDIA能够在每颗GPU中实现更多数量的SMM。Maxwell架构的高效使得NVIDIA在核心面积没有翻倍的情况就实现了SM单元数量翻倍的目标。
56a7b151f819861800ef34e349ed2e738ad4e66e.jpg

NV一边尽了很多努力改变控制逻辑分区以及SM的实现方式使单位面积上的流处理器密度增加30%,晶体管密度增加15%,减少SMM晶体管消耗, 一边却又毫不吝啬地把有限的晶体管资源去实现更大的ROPs规模。这是因为NVIDIA意识到在驱动层面跟进分辨率时代的脚步的同时,扩充显卡硬实力迫在眉睫,而光栅操作单元对于抗锯齿以及处理高分辨率起着至关重要的作用,所以这次光栅单元成为Maxwell重点变更区。
ROP/MC配比一直没有改变,一直维持8 ROPs per MC。NVIDIA这次不计成本地对ROPs进行了翻倍,从 8 ROPs per MC提高到了16 ROPs per MC,使二代Maxwell在AA、高分辨率下的表现接近于同位宽一代Maxwell和Kepler的2倍。目的是使显卡真正具备流畅运行超高分辨率游戏的能力。
通过游戏测试我们发现GTX980在高分辨率画质的较量中获得了更好的帧数表现,和AMD一样并没有明显的衰减,这一现状告诉我们,位宽时代已经成为过去,主宰显卡等级的光栅时代和Shaders时代已经到来。因此麦克斯韦的核心,只要基于SMM 任何规模和显卡的性能都能得到解释
8bba1c950a7b0208339ff88661d9f2d3562cc844.jpg

GTX980 16组SMM高于15组的GTX780Ti。在频率优势下GM204的理论性能是GK110的106.67%(16/15)GTX 970的理论规格是少于GTX780 1组,由于频率的优势,GTX970可以轻松追平GTX780。GTX960拥有10组SMM,GTX770仅8组SMX,所以可以预见GTX960将稳超 GTX770。
可见以后区分显卡性能的主要指标将是先端SMM和 后端 ROPs/TMUs 的配比 显存的位宽将退居次要地位 NV的 TDCC技术将弥补显存带宽的不足。可以遇见 64 ROPs 48ROPs 32ROPs 16ROPs 将对应NV显卡的层级划分。



您需要登录后才可以回帖 登录 | 注册

本版积分规则

快速回复 返回顶部