GTX980/970上市有一段时间了,从参数来看,这两张卡的参数确实很接近,打开GTX980和GTX970的GPU参数信息,可以发现 大体规格一模一样 有区别的地方只有三个 ROPs/TMUs Shaders 核心频率。频率的区分很小。差别主要在Shaders。ROPs/TMUs 和 Shaders。
GTX970 GPU信息
GTX980 GPU信息
频率的差别在100MHZ之内 主要差别其实就在 970比980少三组 SMM (ROPs/TMUs有争议,根据资料970的 ROPs应该可以980是一样的)
通过测试,同平台下,少三组SMM 的970 的性能只有980的 75%左右 无论是跑分 还是游戏都有印证这一点。
980 跑分测试截图
970 跑分测试截图
980孤岛危机3游戏帧数测试截图
970孤岛危机3游戏帧数测试截图
MAXWELL 1.0核心是NV变革的开始,在MAXWELL核心NV引入了能耗比的概念。能耗比其实说白了就是能耗的降低和执行效率的提升。
最近GTX960的消息很多,有一条消息引起了大家的注意就是GTX960将不会子在显存及位宽上进行阉割仍然是保持 256bit 4G DDR5的格局。网上GTX960的 参数也已经曝光,同样的显存大小 和位宽,差异也仅仅是 Shaders 单元 ROPs/TMUs。
可见NV变革的重点就恰恰在这Shaders 和 ROPs/TMUs 上。细心的人会发现,这一代MAXWEll的 Shaders 命名有所不同,上一代叫SMX “Streaming Multiprocessor Xtreme”(极致流式多处理器),麦克斯韦上则是SMM,全称为“Streaming Multiprocessor of Maxwell”(麦克斯韦流式多处理器) SMX 其实就是SMM的改进和精简版,新的SMM单元仅包含2组共计8个Texture Array,所以Kepler相对而言是一个更偏重于图形操作的架构,而Maxwell则将注意力更多地集中在了运算和任务效率层面
NV尽了很多努力通过对控制逻辑分区、负荷均衡、时钟门控粒度、编译器调度、每时钟周期发出指令条数等方面的优化改进每个SM的尺寸得到大幅缩减,而性能却能够达到一个Kepler核心 SM的90%多。更小的晶体管消耗让NVIDIA能够在每颗GPU中实现更多数量的SMM。Maxwell架构的高效使得NVIDIA在核心面积没有翻倍的情况就实现了SM单元数量翻倍的目标。
NV一边尽了很多努力改变控制逻辑分区以及SM的实现方式使单位面积上的流处理器密度增加30%,晶体管密度增加15%,减少SMM晶体管消耗, 一边却又毫不吝啬地把有限的晶体管资源去实现更大的ROPs规模。这是因为NVIDIA意识到在驱动层面跟进分辨率时代的脚步的同时,扩充显卡硬实力迫在眉睫,而光栅操作单元对于抗锯齿以及处理高分辨率起着至关重要的作用,所以这次光栅单元成为Maxwell重点变更区。
ROP/MC配比一直没有改变,一直维持8 ROPs per MC。NVIDIA这次不计成本地对ROPs进行了翻倍,从 8 ROPs per MC提高到了16 ROPs per MC,使二代Maxwell在AA、高分辨率下的表现接近于同位宽一代Maxwell和Kepler的2倍。目的是使显卡真正具备流畅运行超高分辨率游戏的能力。
通过游戏测试我们发现GTX980在高分辨率画质的较量中获得了更好的帧数表现,和AMD一样并没有明显的衰减,这一现状告诉我们,位宽时代已经成为过去,主宰显卡等级的光栅时代和Shaders时代已经到来。因此麦克斯韦的核心,只要基于SMM 任何规模和显卡的性能都能得到解释
GTX980 16组SMM高于15组的GTX780Ti。在频率优势下GM204的理论性能是GK110的106.67%(16/15)GTX 970的理论规格是少于GTX780 1组,由于频率的优势,GTX970可以轻松追平GTX780。GTX960拥有10组SMM,GTX770仅8组SMX,所以可以预见GTX960将稳超 GTX770。
可见以后区分显卡性能的主要指标将是先端SMM和 后端 ROPs/TMUs 的配比 显存的位宽将退居次要地位 NV的 TDCC技术将弥补显存带宽的不足。可以遇见 64 ROPs 48ROPs 32ROPs 16ROPs 将对应NV显卡的层级划分。
|