本帖最后由 xeon_phi 于 2015-3-30 18:08 编辑
当我第一次知道要写DX12评测的时候,其实我是拒绝的。因为我觉得,你不能因为叫我写就马上写。第一我要确认一下,我又不想说,你写一篇评测写完以后,加很多特技,duang~跑分很高,很美,很炫,结果网友出来一定骂我,根本没有这种技术,证明那些跑分都是假的。我说先要给我研究一下,后来我才知道DX12真的很厉害。我看了半天下来之后呢,起码我看起来觉得很真,我每帧都看了,每帧都看我还给我的P家班看,来来来,大家都来看一看。
话说上周Futuremark发布了新的3DMark API Overhead系统开销性能测试。它基于2013年发布的3DMark,加入了对DX12、DX11、AMD Mantle API的性能差异性独立测试,这也是全球第一个DX12性能测试工具。虽然它只是个关注系统开销(Overhead)、绘制调用(Draw Call)的特殊测试工具,而不是模拟游戏场景的基准测试,因此更适合开发人员和技术玩家研究。Futuremark明确表示,它并非通用GPU基准测试,不能拿来对比不同厂商的GPU、APU,但如果都搭配同样的CPU,可以作为比较的依据,只是别太较真,这不代表不同显卡在未来DX12游戏里的实际表现。
谈到图形API的时候,GPU很重要,但低系统开销API的好处在于,能充分利用多核CPU来简化代码执行过程、消除软件瓶颈,尤其是绘制调用(Draw Call)的瓶颈。绘制调用发生于CPU每次通知GPU在屏幕上绘制物体时。电脑游戏的每一帧通常需要几千次绘制调用。图形API所处理的每次绘制调用都会增加CPU系统开销。随着绘制调用次数的增多,即便在GPU还有余力的情况下,图形引擎也会因API系统开销而受到限制。DX12、Mantle就能降低系统开销,从而使得更多的绘制调用成为可能。绘制调用的数量越多,图形引擎就能向屏幕绘制更多物件、纹理和特效。
该测试通过稳步增加绘制调用的方式来测试API的性能。测试所反馈的结果是在帧速率降低到30FPS之前,每个API每秒实现的最大绘制调用数量。API系统开销测试并非通用GPU基准测试,不能拿来对比A卡、N卡,因为只有在同一CPU作为限制因素的情况下,降低API系统开销的效益才是最佳的。
我们已在第一时间内完成了对新版3DMark的简单测试,因为是3DMark首次支持DX12,跑分难免有误差,我们尽可能的测了几遍,选取了分数的中间值
测试平台: 主板 技嘉Z87X-OC 内存 镁光 DDR3-2400 2x8GB 硬盘 浦科特 M6P 256GB 显卡 微星(MSI)GTX 960 GAMING 100ME 系统 Windows 10技术预览版(10041) 驱动 NVIDIA 349.90 Beta 首先,我们在BIOS关闭了两颗核心,同时也禁用了超线程来模拟双核处理器 我们可以看到,DX12相比DX11在CPU多核心利用率上略有提高,提升幅度不大。下面我们看看关闭了两颗核心并开启超线程,模拟双核心四线程的情况 开启超线程后,DX11下无论是单线程还是多线程的利用率都有所提高,但出现了多线程利用率不如单线程的情况,而DX12下的利用率则有了飞一般的提升,利用率比双核心双线程平台提高了大概2.8倍!接下来我们开启了全部的四颗核心并关闭超线程,模拟四核心四线程 有些出乎我的意料,DX11的多核心利用率在单线程和多线程中均有下降,甚至低过了双核心双线程平台,DX12的利用率则有一定幅度的提升,但利用率也只有双核心四线程的一半左右。最后,我们开启了全部的四颗核心和超线程 Duang~开启超线程后DX11的多核心利用率有了数倍的提高,DX12的多核心利用率提升幅度更高,相比双核心四线程平台提高了将近9倍。
DX12的规范仍未正式完全确定,所以此次测试仅供交流讨论,不应作为性能参考依据。
总结:简单的说,DX12对于多核心多线程的利用率有着非常明显的提高,核心越多,线程越多,DX12的性能就越好。
|