PCEVA,PC绝对领域,探寻真正的电脑知识
打印 上一主题 下一主题
开启左侧

谈谈推土机在WIN7与WIN8下的性能差异

  [复制链接]
跳转到指定楼层
1#
royalk 发表于 2012-7-12 21:07 | 只看该作者 回帖奖励 |正序浏览 |阅读模式
点击数:50841|回复数:150
开头先插点题外话,上次在做了Intel平台Offset超频教程之后,本打算接着做技嘉Z68主板G1.Sniper 2支持IVB超频BIOS在无防掉压下利用offset加压来抵消掉压的进一步测试,无奈我又发现这货现在不仅没防掉压,而且手动设置电压还无效。虽然设置电压无效从理论上来讲也不影响我们做测试(毕竟这篇里我打算说的也只是VID变化和Vdroop的互相补偿),但我还是想把这篇往后推一下,等技嘉把电压调整和防掉压做好,能拿得出手了再来讲。

这里先放两张图,一张是技嘉的Z68新UEFI界面启动画面,个人感觉是比较帅。


第二张图是使用G1.Sniper 2主板与Core i7 3770K超频到4.5G、内存超到DDR3-2666的截图,稳定性未测。



如果你不关心推土机,这帖子对你来说已经结束了。如果你关心推土机,或者想看看热闹,请继续往下看——

回到今天的话题。前两天微软在WPC上透露Windows 8 RTM版本将在8月第一周发布,也就是还有不到一个月的时间大家就能用上WIN8的正式版了。那么有个老话题就应该被挖出来谈谈了:推土机在WIN7下因线程调配问题导致的性能低下,在WIN8下会怎样呢?是不是推土机不给力完全可以归咎于WIN7的线程调配问题?这里我装了一个Windows 8 RP版本,并选取了一些测试软件,来对比一下推土机在Windows 7和Windows 8下性能表现是否有差异。


之前那张Rev 1.1的技嘉990FXA-UD7还回去了,现在又弄来了一张Rev 1.0的,没法开启防掉压,所以超4.5G难度很大。下面所有测试都以4.2G来跑。

测试平台:
CPU:AMD FX-8120 OC 4.2GHz
主板:Gigabyte 990FXA-UD7 Rev 1.0
内存:Team Xtreem LV 2133 OC DDR3-2400 10-10-11-24-1T 1.5V
显卡:MSI N680GTX Lightning
硬盘:美光m4 128G+浦科特 PX-128M2P
电源:安耐美 冰核 Revolution 85+ 1050W
散热器:九州风神 冰阵600
操作系统:Windows 7 Ultimate/Windows 8 Release Preview



在Win8下,CPU-Z还是把推土机识别成8核心8线程,但是在Win8的任务管理器中,系统是把推土机识别成4核心8线程了。


---------------SuperPi--------------

先看最简单的SuperPi,单线程整数运算。在WIN7下,4.2G的推土机跑完1M耗时20.779秒,真是渣渣效能,比默认频率的i7 3770K还慢了一倍,比自家K10同频也慢了20%以上。

▲WIN7 SuperPi 1M

在WIN8下,成绩有小幅度提升,耗时20.498秒。

▲WIN8 SuperPi 1M

跑1M就有差不多0.3秒的提升,是不是误差呢?我们接着跑个32M来验证一下。在WIN7下,32M使用19分47.646秒完成。

▲WIN7 SuperPi 32M

在WIN8下,快了差不多40秒,仅用19分08.079秒完成。

▲WIN8 SuperPi 32M

小结:推土机每个核心只有2个整数计算单元是硬伤,因此单线程的SuperPi是不用指望能快很多了,但是WIN8比WIN7下能有一定的提升,也让我们看到了一点希望,接着往下看别的测试。

---------------3DMark 11--------------

我们分别跑3DMark 11的P模式和X模式,其中前者画质较低,受CPU影响较大,后者则基本取决于GPU。NVIDIA的显卡驱动现在已经可以完美支持WIN8了,并且和Vista、WIN7通用,这里显卡驱动统一使用ForceWare 304.79 beta。

在WIN7下,N680GTX Lightning分别拿到P9520和X3558分。另外我们注意一下P模式的图形总分和物理总分,它们分别代表着GPU和CPU的成绩。

▲WIN7 3DMark 11 P模式


▲WIN7 3DMark 11 X模式

再来看WIN8下,同样的显卡及同样的驱动,分别拿到P9421分和X3536分。

▲WIN8 3DMark 11 P模式


▲WIN8 3DMark 11 X模式

小结:在3DMark 11的测试环节中,不管是P模式还是X模式,WIN8下的得分比WIN7还少了点,在GPU分数(图形分数)子项中两者表现差不多,误差不会超过1%,但是CPU分数(物理分数)无论是P模式还是X模式下,WIN8的得分都比WIN7少了两百,以致于拉低了总分。3DMark 11的物理分数属于多线程浮点运算,看来如我之前的推断一样,在可以用满八个线程的应用下,线程调配优化与否都没多大区别,甚至还出现了可能是争抢浮点资源的情况,导致WIN8下成绩还不如WIN7。

---------------AIDA64内存及缓存测试--------------

AMD的内存性能就是个悲剧,这里同样由于防掉压问题我只能把CPU-NB频率跑在2400MHz,内存也跑在同一个频率上。在WIN8下如果只是线程调配优化,对内存性能应该没太大影响,下面我们来测试看看是不是这样。

Win7下的AIDA64内存及缓存成绩:

▲WIN7 AIDA64内存及缓存测试

Win8下的AIDA64内存及缓存成绩:

▲WIN8 AIDA64内存及缓存测试

小结:AIDA64内存测试对CPU来说应该属于单线程浮点运算,按理说应该不会受到线程调配的影响。对比WIN7和WIN8下的内存测试成绩,还是WIN8下要高了那么一点点,但是WIN8似乎对缓存策略也有所改变,也许跟这个也有一定关系。

---------------CineBench R11.5--------------

CineBench是一个使用CPU渲染3D画面的程序,典型的多线程浮点运算,当然也可以运行单线程,这里我们单线程和多线程都运行一下。

WIN7下,单线程1.04分,多线程6.90分。

▲WIN7 CineBench R11.5测试

WIN8下,单线程1.03分,多线程6.69分。

▲WIN8 CineBench R11.5测试

小结:Cinebench也是多线程浮点运算,出现了类似3DMark 11物理分的情况,WIN8下的成绩反而比WIN7低,看来推土机的多线程浮点运算在WIN8下表现确实较弱。

---------------Winrar 4.20 x64--------------

Winrar在升级到4.20之后改进了内存调用策略,并可以占用到八个线程,64位版本压缩和解压缩速度大幅提升,Winrar自带benchmark,主要考验内存及缓存速度。

WIN7下的测试,注意一下任务管理器的CPU占用率已经可以完全使用八个线程,但是并未满载。之前我们使用3770K测试的时候CPU是可以满载的,并且成绩也可以达到12000分左右。看来这里推土机受到了内存和缓存结构速度瓶颈的影响,核心资源未能充分使用。

▲WIN7 Winrar 4.20 x64测试

在WIN8下,情况也类似,大约80%多的CPU占用率。

▲WIN8 Winrar 4.20 x64测试

小结:推土机的WINRAR性能测试应该是受制于内存速度,因此跟AIDA64类似WIN8和WIN7下差不多。不过能占满8线程之后拿到8000多分的表现,也比以前的版本提升了差不多一倍。


---------------Fritz Chess Benchmark 4.3(国际象棋)--------------

国际象棋(Fritz Chess Benchmark)做的是模拟电脑AI的步法计算和预测,国际象棋不怎么吃内存和缓存,因此推土机的成绩表现不会输得太多。由于它可以指定运行线程数,并且可以通过任务管理器里设置相关性来手动调整使用线程,因此我们选择这款软件来做检验线程分配情况的详细测试。

首先看八线程下的跑分。在WIN7下,4.2G的FX-8120跑出13367千步,大约和4.5G的i5 3570K或默频的i7 3770K相当。

▲WIN7 Fritz Chess Benchmark测试

在WIN8下,成绩变化不大。

▲WIN8 Fritz Chess Benchmark测试

小结:这段测试表明八线程占满的情况下WIN7和WIN8的国际象棋性能差距并不大,但是接下来我们跑四个线程就不一定了。


下面把软件设置改成四个线程,并通过任务管理器手动分配线程到两个模块中的四个核心、三个模块2+1+1模式、四个模块的各一个核心来跑,看看成绩有何差异。

首先是WIN7下,从左到右依次是两个模块、三个模块、四个模块的四个核心跑的。


然后是WIN8下,同样从左到右依次是两、三、四个模块的四核心跑的。


小结:在这一段测试中,我们手动指定线程跑出来的成绩在不同操作系统下也同样差距不大,但是我们也看到在运行四个线程的时候,线程分配应该尽量规避推土机的浮点资源互相抢占现象,也就是尽可能只用一个模块中的一个核心来跑,性能才能最大化。

接下来我们依然跑四个线程,但是给操作系统自动分配线程,看看成绩如何变化。

在WIN7下,得分8336千步,与上边跑出来的三个模块四个线程的分数接近。从宏观上可以认为有一半的时间是出现了同一模块内资源冲突的情况,有一半时间则没有出现,充分表现了WIN7下四个线程的任务负载是平均分配给八个CPU线程的。


再来看看WIN8下,这次情况可不同了,得分9520千步,和四模块四线程的分数基本吻合,因此在用八核心推土机跑四个线程的时候,WIN8下对推土机线程优化的表现非常到位。


小结:四模块的推土机在跑四个线程的时候,WIN8的线程调度优化可以发挥最大的功效,这时候推土机的性能提升幅度可达10%以上。这样看来,推土机平台在WIN8下对CPU敏感但又只能使用四个线程的应用,或许都可以受益于线程调配优化而得到性能提升。


---------------MediaCoder x64 视频转码--------------

以上都是理论测试,下面我们来个比较贴近实际应用的测试:视频转码。我们选用MediaCoder x64,把一部720p X264编码的《星际迷航》转成H264格式,800x480的手机分辨率,用MP4封装。这里说一句闲话,如果你担心你的CPU和内存超频之后过了烧机软件还不够稳定,可以试着做一次转码,有时候过了1小时的Prime 95在转码时候报错也是有可能的。

在WIN7下,耗时1225.9秒,也就是20分钟25.9秒完成转码。

▲WIN7下MediaCoder转码完成时间

在WIN8下,耗时20分02.2秒完成转码,比WIN7稍微快一点点。

▲WIN8下MediaCoder转码完成时间

小结:WIN8可能存在的缓存机制改动使得转码在头半分钟内速度稍微快一点,从一开始就拉开了差距,并保持到最后,依然领先20秒。这种WIN8比WIN7转码快的情况不仅在推土机上出现,在i7 3770K上也是一样的。


---------------总结--------------


通过以上的测试,我们也已经看到在什么情况下推土机+WIN8组合的线程调配会起性能提升作用了——在四个线程的时候,每个模块的一个核心各跑一个线程时,性能可最大化。只不过在WIN7下你需要手动指派线程来做这个优化,到了WIN8就可以自动帮你实现了。当然,哪怕你跑三个线程,五个线程,也是有改善的,只不过没有跑四个线程那么多,而到了八个线程全部占满的时候,WIN7和WIN8就基本没区别了。因此,推土机不给力的主要原因还是在于其自身设计——长流水线导致高频低能,缓存命中率低影响分支预测能力,进而影响执行效率和内存性能,WIN8并不是它的救世主!

总之,我想说的是,WIN8下推土机的性能虽然有改善,但不要期望太多,也不是什么时候都有改善的,而是有条件的。对于一般的PC用户而言,如果不能从本质上提升IPC(单线程运算能力),推土机还是不合适的选择。OK,今天就说到这,技嘉的Z68超频IVB的文章我们先无限期搁置,等待技嘉改好BIOS,下一期我们先来谈谈以i7 3770为代表的非K系CPU超频方式和K系有何区别。


最后,汇总一下本次测试的成绩,红框里表示更好的。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?注册

x

评分

参与人数 3活跃度 +75 收起 理由
kobe327292007 + 20 学习了!
solonace + 5 很给力!
jasu30 + 50

查看全部评分

151#
ly530408 发表于 2014-10-20 23:22 | 只看该作者
据AMD吧的ziboys的说明在windows10的条件下FX的处理器的负荷趋于均衡,不知楼主是可以测试一下
150#
luyangcy 发表于 2013-6-26 11:13 | 只看该作者
看好AMD,毕竟拿下了PS4和Xbox one, 这个比PC挣钱多了。一代芯片能卖十年
149#
ly530408 发表于 2013-5-10 23:21 | 只看该作者
wjpok0753 发表于 2013-5-10 20:05
学习了~希望下一代AMD的APU的cpu性能能提升多点~~~

希望下一代AMD的APU的cpu性能能提升多点,这个希望很可能在Kaveri APU的架构中实现。这个才是值得期待的APU架构,其有三大特点
1。全新的CPU架构,该架构由以下的特点
改为每个物理核心都有完整的整数运算器,两个物理核心共享一个浮点运算运算器,而每个核心有一个独立前端解码器,共享二级缓存,
三级缓存的架构,这样就可以解决操作系统的识别的问题。
设计了全新的除法器,使浮点运算的每个指令周期的2发射变为3发射。
对二级缓存在指令的读取进一步优化
2。全新的GPU架构,该架构的通用计算能力将大幅增强。
3。初步实现了CPU,GPU的统一寻址。将大幅度增强APU的运算能力。

148#
wjpok0753 发表于 2013-5-10 20:05 | 只看该作者
学习了~希望下一代AMD的APU的cpu性能能提升多点~~~
147#
icbcodc 发表于 2013-4-16 15:07 | 只看该作者
感觉这WIN8显现出的性能提升级别已经很接近测试误差了。

我自己仅仅是这个月初才升级到WIN7。

一直觉得推土机,真可惜。
146#
fastone 发表于 2013-3-24 19:35 | 只看该作者
ly530408 发表于 2013-3-23 17:37
现在孤岛危机3和古墓丽影9已给出完满的答案了,印证了本人的猜测,这是相应的地址:http://www.expreview ...


我之前回复后,又重新去看了后续驱动,全部开放多线程调度权限了,所以可以更正了。
145#
qin_198471 发表于 2013-3-23 23:21 | 只看该作者
好文章   看看有益  
144#
ly530408 发表于 2013-3-23 17:37 | 只看该作者
fastone 发表于 2013-3-21 04:43
不过就DX11本身来说,虽然支持多线程,但受限驱动,还是不怎么支持多线程。 ...

现在孤岛危机3和古墓丽影9已给出完满的答案了,印证了本人的猜测,这是相应的地址:http://www.expreview.com/23891.html
http://news.mydrivers.com/1/256/256569_all.htm
143#
fastone 发表于 2013-3-21 04:43 | 只看该作者
ly530408 发表于 2012-7-14 22:13
你没有看懂本人的意思,是希望你能去揭示测试背后的规律和原因.本人没有FX-8150,只有FX-4100,故希望你通过测 ...

不过就DX11本身来说,虽然支持多线程,但受限驱动,还是不怎么支持多线程。
142#
ly530408 发表于 2013-3-21 00:23 | 只看该作者
彤泪 发表于 2013-3-19 21:57
学习中   要融合可能就要这样走吧

据传两大游戏主机商用AMD的APU估计时期有了较大突破。
141#
彤泪 发表于 2013-3-19 21:57 | 只看该作者
学习中   要融合可能就要这样走吧  
140#
夏洛克 发表于 2012-12-12 20:53 | 只看该作者
技术贴支持了
139#
whp1130 发表于 2012-11-30 15:24 | 只看该作者
如果当年AMD没有收购ATI,现在会是一个什么状况?
起码没有APU这个东西了,光靠着着推土机活着?
138#
everysun 发表于 2012-11-1 10:47 | 只看该作者
很精彩的评测,内容丰富,看着过瘾!
137#
银子 发表于 2012-10-31 13:53 | 只看该作者
dv25 发表于 2012-10-10 05:12
兄台是高人
很多想法深有同感,虽然咱技术不懂,对于数据分析的意义为了解决问题这个明镜似得

产品最终是要卖出去的,就必须适应市场的需求,所以要从市场的角度看。作为一个处理器,性能,价格,功耗,稳定性,都是很重要的指标。市场上性价比往往是第一位的,所以像开核U,神U之类的卖的火爆的很。

CPU怎么设计是厂商的事,反正我知道现阶段AMD的U性能没搞头(低端还行),等什么时候有搞头了,自然不怕没人买。风水轮流转,没有什么不可能。以前买过三块U都是A的,现在照样换了I。

至于说什么AMD的U到时可以靠显卡补上CPU的短板,那作为消费者来看,非要带上显卡才能达到I系U的速度,这个东西它就有局限性,有点捆绑销售的味道。

买了A非要再买上B,A才能发挥全部性能,那我干嘛不直接买别人的C呢。另外不需要用到B的人,你说会买A吗?
136#
qq380602761 发表于 2012-10-11 07:17 | 只看该作者
不错 不错
135#
dv25 发表于 2012-10-11 00:43 | 只看该作者
ly530408 发表于 2012-10-10 21:17
电源用全汉黑骑士650 550或酷冷至尊酷冷至尊GX-750W 650。前者额定功率650W。12伏电流单路输出12X50=600W ...

不超频 额定500的足够了
134#
circlegame 发表于 2012-10-10 22:37 | 只看该作者
ly530408 发表于 2012-10-10 22:26
记住用FX系列的处理器电源和散热是最重要一环。GTX460的功耗也不低。也有150w,整机标称功率349W,峰值功 ...

嗯,謝謝!我知道電源的重要性,這幾天先看一下750W的電源有哪些好的選擇
133#
ly530408 发表于 2012-10-10 22:26 | 只看该作者
circlegame 发表于 2012-10-10 21:41
謝謝!其實我一般只玩網游,單機也只玩仙劍,軒轅劍,英雄傳說之類的,現在的GTX460都夠我用了.這次準備換新機 ...

记住用FX系列的处理器电源和散热是最重要一环。GTX460的功耗也不低。也有150w,整机标称功率349W,峰值功率为349X1.414=493W。不超频也要额定功率500W,超频至少650W及以上的。
您需要登录后才可以回帖 登录 | 注册

本版积分规则

快速回复 返回顶部