PCEVA,PC绝对领域,探寻真正的电脑知识
打印 上一主题 下一主题
开启左侧

针对前几天的推土机假图,发一个PI预测:同频K10.5慢50%略少

[复制链接]
跳转到指定楼层
1#
kkgodygah 发表于 2011-5-12 11:14 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
点击数:8400|回复数:21
本帖最后由 kkgodygah 于 2011-5-12 11:16 编辑

在那个假的技嘉图中,推土机跑PI速度令人咋舌,

实际上只要看一眼推土机的结构图就知道,推土机跑PI的速度将会惨不忍睹。

我预计仅仅能达到同频K10.5的2/3略好一点。也就是慢50%左右。

原因很简单PI是非常典型的单线程应用,
对推土机来说,仅仅用到一个模块中的一个核心(双指令乱序发射),
只是由于有更大的二级缓存和三级缓存,能让成绩略微好看一点。
2#
kkgodygah  楼主| 发表于 2011-5-12 11:21 | 只看该作者
推土机一个模块的性能或许有可能优于I的一个超线程的核心。但是单个核心的性能远远比不上I的一个核心,甚至比不上一个K10.5核心。
3#
ach9999 发表于 2011-5-12 11:36 | 只看该作者
不用你预计 ;P

这个在几周前就有人说了
4#
kkgodygah  楼主| 发表于 2011-5-12 11:36 | 只看该作者
几周前没有人PS假图忽悠大家啊
5#
liwenchao 发表于 2011-5-12 13:26 | 只看该作者
单线程不行,多线程可以就行了。
6#
xiaomudou 发表于 2011-5-12 13:32 | 只看该作者
如果推土机落后那么多,A死定了。
7#
royalk 发表于 2011-5-12 13:33 | 只看该作者
其实我现在关心的是推土机是否会出现类似P4时代超线程开不如关的情况
8#
cv006ance 发表于 2011-5-12 13:39 | 只看该作者
玩跑Pi这类单线程负载的话,2.8G的推土机可能拧不过2.2G的K10。不过多线程就不好说。还有,未来是多线程的天下,单线程的程序会逐渐淡出人们的视野吧
9#
pphiuyt 发表于 2011-5-12 14:04 | 只看该作者
回复 1# kkgodygah

推土机好像就是为了提高单线程效率 而设计的吧
10#
joekoo 发表于 2011-5-12 15:09 | 只看该作者
觉得楼主貌似理解错误了,我观望...
11#
landy_zhu 发表于 2011-5-12 17:58 | 只看该作者
回复 1# kkgodygah


   LZ你正好说反了,推土机就要2核心当当核心用:)
12#
kkgodygah  楼主| 发表于 2011-5-12 18:16 | 只看该作者
回复  kkgodygah


   LZ你正好说反了,推土机就要2核心当当核心用
landy_zhu 发表于 2011-5-12 17:58



    那是优化后的理想情况
   一个核心负责整数运算,一个核心负责浮点运算。两个核心协同工作,
   理想情况。。。。。。一个模块取得比IU一个核心更强的性能。同时凭借更大的缓存取得游戏以及服务器领域的优势。

这种理想情况在跑PI的时候出现的几率我看悬。
13#
landy_zhu 发表于 2011-5-12 19:20 | 只看该作者
呵呵,如果不能实现这功能推土机就彻底失去意义了
14#
karl.16 发表于 2011-5-12 21:39 | 只看该作者
跑PI必然悲剧!
浮点想靠GPU来争取必须等到完全融合以后
15#
lbs 发表于 2011-5-12 23:00 | 只看该作者
lz不要想当然了..... 推土机架构不是你想的那样..
就这么说吧. amd要搞半天搞个单线程能力还不如上代的产品, 那还推出干什么...

并不是说一个模块里设计了2个整数运算单元, 单线程能力就差了.
16#
leonthepro 发表于 2011-5-12 23:55 | 只看该作者
如果比K10.5还差,那干脆死了算了AMD
17#
锅锅 发表于 2011-5-13 02:08 | 只看该作者
跑Pi很正常的……
18#
kkgodygah  楼主| 发表于 2011-5-13 10:49 | 只看该作者
lz不要想当然了..... 推土机架构不是你想的那样..
就这么说吧. amd要搞半天搞个单线程能力还不如上代的产 ...
lbs 发表于 2011-5-12 23:00



    两个整数单元在PI这种典型的单线程应用中只能用到一个。
19#
deneb0 发表于 2011-5-13 18:42 | 只看该作者
根据官方公布的消息是服务器推土机增加33%核心数量,性能提高50%
依你的说法,
magny-cours opteron 6176 12核 2.3Ghz 单线程100% 多线程1200%
一个模块最多能提供1.8核的性能
bulldozer 16核 2.3Ghz单线程(依楼主所说) 66% 多线程=66% x(8x1.8)= 950%
假设官方所说的性能提高50%是多线程情况,16核推土机性能应为1200%x1.5=1800%
16核推土机要提升多少频率,性能才能从950%效能提升至1800%(1.89倍)
我估计最少都要提升100%左右的频率(4.6Ghz)
AMD服务器能出现4.6Ghz的cpu,我不太相信

对于CPU架构,我不是很熟悉
不过,以我所知推土机整数核心性能是有提升,推土机整数核心的管线设计与k10是完全不同,不能只以数管线数量来判断性能
AMD官方人员对推土机整数核心的解说
“In addition, John clarified how each integer unit’s pipelines are oriented. Whereas K10 enables three pipelines shared between ALUs and AGUs (effectively 1.5 of each), Bulldozer increases this number to four pipelines—two dedicated AGU and two dedicated ALU.”
http://www.tomshardware.co.uk/bulldozer-bobcat-hot-chips,review-31978-2.html
“Today's processors have 3 execution units that are shared between ALU/AGU. That is essentially 1.5 ALU and 1.5 AGU. With BD we get 2 AGU and 2 ALU. Much better.”
http://www.xtremesystems.org/forums/showthread.php?p=4523917#post4523917
“Even though the module allows AMD to build a chip with many cores on a single die, single-threaded integer performance cannot be compromised. The out-of-order scheduler must efficiently pick up to four ready instructions for execution and wake up dependent instructions so that they may be picked in the next cycle. The execution units must compute results in a single cycle and forward them to dependent operations in the following cycle. All of this is required so that the module gives high architectural performance, measured in the number of instructions completed per cycle (IPC).”
http://blogs.amd.com/work/2011/02/21/amd-at-isscc-whats-in-a-box/
等上市:sleepy:
20#
lbs 发表于 2011-5-13 23:54 | 只看该作者
两个整数单元在PI这种典型的单线程应用中只能用到一个。
kkgodygah 发表于 2011-5-13 10:49



    只能用一个不见得那一个就比原来的差.
您需要登录后才可以回帖 登录 | 注册

本版积分规则

快速回复 返回顶部