PCEVA,PC绝对领域,探寻真正的电脑知识
打印 上一主题 下一主题
开启左侧

amd,拿什么来拯救你?amd单核效能提升多少,你会接受?

  [复制链接]
61#
Erujia 发表于 2012-8-31 09:29 | 只看该作者
也收藏了此帖,几年后来看胜负吧
62#
acde 发表于 2012-8-31 15:09 | 只看该作者
ly530408 发表于 2012-8-31 01:01
这段是当年驱动之家的一篇文章四面威风!Intel 4核、4GHz、45nm处理器详尽评测的摘录
Fast Radix-16 Divi ...

CPU指令中,7成是内存控制和位运算,2成是加乘,Radix-16能发挥作用的地方不会超过1%

Penryn对Conroe,不算外频带来的内存性能提高和L2提升,性能提升还有多少?推土机得到这种程度的提升照样不如SNB,更不谈IVB、Haswell了。
63#
ly530408 发表于 2012-8-31 17:41 | 只看该作者
原来本人在推土机出来之前与你的观点相同,但是推土机出来后专门参阅了有关资料才知道CPU中除法器的地位的重要,你所Radix-16能发挥作用的地方不会超过1%是站不住脚的,就在写从数学角度看推土机CPU一文中只认为Radix-4改进到Radix-16是提高一倍。
    但是看了Intel 4核、4GHz、45nm处理器详尽评测的摘录Fast Radix-16 Divider快速Radix-16除法器在原有的酷睿2处理器可以支持每个周期同时处理4个指令,并且重新使用了较高效率的14层“Pipeline Stages”。 Penryn 45nm处理器在原有的架构上对除法器进行了改良,Intel称其为“Fast Radix-16 Divider快速Radix-16除法器”。改良之后的除法器在运行科学计算、三维坐标转换和其他数学密集型运算的时候,会带来比原有高两倍的运算速度,并可以加速浮点和整数运算的速度。其重要原理就在于,通过Radix-16除法器的采用,使得当面对基数提升到16的运算时,该功能会每次运算出4位商值,将运算延迟缩短了一倍后,本人明白除法器不仅涉及浮点而且涉及整数的运算,原来估算有误不是一倍,而是文中的两倍,算延迟缩短一倍单位的除法运算量不是线性的算数递增,而是几何递增的。
   你有一个概念的错误。CPU指令中,7成是内存控制和位运算,2成是加乘,Radix-16能发挥作用的地方不会超过1%。注意指令执行的多少与运算量和运算时间不是必然的呈正相关的的关系。可能在某个时间周期内执行了9999条非除法运行的指令,而其所有指令运行时间占运算周期30%,而在这个时间周期内执行了1条除法指令指令运行时间占运算周期70%。你能说其Radix-16能发挥作用的地方不会超过1%吗。

64#
Mufasa 发表于 2012-9-1 01:16 | 只看该作者
没有除法器的CPU用原始的汇编做除法,也不会慢到一次除法就拖上千个指令周期。

理论脱离实际是没有意义的。

你可以继续讨论出更多的理论依据,AMD未来的产品会怎样。
但我看到的实际情况就是,
FX4100的多任务性能只比i3高一点,单任务性能完全不行。

Win7没有对推土机架构优化,Win8也没有优化到位。
或许AMD应该自己做一个操作系统,搞个5A 6A平台。
这才算是优化到位
65#
ly530408 发表于 2012-9-1 02:53 | 只看该作者
Mufasa 发表于 2012-9-1 01:16
没有除法器的CPU用原始的汇编做除法,也不会慢到一次除法就拖上千个指令周期。

理论脱离实际是没有意义的 ...

你说过的正是压路机要做的CPU的编译器的微指令,由CPU完成每个核心4指令发射,而不是现在的每个模块4指令发射。你可以去看AMD压路机架构预览:也许会有惊喜发生的文章地址http://news.mydrivers.com/1/239/239327.htm
66#
lzy24 发表于 2012-9-2 11:24 | 只看该作者
ly530408 发表于 2012-7-7 16:26
若是在推土机架构CPU出来之前说AMD的CPU的单核运算能力弱是有道理的.因为CPU的单核运算能力它包含两个方面, ...

推土机出来后,综合来看,各种测试都表明,AMD的单核效能更弱了。
67#
ly530408 发表于 2012-9-2 12:36 | 只看该作者
lzy24 发表于 2012-9-2 11:24
推土机出来后,综合来看,各种测试都表明,AMD的单核效能更弱了。

主要是浮点运算有差距,整数运算不弱。可去看本人写的从数学角度看推土机CPU
68#
lzy24 发表于 2012-9-3 01:32 | 只看该作者
ly530408 发表于 2012-9-2 12:36
主要是浮点运算有差距,整数运算不弱。可去看本人写的从数学角度看推土机CPU ...

浮点就不用说了。推土机整数ALU单元相比肥龙2也是缩减了的,因此从任何角度看,推土机的单核性能都是倒退。

至于以后什么压路机什么机,以后出来再说。
69#
AMDK9 发表于 2012-9-3 09:43 | 只看该作者
fx 8350

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?注册

x
70#
oyyn2001 发表于 2012-9-3 11:14 | 只看该作者
楼主说这么多不就是告诉大家,AMD的神U的某种频率和P4处理器一样高,结果性能也是一样低吗?
别跟我说AMD未来可以多强大,理论性能多牛逼,现在先出一个秒我2600K的神器,我马上买了。 什么理论上星际2AMD神U能超2600.麻烦测试下嘛。星际2典型的拼单核性能的游戏,A U只有被宰的份。
71#
lzy24 发表于 2012-9-6 07:21 | 只看该作者
AMDK9 发表于 2012-9-3 09:43
fx 8350

恩,推土机2代(什么机?)同频大约有4%的提升。同频还是被自家955完秒.
72#
Mufasa 发表于 2012-9-20 09:57 | 只看该作者
其实当初推土机一代的时候我就希望是8个整数核心都可以四指令发射,这样整数运算会比Intel快不少。

结果做出来的是每个模块4指令发射,这让人非常失望。

现在推土机的单任务性能只能和不带睿频也不能超频的i3比较。
下一代似乎改进也不明显,除了官方加主频到4GHz以上。

全核心四指令发射要等到明年,再下一代CPU才会有。
这个耽误的时间就太多了。。。。

因为在CPU方面感受不到压力,Intel拿大片硅片面积去做显卡。
消费者被迫买单。
73#
wjcdra 发表于 2012-9-20 10:46 | 只看该作者
除了一个奔腾MMX之外,一直用AMD的U,到现在已经快没信心了。希望能出奇迹啊。
74#
苹果不会飞 发表于 2012-9-21 17:34 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
75#
ly530408 发表于 2012-9-23 21:05 | 只看该作者
苹果不会飞 发表于 2012-9-21 17:34
支持AMD,手上一直用AMD的U

其实amd完全有一把好牌在手,只不过不会打而已。
如果采取以下方案在不需要对CPU和GPU做多少更新即可改变局面
高端APU X8X0系列与高端GPU X9X0系列作CF提升显卡功能180%。高端APU X8X0系列与中端GPUX8X0系列作CF提升显卡功能165%
中端APU X6X0系列与中端GPUX8X0系列作CF提升显卡功能160%,中端APU X6X0系列与低端GPUX7X0系列作CF提升显卡功能150%
低端APU X4X0系列与中端GPUX8X0系列作CF提升显卡功能150%,低端APU X4X0系列与低端GPUX7X0系列作CF提升显卡功能140%。
其销路自然打开。
76#
yhhx 发表于 2012-9-23 21:20 | 只看该作者
APU很有创意啊 单个APU能玩wow intel的核显就不行啊  记得前阵子看他们配了一个APU+(好像是HD4800? 反正是个低端A卡)当时这配置被嘲笑的鸡毛不是  结果那个客户打电话说谢谢你给我配的这个机器玩战地3太爽了
话说APU现在要是能做成 8120+7950的性能 完了价格2000  肯定很多很多人买
77#
ly530408 发表于 2012-9-23 21:58 | 只看该作者
Mufasa 发表于 2012-9-20 09:57
其实当初推土机一代的时候我就希望是8个整数核心都可以四指令发射,这样整数运算会比Intel快不少。

结果做 ...

其实不是设计的问题,是现有软件无法识别的问题,AMD在压路机的架构中向传统的软件做了一定程度的妥协,在前端的的解码器由每个模块共享一个,改为每个核心用一个的解码器,但是仍然是每个核心有一个整数运算运算器,每两个核心共用一个浮点运算器。但是这样在整数运算由目前推土机架构的与INTEL的I7的2600K在每个周期的指令执行数相等到压路机架构的领先,推土机架构整数运算每个周期的指令执行数为4X4=16,INTEL的I7的2600K整数运算每个周期的指令执行数为4X4=16,而压路机架构整数运算每个周期的指令执行数为8X4=32。但如果在浮点运算上压路机架构的除法器不更新,依旧用采用的Radix-4除法运算器,则在浮点运算上压路机架构每个周期的指令执行数至多与INTEL的I7的2600K持平即压路机架构=8X2=16,INTEL的I7的2600K=4X4=16,这与传出的压路机架构较现有的INTEL的I7有30%-45%的提升不符,只有压路机架构的除法器更新,采用的Radix-8除法运算器,则有浮点运算上压路机架构每个周期的指令执行数=8X3=24,INTEL的I7的2600K=4X4=16,则24/16=1.5=150%。根据大话处理器一书的作者讲INTEL称其编译器比一般编译器效率高10%,则有1.5/1.1=1.36=136%。这样说压路机架构较现有的INTEL的I7有30%-45%的提升就大体符合了。
    另外据你讲其有FX-4100,不知其如何充分发挥作用。其实你多数是用CPU来玩游戏。推土机架构在DX11的游戏如果对多核优化的好的情况下,在最高画质的运行下用HD7970去测FX-8150,FX-8120,FX-6100,FX-4100,I7 2600K,I5 2500K可能差距不大。你可测试一下。并祝你一切顺利。另外上一幅图你看一下。
   

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?注册

x
78#
wenlyyang 发表于 2012-9-24 10:45 | 只看该作者
我一直认为,推土机不能以核心为单位,而应该以模块为单位,FX8150其实只是相当于原来的4核心,只是支持的软件少所以不怎么被认同
79#
zc0224 发表于 2012-9-24 12:40 | 只看该作者
至少提升15%
80#
arthas_p 发表于 2012-9-27 09:56 | 只看该作者
需要全新架构
您需要登录后才可以回帖 登录 | 注册

本版积分规则

快速回复 返回顶部