折旧 发表于 2012-7-15 10:54 
看了我总结一下
你是想说现在AU的浮点运算能力不行 但是以后是用显卡补上的 因为显卡很强大 ...
你的理解基本正确.给你一点本人的看法:
以上着重谈了推土机下面再谈一下APU
1.APU的发展是CPU方展到一定时期的不可超越的阶段.
人们在IT的发展过程是一个由低级向高级的进化过程.由分立原件向集成原件转化的过程.人们
在IT之初生产的器件都是分立的,随着工艺的进步,人们发现集成化可以产品的效能即通过产品
的综合和系统集成可使其产生1+1大于2的效用。举例说明,当年的米格25,它的各项单个技术不
是顶尖水平的,但是前苏联的科学家通过系统集成造出当时称雄天空的一代名机米格25。人们对
CPU和GPU的发展过原来是各自分立发展的.但是人们发现CPU在通用计算的简单大数据流量处理上
弱于GPU,而GPU在通用计算的复杂的数据运算,逻辑推演,分支判断远不及CPU.因此CPU尺有所短,
GPU寸有所长,而AMD发现两者在通用计算方面可以互补.具体的就是通过CPU在通用计算的复杂的
数据运算,逻辑推演,分支判断的强大的能力,去进行通用计算的复杂数据的的处理,并指挥GPU对简
单大数据流量处理快速处理.这只不过是APU运算的第一步进化,即各自分工发挥所长,提升效力,第
二步是提升CPU对在通用计算的复杂的数据运算,逻辑推演,分支判断的分解能力,将复杂的数据分
解为可为GPU处理的简单大数据流量,而此时进步提升GPU处理的简单的数据的能力和运算速度.以
加强APU的运行能力.第三步就是运用分布式并行计算理论,神精网络理论,遗传算法理论,IA智能算
法和P和PN的理论,对APU进行全新的再构造,并发挥其强大的CPU复杂的数据运算,逻辑推演,分支判
断的强大的能力,和GPU高速的简单大数据流量的处理能力,逐步完成APU对数据处理和运算的人工智
能的推进.具体的说APU的发展可分为三个阶段.初步融合.架构提升,人工智能.AMD的第一代和第二
代才开始进到初步融合的阶段.离后续目标还很遥远.但它迈出了坚实的第一步.
2.APU的发展有数学理论做依据
各种软件都说明在运用异构同步计算时HC Benchmark的软件测试说明AMD的APU胜过INTEL的I系
列的核显处理器.而EWSA也说明了这样的问题,因而有许多用I系列的核显处理器的人不服气,认为这
是AMD的GPU的功劳.AMD此时就应该指出为什么会出现这样的结果,其原理是什么.其实这里包含了严
格的数学定理.也就是说INTEL的I系列的核显处理器只要在GPU落后于AMD的GPU的条件下,是没有办法
在异构同步计算的条件下战胜AMD的APU的.
现在给出严格的证明.
设K1为CPU,K2为GPU,由于CPU和GPU同时工作并且有.即K1*K2=1.
现在设INTEL的I系列的核显处理器中的CPU的效率为CPU的基准分为1,
I系列的核显处理器中的GPU的效率的效率为GPU的基准分为1,因为INTEL的I系列的核显处理器
中的CPU在K1*K2=1.即其同在一个封装的处理器工作时,由于其不是融合的异构同步计算的,故其计
算综合基准分为K1*K2=1*1=1.
现在设AMD的APU中的CPU的基准分为INTEL的I系列CPU的效率的80%,(实际CPU差距没有这么大)
即AMD的APU中的CPU的K1小于INTEL的I系列的CPU的K1,而即AMD的APU中的GPU的基准分为INTEL的I系
列GPU的效率的两倍,(实际GPU差距远超过这么大)即AMD的APU中的CPU的K2大于INTEL的I系列的CPU
的K2由于其是融合的异构同步计算的
有人会说为什么不用AMD的APU中的CPU,GPU做基准分,因为INTEL的I系列的核显处理器是非融合
的异构同步计算的故取其为基准分.如果不服气,可采用加权平均计算法或乘数计算法.从简单的乘数
计算法:
I系列的核显处理器的基准分=1X1=1
AMD APU处理器的基准分=0.8X2=1.6
则APU与I系列的核显处理器效能=1.6/1=1.6.即APU的至少数据处理能力是I系列的核显处理器
的1.6倍.正是基于以上的原因,INTEL即便是在GPU的水平上与AMD有巨大的落差,也要在其的CPU中
集成核显,其目的有两个其一是通过对核显的不断的开发缩短与AMD在CPU中的巨大的落差,其二是摸
索CPU和GPU的异构同步的运算能力的融合规律.然而在GPU的水平上与AMD有巨大的落差是短时间无法
缩短的,因为如上面所说的GPU的游戏规则是由AMD,NVIDIA,微软通过DX指令集来定义的,因此由CPU的
规则的制定者,转变为GPU的规则的应用者,这点区别是显而易见的.
3.APU的实际的测试成绩和应用实践证明了数学理论的正确度.
而HC Benchmark的软件证明了这点.HC Benchmark是中国计量科学院最近才开发完成的,全球第
一款真正的异构计算基准测试工具,能够真正同时调用CPU、GPU资源,可以说是为APU量身打造的。
这个工具的测试有办公应用、视频体验、上网体验、游戏体验四部分,可自由选择进行测试,完
成后给出四个子分数和一个总分数。如果系统中有APU这种异构系统,程序就会自动为CPU、GPU分配
计算任务。如果说GPU不支持加速计算,就会全部交给CPU执行。
在该测试的四个子项中:
测试项目 测试品牌 测试成绩
办公: APU A8 3850 4393
I5 2300 697
视频: APU A8 3850 3391
I5 2300 3325
上网: APU A8 3850 6033
I5 2300 2587
游戏: APU A8 3850 6707
I5 2300 2587
总分: APU A8 3850 21125
I5 2300 8029
在APU的测试过程中可以清楚地看到计算任务在CPU(蓝色方块)、GPU(橙色方块)之间的分配,
而且会根据计算性质的不同为合适的硬件分配适量的任务。从成绩看,双显加速情况下的成绩比
APU单显、6670独显分别高出62%、12%,效率还算可以。Core i5-2300因为无法利用GPU加速,
只能将所有任务交给缓慢的CPU,结果自然和APU无法相提并论,总分刚刚超过8000,还不到APU的
四成,APU双显交火后更是可以达到其4.3倍。各个子项目中,只有视频体验部分能够接近APU
,其它都差距甚远。
以上是HC Benchmark的测试结果.摘自
从最强集显到融合加速:A8-3850 APU完全评测
来源:驱动之家 作者:上方文Q 2011-07-21 17:44
同样来自该文谈到的另一项测试:APU加速计算测试:SiSoftware Sandra
老牌系统检测、测试工具SiSoftware Sandra近日刚刚发布了最新的2011 SP4升级包,版全面
加入了对AMD Fusion APU处理器的支持。现在不仅可以完善检测APU系统的规格参数,基准性能测
试模块也做了相应更新,通用目的测试环节中的运算性能、加密性能、内存性能三个环节都可以对
APU进行考察。它的通用目的基准测试是基于OpenCL标准的,因此能够同时调动APU处理器中的CPU、
GPU资源,并根据它们的处理能力不同而自动分配计算任务。如果系统内还有独立显卡,不管是A卡
还是N卡都能加入基准性能测试。
首先是OpenCL运算项目,A8-3850单独使用CPU的话要比Core i5-2300弱不少,但是GPU部分明
显强大得多,CPU+GPU联合之后更是遥遥领先,成绩为423亿次浮点每秒、1.09亿次像素每秒,是
Core i5-2300的1.9倍。具体成绩如下:
测试项目 测试品牌 测试成绩
平均Shaber(十亿次浮点每秒/GFlops) A8 3850 CPU 7.8
平均Shaber(百万像素每秒) 20
平均Shaber(十亿次浮点每秒/GFlops) A83850 GPU 37.55
平均Shaber(百万像素每秒) 96.56
平均Shaber(十亿次浮点每秒/GFlops) A8 3850 CPU+GPU 42.3
平均Shaber(百万像素每秒) 108.78
平均Shaber(十亿次浮点每秒/GFlops) I5 2300 14.52
平均Shaber(百万像素每秒) 37.34
其次加密带宽测试
测试项目 测试品牌 测试成绩
加密带宽
A8 3850 CPU 372
A83850 GPU 1260
A8 3850 CPU+GPU 1160
I5 2300 599
加密带宽测试出了点儿问题,CPU+GPU联合之后的成绩反而降低了,看来Sandra对这种架构的
支持还有待进一步完善。
其三内存性能
测试项目
内存性能 A8 3850 CPU 6.81
A83850 GPU 5.52
A8 3850 CPU+GPU 11.15
I5 2300 12
Fusion APU的设计理念对内存提出了相当高的要求,而且受到了现有技术的一些制约。通过
本次测试可以看出,APU无论单独CPU还是单独GPU的内存带宽都不是很高,联合之后才基本接近
Core i5-2300的水平。
综上所述可知以下两点:
1)APU在CPU和GPU的融合后将使异构同步的运算的效能大幅度提升.从实践上证明了数学推导的
正确.
2)APU在CPU和GPU的融合后对软件的支持提出了新的要求,只有在完善的软件的支持下APU的功能
才可能有质的提升与发挥. 要向市场转化就要软硬并重.AMD长期以来的一个弱项就是硬件超前,支持
的软件滞后.K8的HT总线,64位处理器架构,双核处理器架构,CPU内存控制器,K10的多核处理器架构,融
合芯片的APU,推土机CPU,都无一例外的遇到这样的问题.现在AMD已开始注意这方面的问题.尽快开发
出便于硬件运行的软件包是其重要任务.AMD发布新版加速计算开发包APP SDK 2.6的发表明显反映其
对软件的关注度.
4.APU将完成由标准的执行者项标准的制定者的转身.
在商界有句名言:一流企业做标准.
所谓的做标准在某种意义上说就是制定产品制造的规范,制定产品生产和市场销售的游戏规则.长
期以来在X86的处理器架构的领域中,英特尔用其在X86的处理器架构中相对强势的地位,给出了X86的
处理器的长期发展的标准模式及相应的CPU的指令集的规范.因而导致PC业界的基本上是以INTEL的X86
架构的指令集来统一PC配件的标准和规范.AMD曾经有过多次领先的创新,如CPU的三级缓存L3在K6-3的
利齿上的应用,K7价构提出效率为先原则,K8的HT总线,64位处理器价构,双核处理器架构,CPU内存控制
器,K10的多核处理器架构,融合芯片的APU.可是为什么没从根本上取的市场的绝对多数的份额.其根本
原因就是AMD的技术上的突破最终还是要通过INTEL的X86架构的指令集来实现.AMD现在通过APU的架构
完成了一个质的飞跃.过去衡量CPU的标准规范是CPU的X86的处理器架构的指令集,而APU的架构的出现
,是CPU的X86的处理器架构的指令集,仅是APU架构的指令集的一部分,而且CPU的X86的处理器架构的指
令集要向APU架构的指令集靠拢,否则将无法充分发挥APU的功能.而AMD APP SDK 2.6的发布说明AMD逐
步推广APU和推土机架构的标准.其实类似AMD的APU架构英伟达也在做.所不同的是由于英伟达没有X86
架构处理器的专利授权,而且没有对X86的处理器架构的研发经验,故另辟蹊径,用ARM架构的处理器和
其的显卡组成,英伟达做成了类似APU架构的ARM结构的处理器.而且在平板电脑市场做的风生水起.
AMD和英伟达都在做一件相似极高的事,即通过类似APU架构的处理器确定其在业界的技术标准,所不同
的是AMD面对的是X86的处理器架构的市场,即传统的PC市场,而英伟达面对的是ARM的处理器架构的市
场.既新兴的移动设备市场.两个企业不约而同的逐步脱离以纯依赖CPU,或GPU的局面,而走向两者融合
的新道路和业界的规范.
5.APU是未来发展的长远战略.
我国有句名言:不谋万世者不足以谋一时,不谋全局者不足谋一城.
由于未来云计算的发展,个人计算机未来在云运行的网络中更多的是起数据上传与接收的作用.
这了说明APU才是未来的方向.AMD今年二季度据说推出第二代APU.功能强过一代50%以上.AMD实际
上采取的是两翼齐飞,中间突破的发展战略AMD现在是两手抓,推土机及后续品种解决CPU的架构和效率
的研制问题显卡则解决GPU的通用计算.和并行运算的结构问题,这是两翼,而APU则是在推土机及后续品
种解决CPU的架构和效率的问题后,显卡解决GPU的通用计算.和并行运算的结构实际应用问题后,着重解
决GPU与CPU的融合的.大家可以看第一代APU用的是K10.5的CPU和6XXX系列的GPU,英特尔的CPU游戏上不
借助外接独立显卡已无法应对,今年二季度推出的第二代APU,将是推土机架构的CPU与7XXX系列的GPU.
英特尔的CPU游戏上不借助外接独立显卡,与APU的距离将会进步拉大. |