PCEVA,PC绝对领域,探寻真正的电脑知识

标题: amd,拿什么来拯救你?amd单核效能提升多少,你会接受? [打印本页]

作者: terriblely    时间: 2012-6-21 13:17
标题: amd,拿什么来拯救你?amd单核效能提升多少,你会接受?
amd太死了。。。好多人都去转投intel阵营了。。。。
作者: hxl    时间: 2012-6-22 00:32
单核没所谓,我要的是多核性能
希望压路机有8M16T吧
作者: royalk    时间: 2012-6-23 21:18
hxl 发表于 2012-6-22 00:32
单核没所谓,我要的是多核性能
希望压路机有8M16T吧

应该会有,推土机也有opteron628X
作者: hxl    时间: 2012-6-23 22:00
royalk 发表于 2012-6-23 21:18
应该会有,推土机也有opteron628X

我说的是桌面
作者: royalk    时间: 2012-6-23 22:02
hxl 发表于 2012-6-23 22:00
我说的是桌面

哦。。桌面的我估计没戏,功耗应该还是控制不住的
作者: hxl    时间: 2012-6-23 22:13
royalk 发表于 2012-6-23 22:02
哦。。桌面的我估计没戏,功耗应该还是控制不住的

我也是...

就算是28NM估计8M16T的压路机在3.6G功耗就超200W了= =
作者: royalk    时间: 2012-6-23 22:24
hxl 发表于 2012-6-23 22:13
我也是...

就算是28NM估计8M16T的压路机在3.6G功耗就超200W了= =

是的,只能做低频,而且AMD目前8M16T还是胶水模式两个独立的die,内部HT总线通讯
作者: Mufasa    时间: 2012-7-4 00:17
单任务性能不提升也罢。

好歹弄出个游戏级别的8M16T啊。
二级缓存全部改成1MB,三级缓存依旧8MB,芯片面积不会失控的。

面对Intel的6C12T,推土机(打桩机)只有用8M16T来玩了。。。。

基于速龙的APU也快退市了,新APU性能也不明了。
AMD真是麻烦。
作者: ly530408    时间: 2012-7-7 16:26
若是在推土机架构CPU出来之前说AMD的CPU的单核运算能力弱是有道理的.因为CPU的单核运算能力它包含两个方面,一个是单核的整数运算能力,一个是单核的浮点运算能力.
       可是推土机的问世后,各种测试软件都反映了一个共同的特点就是在涉及到浮点运算时的数据均反映了推土机的弱项,而设计到纯整数或整数运算占主导地位的数据时推土机架构多数处于领先的地位。准确的讲AMD的CPU但核的浮点运算效率低.
作者: einstein86    时间: 2012-7-7 17:14
求AMD可以强力一点,高端处理器能有A和I可以选,不然高端市场好无聊。
作者: ly530408    时间: 2012-7-9 15:16
einstein86 发表于 2012-7-7 17:14
求AMD可以强力一点,高端处理器能有A和I可以选,不然高端市场好无聊。

       实话实说打桩机将全面接近IETTL的高端,真正可以超越的是压路机.压路机将是AMD的CPU发展的三步走战略的最后飞跃.具体说推土机解决了高主频,双核心组合模块新架构,全新指令集,及CPU的三级大缓存的验证和跨越,如同完成了军机试验的验证机,证明了其新架构的可行度,打桩机从透露出的信息看是用Piledriver的新一代处理器内核架构。将来会应用于服务器MPU“Opteron”等产品。此次采用32nm工艺以Piledriver架构试制了由64个处理单元构成的处理器内核。时钟频率超过4GHz。利用Cyclos的揩振时钟技术实现了该时钟网络。采用该技术后,与普通时钟网络相比,可将时钟分配的功耗最大减少24%。另外,不仅功耗大幅降低,时钟偏移也得到充分减小。整个芯片有望最多降低10%的功耗。也就是说第二代的CPU解决了新架构的稳定和效率的双重目的,而从有关的资料透露看, 按照AMD的规划,“Bulldozer”推土机是第一代模块化CPU,第二代则是Piledriver打桩机,将于今年下半年发布,而且使用了Cyclos半导体的Resonant Clock Mesh技术以提高性能。到了2013年就该“Steamroller”压路机出场了,AMD对它的描述是“Greater parallelism”,强调并行性能提升。
  有关压路机的架构设计目前还是捕风捉影的阶段,日前AMD研究部门的David M.Russinoff发布的一篇论文中证实了Steamroller将会采用radix-8 SRT浮点模块,每周期运行指令将从目前的radix-4单元的2条提高到3条。
    而此架构一但落实与成功,AMD与IETTL的差距将不复存在.但有人会说Intel早在酷睿时代的Penryn架构上就已经采用radix-16除法器了.每周期指令数从原来的2条一下子提高到4条.你的效率还是低25%.可是大家不要忘记AMD的CPU是双核心组合模块新架构,2 X radix-8=2X3=6.效率将是6/4=1.5=150%.
      这时INTEL的CPU在单核的处理能力无论是整数的运算能力还是浮点运算能力将不复有优势了。
    其实AMD的CPU的浮点运算的软肋补齐的方法不外是以下几条。
     1.给CPU设计全新的除法运算器。
     上面一谈及不再多说。
     2.通过硬架构实现CPU、GPU统一寻址,充分调用GPU的强大的通用计算和浮点运算的能力.而
随着第三代的APU的CPU、GPU统一寻址,则AMD与IETTL的差距也将不复存在。
    CPU、GPU统一寻址真正厉害之处在于CPU今后可以充分调用GPU的强大的通用计算和浮点运算的能力.AMD的CPU的一个软肋就是其浮点运算的能力偏弱,而AMD的GPU的通用计算和浮点运算的能力.已经达到了令人恐怖的地步,特别是HD7970的GPU的通用计算和浮点运算的能力有了大幅提升.
      即然AMD推土机架构涉及到浮点运算的能力偏弱的这一明显的事实,为什么AMD还要坚持推土机架构而且不肯放弃呢?除了上面通过数学和实例证明并非是推土机架构的浮点运算器减少所致CPU单核的浮点运算能力偏弱的说法外,还有一个重要的原因,就是在未来的大数据量的通用计算和浮点运算时起着主导地位的将是GPU.CPU未来的大数据量的通用计算和浮点运算时仅起着调用GPU的通用计算和浮点运算能力的作用,在未来的大数据量的通用计算和浮点运算时仅起辅助作用。这一点在大型通用计算机和超级服务站的架构中得到了体现。
    现在引用 作者:中关村在线 濮元恺的一篇文章,超越图形界限 AMD并行计算技术全面解析的一段话不无启迪的意义。
    AMD就是充分的分析了这一趋势才采取了每一颗核心拥有双倍的整数运算单元,每个单元4条并行流水线,整数和浮点为非对称设计。Bulldozer还将加入128-bit的SSE5指令集支持,达到更高的执行效率,还通过增加CPU寄存器数量,为单指令多数据流技术(SIMD)运算提供更多的空间。
    这种设计使得浮点计算的重任开始向GPU倾斜,未来的CPU将专注整数运算能力,而如果用户需要
大量的并行浮点计算,可以选择使用外置的加速卡(GPU通用计算产品)来实现。
    在一个推土模块里面有两个独立的整数核心,每一个都拥有自己的指令、数据缓存,也就是scheduling/reordering逻辑单元。而且这两个整数单元的中的任何一个的吞吐能力都要强于Phenom II上现有的整数处理单元。Intel的Core构架无论整数或者浮点,都采用了统一的scheduler(调度)派发指令。而AMD的构架使用独立的整数和浮点scheduler。
    AMD认为CPU和GPU谁也不可能取代谁,双方是互补的关系,只有CPU和GPU协同运算,各自去处理最擅长的任务,才能发挥出计算机最强的效能。从CPU漫长的发展历程来看,它会延续一路不断整合其他功能单元的道路来整合GPU,但仅限中低端产品,而且这种整合不是吞并,而是提高CPU的浮点运算性能;GPU会取代CPU进行浮点运算,但它仍然需要CPU来运行操作系统并控制整个计算机。
    这段摘要就充分说明了AMD对未来CPU发展的总体思路。
    那么这种做法是否科学呢?
    那么大家可以看到在更强调浮点运算和通用计算的游戏的图形运算中I系列的处理器并没有取得如同内存写入一样的两倍的优势。这个产生的原因就是当游戏的图形运算中浮点运算和通用计算的数据量极大,特别是在DX10,DX11的游戏时,GPU的浮点运算和通用计算的数据量远超过CPU的浮点运算和通用计算的能力时,CPU的浮点运算和通用计算的能力地位将大幅下降其将处于辅助的地位。
      先选用《微型计算机》2011年11月上AMD FX 8150处理器首发评测一文的测试数据。

                          FX-8150      I5 2500K      I7 2600K      X6 1090T     X4 970
                                         +HD6970    +HD6970     +HD6970     +HD6970     +HD6970

3DMark 11 Extreme总分      1870         1842            1859           1827           1824
物理分数                   7120       6739              8836            5187         4464   
结合分数                   2039       2065              2046            2063         2082

DX9.0
使命召唤黑色行动          107.95      117.53            119.61      100.97       100.43
1920X1080 high,4AA                fps         fps                   fps         fps             fps
星际争霸2
1920X1080 极高画质         73.71       97.26            101.73         67.25        68.22
                                           fps         fps                 fps              fps          fps
DX10
far cry 2                               99.92       105.93            105.81      81.97        92.51
1920X1080 Ultra,4AA              fps            fps                fps           fps          fps
Crysis                                  40.11       39.87              40.48       38.43        39.73
1920X1080 Very high,4AA        fps           fps                 fps           fps          fps

DX11
尘埃3                                    71.55      72.59             72.93       71.62        70.74
920X1080 Ultra                         fps        fps                 fps         fps           fps   
失落的星球2                           37.8       38.3              38.1        37.3         37.5
1920X1080 high,4AA                  fps        fps                 fps         fps          fps  
异形大战铁血战士            66.5       66.6              66.6        66.2         65.9
1920X1080 高画质            fps        fps                  fps         fps          fps

    现在给出数学公式如下:
    综合浮点运算的能力=(1/(GPU的浮点运算能力+CPU的浮点运算能力))X运算地址调度能力(为整数运算能力) (其最后的值越小越好,运行速度越快)
    运算地址调度能力=4/软件可支持的处理器的的整数运算单元 (其最后的值越小越好,运行速度越快)
    现在已知:
    i7 2600 浮点运算能力 0.107TFLOPS
    FX-8150 浮点运算能力 0.076TFLOPS
    HD6970  浮点运算能力 2.7TFLOPS
    i7 2600 运算地址调度能力=4/软件可支持的处理器的的整数运算单元 =4/4=1
    FX-8150 运算地址调度能力=4/软件可支持的处理器的的整数运算单元=4/4=1(因为软件可支持的处理器的的整数运算单元不识别FX-8150的推土机架构故按4个整数单元计算)
      则有
    i7 2600综合浮点运算的能力=1/( 0.107TFLOPS+2.7TFLOPS)X1=0.3562
       FX-8150综合浮点运算的能力=1/(0.076TFLOPS+2.7TFLOPS)X1=0.36
        i7-2600综合浮点运算的能力是FX-8150综合浮点运算的能力的=1.01=0.36/0.3562
       也就是说当游戏的图形运算中浮点运算和通用计算的数据量极大,特别是在DX10,DX11的游戏时,GPU的浮点运算和通用计算的数据量远超过CPU的浮点运算和通用计算的能力时,CPU的浮点运算和通用计算的能力地位将大幅下降其将处于辅助的地位的说法是有数学依据的.
       请大家注意如果运算地址调度能力是八个整数运算单元则计算结果要逆转.
       现在将DX11,DX10的游戏数据进行计算有
     尘埃3                    i7-2600综合浮点运算能力是FX-8150综合浮点运算的能力1.016=72.93/71.73   
        失落的星球2           i7-2600综合浮点运算能力是FX-8150综合浮点运算的能力1.007= 38.1/37.8      
        异形大战铁血战士  i7-2600综合浮点运算能力是FX-8150综合浮点运算的能力1.001=66.6/66.5   
        Crysis                     i7-2600综合浮点运算能力是FX-8150综合浮点运算的能力1.009=40.48/40.11
       但是在DX10的far cry 2 游戏中由于对CPU单模块识别问题,i7-2600 运算地址调度能力不变,FX-8150而运算地址调度能力=4/软件可支持的处理器的的整数运算单元中的软件可支持的处理器的的整数运算单元不是四个,至多按超线程的最好结果单个整数单元按0.95的效率算则有4/(4X0.95)=4/3.8=1.05
       i7 2600综合浮点运算的能力=1/( 0.107TFLOPS+2.7TFLOPS)X1=0.3562
       FX-8150综合浮点运算的能力=1/(0.076TFLOPS+2.7TFLOPS)X1.05=0.378
        i7 2600综合浮点运算的能力是FX-8150综合浮点运算的能力的1.061=0.378/0.3562
       则有far cry 2 i7-2600综合浮点运算能力是FX-8150综合浮点运算的能力的105.81/99.92=1.0589
       由此可见公式的与实测基本吻合.
       有人会问为什么DX9会出现如此大的差距.
       其实上面的公式是可用的但是要给GPU的运算量设定上限即可.也就是说GPU进到DX9的浮点运算量不超过0.2TFLOPS
       i7 2600综合浮点运算的能力=1/( 0.107TFLOPS+0.2TFLOPS)=3.25
        FX-8150 浮点运算能力的能力=1/(0.076TFLOPS+0.2TFLOPS)=3.62
        DX9中i7 2600综合浮点运算的能力是 FX-8150 浮点运算能力的能力的1.11=3.62/3.25
        使命召唤黑色行动i7 2600综合浮点运算的能力是 FX-8150 浮点运算能力的能力的1.10=
119.61/107.95
       星际争霸2中由于对游戏中由于对CPU单模块识别问题,i7-2600 运算地址调度能力不变,FX-8150而运算地址调度能力=4/软件可支持的处理器的的整数运算单元中的软件可支持的处理器的的整数运算单元不是四个,至多按超线程的最好结果单个整数单元按0.6的效率算则有4/(4X0.8)=4/3.2=1.25
      DX9中i7 2600综合浮点运算的能力是 FX-8150 浮点运算能力的能力的1.39=3.62X1.25/3.25
      星际争霸2i7 2600综合浮点运算的能力是 FX-8150 浮点运算能力的能力是138=101.73/73.71
      从以上的公式可以看出随着GPU的通用运算和浮点运算能力的提高,CPU的通用运算和浮点运算能力的的作用将相对弱化。未来的CPU将专注整数运算能力。从以上的证明可以看出一旦实现了硬架构实现CPU、GPU统一寻址,CPU在浮点运算时充分调用GPU的强大的通用计算和浮点运算的能力,那么CPU的浮点运算能力不足的软肋将不复存在。
    3。通过编写OpenGL的软件,实现CPU对GPU运算能力在底层的调用,以充分发挥GPU的强大的通用计算和浮点运算的能力。这一项的实现是未来AMD可能为购买新一代的GPU发放的一项福利。
    也就是说当前买了推土机架构的CPU,以后可能通过购买AMD的显卡及附属的驱动软件来调用GPU的强大的通用计算和浮点运算的能力,实现CPU功能的提升。
    下面引用硬派网作者:谢平的GPU将变成CPU?AMD下一代GPU特性解析一文的内容:
    据AMD表示,首款整合x86 CPU核心和支持DirectX 11的Radeon GPU核心的Fusion APU产品已早于1月发布,而未来AMD将会致力推动该架构的进化,当中包括按步骤支持C++的功能,令系统更充分地利用GPU的平行处理器,而且加入提供用户模式以调配CPU和GPU之间的资源,实现更低延迟的任务派发。同时,APU还会使CPU和GPU共享的统一内存地址,以及两者共享完全一致的内存,预期将持续到2014年。
     从引用文章可以看出通过编写软件实现CPU对GPU运算能力在底层的调用,以充分发挥GPU的强大的通用计算和浮点运算的能力。这对推土机CPU实现浮点运算和通用计算的能力的提升是更直接和更快捷。

        
作者: flshlion    时间: 2012-7-9 16:32
ly530408 发表于 2012-7-9 15:16
实话实说打桩机将全面接近IETTL的高端,真正可以超越的是压路机.压路机将是AMD的CPU发展的三步走战 ...

硬件的发挥是靠软件配合的,CPU+GPU共同组合成整数与浮点运算这种模式除非AMD可以很好地自发适应当前的大软件环境,否则要软件开发者去适应AMD目前来说不可能,CPU市场还是Intel说了算。
作者: ly530408    时间: 2012-7-9 18:08
flshlion 发表于 2012-7-9 16:32
硬件的发挥是靠软件配合的,CPU+GPU共同组合成整数与浮点运算这种模式除非AMD可以很好地自发适应当前的大 ...

给你一则消息可知AMD的战略目标:
AMD推动异构计算发展 成立HSA联盟
2012-06-14 CBSi中国·PChome.net 类型: 投稿 来源: CBSi中国·PChome 责编: 王学刚
2012年6月12日,美国华盛顿州贝尔维尤 –在今天召开的AMD Fusion开发者峰会 (AFDS)上,全球技术领袖聚集一堂,宣布成立“异构系统架构基金会”(HSA Foundation)。 异构系统架构基金会是一个非盈利性组织,其宗旨是定义和推广开放的、基于标准的异构计算发展之道,通过提供通用硬件规格和广泛的生态系统支持,使软件开发人员更大程度发挥最新处理器的优势,从而更轻松地完成各种创新应用的开发。

AMD、 ARM、Imagination Technologies、 联发科和德州仪器(TI)是“异构系统架构基金会”的创始成员。这些公司将共同努力,促成单一架构规范的建立,并简化编程模式,从而帮助软件开发人员更大程度利用最新中央处理器(CPU)和图形处理器(GPU)的功能,继而充分发挥异构处理器中并行计算引擎的性能和能效。

通过将异构编程模式标准化,开发者可以更轻松和经济地开发新软件,可谓是针对扩张中的、规模达550亿美元的异构(亦称“混合”)处理器市场量身定制。从实现前所未有的用户体验到提升基于云的数据管理、流服务和安全性,“异构系统架构基金会”将帮助迎来全面创新的软件新时代。

异构系统架构基金会总裁兼AMD 公司院士Phil Rogers表示:“异构系统架构让行业能够摆脱目前遏制软件创新的长达25年的传统系统架构的桎梏。异构系统架构完全瞄准软件开发者的需求,而且我们已经设计出了一个针对高性能和高能效解决方案的通用硬件平台。异构系统架构正在一系列新的应用上发挥优势,包括定义最新计算体验的个人电脑、智能手机、平板电脑和超轻薄笔记本电脑、以及创新的超级计算机和云服务等等。”

作为一个独立的组织,“异构系统架构基金会”面向所有对推动计算性能和能效进入新时代感兴趣的计算产业专业人士开放。“异构系统架构基金会”欢迎所有具有前瞻性思想的半导体公司、平台和操作系统供应商、器件生产商、独立软件供应商、学术机构和开源开发者加入。“异构系统架构基金会”的成员计划为异构计算提供可靠的开发方案,并以提供开发工具、软件开发者工具包(SDKs)、程序库、文档资料、培训和支持等等方式推动创新内容和应用的出现。

AMD负责异构应用和开发者解决方案的全球副总裁Manju Hegde表示:“一年前,AMD大胆公布了实现异构系统架构的路线图,首先将CPU和 GPU 融合成一个统一处理引擎,并创建可大大简化异构平台编程工作的架构。今天,我们继续保持在异构计算方面的领先地位,通过使异构系统架构成为开放标准来继续推动该架构在行业中的广泛应用。”

ARM公司院士、技术和媒体处理器部门副总裁Jem Davies表示:“我们都期待从这项可将我们与数字世界相连的技术中获得更多。图形界面在对用户体验至关重要的同时却存在着能效问题。采用开放标准后,开发者可同时提供卓越图形体验和高能效。ARM欢迎HSA基金会的成立,并很高兴成为创始成员之一。ARM在异构系统方面具有丰富经验,能向基于最新ARM技术(如ARM Mali GPU和Cortex 处理器),为特定任务开发特定计算处理器提供独特的、行业领先的视角。”

Imagination Technologies公司营销副总裁 Tony King-Smith说:“Imagination很高兴成为‘异构系统架构基金会’的创始成员之一。我们一直认为异构处理架构是实现可扩展的、灵活和高性能的未来SoC (Systems-on-Chip) 设计的基础。我们相信,利用诸如OpenCL、Renderscript Compute 和Direct Compute等行业标准API,将CPU与性能日益强大的融合GPU相结合,是这条道路上至关重要的第一步。HSA API和工具可以补充这些更高层次的API,进而帮助SoC系统工程师打造未来的计算平台。由于应用开发人员能够从这些架构中获得好处,所以‘异构系统架构基金会’将为保证最便携和最优化的异构应用提供一套宝贵的跨平台和跨操作系统的手段。我们期待与‘异构系统架构基金会’的所有创始成员和其他成员密切合作,来推动这个关键的开放标准在高性能计算大众市场的发展。”

联发科公司技术办公室高级总监Chien-Ping Lu表示:“联发科对于异构计算在实现创新性移动应用方面的潜力感到非常高兴。我们相信,一个开放的标准是将科技带向主流智能手机市场的关键。作为一个专注于主流智能手机市场的芯片组和平台供应商,我们很高兴能够同AMD、我们的IP合作伙伴、Imagination公司、ARM公司、德州仪器公司和其他行业领导者一起,推动异构系统架构成为异构计算的开放标准。”

德州仪器公司Linux 开发中心总监Matthew Locke说:“德州仪器在以OMAP平台的智能、多核架构提供低功耗、高性能体验方面的经验,毫无疑问自然使我们成为‘异构系统架构基金会’的一个创始成员。我们期待着与其他行业领导者共同推动异构计算成为嵌入式、移动、个人计算和云计算等领域的标准化平台。”

除创始成员外,捐助者和支持成员也将帮助进行异构系统架构和异构计算软件的研究、开发、生产、制造、使用和销售工作。如需了解关于“异构系统架构基金会”成员级别和权益方面的更多情况,或想加入该机构,请访问www.hsafoundation.com
以上是消息的全文。
APU将完成由标准的执行者项标准的制定者的转身.
在商界有句名言:一流企业做标准.
所谓的做标准在某种意义上说就是制定产品制造的规范,制定产品生产和市场销售的游戏规则.长期以来在X86的处理器架构的领域中,英特尔用其在X86的处理器架构中相对强势的地位,给出了X86的处理器的长期发展的标准模式及相应的CPU的指令集的规范.因而导致PC业界的基本上是以INTEL的X86架构的指令集来统一PC配件的标准和规范.AMD曾经有过多次领先的创新,如CPU的三级缓存L3在K6-3的利齿上的应用,K7价构提出效率为先原则,K8的HT总线,64位处理器价构,双核处理器架构,CPU内存控制器,K10的多核处理器价构,融合芯片的APU.可是为什么没从根本上取的市场的绝对多数的份额.其根本原因就是AMD的技术上的突破最终还是要通过INTEL的X86架构的指令集来实现.AMD现在通过APU的架构完成了一个质的飞跃.过去衡量CPU的标准规范是CPU的X86的处理器架构的指令集,而APU的架构的出现,是CPU的X86的处理器架构的指令集,仅是APU架构的指令集的一部分,而且CPU的X86的处理器架构的指令集要向APU架构的指令集靠拢,否则将无法充分发挥APU的功能.而AMD APP SDK 2.6的发布说明AMD逐步推广APU和推土机架构的标准.其实类似AMD的APU架构英伟达也在做.所不同的是由于英伟达没有X86架构处理器的专利授权,而且没有对X86的处理器架构的研发经验,故另辟蹊径,用ARM架构的处理器和其的显卡组
成,英伟达做成了类似APU架构的ARM结构的处理器.而且在平板电脑市场做的风生水起.AMD和英伟达都在做一件相似极高的事,即通过类似APU架构的处理器确定其在业界的技术标准,所不同的是AMD面对的是X86的处理器架构的市场,即传统的PC市场,而英伟达面对的是ARM的处理器架构的市场.既新兴的移动设备市场.两个企业不约而同的逐步脱离以纯依赖CPU,或GPU的局面,而走向两者融合的新道路和业界的规范.
AMD成立HSA联盟就是为未来的APU和IT的发展做标准。

作者: hokimfong    时间: 2012-7-15 07:47
唉.....打机党表示用AMD压力很大.....
作者: 印第安纳琼斯    时间: 2012-7-19 09:31
“数学依据”不就是数据么?
作者: ly530408    时间: 2012-7-20 17:36
印第安纳琼斯 发表于 2012-7-19 09:31
“数学依据”不就是数据么?

数学依据不就是数据的说法不完全,要从数据重归纳出其规律和公式,否则数据是死的毫无意义。
作者: 印第安纳琼斯    时间: 2012-7-20 18:06
ly530408 发表于 2012-7-20 17:36
数学依据不就是数据的说法不完全,要从数据重归纳出其规律和公式,否则数据是死的毫无意义。 ...

我只看到你的帖子一团糟,没想到回答我的问题又好像很清醒。
作者: ly530408    时间: 2012-7-20 18:23
印第安纳琼斯 发表于 2012-7-20 18:06
我只看到你的帖子一团糟,没想到回答我的问题又好像很清醒。

不是帖子一团糟,是这种格式不行。本来是想在PCEVA论坛首发全文的。可是没想到发成这样。好几人都说不便阅读。正联系版主看其能否重排一下。最后因格式不当,导致阅读不便在此致歉。
作者: 印第安纳琼斯    时间: 2012-7-20 18:27
ly530408 发表于 2012-7-20 18:23
不是帖子一团糟,是这种格式不行。本来是想在PCEVA论坛首发全文的。可是没想到发成这样。好几人都说不便 ...


老实说,看到“数学”这两个平凡而伟大的字眼,我心中不由得一动。但是往下一看,发现“语文”的阅读障碍令我无法体验到科学的奥妙。
作者: ly530408    时间: 2012-7-20 18:34
印第安纳琼斯 发表于 2012-7-20 18:27
老实说,看到“数学”这两个平凡而伟大的字眼,我心中不由得一动。但是往下一看,发现“语文”的阅读障碍 ...

其实这篇文章除了格式外,在语言结构上是按论文模式展开。欠考虑了。只是按逻辑进程就可以懂,确少了过渡和过程的展开。
作者: qwer252551    时间: 2012-7-23 14:22
其他要求吗没有。。

堆核心也堆得到位点。。

amd敢不敢来一发桌面的16核
作者: FATALITY    时间: 2012-7-27 14:05
hxl 发表于 2012-6-22 00:32
单核没所谓,我要的是多核性能
希望压路机有8M16T吧

多核的还是上双路服务器好了
作者: ggxuelei    时间: 2012-7-27 14:47
AMD灭火队很积极啊,可惜再怎么吹也不该让消费者为你的不成熟产品买单,等A枪吹嘘的那些特性真实现了我们再来支持阿曼达
作者: 3332243    时间: 2012-7-27 18:28
有nehalem就谢天谢地了,再加上大幅度超频,应该可以抢回很多市场
作者: ggxuelei    时间: 2012-7-29 18:49
其实性能神马的,都不用指望了,哪天AMD让大家把FX4100当成FX8150用就可以了
继续开,你们都懂的
作者: terriblely    时间: 2012-8-1 17:50
ggxuelei 发表于 2012-7-29 18:49
其实性能神马的,都不用指望了,哪天AMD让大家把FX4100当成FX8150用就可以了
继续开,你们都懂的 ...

,我也是这么想滴
作者: keeyboy    时间: 2012-8-1 22:42
估计没戏了……
作者: terriblely    时间: 2012-8-4 12:17
keeyboy 发表于 2012-8-1 22:42
估计没戏了……

amd的最强5000还没用呢,以前的5000+黑盒,到后来的开核5000,这次再搞个推土机5000吧
作者: eraser666    时间: 2012-8-10 19:58
推土机要是08年末09年初能出,AMD现在不会进退维谷
作者: aizhishen    时间: 2012-8-10 23:13
ly530408 发表于 2012-7-9 15:16
实话实说打桩机将全面接近IETTL的高端,真正可以超越的是压路机.压路机将是AMD的CPU发展的三步走战 ...

感觉这U就是你造的样....
说得比唱得好听!
象这样的新闻我记得每年都会有那么几个人再吹,吹到后来就吹非了....
除了939(940)的3000+(我用的939)那个时代AMD的确火了一把外,怎么多年了,我就没用过一颗AMD的U!
怎么AMD怎么多年了,除了意淫就还是意淫,意淫得差点挂了,还不知悔改,依然在继续????
AMD什么时候才能真正的进入高端桌面市场呢?
作者: ly530408    时间: 2012-8-10 23:46
aizhishen 发表于 2012-8-10 23:13
感觉这U就是你造的样....
说得比唱得好听!
象这样的新闻我记得每年都会有那么几个人再吹,吹到后来就吹非 ...

本人跟你恰相反,原来用奔腾,赛扬包括图拉丁,自从用过毒龙后,基本是AMD的CPU,虽然也用过奔腾D 915,但是主要是AMD的CPU,X2 4400+ ,X2 250 ,FX-4100。你要是去过中国无线论坛就懂了。
作者: aizhishen    时间: 2012-8-11 00:09
eraser666 发表于 2012-8-10 19:58
推土机要是08年末09年初能出,AMD现在不会进退维谷

如果2600K在08年末09年初就能出,AMD就活不到今天了....
作者: aizhishen    时间: 2012-8-11 00:33
ly530408 发表于 2012-8-10 23:46
本人跟你恰相反,原来用奔腾,赛扬包括图拉丁,自从用过毒龙后,基本是AMD的CPU,虽然也用过奔腾D 915, ...

什么懂不懂呢?
我只觉得中国人的意淫程度比较高!
AMD收购ATI之前都还比较勉强,收购后就开始意淫了....难不成是被之前ATI的老总教会意淫???
940-3600+那个年代其实AMD的市场占有率还能维持在4-5成(中国区),看看现在,基本上已经降到了3成左右了,意淫继续意淫....
非要让I-U卖得死贵死贵的,AMD才开心,搞不好私地下I总还给A总分红....
我在IT行业也混了差不多6年了,AMD从来就没好过,你说创新我到是感觉AMD的确不差创新,开始出黑盒也是AMD先出,不过最后I才把黑盒推向高端!
而AMD却又在那里意淫....
感觉怎么多年了,AMD一创新完就开始意淫,intel就在那里等,等你创新完了,意淫的时候就是我工作的时候...这到底那里跟那里啊?
作者: 固特异轮胎    时间: 2012-8-11 13:57
哎,6年的940的3000+已经都不行了,稍微一用,那使用率呼呼的往上飙啊。真希望AMD给力点啊
作者: ly530408    时间: 2012-8-11 19:40
aizhishen 发表于 2012-8-11 00:33
什么懂不懂呢?
我只觉得中国人的意淫程度比较高!
AMD收购ATI之前都还比较勉强,收购后就开始意淫了....难 ...

你知道什么运算最占CPU的资源,你如果说游戏,那么你就错了,最占CPU的资源的按占用大小排序密码的加密解密,DNA和蛋白质拓扑结构的运算,大型数学矩阵方程的线性与非线性解得运算,数学3D的建模与实时的渲染等。
举例说明用100个字符构成的20位长的密码的数据量是1乘10的40次方,用一个大型超算工作站为每秒一亿亿,,运算一天可处理8.64乘以10的22次方数据量,运行一年可处理2.72乘以10的30次方。而用穷举法破解该密码,一个大型超算工作站要连续运行36亿年。这就是为什么要你去看中国无线论坛的原因。
作者: aizhishen    时间: 2012-8-11 21:58
ly530408 发表于 2012-8-11 19:40
你知道什么运算最占CPU的资源,你如果说游戏,那么你就错了,最占CPU的资源的按占用大小排序密码的加密解 ...

我给你讲个故事....
以前有一个非常有学文的老教授讲课,但去听的人一直不多
本人怀着好奇,有一天就去听这老教授的科
开始老教授在上面教程序与公式进化,并在上面说,这套公式很牛B,能让现在的某些硬件性能对软件支持提升多少多少倍....
这时我傍边一个师兄小声说了一句"这些软件市场占有率不到1%"....
讲完这个后,这位老教授又开始讲程序调用与一体化,并说这个更牛B能让现在的计算机有质的飞跃....
然后我后面一位师兄小声说了一句"我父亲在这里读书的时候这老教授就怎么说了...."

你觉得你说的这个有什么用?
什么"20位长的密码"什么"一天可处理8.64乘以10的22次方数据量"什么"连续运行36亿年"
你觉得这些东西有什么用?
你难道让所有的人的电脑一天什么事都不做就去破解那20位的密码?
到底是你意淫昏了头,还是全中国人都是科学家?
我只能说难怪AMD始终被intel压着,意淫继续意淫,我看AMD想要翻身除非中国足球能夺世界杯....
不论是"功耗""性能"还是"制程"都比差了好几个等级!
当初穷得只有卖厂,导致现在不得不去别家拿硅晶体,还有意思说什么翻身?
能实际点不?能不意淫不?少意点淫AMD才有希望!
作者: ly530408    时间: 2012-8-11 22:20
aizhishen 发表于 2012-8-11 21:58
我给你讲个故事....
以前有一个非常有学文的老教授讲课,但去听的人一直不多
本人怀着好奇,有一天就去听这 ...

你知道IT业发展的理论基础是什么,未来的世界占主导的是两大主流产业的理论基础是什么。特此向你请教。
作者: aizhishen    时间: 2012-8-11 22:52
ly530408 发表于 2012-8-11 22:20
你知道IT业发展的理论基础是什么,未来的世界占主导的是两大主流产业的理论基础是什么。特此向你请教。 ...

我不知道IT行业发展的理论,我也不知道未来世界导的是两大主流产业的理论基础(我也不想知道)....
我只知道现在讲的是"能耗""性能""价格",不论多久都脱离不了这3样?
我试问你,AMD在这3样上那一样占了优势??除了"价格"外我真找不到AMD的优势在那里!
而"能耗"与"性能"又是相关连的!这又是AMD的死血!
什么CPU直接调用GPU,说得怎么高深,说好听了就是把GPU集成到CPU里面,说不好听了就是集显!
那么我问问你,到底要怎么做才能提高GPU的频率以至超过独显(不单单是调用问题),GPU的内存怎么办(调用主板内存?)GPU和CPU散热怎么办,功耗如何计算?
如果不集成到CPU,那么直接把GPU放在主板上吗?那主办散热怎么办?供电部分?内存部分?性能部分?
这些问题你以为是你几句话,说一堆毫无作用的参数就能解决的?
我已经说过了,如果AMD不务实,未来的5年-10年内别说翻身了,能不能生存都要打一个问号....
作者: ly530408    时间: 2012-8-11 23:11
aizhishen 发表于 2012-8-11 22:52
我不知道IT行业发展的理论,我也不知道未来世界导的是两大主流产业的理论基础(我也不想知道)....
我只知道 ...

从你的回复中就知道你根本没看懂文章的内容。你知道吗你说的什么CPU直接调用GPU,说得怎么高深,说好听了就是把GPU集成到CPU里面,这不是AMD的APU的目的,而恰好是INTEL现在I系列核显的特色。现在就问你一下APU中的GPU的作用和INTEL现在I系列核显作用的根本区别是什么,请回答出四点以上的不同之处。如果你回答不出来,那么你永远无法超越玩游戏的水准。
作者: aizhishen    时间: 2012-8-11 23:45
本帖最后由 aizhishen 于 2012-8-11 23:48 编辑
ly530408 发表于 2012-8-11 23:11
从你的回复中就知道你根本没看懂文章的内容。你知道吗你说的什么CPU直接调用GPU,说得怎么高深,说好听了就 ...


我只说3点!
第一:我不会回答你的问题,我的确没有跳出游戏水准,不过你口中所谓的APU不是现在才有的,这玩早就有了!
第二:我不会要求你回答我的问题,因为那些不是简单的百度或者google就能知道的(要明白你至少得学过最基本的工程电路学),更不是你所谓的理论参数对比就能解决的!
第三:请不要用转载或者能百度到的东西来证明自己很牛B,可以YY,也可以意淫,但不要拿这个当学问,更不要以为别人不说,就不如自己....

PS:最后,不要拿什么APU来证明自己,你是想证明自己很有学问?还是想证明AMD比intel牛B?
     我收藏这贴子,2年后再来挖坟,你就知道什么叫学问了!不要说你,就连AMD住重庆办事处的人都被我翻过白眼!
作者: aizhishen    时间: 2012-8-11 23:51
本帖最后由 aizhishen 于 2012-8-12 00:33 编辑

每年都有被我挖死的a饭....
我不是什么饭,只是实话实说,不喜欢夸大,但也绝对不会添油加醋!
本人不喜欢不务实的家伙,特别那种装腔作势的人,看点了皮毛就以为自己可以当科学家了.....
哎....
作者: ly530408    时间: 2012-8-12 01:50
aizhishen 发表于 2012-8-11 23:45
我只说3点!
第一:我不会回答你的问题,我的确没有跳出游戏水准,不过你口中所谓的APU不是现在才有的,这玩早 ...

欢迎你来挖坟。可能你还不了解本人提出的一系列问题都涉及到数学的顶尖基础理论。等你学过以后再说胜负吧。
作者: aizhishen    时间: 2012-8-12 02:02
ly530408 发表于 2012-8-12 01:50
欢迎你来挖坟。可能你还不了解本人提出的一系列问题都涉及到数学的顶尖基础理论。等你学过以后再说胜负吧 ...

麻烦你!你还真以为你是"科学家"吗?
还"顶尖基础理论"....要不我也学你去CTRL+C再CTRL+V过了,就成了"顶尖基础理论"....
那么你装也装象点好不....要是简单的C+V就成了"顶尖基础理论",那我已经不是理论了,我直接在造CPU了....
看清楚,我已经收藏了,希望你不要被我挖死了....哎....
主要是基本上以前的都被我挖死了,好可惜....
感觉高知识分子的寿命不怎么长啊....
呵呵....
作者: bokuu    时间: 2012-8-12 02:07
学习,其实你们说的都比较精彩希望继续
作者: ly530408    时间: 2012-8-12 02:19
aizhishen 发表于 2012-8-12 02:02
麻烦你!你还真以为你是"科学家"吗?
还"顶尖基础理论"....要不我也学你去CTRL+C再CTRL+V过了,就成了"顶尖 ...

你知道什么是NP/P问题吗,你知道什么是连续统假设吗,你知道什么是哥德尔定理吗,你知道什么是选择公理和不动点定理,角谷猜想吗,连这些都没接触过谈什么CPU的好坏。
作者: aizhishen    时间: 2012-8-12 02:30
ly530408 发表于 2012-8-12 02:19
你知道什么是NP/P问题吗,你知道什么是连续统假设吗,你知道什么是哥德尔定理吗,你知道什么是选择公理和 ...

偶尔破例一下不为过吧....
哥德尔定理是数理逻辑中的一个定理,1931年奥地利逻辑、数学家克尔特·哥德尔(Kurt Godel)发现并证明的,这个定理彻底粉碎了希尔伯特的形式主义理想。

这个就百度一下就来了....
不好意思,没我时间去玩C+V的游戏,这个扮演"C+V科学家"的游戏我玩不来....
玩玩FPS到是可以....呵呵
作者: ly530408    时间: 2012-8-12 07:49
aizhishen 发表于 2012-8-12 02:30
偶尔破例一下不为过吧....
哥德尔定理是数理逻辑中的一个定理,1931年奥地利逻辑、数学家克尔特·哥德尔( ...

你用百度的复制只回答了什么是哥德尔定理,但是本人要问你的是哥德尔定理的证明的依据是什么,他在什么条件下是成立的,在什么条件下是不成立的。哥德尔定理为什么要建立素数对应表示法来证明,素数表示法和整数表示法的区别是什么,为什么不用实数表示来证明。这些是书上没有的请你回答。另外问你哥德尔定理对计算机的算法的影响体现在什么方面,如何运用哥德尔定理解决计算机算法中出现的问题。
作者: aizhishen    时间: 2012-8-12 13:20
本帖最后由 aizhishen 于 2012-8-12 13:25 编辑
ly530408 发表于 2012-8-12 07:49
你用百度的复制只回答了什么是哥德尔定理,但是本人要问你的是哥德尔定理的证明的依据是什么,他在什么条 ...


说得真高深....
我也给你说过了,"C+V科学家"这个游戏我玩不来....
不过你这些问题的答案百度上还真的有(google都剩了,好坏你也找个要翻墙才能找到的这样专业点知道不)....
我就难得C+V了,必定我不是科学家,更不是去冒充科学家....
动不动就来个什么算法就能改变计算本质,做到飞跃的提升....
这个连科学家都解决不了的问题,在你这里解决了....
我就纳闷了....怎么AMD的高级工程师里面没有你呢?
看来AMD的失败不单单只是意淫,还有另一大因数就是没聘用象你这样的"高级科学家"....呵呵
作者: ly530408    时间: 2012-8-12 13:56
aizhishen 发表于 2012-8-12 13:20
说得真高深....
我也给你说过了,"C+V科学家"这个游戏我玩不来....
不过你这些问题的答案百度上还真的有(g ...

你随便找那个翻墙文件也没有这样的提问只有专门研究到核心层次才踢得出来,所以你找遍全世界的翻墙文件也没有答案,你收收叠叠吧,还是老老实实的打牢你的基础知识再来提问。告诉你的是AMD的工程师水平绝对不会比本人差,就凭你这几斤几两,人家决不会放在眼中。
作者: aizhishen    时间: 2012-8-12 14:41
ly530408 发表于 2012-8-12 13:56
你随便找那个翻墙文件也没有这样的提问只有专门研究到核心层次才踢得出来,所以你找遍全世界的翻墙文件也 ...


我不提什么问题!
我要提问你估计多半不好意思回答....
我已经给你讲过了,你所提出的问题"百度"有,但不是标准答案!
如果真的你能解决现在连AMD工程师都解决不了的,那我还是那句,AMD不聘请你去当工程师,这就是AMD失败的原因!
当然我肯定也不可能给标准答案(如理论没有以实际为基础就是可变,而可变责为假命题),比起你这样的"科学家"尔等最多算菜农而已....
感觉你还是比较谦虚的,多半AMD公司给你发的邀请函,可能你只是看不起,你是想制造中国的CPU吧....伟大的"科学家"
我等菜农就看你表演了,希望你能制造中国的CPU,最好还能改变计算机的本质....哈哈哈哈!
作者: ly530408    时间: 2012-8-12 14:47
aizhishen 发表于 2012-8-12 14:41
我不提什么问题!
我要提问你估计多半不好意思回答....
我已经给你讲过了,你所提出的问题"百度"有,但不是 ...

你把无知当有趣,提得问题无一回答出来。因而本人对你的帖子不再回复,毫无讨论价值。
作者: aizhishen    时间: 2012-8-12 15:03
本帖最后由 aizhishen 于 2012-8-12 15:06 编辑
ly530408 发表于 2012-8-12 14:47
你把无知当有趣,提得问题无一回答出来。因而本人对你的帖子不再回复,毫无讨论价值。 ...


我要能回答你的问题,我就不在这里和你瞎聊了!
建议你百度一下"假命题"或者"伪命题"是个什么东西,再来和我聊什么"哥德尔定理"吧!
在我面前装"C+V科学家"的,比你理论还多的都多得去了,到了我一提问都变成文盲了....
算了,我已经白眼过许多人了,所以就你这点C+V水平,还真不值得我白眼的(或者叫不够白眼)....
发些含金量几乎为0的帖子也好意思叫人回答....
见过C+V,不过没见过如此C+V的,1年多不跟进,现在落后了....呵呵
作者: kill_meyeah    时间: 2012-8-13 23:04
希望打桩机单核同频率可以和SNB一个水平。其次功耗不能离谱的
作者: flshlion    时间: 2012-8-17 13:03
看了aizhishen与ly530408 的争论,真心感觉没有必要。你们两人的电脑需求完全不同,侧重点不同,观点不可能会扯到一块去。

一个是计算性能需求者,一个是游戏性能需求者,吵什么呢。

当一个人对自己喜欢的品牌产品寄予大胆的合理或非合理的想象或假设时,这是良性的意淫,问题只在于科学不科学,合理不合理;

但如果将自己的想法要强加于他人身上,就是恶性的意淫,这是道德与人品问题了。

也这是我注册这个论坛而不泡在某村,某洋论坛的主要原因,现在国内论坛吵得还不足够吗。
作者: Mufasa    时间: 2012-8-20 13:43
这都几个月以前的帖子了,还能回这么多。。。。

我作为消费者,选择CPU不会考虑这么多技术细节。
我只会关心,
在计划的使用周期内,这颗CPU能否达到我的目标性能,并且在目标价格范围内。

推土机不符合我的需要,所以我只是买了一颗FX4100来玩。
i7 符合我的需要,所以我先后两次购买了i7
作者: strong1415    时间: 2012-8-30 01:17
作为一个对这方面并不了解的观众,相对于”aizhishen“我注意到LY明显更有素质,而且耐心。
个人喜欢讨论,但只喜欢有礼貌的讨论,希望彼此都能给点耐心。
个人对APU未来发展方向的理解是:能够满足办公,影视等需求,在游戏等应用时,GPU部分协助CPU进行浮点等GPU较CPU有明显优势的运算。也就是说,你如果只是办公、看看电影、玩玩小游戏,APU就能满足你。但是玩大型游戏,还是要独显,而且开了独显,集显还是在协助CPU工作。
作者: strong1415    时间: 2012-8-30 01:17
作为一个对这方面并不了解的观众,相对于”aizhishen“我注意到LY明显更有素质,而且耐心。
个人喜欢讨论,但只喜欢有礼貌的讨论,希望彼此都能给点耐心。
个人对APU未来发展方向的理解是:能够满足办公,影视等需求,在游戏等应用时,GPU部分协助CPU进行浮点等GPU较CPU有明显优势的运算。也就是说,你如果只是办公、看看电影、玩玩小游戏,APU就能满足你。但是玩大型游戏,还是要独显,而且开了独显,集显还是在协助CPU工作。
作者: ly530408    时间: 2012-8-30 08:44
strong1415 发表于 2012-8-30 01:17
作为一个对这方面并不了解的观众,相对于”aizhishen“我注意到LY明显更有素质,而且耐心。
个人喜欢讨论, ...

感谢你的阅读。AMD的CPU的单核能力分为整数与浮点。其整数运算能力与INTEL的持平或略有领先。AMD的CPU由于推土机整数指令是4发射,整数受运算除法运算器的指令快慢关系不大,双核心一模块架构下没有影响,即这样在一个指令周期内FX-81XX处理器不受除法运算器条件下整数运算指令数为4X4=16(指令调度运行还是4核的模式,也就是说在FX-81XX处理器浮点运算时,每两个核做一个模块的4指令发射,而不是两个核心的4指令发射这样FX-81XX处理器每个运行周期指令发射是4X4=16个).I7在一个指令周期内条件下整数运算指令数为4X4=16。故两者在整数运算能力相当或FX-81XX略强。但是浮点运算不同,受运算除法运算器的指令快慢关系极大。与其浮点运算指令由于共用一个浮点运算单元,操作系统目前识别双核心一模块架构FX-81XX处理器为八核,但是指令调度运行还是4核的模式,也就是说在FX-81XX处理器浮点运算时,每两个核做一个模块的4指令发射,而不是两个核心的4指令发射这样FX-81XX处理器每个运行周期指令发射是4X4=16个,而I7的每个核做一个的4指令发射,每个运行周期指令发射是4X4=16个,按说FX-81XX处理器和I7的每个运行周期浮点运算指令数是相同的,则两者浮点运算能力应该相同,但是这要建立在两个处理器的CPU的除法运算器相同的基础上,但两个处理器的CPU的除法运算器是不同的,FX-81XX处理器采用的Radix-4除法运算器每个时钟周期内可以传递2bit的运算,处理2个指令,I7采用radix-16除法器了,每周期指令数从原来的2条一下子提高到4条,这样在每个运行周期浮点运算指令数是相同时的i7的浮点运算能力超过FX-81XX处理器的一倍。压路机要提升浮点运算能力有三条路,1.改进调度方式改单模块双核执行一个4指令发射,改为每核执行一个4指令发射,这样在一个指令周期内FX-81XX处理器除法运算器不变得条件下浮点运算指令数8X4X2=64。I7在一个指令周期内除法运算器不变得条件下浮点运算指令数为4X4X4=64。两者持平。2.设计新的除法器达到radix-8每周期指令数从原来的2条提高到3条并改进调度方式改单模块双核执行一个4指令发射,改为每核执行一个4指令发射这样在一个指令周期内FX-81XX处理器浮点运算指令数为8X4X3=72,I7在一个指令周期内除法运算器不变得条件下浮点运算指令数为4X4X4=64。则FX-81XX处理器浮点运算能力是I7的1.5倍=72/64.3.通过硬件架构或软件编译的方式使CPU可以调用GPU的强大浮点运算能力。而提升FX-81XX处理器的浮点运算能力的第一条原来AMD是希望WIN7与WIN8能够改进调度方式改单模块双核执行一个4指令发射,改为每核执行一个4指令发射,但是WIN7与WIN8没有做到,这就造成了浮点运算时FX-81XX处理器浮点运算能力的不足,而AMD针对这一现状决定在压路机架构时改进调度方式改单模块双核执行一个4指令发射,改为每核执行一个4指令发射,即每个模块是个8发射。现本人从数学的角度看推土机CPU系列提出的观点昨天在超能网的报道中得到了完全的印证,现在给出文章和网址:推土机三世能否翻身,Steamroller聚焦性能提升 http://www.expreview.com/20997.html
     你提到的APU就是可以通过硬件架构或软件编译的方式使CPU可以调用GPU的强大浮点运算能力来提升CPU处理器的浮点运算能力最直接的方法。现在最强的CPU的浮点运算能力 0.185TFLOPS,而浮点运算能力GPU2.5TFLOPS,是CPU的浮点运算能力十多倍,而当APU中的GPU与外置GPU实现交火则是CPU的浮点运算能力数十倍。因此你的APU的理解是正确的。
    最后再次感谢你的阅读。
作者: acde    时间: 2012-8-30 18:07
除法器这种1%使用率的玩意也能当遮羞布来用了啊,就和没Radix-16的65nm Conroe来比吧,同频同核心数,非带宽敏感应用。
作者: ly530408    时间: 2012-8-31 01:01
acde 发表于 2012-8-30 18:07
除法器这种1%使用率的玩意也能当遮羞布来用了啊,就和没Radix-16的65nm Conroe来比吧,同频同核心数,非带 ...

这段是当年驱动之家的一篇文章四面威风!Intel 4核、4GHz、45nm处理器详尽评测的摘录
Fast Radix-16 Divider快速Radix-16除法器
在原有的酷睿2处理器可以支持每个周期同时处理4个指令,并且重新使用了较高效率的14层“Pipeline Stages”。
[attach]136142[/attach]Penryn 45nm处理器在原有的架构上对除法器进行了改良,Intel称其为“Fast Radix-16 Divider快速Radix-16除法器”。改良之后的除法器在运行科学计算、三维坐标转换和其他数学密集型运算的时候,会带来比原有高两倍的运算速度,并可以加速浮点和整数运算的速度。其重要原理就在于,通过Radix-16除法器的采用,使得当面对基数提升到16的运算时,该功能会每次运算出4位商值,将运算延迟缩短了一倍。
其原文地址为:http://hardware.mydrivers.com/2/94/94327_3.htm
     AMD统计过CPU的整数运算占80%。浮点运算占20%,故此浮点运算与之相关度最大的是除法器,此外整数运算也有除法。故此除法器的使用率决不是1%。而且CPU的除法器在CPU的设计中是最难的。



作者: Erujia    时间: 2012-8-31 09:29
也收藏了此帖,几年后来看胜负吧
作者: acde    时间: 2012-8-31 15:09
ly530408 发表于 2012-8-31 01:01
这段是当年驱动之家的一篇文章四面威风!Intel 4核、4GHz、45nm处理器详尽评测的摘录
Fast Radix-16 Divi ...

CPU指令中,7成是内存控制和位运算,2成是加乘,Radix-16能发挥作用的地方不会超过1%

Penryn对Conroe,不算外频带来的内存性能提高和L2提升,性能提升还有多少?推土机得到这种程度的提升照样不如SNB,更不谈IVB、Haswell了。
作者: ly530408    时间: 2012-8-31 17:41
原来本人在推土机出来之前与你的观点相同,但是推土机出来后专门参阅了有关资料才知道CPU中除法器的地位的重要,你所Radix-16能发挥作用的地方不会超过1%是站不住脚的,就在写从数学角度看推土机CPU一文中只认为Radix-4改进到Radix-16是提高一倍。
    但是看了Intel 4核、4GHz、45nm处理器详尽评测的摘录Fast Radix-16 Divider快速Radix-16除法器在原有的酷睿2处理器可以支持每个周期同时处理4个指令,并且重新使用了较高效率的14层“Pipeline Stages”。 Penryn 45nm处理器在原有的架构上对除法器进行了改良,Intel称其为“Fast Radix-16 Divider快速Radix-16除法器”。改良之后的除法器在运行科学计算、三维坐标转换和其他数学密集型运算的时候,会带来比原有高两倍的运算速度,并可以加速浮点和整数运算的速度。其重要原理就在于,通过Radix-16除法器的采用,使得当面对基数提升到16的运算时,该功能会每次运算出4位商值,将运算延迟缩短了一倍后,本人明白除法器不仅涉及浮点而且涉及整数的运算,原来估算有误不是一倍,而是文中的两倍,算延迟缩短一倍单位的除法运算量不是线性的算数递增,而是几何递增的。
   你有一个概念的错误。CPU指令中,7成是内存控制和位运算,2成是加乘,Radix-16能发挥作用的地方不会超过1%。注意指令执行的多少与运算量和运算时间不是必然的呈正相关的的关系。可能在某个时间周期内执行了9999条非除法运行的指令,而其所有指令运行时间占运算周期30%,而在这个时间周期内执行了1条除法指令指令运行时间占运算周期70%。你能说其Radix-16能发挥作用的地方不会超过1%吗。


作者: Mufasa    时间: 2012-9-1 01:16
没有除法器的CPU用原始的汇编做除法,也不会慢到一次除法就拖上千个指令周期。

理论脱离实际是没有意义的。

你可以继续讨论出更多的理论依据,AMD未来的产品会怎样。
但我看到的实际情况就是,
FX4100的多任务性能只比i3高一点,单任务性能完全不行。

Win7没有对推土机架构优化,Win8也没有优化到位。
或许AMD应该自己做一个操作系统,搞个5A 6A平台。
这才算是优化到位
作者: ly530408    时间: 2012-9-1 02:53
Mufasa 发表于 2012-9-1 01:16
没有除法器的CPU用原始的汇编做除法,也不会慢到一次除法就拖上千个指令周期。

理论脱离实际是没有意义的 ...

你说过的正是压路机要做的CPU的编译器的微指令,由CPU完成每个核心4指令发射,而不是现在的每个模块4指令发射。你可以去看AMD压路机架构预览:也许会有惊喜发生的文章地址http://news.mydrivers.com/1/239/239327.htm
作者: lzy24    时间: 2012-9-2 11:24
ly530408 发表于 2012-7-7 16:26
若是在推土机架构CPU出来之前说AMD的CPU的单核运算能力弱是有道理的.因为CPU的单核运算能力它包含两个方面, ...

推土机出来后,综合来看,各种测试都表明,AMD的单核效能更弱了。
作者: ly530408    时间: 2012-9-2 12:36
lzy24 发表于 2012-9-2 11:24
推土机出来后,综合来看,各种测试都表明,AMD的单核效能更弱了。

主要是浮点运算有差距,整数运算不弱。可去看本人写的从数学角度看推土机CPU
作者: lzy24    时间: 2012-9-3 01:32
ly530408 发表于 2012-9-2 12:36
主要是浮点运算有差距,整数运算不弱。可去看本人写的从数学角度看推土机CPU ...

浮点就不用说了。推土机整数ALU单元相比肥龙2也是缩减了的,因此从任何角度看,推土机的单核性能都是倒退。

至于以后什么压路机什么机,以后出来再说。
作者: AMDK9    时间: 2012-9-3 09:43
fx 8350
作者: oyyn2001    时间: 2012-9-3 11:14
楼主说这么多不就是告诉大家,AMD的神U的某种频率和P4处理器一样高,结果性能也是一样低吗?
别跟我说AMD未来可以多强大,理论性能多牛逼,现在先出一个秒我2600K的神器,我马上买了。 什么理论上星际2AMD神U能超2600.麻烦测试下嘛。星际2典型的拼单核性能的游戏,A U只有被宰的份。
作者: lzy24    时间: 2012-9-6 07:21
AMDK9 发表于 2012-9-3 09:43
fx 8350

恩,推土机2代(什么机?)同频大约有4%的提升。同频还是被自家955完秒.
作者: Mufasa    时间: 2012-9-20 09:57
其实当初推土机一代的时候我就希望是8个整数核心都可以四指令发射,这样整数运算会比Intel快不少。

结果做出来的是每个模块4指令发射,这让人非常失望。

现在推土机的单任务性能只能和不带睿频也不能超频的i3比较。
下一代似乎改进也不明显,除了官方加主频到4GHz以上。

全核心四指令发射要等到明年,再下一代CPU才会有。
这个耽误的时间就太多了。。。。

因为在CPU方面感受不到压力,Intel拿大片硅片面积去做显卡。
消费者被迫买单。
作者: wjcdra    时间: 2012-9-20 10:46
除了一个奔腾MMX之外,一直用AMD的U,到现在已经快没信心了。希望能出奇迹啊。
作者: 苹果不会飞    时间: 2012-9-21 17:34
提示: 作者被禁止或删除 内容自动屏蔽
作者: ly530408    时间: 2012-9-23 21:05
苹果不会飞 发表于 2012-9-21 17:34
支持AMD,手上一直用AMD的U

其实amd完全有一把好牌在手,只不过不会打而已。
如果采取以下方案在不需要对CPU和GPU做多少更新即可改变局面
高端APU X8X0系列与高端GPU X9X0系列作CF提升显卡功能180%。高端APU X8X0系列与中端GPUX8X0系列作CF提升显卡功能165%
中端APU X6X0系列与中端GPUX8X0系列作CF提升显卡功能160%,中端APU X6X0系列与低端GPUX7X0系列作CF提升显卡功能150%
低端APU X4X0系列与中端GPUX8X0系列作CF提升显卡功能150%,低端APU X4X0系列与低端GPUX7X0系列作CF提升显卡功能140%。
其销路自然打开。
作者: yhhx    时间: 2012-9-23 21:20
APU很有创意啊 单个APU能玩wow intel的核显就不行啊  记得前阵子看他们配了一个APU+(好像是HD4800? 反正是个低端A卡)当时这配置被嘲笑的鸡毛不是  结果那个客户打电话说谢谢你给我配的这个机器玩战地3太爽了
话说APU现在要是能做成 8120+7950的性能 完了价格2000  肯定很多很多人买

作者: ly530408    时间: 2012-9-23 21:58
Mufasa 发表于 2012-9-20 09:57
其实当初推土机一代的时候我就希望是8个整数核心都可以四指令发射,这样整数运算会比Intel快不少。

结果做 ...

其实不是设计的问题,是现有软件无法识别的问题,AMD在压路机的架构中向传统的软件做了一定程度的妥协,在前端的的解码器由每个模块共享一个,改为每个核心用一个的解码器,但是仍然是每个核心有一个整数运算运算器,每两个核心共用一个浮点运算器。但是这样在整数运算由目前推土机架构的与INTEL的I7的2600K在每个周期的指令执行数相等到压路机架构的领先,推土机架构整数运算每个周期的指令执行数为4X4=16,INTEL的I7的2600K整数运算每个周期的指令执行数为4X4=16,而压路机架构整数运算每个周期的指令执行数为8X4=32。但如果在浮点运算上压路机架构的除法器不更新,依旧用采用的Radix-4除法运算器,则在浮点运算上压路机架构每个周期的指令执行数至多与INTEL的I7的2600K持平即压路机架构=8X2=16,INTEL的I7的2600K=4X4=16,这与传出的压路机架构较现有的INTEL的I7有30%-45%的提升不符,只有压路机架构的除法器更新,采用的Radix-8除法运算器,则有浮点运算上压路机架构每个周期的指令执行数=8X3=24,INTEL的I7的2600K=4X4=16,则24/16=1.5=150%。根据大话处理器一书的作者讲INTEL称其编译器比一般编译器效率高10%,则有1.5/1.1=1.36=136%。这样说压路机架构较现有的INTEL的I7有30%-45%的提升就大体符合了。
    另外据你讲其有FX-4100,不知其如何充分发挥作用。其实你多数是用CPU来玩游戏。推土机架构在DX11的游戏如果对多核优化的好的情况下,在最高画质的运行下用HD7970去测FX-8150,FX-8120,FX-6100,FX-4100,I7 2600K,I5 2500K可能差距不大。你可测试一下。并祝你一切顺利。另外上一幅图你看一下。[attach]142026[/attach]
   
作者: wenlyyang    时间: 2012-9-24 10:45
我一直认为,推土机不能以核心为单位,而应该以模块为单位,FX8150其实只是相当于原来的4核心,只是支持的软件少所以不怎么被认同
作者: zc0224    时间: 2012-9-24 12:40
至少提升15%
作者: arthas_p    时间: 2012-9-27 09:56
需要全新架构
作者: ly530408    时间: 2012-9-27 23:39
arthas_p 发表于 2012-9-27 09:56
需要全新架构

压路机就是解决浮点运算的新的架构。




欢迎光临 PCEVA,PC绝对领域,探寻真正的电脑知识 (https://bbs.pceva.com.cn/) Powered by Discuz! X3.2