PCEVA,PC绝对领域,探寻真正的电脑知识
打印 上一主题 下一主题
开启左侧

Bulldozer Version 2.0 -- 推土机2代的一些消息

[复制链接]
跳转到指定楼层
1#
royalk 发表于 2010-11-7 22:53 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
点击数:3609|回复数:8
AMD recently added several new extensions for the "upcoming bdver2 processors" into the set of patches for GNU operating system, findings  of a famous blogger reveal. The fact that Advanced Micro Devices made the new extensions available under non-disclosure agreement to select software developers mean that the company's Bulldozer Version 2.0 - or, perhaps, Bulldozer NG - may be just several years away.

The new extensions that should be supported by the Bulldozer 2 processors are the following:

    * BMI - Bit Manipulation Instructions
    * TBM - Trailing Bit Manipulation
    * FMA3 - three operand FMA [fused multiply-add] instructions

Unfortunately, we know nothing about the aforementioned instructions and their potential. What we do know is that AMD's own Bulldozer does support FMA4 instruction already and the FMA3 may be implemented for better compatibility with Intel's Sandy Bridge/Ivy Bridge chips that support the FMA3


坐等翻译
2#
ahfncj 发表于 2010-11-8 10:03 | 只看该作者
同等......
3#
aaaaaa889 发表于 2010-11-8 10:37 | 只看该作者
本帖最后由 aaaaaa889 于 2010-11-8 10:40 编辑

最近一个著名的博客发表了他们的最新发现,AMD在开源操作系统的补丁里添加了一些新的针对“即将到来的bdver2处理器”的扩展指令。AMD在保密协议的前提下发布了这些新扩展指令来选择软件开发者意味着该公司的推土机2.0——或者可能叫做推土机NG——的发布不会远了。
这些新的将会被推土机2.0所支持的扩展指令如下:
BMI:位操作指令
TBM:结尾比特操作指令(BMI和TBM这些位操作指令一般和多媒体性能相关,经过搜索发现,这个指令集可能和H.264编码有关,也就是说可能是增强视频方面性能的,可以搜索“RBSP trailing bits”来搜索相关信息)
FMA3:三操作数FMA指令
不幸的是,对上面这些指令和他们潜在的能力我们一无所知。我们只知道AMD的推土机架构确实已经支持FMA4指令,而FMA3可能会出于兼容英特尔Sandy Bridge/Ivy Bridge芯片的原因而被添加支持。

评分

参与人数 1活跃度 +40 收起 理由
royalk + 40 原创内容

查看全部评分

4#
aaaaaa889 发表于 2010-11-8 10:43 | 只看该作者
回复 1# royalk


  初试翻译,牛人别喷。。。呵呵。。。
5#
aaaaaa889 发表于 2010-11-8 10:47 | 只看该作者
我看到国外网站上有人回帖说他认为这些指令不应该等到推土机二代才被支持,而是推土机就会支持了,我自己也觉得至少FMA3可能推土机就会支持了吧?毕竟英特尔是支持FMA3的。。。
6#
aaaaaa889 发表于 2010-11-8 10:48 | 只看该作者
我记得英特尔先是宣布将会支持FMA4,然后等AMD也修改方案了,又宣布支持FMA3,虚晃了好几枪啊。。。晃点AMD呢。。。
7#
aaaaaa889 发表于 2010-11-8 10:53 | 只看该作者
8#
royalk  楼主| 发表于 2010-11-8 10:54 | 只看该作者
FMA是一种乘法和加法的混合操作,它会先将2个数相乘,然后再与第三个数相加。看上去就相当于:(A*B)+C。这里的差别就是操作数量是3次还是4次。我们将A、B、C假想为三个寄存器。那么FMA3就是(A*B)+C=写入C寄存器。而AMD的版本是将得到的结果存入第四个寄存器D。而事实上,Intel在计算的结束时,也需要将数据覆盖到C寄存器上。如果你询问AMD的工程师,他们会告诉你,FMA4可以帮你节省最后一步覆盖拷贝操作。而 Intel的工程师则会告诉你,FMA3可以使用更少的寄存器就完成了操作。但是有一点我们需要搞清楚,如果你需要做大量的计算任务,例如(A*B)+常量,那么AMD的FMA4方案将会帮助你节省更多的时钟周期。也就是说,从算法技术的方面看,这两种方案都有其优势和缺点。Intel的FMA3并不能完胜FMA4。

这只是AMD官方的评论。。实际对我们有多大作用还不得而知
9#
aaaaaa889 发表于 2010-11-8 11:17 | 只看该作者
本帖最后由 aaaaaa889 于 2010-11-8 11:39 编辑

回复 8# royalk


   拜见R爷。。。
您需要登录后才可以回帖 登录 | 注册

本版积分规则

快速回复 返回顶部