从数学的角度看推土机CPU之五

Mufasa · 发表于 2012-7-21 10:11

数学不及格的飘过。。。。

AMD根本就没有什么战略。
卖掉芯片厂，这就是最大的失败。

Intel 玩工艺都把AMD玩死了。
从这一次 IVY Bridge 就可以看出来，Intel 本来有能力大幅提升主频。
却没有提升主频，而是想到了偷工减料，Die 散热用硅脂。
主频停滞不前，TDP下降很多。

至于异构运算，这个都吹了几年了吧。
Intel 就算对这玩意没兴趣，也会开发一些对应的技术。

另外在高端并行计算方面，Intel 的 XeonE7系列可是领先了很多的。
而且后面还有个一直不算成功的IA64架构安腾处理器。

把棋下得太大太慢，却让对手看清楚了你一步一步怎么走。
即使是好棋，也没有意义。

Mufasa · 发表于 2012-7-21 10:22

另外关于缓存调度，楼主的观点我不认同。

推土机巨量的二级三级缓存事实证明并不成功。
二级缓存延迟高，
三级缓存延迟更高，命中率也低。

更要命的是缓存调度体系

Intel 在Core i 系列架构中引入了L3完全包含L2数据的缓存调度体系。
这样当一个核心在自己的缓存中找不到数据时，只需要到L3当中检索即可。

AMD这一代推土机的缓存调度体系和上一代肥龙没有本质区别。
三级缓存和二级缓存独立，内核寻找缓存数据非常浪费时间。
AMD的三级缓存更加接近北桥的概念，使得集成显卡共享这个缓存更加容易。
但也使得CPU部分从中获取的收益偏低。

Mufasa · 发表于 2012-7-21 11:07

jianghongwei 发表于 2012-7-21 10:30
你这黑amd黑的有点明显把，就说的太过了.....

amd没战略，能把amd玩死，却要故意降低自己的主频，放竞争 ...

真把AMD玩死了，Intel在X86体系成为垄断地位，就面临美国反垄断法的制裁了。。。。

IBM 和 AT&T 都因此被拆分过，所以Intel学得很乖，不去碰这条线。

分析了半天，似乎你们忽略了NVidia 的通用计算技术。
要说这方面走在前面，应该是NVidia Tesla
一套完整的产品线，和大量成熟应用的系统支持。

Intel 如果在通用计算方面烂到渣，最后的一步就是直接收购NVidia
以他现在的现金数量，这完全可行。

AMD 确实在下一盘很大的棋，但是下得太慢。
而且每一步都被对手看得清清楚楚。
这样下棋是赢不了的。

Mufasa · 发表于 2012-7-21 11:19

ly530408 发表于 2012-7-21 10:42
为什么AMD的打桩机不断增大L2,L3是为什么,据本人做算法分析和内存资源分析就是这么多可能还不够,因为如果 ...

16MB 缓存还不够？
(4x2MB L2 + 8MB L3)

现在的推土机芯片面积已经很大了，再增加缓存，GLOBALFOUNDRIES的工艺会更加吃紧。
再把显卡也加进去，制造难度又提高，良品率就低到不能接受了。
做产品终究是要赚钱的，芯片设计不能和芯片制造脱节，否则后果严重。

早期那一大堆价格非常便宜的AthlonII X4 631 641 ，
就是GLOBALFOUNDRIES工艺问题，导致APU内部的显卡部分良品率低，最后只有彻底屏蔽显卡出售。

美好的设计必须有现实的工艺支持，才能成为产品。

Mufasa · 发表于 2012-7-21 11:26

jianghongwei 发表于 2012-7-21 10:30
你这黑amd黑的有点明显把，就说的太过了.....

amd没战略，能把amd玩死，却要故意降低自己的主频，放竞争 ...

你说的那本书我不需要看，我看这个：

TOP 10 Sites for June 2012

1 DOE/NNSA/LLNL
United States Sequoia - BlueGene/Q, Power BQC 16C 1.60 GHz, Custom
IBM

2 RIKEN Advanced Institute for Computational Science (AICS)
Japan K computer, SPARC64 VIIIfx 2.0GHz, Tofu interconnect
Fujitsu

3 DOE/SC/Argonne National Laboratory
United States Mira - BlueGene/Q, Power BQC 16C 1.60GHz, Custom
IBM

4 Leibniz Rechenzentrum
Germany SuperMUC - iDataPlex DX360M4, Xeon E5-2680 8C 2.70GHz, Infiniband FDR
IBM

5 National Supercomputing Center in Tianjin
China Tianhe-1A - NUDT YH MPP, Xeon X5670 6C 2.93 GHz, NVIDIA 2050
NUDT

6 DOE/SC/Oak Ridge National Laboratory
United States Jaguar - Cray XK6, Opteron 6274 16C 2.200GHz, Cray Gemini interconnect, NVIDIA 2090
Cray Inc.

7 CINECA
Italy Fermi - BlueGene/Q, Power BQC 16C 1.60GHz, Custom
IBM

8 Forschungszentrum Juelich (FZJ)
Germany JuQUEEN - BlueGene/Q, Power BQC 16C 1.60GHz, Custom
IBM

9 CEA/TGCC-GENCI
France Curie thin nodes - Bullx B510, Xeon E5-2680 8C 2.700GHz, Infiniband QDR
Bull

10 National Supercomputing Centre in Shenzhen (NSCS)
China Nebulae - Dawning TC3600 Blade System, Xeon X5650 6C 2.66GHz, Infiniband QDR, NVIDIA 2050
Dawning

四个 PowerPC ，四个 Xeon ，一个SPARC ，一个 Opteron

其中三个明确表示用到NVidia Tesla

Mufasa · 发表于 2012-7-21 11:44

吹了半天AMD的并行计算如何如何，产品在哪里？

10名后面倒是有AMD GPU加速的，前10可是一个都没。

Mufasa · 发表于 2012-7-21 11:54

i3 i5 i7 我都在用

Athlon X4 X6 ，推土机，APU ，我也都有。

现实的差距摆在那里，Intel的快一大截。
你告诉我，以后会怎样怎样。。。。

等到明年 Haswell 都出来了。

Mufasa · 发表于 2012-7-21 13:56

这两年AMD不行，Intel 越来越坑爹，价格死死的不降，还各种缩水。

真心希望AMD能在CPU方面有进步，但看不到任何迹象。
因为AMD把精力都放在融合上面去了。

我是NV的支持者，显然不喜欢AMD的显卡。
AMD这种融合策略明显不符合我的期望。
除非AMD能在技术上取得更大的进步，让AMD GPU加速AMD CPU运算，同时允许系统内存在NVidia的显卡。
正常情况下我是不会给自己的主力机器配置3A平台的。

Mufasa · 发表于 2012-7-21 14:12

那个叫OpenCL吧。。。。

不过第二点看起来不错，不知道要多长时间才能做出来。
做出来以后能有多少软件支持，也是个问题。

X86 体系其实在技术上已经没有多少可取的地方，唯一的亮点就是强大的前后继承可兼容性。
Pentium 处理器上可以运行的程序，在i7 处理器上也可以运行。

新开发的软件可以针对CPU GPU优化，这个其实用哪种技术体系并无本质区别。
Intel 也有一个开发中的众核计划，用于高性能计算。
NVidia 有Cuda ，目前应用也很多。

如何让新技术对老程序运算速度实现提升，这才是关键。

目前看来这方面取得突破很难，Haswell 新加入的技术对老程序也没多少效果。

如果AMD能够在融合APU中实现CPU对GPU运算单元的直接调用，不依赖任何外部软件，与操作系统无关。
这才是巨大的成功。

Mufasa · 发表于 2012-9-15 11:12

其实看到楼主说用 OpenCL 来处理加速 X86指令，我就觉得这个帖子没有再回的必要了。

AMD的PPT做得非常好，非常成功，以至于要用高级数学理论来证明。
我等凡人看不懂，只有放弃。

从数学的角度看推土机CPU之五

点评

浏览过的版块