PCEVA,PC绝对领域,探寻真正的电脑知识
打印 上一主题 下一主题
开启左侧

从数学的角度看推土机CPU之五

  [复制链接]
1#
Mufasa 发表于 2012-7-21 10:11 | 显示全部楼层
数学不及格的飘过。。。。

AMD根本就没有什么战略。
卖掉芯片厂,这就是最大的失败。

Intel 玩工艺都把AMD玩死了。
从这一次 IVY Bridge 就可以看出来,Intel 本来有能力大幅提升主频。
却没有提升主频,而是想到了偷工减料,Die 散热用硅脂。
主频停滞不前,TDP下降很多。

至于异构运算,这个都吹了几年了吧。
Intel 就算对这玩意没兴趣,也会开发一些对应的技术。

另外在高端并行计算方面,Intel 的 XeonE7系列可是领先了很多的。
而且后面还有个一直不算成功的IA64架构 安腾处理器。

把棋下得太大太慢,却让对手看清楚了你一步一步怎么走。
即使是好棋,也没有意义。
2#
Mufasa 发表于 2012-7-21 10:22 | 显示全部楼层
另外关于缓存调度,楼主的观点我不认同。

推土机巨量的二级三级缓存事实证明并不成功。
二级缓存延迟高,
三级缓存延迟更高,命中率也低。

更要命的是缓存调度体系

Intel 在Core i 系列架构中引入了L3完全包含L2数据的缓存调度体系。
这样当一个核心在自己的缓存中找不到数据时,只需要到L3当中检索即可。

AMD这一代推土机的缓存调度体系和上一代肥龙没有本质区别。
三级缓存和二级缓存独立,内核寻找缓存数据非常浪费时间。
AMD的三级缓存更加接近北桥的概念,使得集成显卡共享这个缓存更加容易。
但也使得CPU部分从中获取的收益偏低。
3#
Mufasa 发表于 2012-7-21 11:07 | 显示全部楼层
jianghongwei 发表于 2012-7-21 10:30
你这黑amd黑的有点明显把,就说的太过了.....

amd没战略,能把amd玩死,却要故意降低自己的主频,放竞争 ...

真把AMD玩死了,Intel在X86体系成为垄断地位,就面临美国反垄断法的制裁了。。。。


IBM 和 AT&T 都因此被拆分过,所以Intel学得很乖,不去碰这条线。


分析了半天,似乎你们忽略了NVidia 的通用计算技术。
要说这方面走在前面,应该是NVidia Tesla
一套完整的产品线,和大量成熟应用的系统支持。

Intel 如果在通用计算方面烂到渣,最后的一步就是直接收购NVidia
以他现在的现金数量,这完全可行。


AMD 确实在下一盘很大的棋,但是下得太慢。
而且每一步都被对手看得清清楚楚。
这样下棋是赢不了的。
4#
Mufasa 发表于 2012-7-21 11:19 | 显示全部楼层
ly530408 发表于 2012-7-21 10:42
为什么AMD的打桩机不断增大L2,L3是为什么,据本人做算法分析和内存资源分析就是这么多可能还不够,因为如果 ...

16MB 缓存还不够?
(4x2MB L2 + 8MB L3)

现在的推土机芯片面积已经很大了,再增加缓存,GLOBALFOUNDRIES的工艺会更加吃紧。
再把显卡也加进去,制造难度又提高,良品率就低到不能接受了。
做产品终究是要赚钱的,芯片设计不能和芯片制造脱节,否则后果严重。

早期那一大堆价格非常便宜的AthlonII X4 631 641 ,
就是GLOBALFOUNDRIES工艺问题,导致APU内部的显卡部分良品率低,最后只有彻底屏蔽显卡出售。

美好的设计必须有现实的工艺支持,才能成为产品。

5#
Mufasa 发表于 2012-7-21 11:26 | 显示全部楼层
jianghongwei 发表于 2012-7-21 10:30
你这黑amd黑的有点明显把,就说的太过了.....

amd没战略,能把amd玩死,却要故意降低自己的主频,放竞争 ...

你说的那本书我不需要看,我看这个:

TOP 10 Sites for June 2012

1 DOE/NNSA/LLNL
United States Sequoia - BlueGene/Q, Power BQC 16C 1.60 GHz, Custom
IBM

2 RIKEN Advanced Institute for Computational Science (AICS)
Japan K computer, SPARC64 VIIIfx 2.0GHz, Tofu interconnect
Fujitsu

3 DOE/SC/Argonne National Laboratory
United States Mira - BlueGene/Q, Power BQC 16C 1.60GHz, Custom
IBM

4 Leibniz Rechenzentrum
Germany SuperMUC - iDataPlex DX360M4, Xeon E5-2680 8C 2.70GHz, Infiniband FDR
IBM

5 National Supercomputing Center in Tianjin
China Tianhe-1A - NUDT YH MPP, Xeon X5670 6C 2.93 GHz, NVIDIA 2050
NUDT

6 DOE/SC/Oak Ridge National Laboratory
United States Jaguar - Cray XK6, Opteron 6274 16C 2.200GHz, Cray Gemini interconnect, NVIDIA 2090
Cray Inc.

7 CINECA
Italy Fermi - BlueGene/Q, Power BQC 16C 1.60GHz, Custom
IBM

8 Forschungszentrum Juelich (FZJ)
Germany JuQUEEN - BlueGene/Q, Power BQC 16C 1.60GHz, Custom
IBM

9 CEA/TGCC-GENCI
France Curie thin nodes - Bullx B510, Xeon E5-2680 8C 2.700GHz, Infiniband QDR
Bull

10 National Supercomputing Centre in Shenzhen (NSCS)
China Nebulae - Dawning TC3600 Blade System, Xeon X5650 6C 2.66GHz, Infiniband QDR, NVIDIA 2050
Dawning

四个 PowerPC ,四个 Xeon ,一个SPARC ,一个 Opteron

其中三个明确表示用到NVidia Tesla
6#
Mufasa 发表于 2012-7-21 11:44 | 显示全部楼层
吹了半天AMD的并行计算如何如何,产品在哪里?

10名后面倒是有AMD GPU加速的,前10可是一个都没。
7#
Mufasa 发表于 2012-7-21 11:54 | 显示全部楼层
i3 i5 i7 我都在用

Athlon X4 X6 , 推土机 ,APU ,我也都有。

现实的差距摆在那里,Intel的快一大截。
你告诉我,以后会怎样怎样。。。。

等到明年 Haswell 都出来了。

点评

hxl
一大截是多大? 30%还是50%?  发表于 2012-7-21 12:59
8#
Mufasa 发表于 2012-7-21 13:56 | 显示全部楼层
这两年AMD不行,Intel 越来越坑爹,价格死死的不降,还各种缩水。

真心希望AMD能在CPU方面有进步,但看不到任何迹象。
因为AMD把精力都放在融合上面去了。

我是NV的支持者,显然不喜欢AMD的显卡。
AMD这种融合策略明显不符合我的期望。
除非AMD能在技术上取得更大的进步,让AMD GPU加速AMD CPU运算,同时允许系统内存在NVidia的显卡。
正常情况下我是不会给自己的主力机器配置3A平台的。
9#
Mufasa 发表于 2012-7-21 14:12 | 显示全部楼层
那个叫OpenCL吧。。。。

不过第二点看起来不错,不知道要多长时间才能做出来。
做出来以后能有多少软件支持,也是个问题。

X86 体系其实在技术上已经没有多少可取的地方,唯一的亮点就是强大的前后继承可兼容性。
Pentium 处理器上可以运行的程序,在i7 处理器上也可以运行。

新开发的软件可以针对CPU GPU优化,这个其实用哪种技术体系并无本质区别。
Intel 也有一个开发中的众核计划,用于高性能计算。
NVidia 有Cuda ,目前应用也很多。

如何让新技术对老程序运算速度实现提升,这才是关键。

目前看来这方面取得突破很难,Haswell 新加入的技术对老程序也没多少效果。

如果AMD能够在融合APU中实现CPU对GPU运算单元的直接调用,不依赖任何外部软件,与操作系统无关。
这才是巨大的成功。
10#
Mufasa 发表于 2012-9-15 11:12 | 显示全部楼层
其实看到楼主说用 OpenCL 来处理加速 X86指令,我就觉得这个帖子没有再回的必要了。

AMD的PPT做得非常好,非常成功,以至于要用高级数学理论来证明。
我等凡人看不懂,只有放弃。
您需要登录后才可以回帖 登录 | 注册

本版积分规则

快速回复 返回顶部