从芯片设计和逻辑组合来看你的GPU，浅谈Kepler VS Tahiti

ericafountaine · 发表于 2012-8-8 15:34

本帖最后由 ericafountaine 于 2012-8-8 15:38 编辑

其实我本来不想说什么的，不过不说我觉得对不起良心，还是注册了个号来说。

1. 其实老黄的双线设计，并不只是从GF104和GF110开始的，G92和GT200就是很明显的一对，G71和G80其实也是一对只是时间跨度稍微长了一点点

>没有什么“双线”、“单线”。GPU设计厂商会有很多个团队交互工作，比如说之前负责RV770的团队，在做完这一款产品之后投入了Tahiti的开发工作，而RV770之后的Cypress和Cayman都由不同的团队完成。一款产品从设想、立项到完成、流片至少要4~5年时间，ATI就算是三头六臂也不可能用一个团队来一款一款做，更何况还有长期的理论、架构研究。
G71是G70的削减，不是什么G80的双线。

2. AMD的架构变化较大，但是性能的提升却是线性的，而Nvidia却不同，架构小幅改变，性能却是大步迈进

>我真不知该怎么说好，如果你认为UTDP到ACE的变化比SM到SMX的变化小，那我真的没办法。Cypress的Command Processor可以看做RISC CPU，这一点是比费米强多了——虽说费米只有一个Giga-Thread Engine，无必要堆那个，但是你别忘了对面还有鬼畜的UTDP，那玩意从R520沿用至今了。4-way VLIW4变16-way vector SIMD简直是竖着变成横着，还有你看到CU里面的Scheduler了吗？那可比Warp美多了吧。

算了，别的我不说了。身为个宅应该懂日语吧，多点去观摩后藤大神吧，还有不少福利，Cortex A15什么的。

ericafountaine · 发表于 2012-8-8 15:50

还是和CHH当年的水平有差距啊。

可惜什么AFXIF，女王，大死人花都不在了。权当缅怀先烈。

ericafountaine · 发表于 2012-8-8 16:49

heren3 发表于 2012-8-8 16:46
CHH当年真心耐看

你的学姐更耐看

可惜啊可惜，技术区全给轮子个2B砍掉了

ericafountaine · 发表于 2012-8-8 16:53

heren3 发表于 2012-8-8 16:52
哪里来的学姐？

=-=在盛夏等待

ericafountaine · 发表于 2012-8-8 16:54

heren3 发表于 2012-8-8 16:50
1. 此贴个人觉得值三个精华
2. GK104不能买，以后做CUDA开发基本就只能用便宜的GTX480了
3. 一直觉得，GK10 ...

GK104主要砍了SFU和寄存器。而Tahiti却正好有很多这些。

所以我认为这次的局面，很像是当年GF100与Cypress的逆位——两家对调立场了。

ericafountaine · 发表于 2012-8-9 10:15

heren3 发表于 2012-8-8 17:21
AMD看到NV每次推一款GPU，专业卡上坑了不少的人傻钱多，游戏卡这边用广告也揽去不少很眼红
于是逐渐朝着N ...

Barts没割SFU

Evergreen的SFU和费米的区别很大，后者的和普通ALU一起在SM里面（8/32），接受Warp Scheduler调度；前者和4个ALU一起绑定为一个SIMD Core，依靠UTDP调度。所以从原理上来说，Evergreen要砍SFU真心是件蛋疼的事。

成绩也能看出来了，Barts的通用性能也不差嘛。估计也只是割寄存器而已。

ericafountaine · 发表于 2012-8-9 10:40

hyenax1950xtx 发表于 2012-8-9 09:26
发帖目的就是交流和学习，谢谢提出与指正。

1、研发时长的这个理解的，但我指的的单双线是指同一时期市 ...

其实主要是“竖着”和“横着”的区别……

以Cayman为例，UTDP实际上是一个4-WAY VLIW SIMD指令发射单元，每个SIMD CORE有64个ALU，64/4=16个Streaming Processor（他们蛋疼地把每个ALU算作一个“Shader Processor”）。Cayman中，每个UTDP管12个SIMD CORE，VLIW指令到了Streaming Processor解包，给4个ALU。

ACE下面管CU，每个CU是一个4-WAY SIMD，每个SIMD又有4 LANE，每CU与每SIMD CORE同为64ALU。ACE的指令到了CU之后就分4，不像VLIW一样到了最后ALU才分4，也不用解包（所以指令其实更多）。

简单点说，前者是16*4=64，后者是4*16=64……

ericafountaine · 发表于 2012-8-9 10:48

嘛，说白了Cayman从头到尾都是SIMD（但是Command Processor到2*UTDP又不是？这个不清楚了，只知道按架构推定，CP肯定具有有限的分派机能的），而GCN从ACE到CU是MIMD，从CU到4-WAY SIMD是SIMD。

好久不聊这些都记不清楚了，抱歉。

ericafountaine · 发表于 2012-8-9 11:15

hyenax1950xtx 发表于 2012-8-9 11:00
Cayman的指令要到Shader Processor才开始解封，这个也是之前VLIW架构下，UTDP的指令发射模板吧，区别只是 ...

后一个没问题。

关于Cayman我说错了，UTDP对SIMD CORE还是多指令多数据流，MIMD，因为VLIW是给每个SP的

ericafountaine · 发表于 2012-8-9 11:18

老糊涂啊。自R520/580就是UTDP发指令给顶点/像素的

从芯片设计和逻辑组合来看你的GPU，浅谈Kepler VS Tahiti

评分