PCEVA,PC绝对领域,探寻真正的电脑知识
打印 上一主题 下一主题
开启左侧

从芯片设计和逻辑组合来看你的GPU,浅谈Kepler VS Tahiti

  [复制链接]
1#
ericafountaine 发表于 2012-8-8 15:34 | 显示全部楼层
本帖最后由 ericafountaine 于 2012-8-8 15:38 编辑

其实我本来不想说什么的,不过不说我觉得对不起良心,还是注册了个号来说。

1. 其实老黄的双线设计,并不只是从GF104和GF110开始的,G92和GT200就是很明显的一对,G71和G80其实也是一对只是时间跨度稍微长了一点点

>没有什么“双线”、“单线”。GPU设计厂商会有很多个团队交互工作,比如说之前负责RV770的团队,在做完这一款产品之后投入了Tahiti的开发工作,而RV770之后的Cypress和Cayman都由不同的团队完成。一款产品从设想、立项到完成、流片至少要4~5年时间,ATI就算是三头六臂也不可能用一个团队来一款一款做,更何况还有长期的理论、架构研究。
G71是G70的削减,不是什么G80的双线。

2. AMD的架构变化较大,但是性能的提升却是线性的,而Nvidia却不同,架构小幅改变,性能却是大步迈进

>我真不知该怎么说好,如果你认为UTDP到ACE的变化比SM到SMX的变化小,那我真的没办法。Cypress的Command Processor可以看做RISC CPU,这一点是比费米强多了——虽说费米只有一个Giga-Thread Engine,无必要堆那个,但是你别忘了对面还有鬼畜的UTDP,那玩意从R520沿用至今了。4-way VLIW4变16-way vector SIMD简直是竖着变成横着,还有你看到CU里面的Scheduler了吗?那可比Warp美多了吧。

算了,别的我不说了。身为个宅应该懂日语吧,多点去观摩后藤大神吧,还有不少福利,Cortex A15什么的。

评分

参与人数 2活跃度 +10 收起 理由
673 + 5 后藤是谁?
yumeyao + 5 看懂了

查看全部评分

2#
ericafountaine 发表于 2012-8-8 15:50 | 显示全部楼层
还是和CHH当年的水平有差距啊。

可惜什么AFXIF,女王,大死人花都不在了。权当缅怀先烈。
3#
ericafountaine 发表于 2012-8-8 16:49 | 显示全部楼层
heren3 发表于 2012-8-8 16:46
CHH当年真心耐看

你的学姐更耐看

可惜啊可惜,技术区全给轮子个2B砍掉了
4#
ericafountaine 发表于 2012-8-8 16:53 | 显示全部楼层
heren3 发表于 2012-8-8 16:52
哪里来的学姐?

=-=在盛夏等待
5#
ericafountaine 发表于 2012-8-8 16:54 | 显示全部楼层
heren3 发表于 2012-8-8 16:50
1. 此贴个人觉得值三个精华
2. GK104不能买,以后做CUDA开发基本就只能用便宜的GTX480了
3. 一直觉得,GK10 ...

GK104主要砍了SFU和寄存器。而Tahiti却正好有很多这些。

所以我认为这次的局面,很像是当年GF100与Cypress的逆位——两家对调立场了。
6#
ericafountaine 发表于 2012-8-9 10:15 | 显示全部楼层
heren3 发表于 2012-8-8 17:21
AMD看到NV每次推一款GPU,专业卡上坑了不少的人傻钱多,游戏卡这边用广告也揽去不少很眼红
于是逐渐朝着N ...

Barts没割SFU

Evergreen的SFU和费米的区别很大,后者的和普通ALU一起在SM里面(8/32),接受Warp Scheduler调度;前者和4个ALU一起绑定为一个SIMD Core,依靠UTDP调度。所以从原理上来说,Evergreen要砍SFU真心是件蛋疼的事。

成绩也能看出来了,Barts的通用性能也不差嘛。估计也只是割寄存器而已。
7#
ericafountaine 发表于 2012-8-9 10:40 | 显示全部楼层
hyenax1950xtx 发表于 2012-8-9 09:26
发帖目的就是交流和学习,谢谢提出与指正。

1、研发时长的这个理解的,但我指的的单双线是指同一时期市 ...

其实主要是“竖着”和“横着”的区别……

以Cayman为例,UTDP实际上是一个4-WAY VLIW SIMD指令发射单元,每个SIMD CORE有64个ALU,64/4=16个Streaming Processor(他们蛋疼地把每个ALU算作一个“Shader Processor”)。Cayman中,每个UTDP管12个SIMD CORE,VLIW指令到了Streaming Processor解包,给4个ALU。

ACE下面管CU,每个CU是一个4-WAY SIMD,每个SIMD又有4 LANE,每CU与每SIMD CORE同为64ALU。ACE的指令到了CU之后就分4,不像VLIW一样到了最后ALU才分4,也不用解包(所以指令其实更多)。

简单点说,前者是16*4=64,后者是4*16=64……
8#
ericafountaine 发表于 2012-8-9 10:48 | 显示全部楼层
嘛,说白了Cayman从头到尾都是SIMD(但是Command Processor到2*UTDP又不是?这个不清楚了,只知道按架构推定,CP肯定具有有限的分派机能的),而GCN从ACE到CU是MIMD,从CU到4-WAY SIMD是SIMD。

好久不聊这些都记不清楚了,抱歉。
9#
ericafountaine 发表于 2012-8-9 11:15 | 显示全部楼层
hyenax1950xtx 发表于 2012-8-9 11:00
Cayman的指令要到Shader Processor才开始解封,这个也是之前VLIW架构下,UTDP的指令发射模板吧,区别只是 ...

后一个没问题。

关于Cayman我说错了,UTDP对SIMD CORE还是多指令多数据流,MIMD,因为VLIW是给每个SP的
10#
ericafountaine 发表于 2012-8-9 11:18 | 显示全部楼层
老糊涂啊。自R520/580就是UTDP发指令给顶点/像素的
您需要登录后才可以回帖 登录 | 注册

本版积分规则

快速回复 返回顶部