PCEVA,PC绝对领域,探寻真正的电脑知识

标题: AMD Zen的核心架构与现有Intel的有何大方向上的差异? [打印本页]

作者: alex310110    时间: 2017-3-16 17:14
标题: AMD Zen的核心架构与现有Intel的有何大方向上的差异?
这个问题只关注核心架构,不太关注具体的参数差异(比如缓存大小、way数等),关注一些架构大方向上的差异。比如AMD之前Bulldozer每个模块分成两个2发射的整数单元,共享一个浮点单元,与Intel架构就有很大的差异;Netburst架构使用replay system等设计,与现有Intel Core架构也有很大差异。现在我看上去就觉得AMD搞了个和Intel类似的架构,因此最后也反映出了一个类似的性能来。这个还得请教对此方面有深入的人士来讲述一下,或者说现在x86核心架构也就只能做到这个样了,做不出一代黑科技来?

作者: royalk    时间: 2017-3-16 17:16
CCX不一样,AVX单元不一样,L3工作机制不一样,内部集成的功能模块也差很多,等等等等,还是差很多的。
作者: alex310110    时间: 2017-3-16 17:26
royalk 发表于 2017-3-16 17:16
CCX不一样,AVX单元不一样,L3工作机制不一样,内部集成的功能模块也差很多,等等等等,还是差很多的。 ...

AVX这个搜到了相关的帖子,确实有些意思。L3的工作机制差异能具体说一下吗?特别在单个核心范围内的架构,还有哪些比较大的差异呢?谢谢

作者: royalk    时间: 2017-3-16 17:28
alex310110 发表于 2017-3-16 17:26
AVX这个搜到了相关的帖子,确实有些意思。L3的工作机制差异能具体说一下吗?特别在单个核心范围内的架构 ...

http://bbs.pceva.com.cn/thread-137952-6-1.html
119楼说的很清楚了

作者: alex310110    时间: 2017-3-16 17:37
royalk 发表于 2017-3-16 17:28
http://bbs.pceva.com.cn/thread-137952-6-1.html
119楼说的很清楚了

还有之类相关的回复吗?有没有汇总的帖子?另外,我还是比较关心单核心内部实现还有哪些大方向的差异,现在AVX的实现上倒是一点。谢谢

作者: royalk    时间: 2017-3-16 19:24
alex310110 发表于 2017-3-16 17:37
还有之类相关的回复吗?有没有汇总的帖子?另外,我还是比较关心单核心内部实现还有哪些大方向的差异,现 ...

单核内部只有浮点单元设计不太一样,其它都差不多

作者: alex310110    时间: 2017-3-16 19:32
royalk 发表于 2017-3-16 19:24
单核内部只有浮点单元设计不太一样,其它都差不多

那现在是不是I、A两家在单纯核心架构上都摸不出啥更好的新路子来的状态?

作者: dogbear    时间: 2017-3-16 19:37
alex310110 发表于 2017-3-16 17:37
还有之类相关的回复吗?有没有汇总的帖子?另外,我还是比较关心单核心内部实现还有哪些大方向的差异,现 ...

有的看就不错了,将来那些帖子可能都是收费的

作者: royalk    时间: 2017-3-16 19:40
alex310110 发表于 2017-3-16 19:32
那现在是不是I、A两家在单纯核心架构上都摸不出啥更好的新路子来的状态?
...

不是摸不出什么路子,性能的提升是有限的,无论硬件还是软件,都只能尽量提高效率,往一个理论值上去靠。

作者: alex310110    时间: 2017-3-16 19:45
royalk 发表于 2017-3-16 19:40
不是摸不出什么路子,性能的提升是有限的,无论硬件还是软件,都只能尽量提高效率,往一个理论值上去靠。 ...

了解了,多谢!
作者: adsl4096    时间: 2017-3-16 21:07
个人觉得intel已经利用这几代cpu完成了许多黑科技的前置实验。比如Netburst的倍速alu设计一直实验到atom退市,要不你以为做个atom来干嘛
作者: Mufasa    时间: 2017-3-16 21:16
adsl4096 发表于 2017-3-16 21:07
个人觉得intel已经利用这几代cpu完成了许多黑科技的前置实验。比如Netburst的倍速alu设计一直实验到atom退 ...

Atom 还验证了一个古老的设计,顺序执行,用于现在的应用场合,是否性能真的差到完蛋。

结果并没有完蛋,凑合能用。

并且Atom的超线程技术与我们现在看到的乱序执行CPU超线程技术也有区别。

AMD已经出招,就看Intel怎么接招了。

作者: adsl4096    时间: 2017-3-16 21:57
Mufasa 发表于 2017-3-16 21:16
Atom 还验证了一个古老的设计,顺序执行,用于现在的应用场合,是否性能真的差到完蛋。

结果并没有完蛋 ...

AMD还是差的太远了,intel根本就是纯粹用市场来做实验。一个宏融合AMD到现在还学不了,何况还有那么多已经实验完成的技术储备。

作者: alex310110    时间: 2017-3-16 22:36
adsl4096 发表于 2017-3-16 21:07
个人觉得intel已经利用这几代cpu完成了许多黑科技的前置实验。比如Netburst的倍速alu设计一直实验到atom退 ...

那AMD推土机是不是也试了一把?……

作者: adsl4096    时间: 2017-3-16 22:47
alex310110 发表于 2017-3-16 22:36
那AMD推土机是不是也试了一把?……

是啊,试那破玩意干嘛。在模拟的时候就应该知道效率低下了啊,不如继续玩k10

作者: danze    时间: 2017-3-17 13:52
本帖最后由 danze 于 2017-3-17 14:00 编辑

zen核心像iu而不像之前的au(尤其对照老"正宗amd"系列,如k8 k10这些),雷同/相似的设计到处都是  思路更是同道,即多发射强力乱序+smt
具体的实现上,把zen和haswell的一些规格列出来,比如前端解码/吞吐,乱序引擎的布局 调度窗口数,L/S能力等
不仅很多拓扑一样,而且一堆参数一致   就如早期报道说的那样,微架构高度致敬intel它也有自己的特点,如借助更大uops cache容量配合分离式-主动投机拾取的分支预测来降低失败惩罚,更多执行端口和调度资源等
非直接性能相关的特性倒是和intel差别更多,单是电源管理这块就很有意思

作者: danze    时间: 2017-3-17 14:04
alex310110 发表于 2017-3-16 22:36
那AMD推土机是不是也试了一把?……

amd搞的东西很多思路都来自已死或半残的诸risc好汉(主要是sparc),思路比较specialize
intel看起来大多时候练基本功,思路保守谨慎,不断抠细节提高

作者: 里奥    时间: 2017-3-17 14:22
royalk 发表于 2017-3-16 17:28
http://bbs.pceva.com.cn/thread-137952-6-1.html
119楼说的很清楚了

R大,问个问题
现在R5出来了
1400和1500X当中,1400L3被砍一半,1500X依然是16M,你觉得这会对性能有什么特别的影响吗
核心都是2+2,这L3中数据交流肯定有变吧

作者: royalk    时间: 2017-3-17 14:30
里奥 发表于 2017-3-17 14:22
R大,问个问题
现在R5出来了
1400和1500X当中,1400L3被砍一半,1500X依然是16M,你觉得这会对性能有什么 ...

我觉得不会有太大影响,毕竟L3是排除式缓存

作者: alex310110    时间: 2017-3-17 19:56
danze 发表于 2017-3-17 13:52
zen核心像iu而不像之前的au(尤其对照老"正宗amd"系列,如k8 k10这些),雷同/相似的设计到处都是  思路更是同 ...

对的,我现在就是这个感觉。非核心架构方面的改进很多确实有意思,比如SATA、USB集成,然后用PCI-E和南桥通讯,那我觉得这个南桥可能可以在一个系统上完全不存在。Intel现在CPU运行还是必须要南桥存在的,但如果AMD现在平台完全可以不需要南桥的话,那CPU集成的SATA、USB数量在笔记本上可能就直接够用了。服务器上多一个PCI-E 4X还可以拿来去接别的东西。

作者: alex310110    时间: 2017-3-17 19:58
danze 发表于 2017-3-17 14:04
amd搞的东西很多思路都来自已死或半残的诸risc好汉(主要是sparc),思路比较specialize
intel看起来大多时 ...

除了Netburst时候浪了一波是吧?……

作者: yy0c    时间: 2017-3-21 14:11
现在 Zen 这么猛就因为在微结构上向 Intel 靠齐了啊。恰恰说明 Intel 很牛而不是他们“挤牙膏”。而且还应该注意到在很多 corner case 上 Zen 还有很大不足,我想这也是其预计未来两代还能有 15% 的性能提升的缘故。和 ARM 一样,AMD 起点低,进步快。但是要追上甚至赶超 Intel,我看不到可能性。

现在 CPU 微结构趋同是趋势,高性能一般都是超标量+乱序执行的方案,节能优先的小核心可能会砍掉OoO(A7/A53/Atom)。真正奇葩的是 NVIDIA 的 Denver,VLIW+DCO 的微结构。但是我没看到足够公开资料,不好评论。
作者: alex310110    时间: 2017-3-21 19:44
yy0c 发表于 2017-3-21 14:11
现在 Zen 这么猛就因为在微结构上向 Intel 靠齐了啊。恰恰说明 Intel 很牛而不是他们“挤牙膏”。而且还应 ...

Denver是CPU里面跑JIT程序,然后把ARM编译成VLIW来并发吗?好像很厉害的样子,但我看他们自家Tegra有时候也不见得全用这个架构……

话说,你就是Skorny吗?……

作者: yy0c    时间: 2017-3-21 19:56
本帖最后由 yy0c 于 2017-3-21 19:58 编辑
alex310110 发表于 2017-3-21 19:44
Denver是CPU里面跑JIT程序,然后把ARM编译成VLIW来并发吗?好像很厉害的样子,但我看他们自家Tegra有时候 ...

是的。这种奇葩的设计独此一家,并不总是用这个方案的原因很简单。公版也在进化,哪个更好就用哪个。 VLIW + DCO 的 Die Size 似乎比较小,方便他们节省成本或者把预算用在 GPU 上,功耗上也有优势。但这些都是他们说的,很难就此做出判断。

是。我看到你是才回复的。

不过说回来,GPU 也是 VLIW 的,GPU 驱动就是个 JIT 编译器……

作者: alex310110    时间: 2017-3-21 20:20
yy0c 发表于 2017-3-21 19:56
是的。这种奇葩的设计独此一家,并不总是用这个方案的原因很简单。公版也在进化,哪个更好就用哪个。 VLIW ...

现在的GPU还在用VLIW做吗?感觉好像都不这么玩了…… 但Denver这个把JIT的软硬件全集成了吧,就有意思多了……
作者: yy0c    时间: 2017-3-21 20:33
本帖最后由 yy0c 于 2017-3-21 21:00 编辑
alex310110 发表于 2017-3-21 20:20
现在的GPU还在用VLIW做吗?感觉好像都不这么玩了…… 但Denver这个把JIT的软硬件全集成了吧,就有意思多 ...

移动端还没那么先进呢。

至于 Denver 的未来还得再看。也许能在车载焕发第二春呢。

NVIDIA 的一份资料:http://www.softmachines.com/wp-c ... ech-Briefing-vF.pdf

作者: haierccc    时间: 2017-3-21 21:06
都是高人,都知道CPU的设计
作者: alex310110    时间: 2017-3-21 22:17
yy0c 发表于 2017-3-21 20:33
移动端还没那么先进呢。

至于 Denver 的未来还得再看。也许能在车载焕发第二春呢。

这个真的是NVIDIA的吗?……

PPT做得好,真能把单个软件线程拆成多个硬件线程那就黑科技了,但我怕这玩意实际上做出来就是多发射OoO + 超线程……

作者: alex310110    时间: 2017-3-21 22:19
haierccc 发表于 2017-3-21 21:06
都是高人,都知道CPU的设计

真正设计实现都是硕士起步一般博士学历的人在搞吧,我就大致看看做出来的成果,能看懂一些就不错了……

作者: yy0c    时间: 2017-3-21 22:27
alex310110 发表于 2017-3-21 22:17
这个真的是NVIDIA的吗?……

PPT做得好,真能把单个软件线程拆成多个硬件线程那就黑科技了,但我怕这玩 ...

那到不至于,我只是不确定这个方案的具体效果。

如果是基于公版的设计,主要都是本科。但是新的微结构设计确实需要博士什么的。

作者: alex310110    时间: 2017-3-22 07:32
yy0c 发表于 2017-3-21 22:27
那到不至于,我只是不确定这个方案的具体效果。

如果是基于公版的设计,主要都是本科。但是新的微结构设 ...

嗯。我看英特尔招人一般都是硕士起的

作者: danze    时间: 2017-3-24 14:09
alex310110 发表于 2017-3-17 19:56
对的,我现在就是这个感觉。非核心架构方面的改进很多确实有意思,比如SATA、USB集成,然后用PCI-E和南桥 ...

更密集也更有趣了.. 我一直想要一个加厚2.5移动硬盘尺寸的mini pc  以前的产品做到这个尺寸的似乎只有via
zen集成度高,如果出个apu 完全可以压缩尺寸到很小.. 想想就觉得很美啊

作者: alex310110    时间: 2017-3-24 19:19
danze 发表于 2017-3-24 14:09
更密集也更有趣了.. 我一直想要一个加厚2.5移动硬盘尺寸的mini pc  以前的产品做到这个尺寸的似乎只有via ...

我现在就很好奇现在这个平台能不能脱离南桥





欢迎光临 PCEVA,PC绝对领域,探寻真正的电脑知识 (https://bbs.pceva.com.cn/) Powered by Discuz! X3.2