PCEVA,PC绝对领域,探寻真正的电脑知识
打印 上一主题 下一主题
开启左侧

Finfet/3D晶体管时代的几个工艺

[复制链接]
跳转到指定楼层
1#
点击数:12631|回复数:35
本帖最后由 haomingci3 于 2017-8-3 10:57 编辑

首先先有几个先导知识:
1、高性能工艺与低功耗工艺:高性能工艺又被称为通用工艺,在同关键技术(HKMG、Finfet等)代内一般密度低的性能强劲,当然并不绝对,一方面受厂商鱼鳍与底层技术能力影响,另一方面每一代关键技术都有一个密度性能甜点,这一代的甜点估计是在intel 14++到台积电16FF+左右的位置,intel 14++、台积电12FFN两大高性能工艺都选择在这个密度点附近,预计GF14+也是如此。
高性能工艺的特征是在高频率下,同频功耗低于低功耗工艺,并且能稳定下来的频率上限更高(极限超频不追求稳定,这主要指1.4V以下超频);但是在低频下则功耗逊色于低功耗工艺。什么时候属于高频,什么时候属于低频是看对比工艺的,有些工艺对比时2G多点就开始算高频,如台积电20nm vs 28nmHPM,有些工艺对比甚至500MHZ就成为拐点。高性能、低功耗除了厂商有时候有定位外(i14++和初代10,台积电的16+和10,三星的GF14+和10LPE),多数情况都是相对而言的,在跨厂商对比时要慎用。
PS:工艺本身不会影响IPC。




2、关键技术:进入45nm以后,关键技术的利好性最佳,进入intel 22nm之后的FF工艺基本都是一个世代,只是在做性能、成本、良率、功耗等不同导向的取舍,密度增大已经是一把双刃剑。工艺利好性较高的另一操作是鱼鳍增高与底层优化(14+相对于14除密度降低一点外的主要操作,老黄的12FFN和接下来GF14+估计也是进行了类似操作),当然鱼鳍加高也是有上限的,能抵消的密度副作用也有限,业界普遍认为在intel密度标准下10nm是FF的最终章,EUV可以小续一秒,不过10nm-7nm之间就已然不是好不好强不强的问题了,而是能不能用的问题,intel的10nm和其他家的7nm选的密度点大同小异很大程度上源于此,真正续命得引入新关键技术。
但业界终点并非什么好事,业界的认知上,非HKMG不要做30nm以下产品,台积电强做了28lp;非FF不要做20nm以下产品,台积电强做了20nm。所以你看到intel的初代10nm现有资料看地位连初代14nm都不如,初代14好歹硬着上了桌面,而intel自己也承认即使是第二代10+也没能干掉14++,10++干掉了14++,那是19年的事情,那是业界估计的GAA元年,当然也可能会出现不顺,10++又像14++一样降密度玩。
总之,密度更大的工艺能做到全面进步才是罕见的,有升有降做取舍是常态。




3、流水线:影响能否跑高频除了工艺还有别的因素,其中一个参数就是流水线,流水线越长越能超,但同时也受到SIMD等其他因素影响,根据分支预测反推,SNB的流水线为14级,haswell为15级,skylake为17级,ryzen为19级,具体我们下面说。这里提一句,ryzen受到14LPP的限制是非常大的,不仅是在表象上频率上不去,为了能够达到4G左右拉到这么高的流水线也会对IPC和uncore设计有不小的影响。




4、没有意义的优势:有些优势在一些产品上没有意义,比如22SOI工艺(这个不是FF流派,不能简单地比密度)在200MHZ下能耗比超强,但对于桌面端没有任何意义,它目前也只是嵌入式领域的工艺;比如22nm,性能比初代14nm强很多,但放到超多核心的服务器领域,低频多核效率更高,那22nm超频能到5G也没有意义。




5、意义较低的优势:很多人问,既然20nm和初代10nm等低功耗工艺适合低频多核,那老黄和AMD干嘛不上,反正规模对显卡肯定有效,1080规模多一倍,性能就比1060多一倍。没错,GPU怎么堆规模都有效果,但问题在于如10nm、20nm一类的低功耗工艺在频率上降低很多,帕斯卡跑10LPE有可能出现1G多点到顶的状况,这时候你要花翻倍的规模来弥补,最终的成品可能是面积与16+的帕斯卡一样,能耗比是秒飞了16+帕斯卡,但纯性能差不多,成本却暴涨(有过分析单位面积价格10nm比14/16高50%)。问题来了,用户愿不愿意为接近的性能、能耗比增加多付出50%的票子?又或者厂商愿不愿意保持原价,让利50%给消费者?并且厂商低功耗定位的工艺做大核心也存在很多问题,成本进一步提升只是问题的一部分。




总结:
Intel 22nm:FF世代的开山之作,虽然莫名其妙地被硅脂弄的口碑不佳,22nm如果不考虑功耗,至今性能仍然处于顶尖范畴,你可能疑惑14+那么能超,比22nm不强多了。问题要综合来看,现在你需要看流水线,上面的几个架构常用IPC差异还没到能吃多级流水线的程度,除了haswell的AVX2能达到吃掉一级流水线的水平,不信你试试haswell-KBL跑P95 27.9X64的稳定电压是不是比你用29.2X64低很多,能稳的频率是不是要高。而同时你可以看到broadwell超频很烂,但同为初代14的SKL则要好上不少,那两级流水线不是白上的,因此14+超频更强我认为架构流水线变化占了一部分功劳,同架构比22与14+孰强孰弱并不确定。功耗不必说,肯定被后面的工艺打趴。




Intel 初代14nm:虽然也做了拉鱼鳍和底层优化,但密度提升太大抵消了收益,导致其性能倒车严重,broadwell你懂的,5775C立即被淘汰与此估计有不小关系。功耗控制倒是尚可,同频同压和14+几乎一样,但14+并不和初代14同压玩。




Intel 14+:相对初代14降低密度,调侃一下我叫个intel 14.5nm,并拉高鱼鳍底层优化,与调体质的7700K到7740X是本质的不同,调体质主要是掺杂选取与良率等的小幅度变化,工艺是一样的,频率上下限几乎不变,俗称官方挑雕,没办法做到SKL变KBL这种基本盘甩飞大雕的提升。目前综合最强工艺,虽然性能上与22有些纠缠,但性能强的同时功耗甩开22一大截就已经奠定了它的水准。




Intel 14++:CFL的工艺,预计是10nm甚至比10nm强(因为密度低更敢拉鱼鳍)的鱼鳍和底层用在了intel标准下16nm密度上做出的产品,与初代10nm有通用工艺与低功耗工艺搭配的意思。与14+的PK性能上强劲,低功耗表现上能否完爆14+尚存悬念,毕竟14++也上了笔记本,两个变量,一个是底层14+输,一个是密度14++输,不过话说回来,只要1ghz以上都是14++压制14+,那14+的低功耗优势在桌面上就基本是无用优势了。




GF 14nmLPP:很多人以为它带着LP(low power)就以为它是低功耗工艺,但其实不是,低功耗工艺需要通过拉密度来做的,14LPP作为密度与14++接近的产品(三星自家的10LPE与Intel 14/14+密度差不多,比14LPP大60%),在现阶段的桌面比拼中只有一条出路就是做高性能工艺,然而14LPP的高性能表现大家有目共睹。不得不说ryzen为14LPP做的仁至义尽,把AVX2单元砍了一半,还做了19级流水线来带14LPP,最后4G左右止步,ryzen表示我能怎么办,我也很无奈啊。14LPP同期面对14+主要在成本上占优,14+的密度和三星10LPE基本一样的,而且还做成了高性能工艺,这就不必我多说了吧,其实14LPP对台积电16+的成本都占优。不过14LPP面对自家10LPE和台积电初代10nm时仍能有一些高性能优势。




GF14+:PPT上ryzen的下一代工艺,细节较少,估计密度变化不大,主要是鱼鳍和底层增强,按现阶段的业界平均鱼鳍与底层技术能力来看,把ryzen带到skylake的频率水平也是有可能的。




台积电12FFN:这个工艺不同于公版的12nm即12FFC,大家不要将二者搞混,12FFN在晶体管密度上与16+差不多,比12FFC小很多,N代表NVIDIA定制的意思,细节尚少,但个人估计是将台积电10nm左右的底层和鱼鳍做到了台积电15.5nm的密度上。




台积电16+工艺:台积电现在的通用高性能工艺,高性能表现很突出,台积电在10nm量产后仍称16+性能最强(此消息来源来自国内媒体,我没找到原话),与i初代14的战况比较纠缠,高性能爆掉14LPP问题不大,在1GHZ左右级别对决中能耗略输14LPP。

评分

参与人数 2代金券 +50 绝对值 +1 收起 理由
PC_MasterRace + 1 牛逼
石头 + 50

查看全部评分

2#
haomingci3  楼主| 发表于 2017-8-5 06:27 | 显示全部楼层
AthlonX2 发表于 2017-8-4 15:28
没想到SNB的流水线是最低的。  实际的IPC却比haswell,skylake低, 啥原因?

流水线越长并不代表IPC一定会降低,还有其他影响因素,比如你的分支预测做的怎么样,缓存设计怎么样等等
3#
haomingci3  楼主| 发表于 2017-8-5 06:30 | 显示全部楼层
菲尼克斯 发表于 2017-8-3 16:19
顺便问下LZ,HPM HPC HPC+之间哪个比较好

HPM最佳,除非你拿来做低频A53。HPC是纯缩水型工艺,密度大一些,HPC+是缩水后找回一些HPM特性的工艺,有能与HPM组成高低性能工艺搭配的潜质,不过拐点较低,主要还是成本导向
4#
haomingci3  楼主| 发表于 2017-8-5 06:42 | 显示全部楼层
黄元1981 发表于 2017-8-4 22:25
我只知道目前晶体管数量最多的就是V100  晶体管数量高达211亿,估计英特尔的14nm+++都做不出这种晶体管暴多 ...

我看除了成本拿14++去做没什么问题,GV100的面积非常大,如果你去算GV100对比GP100的晶体管密度提升为3.22%,同为28nm的GK110到GM200的提升为3.3%,我是没看出12FFN能做而14++做不了的情况
5#
haomingci3  楼主| 发表于 2017-8-16 13:41 | 显示全部楼层
黄元1981 发表于 2017-8-16 01:44
那你觉得拿14++来做GV100面积能压到多少mm2?如果真的拿14++来做GV100的话晶体管能不能上到400亿?
...

14++的密度和12FFN差不多,就面积来说压不了多少
6#
haomingci3  楼主| 发表于 2017-8-17 18:02 | 显示全部楼层
黄元1981 发表于 2017-8-16 20:19
那用14++来做GV100的话,晶体管还能增加多少?

密度差不多也增加不了什么
7#
haomingci3  楼主| 发表于 2017-8-17 22:48 | 显示全部楼层
黄元1981 发表于 2017-8-17 18:21
那这么说来,14nm++和12FFN是同一级别的咯?台积电居然在制造工艺上追平了英特尔,真不可思议啊,怪不得黄 ...

密度一样而已,追平无从谈起,要是想要,初代14nm的密度比14+和14++都大,用来做现在的伏特面积比12FFN和14++小多了,同面积的话晶体管也比14++和12FFN多
8#
haomingci3  楼主| 发表于 2017-8-19 07:13 | 显示全部楼层
本帖最后由 haomingci3 于 2017-8-19 08:04 编辑
黄元1981 发表于 2017-8-17 23:22
这么说来初代14nm才是王道?现在的14nm+ 14nm++都是垃圾货?如果用初代14nm来做GV100的话,在同为815mm2 ...

工艺要看应用场景,这我主贴已经说的比较明白了,不是简单的谁王道谁垃圾,密度大小更是无法决定一个工艺的好坏。
1、单看做现在这个GV100初代14占不到半点便宜,14++来做虽然面积大,但对散热有利,比如你觉得300W在800mm2上好散热还是500mm2上好散热,关键在14++和14+比初代14功耗还低;
2、如果说你考虑工艺切割极限性能,同面积下的性能,给815mm2里塞更多性能,此时14++的确没有14和14+来的有利,因为规模差距过大,频率弥补不上,但初代14和14+密度差距并不大,频率可以弥补很可能超过规模的损失,14+此时我看比初代14更有利

如果综合来看,我认为三者中比较适合做理想中的GV100的工艺是14+,但你别又理解成14+是王道,14++是垃圾货了。。。。14++说白了是为性能CPU量身打造的工艺
您需要登录后才可以回帖 登录 | 注册

本版积分规则

快速回复 返回顶部