PCEVA,PC绝对领域,探寻真正的电脑知识
打印 上一主题 下一主题
开启左侧

低延迟的革命 Intel 3D XPoint技术优势解读

[复制链接]
跳转到指定楼层
1#
kobe 发表于 2016-9-5 11:28 | 只看该作者 回帖奖励 |正序浏览 |阅读模式
点击数:15313|回复数:43
之前转载过不少关于Intel 3D XPoint的相关信息,也包括一些Optane SSD的性能表现。由于产品没有最终定型,Intel一直在避免谈论具体的性能参数,而是讲解3D XPoint如何能够通过降低延迟来实现更高的效率。在最近的IDF2016上Intel又介(an)绍(li)了许多关于降低存储延迟的内容。

首先来点背景知识介绍,什么是延迟,延迟与带宽的关系?

最近这段时间能看到很多NVMe SSD的上市,包括浦科特M8Pe、饥饿鲨RD400等等,很多人关注到的是持续读写带宽最高可达XXXX MB/s这样的漂亮数字,这些只是带宽上提升。很少有人注意NVMe协议相比AHCI协议更低延迟的优势,当然这也和消费级产品的宣传中对延迟不是很注重有关。

有人可能会问,带宽的提高不就是降低延迟带来的吗?这二者难道不是此消彼长的关系?答案是否定的。带宽和延迟并没有固定的关系。

举个例子,人们去银行的ATM机取款,取款的过程需要一分钟(取款操作的延迟是1分钟),假设当前只有一台ATM机,业务吞吐量或者说带宽相当于是1/60 人/秒。现在银行升级ATM机系统,原本60秒才能完成的取款操作现在30秒就可以完成,那么延迟就降低到了30秒,业务吞吐量/带宽提高到1/30 人/秒。也就是说降低延迟是可以提高带宽的。

但是,提高带宽的手段并不是只有降低延迟这一种方法。银行可以增加一台ATM取款机来提高业务吞吐量,这样取款操作的延迟依然是60秒,但是业务吞吐量/带宽可以提高到1/30 人/秒了。这种情况下提高并行度就提高了带宽,但对于每个取款人来说,延迟并没有降低,完成取款依然需要60秒,取款操作的耗时没有在增加ATM机后就得到降低。带宽的提升也可以在不降低延迟的前提下达到的。

银行要提高用户满意率,除了要提高自身办事效率(带宽),也要尽量缩短客户办理业务所花的时间(延迟),不仅带宽要大,延迟也要尽可能小,这是两个不同的目标。

带宽可以比较容易的堆叠出来,但降低延迟并不容易

增加闪存通道数量和闪存接口带宽即可轻松提升带宽,但要降低延迟却会受到闪存读写延迟、指令处理延迟、接口访问延迟等诸多方面限制很难获得革命性提升,而低延迟正是3D XPoint的卖点。

对于Intel 3D XPoint来说,它的优势正是延迟更低

相比现有的NVMe SSD来说,使用Intel 3D XPoint技术的Optane主要是在存储介质上实现了大幅降低延迟。

对于SSD来说,更低延迟和更高带宽同样重要,不过传统的NAND介质SSD提升队列深度后带宽可以轻松增长,要降低延迟?没那么容易了。

NAND SSD单纯的读取(绿色)比较容易做到低延迟与高带宽,但混合读写(蓝色)就更为困难:

换做3D XPoint来做的话,即便是混合读写也能轻实现超低的延迟与高带宽(红色)。

对于客户/工作站级应用,Intel使用3D渲染工作来展现3D XPoint的优势:由于更低的延迟,CPU花在等待硬盘存取数据上的时间更少,并行处理速度更快,最终Intel Optane SSD渲染速度达到了Intel 750的三倍。

对于数据中心应用,Intel使用RocksDB数据库性能来演示3D XPoint的优势:使用3D XPoint技术的Optane SSD能达到P3600的三倍带宽与10倍延迟优势。

未来更牛逼的应用:Intel DIMM

Intel历史上也曾制造过内存,不过很早前就放弃了这部分业务。现在,凭借3D XPoint接近于DRAM的延迟与带宽,Intel将有机会将其制成符合DDR4标准的内存条并应用到下一代Xeon平台当中,以获得更大的内存容量和低于DRAM内存的成本。


相比于NVMe接口的Optane,未来DIMM形式的3D XPoint产品连驱动和协议、文件系统等延迟开销也都能削减掉,将低延迟特性发挥到极致:


我们对于3D XPoint应以什么样的姿势等待它的到来?

  • 3D XPoint降低延迟的作用大过提高带宽,不要只盯着持续读写带宽看了
  • 混合读写的性能远比纯读或纯写的理论带宽测试复杂的多,具体可以关注浴室的PCEVA Storage Test
  • 家用低队列深度下的性能比QD128更有价值,3D XPoint能带来有益的变化,不是“然并卵”
  • 3D XPoint不会直接取代NAND,二者是不同定位的产品
  • 初期上市Optane产品可能会是服务器平台使用的,或者至少也要是发烧级X系列芯片组才能用上的,不能抱着坐等3D XPoint的心态而拖延对刚需使用的满足,NAND SSD该买还得买~





本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?注册

x

评分

参与人数 1绝对值 +1 收起 理由
Y6-0785 + 1 很给力!

查看全部评分

44#
haierccc 发表于 2016-9-18 18:42 | 只看该作者
本帖最后由 haierccc 于 2016-9-18 18:47 编辑
nde123456 发表于 2016-9-5 14:57
我猜楼上说的是用DIMM接口形式,而不是代替DRAM
这个东西短期目标是用来当DRAM和NAND之间的缓存,类似TLC ...

我一直在想这个东东为啥使用DIMM接口。现在看来就是用作缓存了,处于DRAM和SSD/HDD之间
但具体的实现方法呢?因为INTEL还在保密,所以我就猜测一番
首先看,3D XPoint使用DIMM接口,目的应该是:和DRAM共享CPU的寻址空间
因为3D XPoint兼具SSD的大容量和接近DRAM的低延迟的优点于一身,所以可以想象将来的PC拥有128G+32G=160G的DRAM
但因为3D XPoint的延迟相比DRAM仍然嫌太高,如果在3D XPoint里运行程序代码,会造成性能的下降
而且3D XPoint的工作原理和DRAM的充放电原理肯定不同,直接用DIMM是不行的,也需要协议的转译,这样也增加了延迟
再则,一部分内存速度快,另一部分内存速度慢,这在操作系统的层面上会给程序的运行会带来负面么?我个人猜测是会的。
所以,我认为128G的3D XPoint内存空间只能用于磁盘缓存,存放数据,而不能存放可执行的程序代码。
剩下的问题是,CPU怎么知道哪些地址范围属于DRAM,哪些地址范围属于3D XPoint,并且把磁盘缓存数据放在3D XPoint的内存空间里呢?
这就是需要INTEL提供驱动了,该驱动辨别3D XPoint的内存空间,并放入缓存数据。
结论就是:用户拥有160G的DRAM内存,然后安装驱动,把其中的128G映射成磁盘缓存,这就大大加快了磁盘读写速度
而且3D XPoint是非易失性的,哪怕是强行关机,里面尚未写入HDD的数据也不会丢失
简单的说,3D XPoint的内存空间是用户不可编程的。

以上的猜测是在软件层面的,也就是需要CPU参与的过程
但其实还有另一种缓存方法:硬件缓存。也就是在底层直接做成缓存,无需CPU的参与
比如在早期(XP时代),INTEL有过一种叫做”迅盘“的加速方案,就是把一块小的FLASH放在操作系统和HDD之间以加快读的速度
但如果是这样设计,那完全可以设计成全新的接口,也不用DIMM啊。所以,以上都是猜测了,看官不必当真

43#
kylinzx 发表于 2016-9-15 00:44 | 只看该作者
真不知神马时候才会降到民用级别???
42#
aixiangsui 发表于 2016-9-10 22:51 | 只看该作者
jerrytsao 发表于 2016-9-10 05:24
碳纳米管RAM, 其实是开发公司Nantero授权给Fujitsu旗下两家公司进行晶圆研发, 这货确实最有潜力成为真正的 ...

额,谢谢给予材料。感觉物理性变化的材料能赶上纯电路的速度有点不可思议。
41#
jerrytsao 发表于 2016-9-10 05:24 | 只看该作者
本帖最后由 jerrytsao 于 2016-9-10 05:48 编辑
aixiangsui 发表于 2016-9-6 20:30
吹牛技术哪家强?看来intel的吹牛技术还是太低了,因为富士通已经吹嘘了一种更神的NRAM。
这种NRAM据说有很 ...

碳纳米管RAM, 其实是开发公司Nantero授权给Fujitsu旗下两家公司进行晶圆研发, 这货确实最有潜力成为真正的Universal Memory, 除了耐久度稍差, 延迟和密度都可以跟DRAM抗衡, 生产线也比3D XPoint之类的简单. 还有就是Fujitsu只是第一家公开授权的厂商, Nantero实际授权的远远不止这一家, 所谓人多力量大前景不可小觑.

40#
aixiangsui 发表于 2016-9-8 18:46 | 只看该作者
也许这种技术里只有粒子的迁移,就像锂离子电池里发生的一样。不然为什么那么信誓旦旦的说不是相变技术呢。
39#
cyqsimon 发表于 2016-9-8 15:05 | 只看该作者
十年后基础家用电脑可能就没有硬盘了 直接dimm上插optane 速度够快而且非易失
到时候nand ssd可能就和今天的机械硬盘地位一样了......
38#
aixiangsui 发表于 2016-9-6 20:30 | 只看该作者
吹牛技术哪家强?看来intel的吹牛技术还是太低了,因为富士通已经吹嘘了一种更神的NRAM。
这种NRAM据说有很长的寿命和极快的读写速度,尤其是后者,富士通吹嘘说碳纳米管开关速度高达皮秒级。
37#
909648183 发表于 2016-9-6 19:24 | 只看该作者
延时低了,才好更进一步的叠加带宽
36#
Y6-0785 发表于 2016-9-6 15:24 | 只看该作者
支持入门级技术帖,看楼主以前没发过精华,PCEVA真是藏龙卧虎。
35#
fanli1230 发表于 2016-9-6 15:19 | 只看该作者
可以理解为我拷贝大量零散的数据速度大幅提升了么?
比如大量的图片和音乐数据,就算是现在的sata ssd,不到100K的文件,也比较难做到500个/S
34#
luckissy 发表于 2016-9-6 14:35 | 只看该作者
听说这货不是晶体管结构,是真的么?
33#
jerrytsao 发表于 2016-9-6 00:48 | 只看该作者
本帖最后由 jerrytsao 于 2016-9-6 01:04 编辑
OstCollector 发表于 2016-9-6 00:06
这个是NVMe协议的,DIMM应该不走这个协议吧

DIMM当然跟这个无关, 只是用来说明SSD应用有很多的限制因素.

32#
OstCollector 发表于 2016-9-6 00:06 | 只看该作者
本帖最后由 OstCollector 于 2016-9-6 00:08 编辑
jerrytsao 发表于 2016-9-5 20:02
1000倍是指Cell Level速度, 做成SSD之后当然不可能这么快, 这只是Intel Optane和Micron QuantX的宣传手段 ...

这个是NVMe协议的,DIMM应该不走这个协议吧

31#
FlankerWang 发表于 2016-9-5 22:58 | 只看该作者
千代 发表于 2016-9-5 17:23
这东西绝对是闪存硬盘杀手,如果成本能足够低,现在的NAND厂商死得一个都不剩 ...

想多了,这个产品的出发点是性能而不是产能
30#
jerrytsao 发表于 2016-9-5 22:46 | 只看该作者
本帖最后由 jerrytsao 于 2016-9-5 22:50 编辑
维他命W 发表于 2016-9-5 20:36
不太同意这个看法……

其实我倒是认为~ 内存延迟是目前CPU性能无法显著提升的主要瓶颈,理由是因为另一 ...

DRAM很明显不是瓶颈, 跟L3在差不多数量级, 今后NVRAM技术主要填补的就是红色这块瓶颈最大的区域, 最终形成SCM和Universal Memory.


本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?注册

x
29#
aixiangsui 发表于 2016-9-5 21:36 | 只看该作者
本帖最后由 aixiangsui 于 2016-9-5 21:38 编辑
jerrytsao 发表于 2016-9-5 20:02
1000倍是指Cell Level速度, 做成SSD之后当然不可能这么快, 这只是Intel Optane和Micron QuantX的宣传手段 ...

这个我前面也提到过,但差别过大,恐怕内有乾坤,所以不看好DIMM的前途。
至于寿命耐久方面,闪存有确切的写入寿命是因为它的结构使然。目前我没有看到关于xpoint上有相关类似结构或限制的材料,而前面那张给出的1000倍没有标明参考对象,slc或mlc,不同制程不同品牌,在写入寿命方面都有很大差别,而图上也没有确切说明是与写入次数相关,所以我觉得像是intel简单做了个老化实验的结果,而不是说xpoint有类似于闪存的写入寿命。如果有相关资料,欢迎给出。

28#
aixiangsui 发表于 2016-9-5 21:31 | 只看该作者
本帖最后由 aixiangsui 于 2016-9-5 21:45 编辑
维他命W 发表于 2016-9-5 20:36
不太同意这个看法……

其实我倒是认为~ 内存延迟是目前CPU性能无法显著提升的主要瓶颈,理由是因为另一 ...

好像没有看到说目前CPU性能怎么受限于内存吧。何况这个东西的延迟比内存还是大太多了,用上去适得其反。目前内存的延迟在十纳秒级,闪存的延迟在十微秒级,而这个东西的延迟在微秒级。

27#
维他命W 发表于 2016-9-5 20:36 | 只看该作者
aixiangsui 发表于 2016-9-5 14:09
没有必要使用DIMM。
历来内存不是系统瓶颈,外存才是。

不太同意这个看法……

其实我倒是认为~ 内存延迟是目前CPU性能无法显著提升的主要瓶颈,理由是因为另一个矛盾的现象:CPU性能过剩。
(也许不是过剩,而是在等待~)

26#
jerrytsao 发表于 2016-9-5 20:02 | 只看该作者
本帖最后由 jerrytsao 于 2016-9-5 20:14 编辑
aixiangsui 发表于 2016-9-5 17:32
并没有写入次数限制。只有闪存有写入次数限制。
但是,这东西的DIMM也许永远出不来,虽然官方只是说延迟 ...

1000倍是指Cell Level速度, 做成SSD之后当然不可能这么快, 这只是Intel Optane和Micron QuantX的宣传手段之一. Endurance方面QuantX SSD只有5年25 DWPD, 不过厂商可以根据不同的应用来做调整所以3D XPoint DIMM会高很多, 可以参考隔壁Flash Memory Summit总结帖.

此外, 原帖里最后一张图也是3D XPoint SSD速度不"达标"的主要原因, SSD传输过程中一些必须的延迟是无法避免的.



本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?注册

x
您需要登录后才可以回帖 登录 | 注册

本版积分规则

快速回复 返回顶部