低延迟的革命 Intel 3D XPoint技术优势解读

kobe · 发表于 2016-9-5 11:28

之前转载过不少关于Intel 3D XPoint的相关信息，也包括一些Optane SSD的性能表现。由于产品没有最终定型，Intel一直在避免谈论具体的性能参数，而是讲解3D XPoint如何能够通过降低延迟来实现更高的效率。在最近的IDF2016上Intel又介（an）绍（li）了许多关于降低存储延迟的内容。

首先来点背景知识介绍，什么是延迟，延迟与带宽的关系？

最近这段时间能看到很多NVMe SSD的上市，包括浦科特M8Pe、饥饿鲨RD400等等，很多人关注到的是持续读写带宽最高可达XXXX MB/s这样的漂亮数字，这些只是带宽上提升。很少有人注意NVMe协议相比AHCI协议更低延迟的优势，当然这也和消费级产品的宣传中对延迟不是很注重有关。

有人可能会问，带宽的提高不就是降低延迟带来的吗？这二者难道不是此消彼长的关系？答案是否定的。带宽和延迟并没有固定的关系。

举个例子，人们去银行的ATM机取款，取款的过程需要一分钟（取款操作的延迟是1分钟），假设当前只有一台ATM机，业务吞吐量或者说带宽相当于是1/60 人/秒。现在银行升级ATM机系统，原本60秒才能完成的取款操作现在30秒就可以完成，那么延迟就降低到了30秒，业务吞吐量/带宽提高到1/30 人/秒。也就是说降低延迟是可以提高带宽的。

但是，提高带宽的手段并不是只有降低延迟这一种方法。银行可以增加一台ATM取款机来提高业务吞吐量，这样取款操作的延迟依然是60秒，但是业务吞吐量/带宽可以提高到1/30 人/秒了。这种情况下提高并行度就提高了带宽，但对于每个取款人来说，延迟并没有降低，完成取款依然需要60秒，取款操作的耗时没有在增加ATM机后就得到降低。带宽的提升也可以在不降低延迟的前提下达到的。

银行要提高用户满意率，除了要提高自身办事效率（带宽），也要尽量缩短客户办理业务所花的时间（延迟），不仅带宽要大，延迟也要尽可能小，这是两个不同的目标。

带宽可以比较容易的堆叠出来，但降低延迟并不容易

增加闪存通道数量和闪存接口带宽即可轻松提升带宽，但要降低延迟却会受到闪存读写延迟、指令处理延迟、接口访问延迟等诸多方面限制很难获得革命性提升，而低延迟正是3D XPoint的卖点。

对于Intel 3D XPoint来说，它的优势正是延迟更低

相比现有的NVMe SSD来说，使用Intel 3D XPoint技术的Optane主要是在存储介质上实现了大幅降低延迟。

对于SSD来说，更低延迟和更高带宽同样重要，不过传统的NAND介质SSD提升队列深度后带宽可以轻松增长，要降低延迟？没那么容易了。

NAND SSD单纯的读取（绿色）比较容易做到低延迟与高带宽，但混合读写（蓝色）就更为困难：

换做3D XPoint来做的话，即便是混合读写也能轻实现超低的延迟与高带宽（红色）。

对于客户/工作站级应用，Intel使用3D渲染工作来展现3D XPoint的优势：由于更低的延迟，CPU花在等待硬盘存取数据上的时间更少，并行处理速度更快，最终Intel Optane SSD渲染速度达到了Intel 750的三倍。

对于数据中心应用，Intel使用RocksDB数据库性能来演示3D XPoint的优势：使用3D XPoint技术的Optane SSD能达到P3600的三倍带宽与10倍延迟优势。

未来更牛逼的应用：Intel DIMM

Intel历史上也曾制造过内存，不过很早前就放弃了这部分业务。现在，凭借3D XPoint接近于DRAM的延迟与带宽，Intel将有机会将其制成符合DDR4标准的内存条并应用到下一代Xeon平台当中，以获得更大的内存容量和低于DRAM内存的成本。

相比于NVMe接口的Optane，未来DIMM形式的3D XPoint产品连驱动和协议、文件系统等延迟开销也都能削减掉，将低延迟特性发挥到极致：

我们对于3D XPoint应以什么样的姿势等待它的到来？

3D XPoint降低延迟的作用大过提高带宽，不要只盯着持续读写带宽看了
混合读写的性能远比纯读或纯写的理论带宽测试复杂的多，具体可以关注浴室的PCEVA Storage Test
家用低队列深度下的性能比QD128更有价值，3D XPoint能带来有益的变化，不是“然并卵”
3D XPoint不会直接取代NAND，二者是不同定位的产品
初期上市Optane产品可能会是服务器平台使用的，或者至少也要是发烧级X系列芯片组才能用上的，不能抱着坐等3D XPoint的心态而拖延对刚需使用的满足，NAND SSD该买还得买~

haierccc · 发表于 2016-9-18 18:42

本帖最后由 haierccc 于 2016-9-18 18:47 编辑

nde123456 发表于 2016-9-5 14:57
我猜楼上说的是用DIMM接口形式，而不是代替DRAM
这个东西短期目标是用来当DRAM和NAND之间的缓存，类似TLC ...

我一直在想这个东东为啥使用DIMM接口。现在看来就是用作缓存了，处于DRAM和SSD/HDD之间
但具体的实现方法呢？因为INTEL还在保密，所以我就猜测一番
首先看，3D XPoint使用DIMM接口，目的应该是：和DRAM共享CPU的寻址空间
因为3D XPoint兼具SSD的大容量和接近DRAM的低延迟的优点于一身，所以可以想象将来的PC拥有128G+32G=160G的DRAM
但因为3D XPoint的延迟相比DRAM仍然嫌太高，如果在3D XPoint里运行程序代码，会造成性能的下降
而且3D XPoint的工作原理和DRAM的充放电原理肯定不同，直接用DIMM是不行的，也需要协议的转译，这样也增加了延迟
再则，一部分内存速度快，另一部分内存速度慢，这在操作系统的层面上会给程序的运行会带来负面么？我个人猜测是会的。
所以，我认为128G的3D XPoint内存空间只能用于磁盘缓存，存放数据，而不能存放可执行的程序代码。
剩下的问题是，CPU怎么知道哪些地址范围属于DRAM，哪些地址范围属于3D XPoint，并且把磁盘缓存数据放在3D XPoint的内存空间里呢？
这就是需要INTEL提供驱动了，该驱动辨别3D XPoint的内存空间，并放入缓存数据。
结论就是：用户拥有160G的DRAM内存，然后安装驱动，把其中的128G映射成磁盘缓存，这就大大加快了磁盘读写速度
而且3D XPoint是非易失性的，哪怕是强行关机，里面尚未写入HDD的数据也不会丢失
简单的说，3D XPoint的内存空间是用户不可编程的。

以上的猜测是在软件层面的，也就是需要CPU参与的过程
但其实还有另一种缓存方法：硬件缓存。也就是在底层直接做成缓存，无需CPU的参与
比如在早期(XP时代)，INTEL有过一种叫做”迅盘“的加速方案，就是把一块小的FLASH放在操作系统和HDD之间以加快读的速度
但如果是这样设计，那完全可以设计成全新的接口，也不用DIMM啊。所以，以上都是猜测了，看官不必当真

kylinzx · 发表于 2016-9-15 00:44

真不知神马时候才会降到民用级别？？？

aixiangsui · 发表于 2016-9-10 22:51

jerrytsao 发表于 2016-9-10 05:24
碳纳米管RAM, 其实是开发公司Nantero授权给Fujitsu旗下两家公司进行晶圆研发, 这货确实最有潜力成为真正的 ...

额，谢谢给予材料。感觉物理性变化的材料能赶上纯电路的速度有点不可思议。

jerrytsao · 发表于 2016-9-10 05:24

本帖最后由 jerrytsao 于 2016-9-10 05:48 编辑

aixiangsui 发表于 2016-9-6 20:30
吹牛技术哪家强？看来intel的吹牛技术还是太低了，因为富士通已经吹嘘了一种更神的NRAM。
这种NRAM据说有很 ...

碳纳米管RAM, 其实是开发公司Nantero授权给Fujitsu旗下两家公司进行晶圆研发, 这货确实最有潜力成为真正的Universal Memory, 除了耐久度稍差, 延迟和密度都可以跟DRAM抗衡, 生产线也比3D XPoint之类的简单. 还有就是Fujitsu只是第一家公开授权的厂商, Nantero实际授权的远远不止这一家, 所谓人多力量大前景不可小觑.

aixiangsui · 发表于 2016-9-8 18:46

也许这种技术里只有粒子的迁移，就像锂离子电池里发生的一样。不然为什么那么信誓旦旦的说不是相变技术呢。

cyqsimon · 发表于 2016-9-8 15:05

十年后基础家用电脑可能就没有硬盘了直接dimm上插optane 速度够快而且非易失
到时候nand ssd可能就和今天的机械硬盘地位一样了......

aixiangsui · 发表于 2016-9-6 20:30

吹牛技术哪家强？看来intel的吹牛技术还是太低了，因为富士通已经吹嘘了一种更神的NRAM。
这种NRAM据说有很长的寿命和极快的读写速度，尤其是后者，富士通吹嘘说碳纳米管开关速度高达皮秒级。

发表于 2016-9-6 19:24

延时低了，才好更进一步的叠加带宽

Y6-0785 · 发表于 2016-9-6 15:24

支持入门级技术帖，看楼主以前没发过精华，PCEVA真是藏龙卧虎。

fanli1230 · 发表于 2016-9-6 15:19

可以理解为我拷贝大量零散的数据速度大幅提升了么？
比如大量的图片和音乐数据，就算是现在的sata ssd，不到100K的文件，也比较难做到500个/S

luckissy · 发表于 2016-9-6 14:35

听说这货不是晶体管结构，是真的么？

jerrytsao · 发表于 2016-9-6 00:48

本帖最后由 jerrytsao 于 2016-9-6 01:04 编辑

OstCollector 发表于 2016-9-6 00:06
这个是NVMe协议的，DIMM应该不走这个协议吧

DIMM当然跟这个无关, 只是用来说明SSD应用有很多的限制因素.

OstCollector · 发表于 2016-9-6 00:06

本帖最后由 OstCollector 于 2016-9-6 00:08 编辑

jerrytsao 发表于 2016-9-5 20:02
1000倍是指Cell Level速度, 做成SSD之后当然不可能这么快, 这只是Intel Optane和Micron QuantX的宣传手段 ...

这个是NVMe协议的，DIMM应该不走这个协议吧

FlankerWang · 发表于 2016-9-5 22:58

千代发表于 2016-9-5 17:23
这东西绝对是闪存硬盘杀手，如果成本能足够低，现在的NAND厂商死得一个都不剩 ...

想多了，这个产品的出发点是性能而不是产能

jerrytsao · 发表于 2016-9-5 22:46

本帖最后由 jerrytsao 于 2016-9-5 22:50 编辑

维他命W 发表于 2016-9-5 20:36
不太同意这个看法……

其实我倒是认为~ 内存延迟是目前CPU性能无法显著提升的主要瓶颈，理由是因为另一 ...

DRAM很明显不是瓶颈, 跟L3在差不多数量级, 今后NVRAM技术主要填补的就是红色这块瓶颈最大的区域, 最终形成SCM和Universal Memory.

aixiangsui · 发表于 2016-9-5 21:36

本帖最后由 aixiangsui 于 2016-9-5 21:38 编辑

jerrytsao 发表于 2016-9-5 20:02
1000倍是指Cell Level速度, 做成SSD之后当然不可能这么快, 这只是Intel Optane和Micron QuantX的宣传手段 ...

这个我前面也提到过，但差别过大，恐怕内有乾坤，所以不看好DIMM的前途。
至于寿命耐久方面，闪存有确切的写入寿命是因为它的结构使然。目前我没有看到关于xpoint上有相关类似结构或限制的材料，而前面那张给出的1000倍没有标明参考对象，slc或mlc，不同制程不同品牌，在写入寿命方面都有很大差别，而图上也没有确切说明是与写入次数相关，所以我觉得像是intel简单做了个老化实验的结果，而不是说xpoint有类似于闪存的写入寿命。如果有相关资料，欢迎给出。

aixiangsui · 发表于 2016-9-5 21:31

本帖最后由 aixiangsui 于 2016-9-5 21:45 编辑

维他命W 发表于 2016-9-5 20:36
不太同意这个看法……

其实我倒是认为~ 内存延迟是目前CPU性能无法显著提升的主要瓶颈，理由是因为另一 ...

好像没有看到说目前CPU性能怎么受限于内存吧。何况这个东西的延迟比内存还是大太多了，用上去适得其反。目前内存的延迟在十纳秒级，闪存的延迟在十微秒级，而这个东西的延迟在微秒级。

维他命W · 发表于 2016-9-5 20:36

aixiangsui 发表于 2016-9-5 14:09
没有必要使用DIMM。
历来内存不是系统瓶颈，外存才是。

不太同意这个看法……

其实我倒是认为~ 内存延迟是目前CPU性能无法显著提升的主要瓶颈，理由是因为另一个矛盾的现象：CPU性能过剩。
（也许不是过剩，而是在等待~）

jerrytsao · 发表于 2016-9-5 20:02

本帖最后由 jerrytsao 于 2016-9-5 20:14 编辑

aixiangsui 发表于 2016-9-5 17:32
并没有写入次数限制。只有闪存有写入次数限制。
但是，这东西的DIMM也许永远出不来，虽然官方只是说延迟 ...

1000倍是指Cell Level速度, 做成SSD之后当然不可能这么快, 这只是Intel Optane和Micron QuantX的宣传手段之一. Endurance方面QuantX SSD只有5年25 DWPD, 不过厂商可以根据不同的应用来做调整所以3D XPoint DIMM会高很多, 可以参考隔壁Flash Memory Summit总结帖.

此外, 原帖里最后一张图也是3D XPoint SSD速度不"达标"的主要原因, SSD传输过程中一些必须的延迟是无法避免的.

低延迟的革命 Intel 3D XPoint技术优势解读

本帖子中包含更多资源

评分

相关帖子

本帖子中包含更多资源

本帖子中包含更多资源