PCEVA,PC绝对领域,探寻真正的电脑知识
打印 上一主题 下一主题
开启左侧

低延迟的革命 Intel 3D XPoint技术优势解读

[复制链接]
跳转到指定楼层
1#
kobe 发表于 2016-9-5 11:28 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
点击数:15244|回复数:43
之前转载过不少关于Intel 3D XPoint的相关信息,也包括一些Optane SSD的性能表现。由于产品没有最终定型,Intel一直在避免谈论具体的性能参数,而是讲解3D XPoint如何能够通过降低延迟来实现更高的效率。在最近的IDF2016上Intel又介(an)绍(li)了许多关于降低存储延迟的内容。

首先来点背景知识介绍,什么是延迟,延迟与带宽的关系?

最近这段时间能看到很多NVMe SSD的上市,包括浦科特M8Pe、饥饿鲨RD400等等,很多人关注到的是持续读写带宽最高可达XXXX MB/s这样的漂亮数字,这些只是带宽上提升。很少有人注意NVMe协议相比AHCI协议更低延迟的优势,当然这也和消费级产品的宣传中对延迟不是很注重有关。

有人可能会问,带宽的提高不就是降低延迟带来的吗?这二者难道不是此消彼长的关系?答案是否定的。带宽和延迟并没有固定的关系。

举个例子,人们去银行的ATM机取款,取款的过程需要一分钟(取款操作的延迟是1分钟),假设当前只有一台ATM机,业务吞吐量或者说带宽相当于是1/60 人/秒。现在银行升级ATM机系统,原本60秒才能完成的取款操作现在30秒就可以完成,那么延迟就降低到了30秒,业务吞吐量/带宽提高到1/30 人/秒。也就是说降低延迟是可以提高带宽的。

但是,提高带宽的手段并不是只有降低延迟这一种方法。银行可以增加一台ATM取款机来提高业务吞吐量,这样取款操作的延迟依然是60秒,但是业务吞吐量/带宽可以提高到1/30 人/秒了。这种情况下提高并行度就提高了带宽,但对于每个取款人来说,延迟并没有降低,完成取款依然需要60秒,取款操作的耗时没有在增加ATM机后就得到降低。带宽的提升也可以在不降低延迟的前提下达到的。

银行要提高用户满意率,除了要提高自身办事效率(带宽),也要尽量缩短客户办理业务所花的时间(延迟),不仅带宽要大,延迟也要尽可能小,这是两个不同的目标。

带宽可以比较容易的堆叠出来,但降低延迟并不容易

增加闪存通道数量和闪存接口带宽即可轻松提升带宽,但要降低延迟却会受到闪存读写延迟、指令处理延迟、接口访问延迟等诸多方面限制很难获得革命性提升,而低延迟正是3D XPoint的卖点。

对于Intel 3D XPoint来说,它的优势正是延迟更低

相比现有的NVMe SSD来说,使用Intel 3D XPoint技术的Optane主要是在存储介质上实现了大幅降低延迟。

对于SSD来说,更低延迟和更高带宽同样重要,不过传统的NAND介质SSD提升队列深度后带宽可以轻松增长,要降低延迟?没那么容易了。

NAND SSD单纯的读取(绿色)比较容易做到低延迟与高带宽,但混合读写(蓝色)就更为困难:

换做3D XPoint来做的话,即便是混合读写也能轻实现超低的延迟与高带宽(红色)。

对于客户/工作站级应用,Intel使用3D渲染工作来展现3D XPoint的优势:由于更低的延迟,CPU花在等待硬盘存取数据上的时间更少,并行处理速度更快,最终Intel Optane SSD渲染速度达到了Intel 750的三倍。

对于数据中心应用,Intel使用RocksDB数据库性能来演示3D XPoint的优势:使用3D XPoint技术的Optane SSD能达到P3600的三倍带宽与10倍延迟优势。

未来更牛逼的应用:Intel DIMM

Intel历史上也曾制造过内存,不过很早前就放弃了这部分业务。现在,凭借3D XPoint接近于DRAM的延迟与带宽,Intel将有机会将其制成符合DDR4标准的内存条并应用到下一代Xeon平台当中,以获得更大的内存容量和低于DRAM内存的成本。


相比于NVMe接口的Optane,未来DIMM形式的3D XPoint产品连驱动和协议、文件系统等延迟开销也都能削减掉,将低延迟特性发挥到极致:


我们对于3D XPoint应以什么样的姿势等待它的到来?

  • 3D XPoint降低延迟的作用大过提高带宽,不要只盯着持续读写带宽看了
  • 混合读写的性能远比纯读或纯写的理论带宽测试复杂的多,具体可以关注浴室的PCEVA Storage Test
  • 家用低队列深度下的性能比QD128更有价值,3D XPoint能带来有益的变化,不是“然并卵”
  • 3D XPoint不会直接取代NAND,二者是不同定位的产品
  • 初期上市Optane产品可能会是服务器平台使用的,或者至少也要是发烧级X系列芯片组才能用上的,不能抱着坐等3D XPoint的心态而拖延对刚需使用的满足,NAND SSD该买还得买~





本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?注册

x

评分

参与人数 1绝对值 +1 收起 理由
Y6-0785 + 1 很给力!

查看全部评分

2#
yhhekeda 发表于 2016-9-5 11:54 | 只看该作者
总结得很不错,补丁 补丁
3#
中华田园犬 发表于 2016-9-5 12:14 | 只看该作者
感觉看到DIMM才是3DPOINT的正确用法
4#
aixiangsui 发表于 2016-9-5 14:09 | 只看该作者
没有必要使用DIMM。
历来内存不是系统瓶颈,外存才是。
5#
SF2281 发表于 2016-9-5 14:44 | 只看该作者
从10秒提升到1秒感觉提升巨大,从1秒提升到0.01秒就没什么感觉了。不过有新东西总是好的,等上市,看成品,广告看了,接下来看疗效
6#
nde123456 发表于 2016-9-5 14:57 | 只看该作者
aixiangsui 发表于 2016-9-5 14:09
没有必要使用DIMM。
历来内存不是系统瓶颈,外存才是。

我猜楼上说的是用DIMM接口形式,而不是代替DRAM
这个东西短期目标是用来当DRAM和NAND之间的缓存,类似TLC SSD中的SLC作用

7#
nde123456 发表于 2016-9-5 15:01 | 只看该作者
SF2281 发表于 2016-9-5 14:44
从10秒提升到1秒感觉提升巨大,从1秒提升到0.01秒就没什么感觉了。不过有新东西总是好的,等上市,看成品, ...

据说只是服务器上用,消费产品上连SSD都还没普及,用不起这种高大上的
另外有可能在手机上代替DRAM+NAND
8#
SF2281 发表于 2016-9-5 15:30 | 只看该作者
nde123456 发表于 2016-9-5 15:01
据说只是服务器上用,消费产品上连SSD都还没普及,用不起这种高大上的
另外有可能在手机上代替DRAM+NAND
...

手机存东西多了经常卡,比较期待手机能用上这个。
9#
aixiangsui 发表于 2016-9-5 15:52 | 只看该作者
SF2281 发表于 2016-9-5 14:44
从10秒提升到1秒感觉提升巨大,从1秒提升到0.01秒就没什么感觉了。不过有新东西总是好的,等上市,看成品, ...

你的电脑上只存储有一个K的数据么?
10秒提升1秒是1秒提升到0.1秒的另一种表达方式。

10#
aixiangsui 发表于 2016-9-5 16:02 | 只看该作者
本帖最后由 aixiangsui 于 2016-9-5 16:05 编辑

目前内存和闪存的延迟时间有好几个数量级的差别。
闪存有人以为速度快,其实是幻觉,它的速度本质上来说和机械硬盘比没有优势。(对比于硬盘闪存真正的优势在于不需要像硬盘那样寻道)
之所以做出产品来感觉速度还过得去的样子,是因为闪存产品采用多通道读写。
U盘这种缩水产品的速度更接近于闪存的实力。。。
11#
SF2281 发表于 2016-9-5 16:10 | 只看该作者
aixiangsui 发表于 2016-9-5 15:52
你的电脑上只存储有一个K的数据么?
10秒提升1秒是1秒提升到0.1秒的另一种表达方式。

我只是打个比方啊,  从10到1提升了9,从1到0.1提升了0.9,都是比原先提升了10倍,但是快了9秒和快了0.9秒的感觉上不一样。
12#
aixiangsui 发表于 2016-9-5 16:18 | 只看该作者
SF2281 发表于 2016-9-5 16:10
我只是打个比方啊,  从10到1提升了9,从1到0.1提升了0.9,都是比原先提升了10倍,但是快了9秒和快了0.9 ...

你完全没有搞懂产品的原理和意义。
运输一个字节的时间提升了10倍,运输1个G的时间也会提升十倍。根本不存在快不快9秒还是0.9秒的区别。
换个简单点的话说,原先你开机10秒,这种提升下理论上就是只需要1秒(不考虑其他初始化),原先你硬盘对拷30分钟,现在就是只需要3分钟。
如果你平时烤数据或者开机只要1秒,你硬盘上也没有虚拟内存的话,这产品或许对你来说没意义。

13#
dboy99 发表于 2016-9-5 16:27 | 只看该作者
低延迟最大的受惠者是高性能计算,跟普通用户几乎没有交集

哪天把3D XPoint应用在显卡显存上才会对家用环境产生价值
14#
aixiangsui 发表于 2016-9-5 16:29 | 只看该作者
这技术intel的宣传是芯片延迟水平比闪存优秀千倍,但限于主控等原因(同时不排除intel吹水),目前实际做出来的成品延迟水平只比闪存优秀8倍,DIMM产品也因此推后到至少18年以后(能不推后么,人家内存延迟只有十纳秒水平)
15#
SF2281 发表于 2016-9-5 16:33 | 只看该作者
aixiangsui 发表于 2016-9-5 16:18
你完全没有搞懂产品的原理和意义。
运输一个字节的时间提升了10倍,运输1个G的时间也会提升十倍。根本不 ...

对啊,原先开机10秒,优化开机后1秒, 我感觉提升很大。

原先开机1秒,优化后开机0.1秒,就没什么感觉了。

给人的感觉是绝对时间,而不是相对倍数。

毕竟启动所需要读取的数据就那么多,达到一定速度后,再提升自然就感觉没那么明显。


所以说,从HDD到SSD,提升是巨大的,而从SSD到NMVe SSD再到3D XPoint,虽说速度也是在进步,给人的感觉就没那么明显了。
16#
aixiangsui 发表于 2016-9-5 16:36 | 只看该作者
SF2281 发表于 2016-9-5 16:33
对啊,原先开机10秒,优化开机后1秒, 我感觉提升很大。

原先开机1秒,优化后开机0.1秒,就没什么感觉了 ...

如果你现在开机能够1秒,程序打开都是秒开,那我没什么要说的。
反正我是自用学习机后,再没遇到过那么快的。

17#
dboy99 发表于 2016-9-5 16:39 | 只看该作者
SF2281 发表于 2016-9-5 16:33
对啊,原先开机10秒,优化开机后1秒, 我感觉提升很大。

原先开机1秒,优化后开机0.1秒,就没什么感觉了 ...

不能这样说,假设用机械硬盘开机是100年,换成ssd之后缩减到了1年,然后换成3D xpoint之后是1个月,那就很有意义了

高性能计算就是这种情况,现在最快的ssd也无法满足高性能计算的要求,换成3D xpoint之后将会得到飞跃性的提升。


18#
各种浪 发表于 2016-9-5 16:55 | 只看该作者
SF2281 发表于 2016-9-5 16:33
对啊,原先开机10秒,优化开机后1秒, 我感觉提升很大。

原先开机1秒,优化后开机0.1秒,就没什么感觉了 ...

然而,新的硬件是配套新的软件的。等这个3D point实用化了,届时的操作系统、软件等就可以以现在同样的载入时间,加载、处理10倍的数据,可以实现更多的、以前因为硬件性能不足而不实用的功能。
不完全贴合的例子:以前TNT时代的顶级显卡就能让当时的3D游戏跑60fps以上,现在顶级显卡跑最高画质还是只能60fps左右。以前的显卡和现在的是一回事么?游戏呢?
19#
OstCollector 发表于 2016-9-5 17:21 | 只看该作者
本帖最后由 OstCollector 于 2016-9-5 17:23 编辑

替代DRAM?没有驱动?上层软件不做改动?

我没记错的话,这玩意儿有写入次数限制,到时候一个counter就能废了吧

CPU的load/store能够忍受超过100ns的延迟吗?PC-100的延迟也就几十个纳秒啊
20#
千代 发表于 2016-9-5 17:23 | 只看该作者
这东西绝对是闪存硬盘杀手,如果成本能足够低,现在的NAND厂商死得一个都不剩
您需要登录后才可以回帖 登录 | 注册

本版积分规则

快速回复 返回顶部