查看原文
其他

再谈3D XPoint:延时、QoS与队列深度

2017-02-16 唐僧 企业存储技术
本文内容非商业用途可无需授权转载,请务必注明作者及本微信公众号、微博ID:唐僧_huangliang,以便更好地与读者互动。


由于在上一篇《Optane P4800X比闪存写快3倍,杀手应用在哪里?》中我有遗漏的要点,并且周末时间有限分析得不够透彻,故有必要就Optane SSD的延时再写点东西。

 


之前我只讲了Optane P4800X的典型读/写延时小于10μs,这里的“typical”具体是指什么条件我会在下文中解释。

 

而这次要谈的是QoS延时——4KBKiB4096字节)块大小、队列深度(QD1699.999%的读/IO延时不超过150/200μs。我们知道最小延时看看就好,那么除了平均延时之外,按照目前的行业惯例,在一定QoS范围内的延时比最大值更有实际意义。

 

这个0.15/0.2ms(换算得来)比NAND闪存SSD的优势有多大呢?我们先来看看另一款产品的性能规格。

 

与希捷硬盘重名的WD Skyhawk SSD

 


前不久,被西部数据收购的SanDisk发布了一个名为Skyhawk的低端系列企业级PCIe SSD,这一点从它的带宽、IOPS性能上也能看出来。与大多数SSD标注最低延时不同的是,它列出的是4KiBQD32下的平均读写延时。由于企业存储应用中SSD面对的多是并发访问,个人感觉高队列深度下的延时应该比QD=1那些“漂亮”数字参考价值更大。

 

根据电梯算法原理,从HDD硬盘时代起就有通过增加队列深度来提高IOPS性能的方法,代价就是延时成反比翻倍提高。SSD在也有类似的情况,后面我会给大家列出一些资料来参考。

 

具体到上面的数字,我们看到Skyhawk中表现最好的Ultra 1600GB/写延时为125/351μs,注意这是平均值。如果QoS延时肯定还要高很多,所以不适合与Optane P4800X直接对比,下文中我还会列出Intel P3700的更多参数。另外我还注意到,调大OP(超量分配)之后的Ultra系列SSD延时表现比Standard更好;至于小容量点表现较好是不是因为SSD控制器的通道数不够多啊?

 

扯点题外话,Skyhawk让我想起去年希捷发布过一个监控硬盘也叫这名字。当然WD不是故意去碰这个瓷,因为早先他们收购过一家闪存系统厂商SkyeraSkyhawk曾经是这公司旗下的产品,也可能注册过商标重新拿出来利用吧。

 

而希捷的那个Skyhawk监控硬盘,我想起接近20年前,曾经有一个低端系列的5400SCSI硬盘——捷鹰(Hawk。当时还没推出ATA版本的7200Barracuda(酷鱼)定位就比它高。

 

50针全高SCSI硬盘,这张图放在文中是不是有点不和谐:

 

在网上搜了一下怀旧照片,希捷捷鹰(HawkHDD并不全是像上面这样的“厚盘”,也有1英寸半高的型号。而在我的记忆中只剩下盘贴上那只老鹰,还有中关村电子世界二楼伟仕公司(当年希捷硬盘总代)柜台写出的宣传牌了。

 

3D XPoint vs. 闪存SSD延时对比分析

 


前一篇中说过Intel SSD标称的20μs延时是顺序读写,随机访问的读/写延时为115/25μs,显然写I/O还是进入了DRAM缓存里。

 

所谓“典型”测试的条件就是4KB传输大小、队列深度=1;并且应该是FOB(开箱)性能,这个压力没有使SSD的闪存达到“稳态”。

 

相比之下,Optane P4800X小于10μs的延时没有标注顺序还是随机,暂且按照后者来看吧。Intel曾经宣传过“3D XPoint在很低的队列深度下就能达到接近峰值性能”(详见《从技术到应用:揭开3D XPoint Memory迷雾》一文),那么QD=1的延时比Flash闪存低10倍也是正常的

 


注:上表的测试条件包括4KB随机工作负载,整盘测试范围(full LBA)和SSD达到稳态性能等。

 

Intel现有数据中心SSD的资料中,我只找到了99%99.99%两种QoS,以及QD=1QD=128的延时数字。与Optane P4800XQoS对比用99.9%那组相对还接近一些吧。

 

同时我发现P3700 NVMe SSDQoS 99%时的写延时比较典型,怎么讲呢?就是0.0911ms这两个数值恰好与队列深度的倍数十分接近,这样我是否可以推算出QD=16时的延时为1.44ms0.09x16)左右呢?如果可行的话,OptaneP4800XQoS 99.999%的写延时也要比它好7倍还多。

 

P3700 QoS 99.99% QD=1的写延时为2ms,在这种不对等的比较中,3D XPoint做为吃亏的一方仍然领先闪存十倍

 

P3700 QoS 99.99% QD=16的读延时,如果不出意外应该在4-5ms之间,Optane P4800X要胜出几十倍了。

 

Tom's Hardware网站上公布的450GB SSDIntel DC P3520QD1699.99%/写延时在1.976/6.752 ms以内,与我在上面分析的依据基本相符。由于目前看到的公开数据有限,讨论不够严谨之处还望大家谅解!

 

参考

Intel's 3D XPoint-Powered Optane DC P4800X 'Cold Stream' NVMe SSDLeaks

http://www.tomshardware.co.uk/wire-protocol-implementation-security-audit,news-54826.html


:本文只代表作者个人观点,与任何组织机构无关,如有错误和不足之处欢迎在留言中批评指正。进一步交流技术,可以加我的QQ/微信:490834312。如果您想在这个公众号上分享自己的技术干货,也欢迎联系我:)


尊重知识,转载时请保留全文,并包括本行及如下二维码。感谢您的阅读和支持!《企业存储技术》微信公众号:huangliang_storage


长按二维码可直接识别关注

历史文章汇总(传送门):http://chuansong.me/account/huangliang_storage


点击下方“阅读原文”,查看更多历史文章↓↓↓

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存