企业存储技术 · 2020年07月21日

Optane SSD 900P评测(2):比拼4x闪存NVMe RAID0

本文内容非商业用途可无需授权转载,请务必注明作者及本微信公众号、微博 @唐僧\_huangliang,以便更好地与读者互动。

如何选择一款测试软件,或者评估方法?我试着给出3种解释:

1、 _它来自权威机构__/__组织,或者被业界广泛认可;_

2、 _它运行在有代表性的典型应用中,测出结果有较大参考价值;_

3、 _通过分析了解到具体的测试机制,包括对系统产生的压力模型,并证明其意义。_

记得在《存储极客:SPC-1负载分析与AFA寿命评估》一文中,我曾经以类似方式分析过企业存储领域公认的SPC-1测试。SPC不是免费开放的Benchmark,参与其测试需要花不少钱,而我在本文中使用的测试软件没有这些限制,每个人都可以跑下试试:)

image.png
继上一篇《Optane 900P SSD评测(1):当热插拔工作站遇上CAS缓存软件》之后,本文开始性能测试部分,其中包括使用3D XPoint Memory的900P、传统闪存NVMe SSD(单盘&RAID0)以及Optane缓存加速机械硬盘的对比。

注:本文中使用__Intel Cache Acceleration Software__配置为__Write-Back__,也就是读写都加速的缓存模式__。

测试软件、应用结合原理分析

image.png
上图我在以前文章中给大家出示过,Dell Precision Ultra-Speed Drives是一块PCIe x16的1转4 M.2 NVMe SSD扩展卡(还有个1转2的型号)。工作站用户更喜欢在有限空间内获得更大的存储带宽。

Optane 900P比单个闪存M.2 SSD快很正常,但在工作站的应用中具体能快多少?如果把4个普通NVMe SSD性能绑在一起,Optane 900P还有胜算吗?

在具体的测试方法上,我首先想到了影视后期制作中的4K/8K高清视频编辑,这将是下一篇评测的主题。我们还需要一个面向工作站更全面的评估手段,同时保持对实际应用的参考价值。

image.png
测试样机为一台__Precision 5820 Tower__工作站,__Xeon W-2133 CPU__只有__4__核,__QuadroP4000__显卡也不算太高端,因此本次测试我们暂时不关注存储以外的表现。在《双__Xeon SP__工作站,我却没找到第二个__CPU__插槽?》一文中,我曾经介绍过这一代的__Xeon W__工作站__CPU__提供最高__18__核__/36__线程的规格。

对SPECviewperf、SPECapc系列测试不能再熟悉的我,决定写一次SPECwpc工作站综合性能BenchMark。SPECwpc测试软件也不是今年刚推出,为什么我以前没有讨论过呢?简单来说是因为其综合成绩受磁盘I/O子系统性能影响较大,因此看www.spec.org网站公布的测试结果,有点像拿SSD来辅助“跑分”的比赛,看谁的盘快、看谁盘配的更多:)

image.png
用__Optane SSD 900P__测得上面这几项__I/O__成绩,几乎属于__“__前无古人__”__了。

SPECwpc测试结果按照工作站应用的行业来划分,包括:媒体和娱乐、产品开发(制造业)、生命科学、金融服务、能源和通用操作这几大项。

具体到存储性能评估,看来用的都是Iometer工具来压测,不过具体的访问模型肯定不同。为了鉴定其说服力,下文中我除了会对比详细的测试结果,还会对测试方法进行剖析。
image.png
SPECwpc使用Iometer测试的项目,除了这些之外还有个预热的脚本,包括先写入一个100GB左右的文件,然后再持续一段时间的写入准备测试。这对于反应SSD的真实能力还是非常重要的。

Optane 900P锋芒显露、SSD RAID的局限

image.png
注:组成软__RAID 0__的__4__个__M.2 SSD__,与__Dell 5820 Tower__工作站自带的__512GB SSD__并非同一型号,虽同为__NVMe__,但性能有一些差距。

首先看I/O综合成绩的对比。SATA机械硬盘与SSD相比确实相差悬殊;4个M.2 NVMe SSD在Windows下软RAID 0(带区卷)比单盘有显著提高,但还是Optane 900P的表现最好。

至于使用Intel Cache Acceleration Software(CAS-W)缓存软件配合Optane 900P来加速HDD硬盘的组合,其表现基本介于NVMe SSD单盘与RAID 0之间,应该说是比较理想的结果了。

由于本文聚焦于存储性能,下面我们来看看具体单项测试的结果。

image.png
在顺序读写测试中,传统闪存SSD与Optane 900P的差距缩小了;而512GB SSD单盘和RAID 0却在64KB顺序写和8KB顺序读测试中出现了很大的反差,这是为什么呢?

1、消费级SSD的峰值写带宽与触发GC(垃圾回收)后的写带宽往往存在一定差距,而组建RAID 0的每个成员SSD写入数据量只有1/4,此时可能还没下降到稳态性能。

image.png
2、8KB顺序读测试虽然在这里记录的是带宽,但IOPS容易成为实际的瓶颈,我们知道RAID的IOPS性能发挥往往要依赖于队列深度(高并发)。上面引用了以前的一个测试结果,我还介绍过SSD性能的“色子效应”——同样需要高出闪存通道数许多的队列深度才能充分发挥性能。工作站的应用大多队列深度不超过8,此时RAID对小数据块读IOPS的价值就很难讲了。

可能有朋友会问,那为什么8KB顺序写的情况不同呢?原因很简单,就是SSD有写缓存,数据可以先合并后再写入闪存,所以与读是不一样的。

看懂SPECwpc测试结果,从每种应用I/O模型开始

下面我们再来看具体针对每种应用软件的I/O测试。

image.png
image.png
SPECwpc媒体&娱乐部分I/O测试包括Autodesk 3ds Max、Blender、Handbrake、Maya 2012和Adobe CS6几项。我想有必要让大家能看懂这些测试结果:有的软件读带宽比写带宽高,而有的正相反,其实Iometer执行的测试脚本一个读写混合的模型。下面我们以Maya为例来讲解:
image.png
由于这个__Maya I/O__测试的配置,有__13%__比例的__1MB__数据块访问为__100%__写入,所以最终结果自然是写带宽明显比读带宽大。

在《图形工作站专业显卡测试:SPECviewperf12》一文中,我曾讲过该BenchMark是将显示子系统负载从3D设计软件中“抽象”出来。而SPECwpc的存储测试,则应该是记录使用者在软件操作中一段时间的I/O访问特征,就像我在《揭秘VDI存储测试:4节点SDS模拟12000虚拟桌面》中使用的压力模型来源一样。

每个工作站用户的使用习惯特点不同, SPECwpc每一个单独的测试模型不见得都有普遍代表性,但是我认为综合起来整体看是有参考价值的。这样来看,按照几个行业计算综合I/O得分也是合理的。

image.png
image.png
工程制造中的PLM(CAD)测试,包含著名的有限元分析软件Ansys、达索SolidWorks、Siemens NX6和Autodesk Inventor几项,制造业是最主要的工作站应用领域之一。下面我们把SolidWorks测试的访问模型列举给大家:

image.png
与前面Maya测试有些类似,这里32KB访问的比例占到17%,而且只有28%为读操作,因此SolidWorks混合测试结果又是写带宽显著高于读带宽。

image.png

关于生命科学、能源和通用I/O测试,SPEC并没有说明具体是模拟的哪种应用软件。而测试结果的排名顺序,基本上与我们前面介绍的一致。

SPECwpc测试到此先告一段落,我估计绝大多数读者朋友之前对这个BenchMark并不熟悉,下面我再列出一款简单的测试软件做为参照。没有对比,便没有优劣。当然这里所说的测试方法好坏,是限定于工作站这个应用领域,如果是一般桌面应用,比较常用的PCMark其实也有局限。

CrystalDiskMark:我是这样测试的

image.png
这部分测试我们统一采用__32GB__文件大小(最大设置)

从上面的测试截图,大家可以看出C盘是2TB的HDD,如果没有Optane+CAS缓存软件的帮助,一块机械硬盘肯定跑不到这么高。

除了对5种不同存储配置分别运行上面的默认测试之外,我还调整CrystalDiskMark测试参数获得了更全面的性能结果——有点像用Iometer来做的事情。而这次我没有用Iometer,是因为之前Optane P4800X已经测的很详细了(参见《Intel Optane P4800X评测(3):Windows绑核优化篇》),900P的结果没什么悬念。

image.png

在QD32(高并发)顺序读测试中,4个M.2 NVMe SSD RAID 0终于火力全开了一把,超过6500MB/s让官方标称2500MB/s的Optane 900P也望尘莫及。但是普通闪存SSD的读写性能不对称,另外我们在上文中也提到过,组成RAID的SSD在Dell工作站上还不是最高的性能等级,Optane 900P的单盘价值还是能体现出来。

同时我还列出了队列深度\=1时的带宽结果,这里我们注意到2点:一个是顺序读性能与QD32时相差比较多;另外Optane 900P用于CAS缓存加速的表现与原始性能相差较大。说明一下,我用的软件版本IntelCacheAccelerationSoftware\_x64-3.1.0.83不是最新的,可能当时Intel还没充分意识到需要为Optane低队列深度下做优化吧?如果想解决这一点的瓶颈,我想应该不困难。

相比上面的图表,用户应该更关心他们的盘在真实应用中能跑多快,这就是我们下一篇8K视频编辑存储测试的目的。
image.png
机械硬盘的随机性能与__SSD__相差太多,在这里数值都不太有必要标出了。

接着看4KB随机读,在低队列深度下Optane 900P(包括缓存加速HDD)基本无敌;Q32T1(单线程)是卡在了CPU的单核性能上(约17万IOPS);Q8T8下Optane再次领先。

由于前面提到过的原因,在这个队列深度下SSD RAID IOPS还无法充分发挥,不过继续提高并发对于工作站也没多大意义。

image.png

随机写测试中传统闪存SSD与Optane 900P的差距缩小了许多,主要还是写缓存的功劳,因为CrystalDiskMark每组测试只跑5轮x 5秒。其中4KB随机写Q32T1还是可以看到单核CPU的瓶颈。

无论Iometer还是CrystalDiskMark,其测试结果如何对应到具体的业务场景都是一个问题。因此除了我们拿实际应用来评估之外,SPECwpc基准测试就成了另一个比较合适的综合参考。
image.png
渲染(数据__IO__)时间,越短越好

上面我引用了国外网站StorageReview的一个测试对比,使用的Houdini是工作站上流行的电影特效软件。在这里Optane 900P的表现超过了包括Intel P3700和Samsung 1725a在内的众多知名NAND闪存SSD。

性能测试小结

简单总结下本文的性能测试,Optane 900P凭借3D XPoint Memory均衡无损的读写性能、低队列深度优势,更好的写入寿命,使其成为工作站上的存储利器。即使4个传统NVMe SSD RAID 0在许多主流工作站应用中也不是它的对手。
image.png
这里我又将本文第一个对比图表转换成性能提高比例,以__512G NVMe SSD__做为基准“__1__”,__Optane 900P__在不同类工作站应用中可达前者的__4-9__倍__;当__900P+CAS__缓存加速机械硬盘时,性能也提高到__NVMe SSD__单盘的大约__2-3__倍__。

有的工作站用户习惯将操作系统和常用软件/数据装在256GB或者更大一些的SSD,更多的“冷数据”存放于机械硬盘。如果这时觉得普通SATA/NVMe SSD还不够快,换成Optane 900P预计能显著提高工作效率。

进一步考虑单位容量成本(性价比),我想不少用户每天频繁访问的热数据应该在100-200GB以内,这样拿280GB Optane作为缓存盘结合廉价大容量的HDD,对于大多数工作站用户都是一个值得考虑的不错选择。在我们的测试中,这一组合性能表现全面超过了单个NVMe SSD,其加速效果远非之前16/32GB的Optane Memory可比。

再谈Optane SSD热插拔的意义
image.png
之前我介绍过,__Optane 900P__就安装在这个热插拔__M.2 SSD__右边的位置。

在上一篇中我讲过,Dell在新一代工作站上采用前置热插拔盘设计的一个意义是数据安全,而我认为2.5英寸U.2热插拔Optane 900P在缓存应用中也有独特的价值。

比如用户采购一批工作站,起初并不确实其中哪些更需要存储加速,同时也是为了尝鲜Optane做Cache的效果,可以先购买少量Optane SSD 900P。这时有了前置热插拔,就可以方便地将缓存盘在不同机器之间移动,把好钢用在刀刃上,并且后续添加缓存盘也是很方便的。
image.png
这张截图是停止__Cache__操作时,正在将脏数据回刷到永久存储的过程。

对缓存盘进行热插拔之前,强烈建议先停止CAS的Cache状态,特别是在Write Back缓存模式下这样做能避免数据丢失。如果使用普通M.2 NVMe SSD + 缓存软件来加速机械硬盘,前置热插拔也能带来同样的价值。

以上是Optane 900P工作站应用评测的第二篇,相信下一篇8K视频编辑测试会更精彩…

推荐阅读

本文转载自企业存储技术微信公众号原文链接点这里
注:本文只代表作者个人观点,与任何组织机构无关,如有错误和不足之处欢迎在留言中批评指正。 进一步交流技术可以加我的微信/QQ:490834312。
尊重知识,转载时请保留全文,并包括本行及如下二维码。感谢您的阅读和支持!《企业存储技术》微信公众号:HL_Storage,也欢迎关注企业存储技术极术专栏,定期更新。
42.jpg
推荐阅读
关注数
5613
内容数
260
关注存储、服务器、图形工作站、AI硬件等方面技术。WeChat:490834312
目录
极术微信服务号
关注极术微信号
实时接收点赞提醒和评论通知
安谋科技学堂公众号
关注安谋科技学堂
实时获取安谋科技及 Arm 教学资源
安谋科技招聘公众号
关注安谋科技招聘
实时获取安谋科技中国职位信息