企业存储技术 · 2020年08月23日

PCIe 4.0 SAS+NVMe RAID/HBA卡:最高读IOPS 300万、写24万

image.png
大家还记得LSI__吧:)

首先请原谅我又怀个旧。从LSI到Avago再到Broadcom的并购史就不详细讲了,对这些故事不熟的朋友可以简单参考下图。

image.png

2016年9月我写过《RAID__卡未来之路:除了NVMe__还有啥?》,如今回过头来看看当年的Roadmap,哪些产品没有出来,想想取消的原因也有点意思。

2016年11月我又写了《首款SAS/SATA/PCIe__三模RAID__发布:ARM__替代PowerPC》。这一代产品如今已经支撑了3-4年,是时候随着PCIe 4.0接口更新一下了。

image.png

上图就是新一代PCIe 4.0 RAID卡中的MegaRAID 9560-16i,16个内部SAS/SATA/NVMe三模HDD/SSD接口。卡的右端连接器和上一代有点变化,从x4 lane的SFF-8643换成了x8 lane的SFF-8654——后者其实我们已经在服务器主板和热插拔背板上见过不少了,比如下图:

image.png

这张照片引用自《_Dell PowerEdge R640:NVMe直连、NDC网卡、PERC10一览_》

从PCIe 3.0 x16到PCIe 4.0 x8

下面我们主要围绕SAS/NVMeRAID卡和HBA的主控芯片来讨论,毕竟大的服务器品牌往往不会直接用Broadcom自有品牌的卡,而规格参数和性能基本上还是决定于芯片。
image.png

上面这款SAS3616W芯片几年前我还没介绍过,严格说它只算Tri-Mode三模IOC控制器的“半代升级”。因为之前SAS34xx/35xx的PCIe 3.0 x8主机接口,连接SSD特别是NVMe数量多了之后实在是个瓶颈,于是后来就有了这款PCIe 3.0 x16 SAS3616W。

请注意,之前用于HBA(不带缓存,非硬件RAID)卡的IOC芯片只是单核ARMA15 1.2GHz,最近的新品就不同了。

SAS/SATA HBA(IOC)的地位提升

image.png

如上图,支持PCIe 4.0的新一代IOC和RoC(RAIDon Chip),从SAS3808开始全部都是双核ARM A15 1.6GHz了,从L1和L2 Cache来看架构变化应该不大。最主要的一点是主机和设备端接口都支持PCIe 4.0,下面看看性能指标。

从215万IOPS判断非原生NVMe RAID

image.png

等继续讲到下面的表格,其实上图中的300万4K随机读/随机写IOPS,8端口(设备端)的SAS3808应该是达不到的。稍后大家就会明白怎么回事,Broadcom的资料复制、粘贴出点小错误我倒是并不意外。13,700 MB/s的带宽相对于接近16GB/s的x8 PCIe Gen4理论带宽来说,效率也还算可以了。

image.png

上图中写PCIe Port(Lanes)的“12 Gb/s”速率,请大家自己脑补纠正成16 Gb/s。大家注意下这里写SAS3808的4K随机读IOPS是215万,比同一份资料里的300万要低哦?

image.png

再看16端口的SAS3816 IOC芯片,我们计算下3M 4KB IOPS换算成带宽应该是11718MB/s,理论上8端口的SAS3808如果通过PCIe 4.0 Switch转接SSD(最多连32个NVMe盘)的话,有可能达到这一水平。

几款芯片的ARM处理能力一样,那么SAS3808实际的2.15M IOPS,是不是有点像受到8个12Gb/s SAS端口的带宽限制呢?尽管从2016年正式发布的三模RAID/HBA产品已经是SAS&NVMe兼容PHY,但还没有说原生NVMe。现在的新品还依然受到MegaRAID SAS RAID架构的限制吧?

image.png

如上图,SAS3916是用于硬件RAID卡的SAS/SATA/NVMe控制器,除了16端口还有8端口的SAS3908,这份资料终于把PCIe 4.0的速率写对了。

同样是在4年前的《_服务器SSD RAID性能速查手册_》一文中,曾经以LSISAS3108芯片的Dell PERCH730p RAID卡举例,当时在PassThrough直通模式可以测到100万IOPS(8-12块SAS SSD)。

那么,如今的SAS3916如果RAID随机读真能跑到300万IOPS也不错了,毕竟现在企业级PCIe 4.0 NVMe SSD单盘有些已经达到100万IOPS(如Intel SSD D7-5500和5600)。至于RAID 5随机写IOPS嘛,24万只能说比以前好,如果使用3D XPoint Memory介质的IntelOptane P4800X或者900P系列,单盘读写都有50万IOPS。

扩展阅读:《_Intel Optane P4800X评测(1):好钢如何用在刀刃上?_》

《_Optane SSD 900P评测(2):比拼4x闪存NVMe RAID0_ 》

传统RAID技术的写惩罚和性能,到了SSD时代之后一直是个难以突破的点;再加上RAID卡如果连接数量稍多的NVMe SSD,中间就需要通过不便宜的Switch芯片,上下行通道带宽还不对称。我们看到一线服务器大厂中,之前许多都放弃了三模芯片RAID/HBA卡对NVMe的支持(仍保持SAS/SATA),比如Dell PERC 10系列。不少用户逐渐习惯了通过软RAID/镜像,或者分布式存储的副本/纠删码技术来保护数据,这也导致SAS HBA的出货比例逐渐变多。

:SDS软件定义存储的2大代表产品,VMware vSAN和微软S2D现在连接SAS/SATA盘都要求使用HBA而非RAID卡。还有一种情况优先使用SAS SSD,就像《_单节点230虚拟桌面、6 GPU卡:AMDEPYC vSAN超融合测试&参考架构_》插了6块PCIe x16的NVIDIA Tesla T4,SAS HBA连接SSD可以节约PCIe信道。

扩展阅读《_4节点近160万IOPS:SDS/超融合测试不能只看数字_》

《_NVMe SSD RAID的几种玩法和测试_》

那么基于Broadcom PCIe 4.0新一代RAID控制芯片的服务器,接下来又有多少RAID卡设计会拥抱NVMe呢?

RAID卡的Secure Boot:保护Firmware更新

image.png
最后再陪大家看一个新特性。昨天我在《_Intel 10代PC/笔记本安装Win7踩坑记 & 驱动分享_》里也提到了Secure Boot,主板和PC厂商的BIOS中目前还允许关闭这个选项,主要是为了软件兼容性和一些特殊需求/应用场景。

RAID/HBA卡没这么复杂,Secure Boot是为了保护其Firmware,只有经过Broadcom Signed签名的固件才能被允许写入。

具体到合作的服务器系统厂商,RAID/HBA卡只是一个组件,整体的Firmware安全要考虑的问题更多,包括BIOS、BMC等。有兴趣的朋友可以参考下《_Xeon SP服务器新技术:防代码入侵从BIOS做起_》。

推荐阅读

本文转载自企业存储技术微信公众号原文链接点这里

注:本文只代表作者个人观点,与任何组织机构无关,如有错误和不足之处欢迎在留言中批评指正。 进一步交流技术可以加我的微信/QQ:490834312。
尊重知识,转载时请保留全文,并包括本行及如下二维码。感谢您的阅读和支持!《企业存储技术》微信公众号:HL_Storage,也欢迎关注企业存储技术极术专栏,定期更新。
42.jpg

推荐阅读
关注数
5615
内容数
264
关注存储、服务器、图形工作站、AI硬件等方面技术。WeChat:490834312
目录
极术微信服务号
关注极术微信号
实时接收点赞提醒和评论通知
安谋科技学堂公众号
关注安谋科技学堂
实时获取安谋科技及 Arm 教学资源
安谋科技招聘公众号
关注安谋科技招聘
实时获取安谋科技中国职位信息