企业存储技术 · 2022年04月20日

利用FPGA:让Optane持久内存可用于AMD、Arm平台

题外话:最近疫情的发展,特别是_当_我看到一些上海朋友在微信、weibo__上发的一些遭遇,心里挺难受的。希望大家能尽快好起来:)

昨天阅读国外网站的一条新闻,标题比较唬人《_SMART brings Optane memory to AMD and Arm_》,其实就是下面这块卡:

afb35356355d7707ea1fa6752f3028a6.jpg
Kestral™ FPGA Accelerator with Intel® Optane™ PMem DIMMs

SMART Modular这款Kestral PCIe Optane AIC,使用Intel Optane PMem(傲腾持久内存)DIMM和Intel FPGA来实现内存扩展和加速能力,号称TB级别PCIe连接内存,并能在DRAM和NAND闪存之间分层。

如果不是SMART网站上给出一个资料链接,我还真没印象曾经见过这块卡了。下图我在一年前的《CXL、GenZ、CCIX架构以及未来的PM、内存和SSD形态》一文中出示过:

c51d4fc528892fd54589b28cc36faf77.png

就是画红圈这个卡哦。SMART Modular在SNIA组织的2021 Persistent Memory + Computational Storage Summit(持久内存&计算存储峰会)上有个演讲,可能当时该卡还在研发中,所以没有具体说支持Optane DIMM。

由于物理接口为PCIe,所以延时在<350ns的水平,转接后性能达不到直插主板DIMM插槽上也正常。

关键特性

1194757def64ed4ef609ed1f0c773164.png

-尺寸:全高半长双宽;
-接口:PCIe Gen4 x16(向下兼容Gen3);
-内存:4个DIMM插槽,双通道。最多支持4条512GB Optane持久内存,或4条256GB DDR4 LR-DIMM,或者混合配置;
-计算:4核ARM A53(FPGA集成),板载2GB DDR4内存、8GB存储(eMMC);
-加速器:IntelStratix 10 DXFPGA,可以现场升级新的算法、协议;
-功耗:小于150W TDP(需要PCIe 6pin辅助供电)、被动散热

下面的小字体注释有时要重点看:当前版本的Kestral卡硬件支持基于DDR-T接口的Optane PMem,只有Memory Mode(内存模式)。也就是说不支持App Direct那样的3D XPoint持久化特性。

需要持久化的用户,目前还只能用Optane SSD块设备了。等将来CXL接口Optane持久内存出来的时候,SMART这个卡只是一个过渡吗?

内存扩展

3bb67a8d2243446d37bd0d38d4a8ffc6.png

由于FPGA充当了一个内存控制器的功能,所以SMART Kestral支持的平台与CPU无关,包括AMD、Arm甚至NVIDIA都可以。

虽然是PCIe x16 lane,但相比传统DIMM的64/72bit(含ECC)并行接口来看也算串行连接内存扩展吧,同时支持CCIX一致性接口来连接Optane。去年那篇我提到过一款基于Xilinx的Versal ACAP(号称FPGA之后的新一代计算平台)的PCIe板卡,也相当于通过CCIX连接的DDR4控制器(只用于内存,没有提到Optane)。

扩展阅读:《AMD EPYC Genoa‘7004’:若DDR5换OMI,CXL.mem服务器内存池化

OMI串行内存(续):当POWER10遇上OCP-HPC & OAM

至于FPGA的硬件加速,Kestral这里指的是线内压缩、加密、Key-Value存储。

内存加速

3939575071edede991ac03a2a64767e1.png
从服务器主机CPU__卸载特定的算法,移动计算到接近数据的位置

如上图,SMART Kestral可能只有Linux内核驱动。FPGA在一端配置出PCIe Ep,另一端则是并行I/O的DDR-T IP(估计Intel提供了支持)。

这里还提到具体的文本压缩算法:GZIP/ZLIB静态和动态Huffman编码。针对本地存储数据保护、Key-Value存储应该还有RAID、纠删码之类的支持。

问题:SMART Kestral资料中所谓的“_tiered between DRAM and NAND flash_”,是与服务器上SSD之间的分层吧?

是否可以在该卡上跑一个RAID存储系统呢?

写到最后,我想起高人唐杰总之前发表过的2个观点:

1、Gen-Z、CCIX、OpenCAPI这些内存一致性互联连技术,除非联合起来才有可能与Intel较量。——今天的情况是,等CXL出来就快一统了吧?Gen-Z是已经投靠去拎鞋了…

2、Intel(的愿景)还是想让大家到CPU上来处理(SmartNIC/DPU这些)…——类比到本文的扩展内存产品形态,等CXL接口Optane PMem出来,不还是连到CPU集成的控制器吗?如有卸载需要最多再加一块FPGA或者QAT卡。

由于疫情原因,我这两年没去上海了,真的有些想念朋友们。一切都快点好起来吧!

作者:唐僧 huangliang
原文:企业存储技术

推荐阅读

欢迎关注企业存储技术极术专栏
推荐阅读
关注数
5555
内容数
236
关注存储、服务器、图形工作站、AI硬件等方面技术。WeChat:490834312
目录
极术微信服务号
关注极术微信号
实时接收点赞提醒和评论通知
安谋科技学堂公众号
关注安谋科技学堂
实时获取安谋科技及 Arm 教学资源
安谋科技招聘公众号
关注安谋科技招聘
实时获取安谋科技中国职位信息