作者:Marc Meunier 2023年4月21日
当前世界产生的数据比以往任何时候都多,对计算能力的需求也在不断增加。仅今年一年,我们就预计将创建超过120 Zettabytes的新数据。传统的服务器体系结构正努力跟上变革的步伐,因为传统流程改进带来的单核性能停滞不前。新的创新服务器设计正在改变传统的数据中心模式。他们正在利用专门的处理来处理特定的工作负载。
数据处理单元(DPU)就是这种现象的一个例子——围绕专业化的创新,被用来改变现状。DPU是一种专门的计算,用于从主CPU中卸载基础设施任务。这为客户端应用程序释放了CPU,并显著提高了性能。DPU有各种形状和大小,但它们都有一个共同点:与在主CPU上运行相比,它们以更少的能量和更高的性能执行特定任务。如今,DPU用于加速网络、安全和存储任务。
除了性能优势外,DPU还提供了许多其他优势。例如,它们通过为运行基础设施任务提供物理隔离来帮助提高数据中心的安全性。它们还有助于减少延迟并提高需要实时数据处理的应用程序的性能。由于DPU在基础结构计算和客户端应用程序之间创建了逻辑分割,因此不同开发和管理团队中的工作负载可管理性得到了优化。
DPU在超大规模服务器架构中的成功(https://www.hpcwire.com/2021/08/25/hot-chips-here-come-the-dpus-and-ipus-from-arm-nvidia-and-intel/)开始扩展到数据中心、电信服务器和边缘计算。然而,这些环境还有额外的挑战需要克服。
在超规模环境中,硬件和软件之间存在紧密耦合,通常由同一开发团队控制,并为特定应用程序量身定制。在云之外,环境更加分散。越来越多的公司正在考虑使用特定的加速器来构建DPU。原始设备制造商(OEMs
)预计会接受,但除非我们能够就发现、供应和生命周期管理的标准达成一致,否则这些不会发生。与SmartNIC不同,DPU具有通用内核,这使它们适合分层软件开发,因此可以支持标准抽象和接口。
这就是Linux基金会开放式可编程基础设施(OPI)项目的用武之地。OPI专注于利用开放式软件和标准,以及框架和工具包,以实现DPU的快速采用。OPI项目包括硬件和软件公司,它们共同建立和培育了一个生态系统。他们正在共同创建解决方案蓝图和标准,以确保合规的DPU能够与任何服务器协同工作。OPI是一个开放的协作环境,拥有合适的公司组合,可以创建端到端的参考设计。
Arm Neoverse平台是大多数DPU设计的核心,引领硬件创新。我们加入OPI项目是为了支持软件生态系统,并为他们提供工具,使最新Arm核心的利益最大化。作为起点,我们正在扩大Arm SystemReady认证,以支持DPU。该程序将硬件和固件结合起来,提供了一个经过验证的无缝引导流行Linux发行版的方法。这一关键的第一步将加快DPU上运行的应用程序的推出并简化其生命周期管理,并使开发团队能够专注于其核心产品。
有关详细信息见:https://opiproject.org/