软硬件融合 · 2021年09月09日

直面NVIDIA DPU挑战,Intel推出全新处理器家族IPU

NVIDIA发布了DPU,现在Intel又发布了IPU。虽然叫了不同的名字,但都是用在同一个场景的“竞品”。本文为Intel IPU的综合介绍。

编者比较认可IPU的叫法,原因是:DPU站在底层数据处理的角度,关注的是“功能是什么”;而IPU上升了一个层次,IPU站在给客户提供基础设施服务的角度,关注的是“能为客户提供什么价值”。

不同的名称,代表了各个公司对这件事情理解和产品定义的不同。

本文包含三部分:

  • Six Five峰会2021,Intel IPU发布
  • Intel架构日2021,IPU综述
  • Intel架构日2021,Mount Evans IPU介绍

1.Six Five峰会2021,Intel IPU发布

在今年(2021)的Six Five峰会期间,Intel公布了其基础设施处理单元(IPU)的愿景。

WeChat Image_20210909103621.jpg

当前正处于云计算的巨大变革中,这会影响交付信息技术的方式,也影响着数据中心建设的方式。

传统的,组成云数据中心的系统或服务器看起来很像经典的企业数据中心中的系统。服务器中的CPU运行所有的软件。例如Hypervisor,操作系统和应用程序。

WeChat Image_20210909103628.jpg

如今,这些已经开始改变。我们开始看到体系结构的解构。这样做的原因是,在传统的数据中心中,只有一个系统和用户。而在云中,工作负载和系统属于不同的人:多租户以及底层的云服务提供商。

打个比方,这有点像酒店和独栋住宅之间的对比。在自己家里,可能希望可以很容易地从客厅到厨房,甚至可以做成开放式厨房。可以在客厅和厨房随意走动。但在酒店里,准备食物的厨房和客人吃饭的餐厅必然是完全分开的。并且,一般来说,员工工作的区域和酒店客人居住的区域也是不同的。云数据中心构建的系统也是类似酒店的“布局”,有专门的处理器来运行云的基础设施功能。

Intel与大型云合作伙伴一起开发了这个解决方案,称之为IPU,或基础设施处理单元。云服务提供商软件运行在IPU上,产生收入的客户软件则运行在CPU上。例如,运行在CPU上的银行金融应用程序现在将与运行在IPU上的CSP基础设施软件完全分离。

WeChat Image_20210909103630.jpg

这种基于IPU的架构有一些主要优点:

  • 首先,云运营商可以将基础设施任务卸载给IPU。由于有了IPU加速器,它可以非常有效地处理这些问题。这优化了性能,云运营商现在可以将100%的CPU出租给他的客户,这也有助于实现收入最大化。
  • 其次,IPU允许功能分离,因此来宾可以完全控制CPU。因此,如果我是一个客人,我可以带自己的管理程序,但云仍然完全控制基础设施,它可以沙箱功能,如网络、安全和存储。
  • 最后,IPU可以帮助将直接连接到服务器的本地磁盘存储替换为通过网络连接的虚拟存储。这极大地简化了数据中心架构,同时增加了大量的灵活性。

英特尔一直在与包括微软、百度、京东和VMware在内的主要客户合作,持续不断的改进产品。

WeChat Image_20210909103633.jpg

不断发展的数据中心需要一种新的智能架构,在该架构中,大规模分布式异构计算系统协同工作并无缝连接以表现为单个计算平台。

这种新架构将有助于解决当今资源搁浅、数据流拥堵和平台安全不兼容的挑战。这种智能数据中心架构将具有三类计算——用于通用计算的 CPU、用于特定应用或特定工作负载加速的XPU以及用于基础设施加速的IPU——它们将通过可编程网络连接以有效利用数据中心资源。

WeChat Image_20210909103635.jpg

Intel当前提供的IPU解决方案是一张CPU+FPGA的加速卡,例如Inventec FPGA SmartNIC C5020X,它将Stratix 10和Xeon D-1612组合到一张卡上。下一步,英特尔将推出更多基于FPGA和专用ASIC的IPU平台。这些解决方案将提供强大的软件基础支持,使客户能够构建领先的云编排软件。

2.Intel架构日2021:IPU综述

WeChat Image_20210909103638.jpg

行业正处于一场变革之中。当前,组成云数据中心的系统看起来很像传统企业数据中心的系统,但现在,这一切开始改变。

WeChat Image_20210909103641.jpg

我们可以看到这两种架构的不同:传统的数据中心中,所有东西都归一方所有;而在云中,不同的人、不同的租户租户和云服务提供商共同拥有工作负载和系统。

一个典型企业数据中心中典型服务器,物理基础设施、管理程序和应用程序都属于一个实体。在这种情况下,它是一家银行。所有的软件都在CPU上运行。

WeChat Image_20210909103643.jpg

但对于为云基础设施构建的服务器,不同的架构已经出现。它们有一个专门的处理器,在云中运行基础设施功能。Intel把这种新的处理器类别称为IPU或基础设施处理单元。

云服务提供商的软件运行在IPU上,产生收入的客户软件运行在CPU上。例如,运行在CPU上的银行金融应用程序不会与运行在IPU上的云服务提供商的基础设施软件完全分离。

WeChat Image_20210909103647.jpg

如果做个类比,这有点像酒店和独栋住宅的对比。在家里,我希望从客厅到厨房,到餐桌都能很容易地移动。在酒店里,情况就大不一样了。客房、餐厅和厨房被完全地分开了。酒店工作人员的区域与酒店客人的区域是不同的。在某些情况下,如果你想从一个地方到另一个地方,你需要获得权限。

本质上,这和我们今天在云基础设施中看到的趋势是一样的。

WeChat Image_20210909103650.jpg

现在,这种基于IPU的体系结构有几个主要优点。

  • 首先,基础设施功能和租户工作负载的物理分离允许租户完全控制CPU。
  • 其次,云运营商可以将基础设施任务卸载给IPU。这有助于最大化CPU利用率,对于公共云,也有助于最大化收入。
  • 第三,IPU允许云数据中心上的完全无磁盘服务器架构。

WeChat Image_20210909103652.jpg

详细展开一下。在具有IPU的服务器中,基础设施和租户工作负载是明显分离的,在CPU上运行的租户工作负载和IPU上运行的基础设施软件是分开的。这样做的直接结果是两者之间更好的隔离。

因此,如果基础设施负载出现峰值,它将不再会导致CPU的性能问题。这显然是一个非常好的属性,但更重要的是,它现在允许租户完全控制CPU。

因此,租户可以携带自己的管理程序并在CPU上运行它(实现虚拟化嵌套),但与此同时,IPU仍然可以将管理程序限制在一个虚拟网段或特定的存储卷上,这允许非常非常灵活的体系结构。

WeChat Image_20210909103655.jpg

IPU的第二个优点是可以卸载基础设施功能。因此,今天的现代应用程序通常被构造为微服务,这导致了大量的通信开销,正如在这张幻灯片中看到的。在某些情况下,大部分CPU周期实际上都花在基础设施开销上,而IPU可以帮助减少这些CPU消耗。

WeChat Image_20210909103658.jpg

通过使用IPU,云运营商可以将这些基础设施任务卸载到IPU。由于IPU的加速性能,它可以非常高效地处理这些问题。这不仅优化了性能,而且云运营商现在可以将100%的CPU资源出租给客户,这有助于最大化整个系统的收益。

WeChat Image_20210909103703.jpg

IPU的第三个优点是,它可以迁移到完全无磁盘的服务器架构。这是一个巨大的架构变化。传统上,在云数据中心,每个服务器上都有磁盘。由于租户对磁盘空间的需求难以预测,必须为每台服务器过度供应磁盘,基本上附加的磁盘数量超过实际需要,最终将导致大量滞留容量,因此无法很好地利用这些容量。

有了IPU,我们就可以转向完全无磁盘的模型。由于所有存储都位于中央存储服务上,当客户在服务器上启动工作负载时,CSP基本上会在存储服务上创建虚拟卷。

通过管理网络,CSP告诉IPU基于虚拟卷创建一个新的NVMe SSD。当这个虚拟NVMe SSD出现在PCIe快速总线上时,就像普通SSD一样,它可以与大多数操作系统和管理程序一起工作。这样我们就可以从SSD启动了。

大家可能会问,这种架构对性能有没有影响?当通过网络访问磁盘,对网络流量处理的压力。这里关于IPU的真正关键之处在于,存储服务器和服务器上的工作负载之间的实际存储流量发生在快路径上,这意味着,Host CPU和IPU内部的嵌入式都不涉及操作。

因此,整个架构具有低延迟、高吞吐量和最大的灵活性,是一个非常强大的解决方案。

随着基础设施和租户业务的物理分离,通过加速器可以有效地卸载基础设施功能,并将其转移到真正的无磁盘架构。

Intel认为IPU将成为未来数据中心架构的核心组件。

WeChat Image_20210909103706.jpg

IPU基本上有两种常用的架构
第一个是专用ASIC的IPU,第二种是基于FPGA的IPU。每种类型都有自己的优点和缺点。基于FPGA的IPU能够快速实现新协议,用户可以对变化的需求或新协议作出反应,或者在这些FPGA上实现不公开的专有协议。另一方面,专用ASIC的IPU可以最大化性能和效率。

这两者实际上都不同于经典的SmartNIC,后者缺乏执行基础设施控制平面的能力。

因为对于不同类型的基础设施加速,没有一种尺寸可以适用于所有类型,英特尔将继续迭代这两种类型的IPU和SmartNIC。

Intel与包括微软、百度、京东和VMware在内的全球领先的云服务提供商进行了深入合作。

凭借Xeon-D、FPGA和以太网组件,Intel成为IPU市场的量产领导者。

WeChat Image_20210909103709.jpg

Intel针对云和通信市场的IPU组合中有两款令人兴奋的基于FPGA的新产品,那就是Oak Springs Canyon和Arrow Creek。

Oak Springs Canyon是一款基于FPGA的IPU,使用英特尔的Agilex FPGA和Xeon-D CPU。

WeChat Image_20210909103711.jpg

Agilex在功耗、效率和性能方面是业界领先的FPGA,与基于Xeon的服务器级CPU协同工作,提供所需的性能,以减轻2x 100G的工作负载,并围绕x86优化了丰富的软件生态系统。

Oak Springs Canyon利用了Intel OpenFPGA堆栈,这是一个可扩展源可访问的软件和硬件基础设施堆栈。Oak Springs Canyon符合下一波100G CSP部署的需求。

Oak Springs Canyon还具有一个加固的加密块,允许以线速率性能确保所有基础设施流量、存储和网络的安全。这在如今非常重要。

WeChat Image_20210909103714.jpg

第二个产品叫做Arrow Creek。Arrow Creek是一个基于Agilex FPGA和E810 100G以太网控制器的加速开发平台。

WeChat Image_20210909103716.jpg

它建立在英特尔N3000 Pack的成功基础上,该Pack目前已部署在全球一些顶级通信服务提供商。

Arrow Creek将帮助电信供应商提供灵活的加速工作负载,如Juniper Contrail、OVS和SRv6。

通过这两个基于FPGA的产品组合,英特尔涵盖了云和通信服务提供商的需求。

3.Intel架构日2021:Mount Evans IPU介绍

WeChat Image_20210909103719.jpg

实际上,今天最关键的是Intel发布了第一个专用ASIC的IPU,代码为Mount Evans。

Mount Evans是与一个实时/大型CSP联合开发的,Mount Evans是一个即将到来的ASIC IPU家族的基础。

英特尔正在通过建立基于FPGA和ASIC资产的领先IPU来帮助引领行业转型。

ASIC IPU的产品代码为Mount Evans,是Intel的第一个200G ASIC IPU或基础设施处理单元。

WeChat Image_20210909103641.jpg

Intel与一家顶级云提供商携手构建和开发了Mt. Evans。这为大规模网络的部署需求提供了重要的经验。

英特尔一直通过基于FPGA的解决方案与其他云供应商密切合作,对这些产品的学习影响了Mount Evans的许多架构和设计权衡。

Mount Evans是为实际工作负载下的大规模性能而设计的。

最后,为了超大规模的准备,Intel从整个芯片的方方面面设计了安全和隔离机制。

在技术方面,Mount Evans充满了创新
首先,该产品的焦点是Intel认为是该类中最好的包处理引擎,它支持大量现有用例,如vSwitch卸载、防火墙和虚拟路由,并为未来用例提供了重要的空间。另一项技术是通过扩展英特尔久经考验的高性能Optane NVMe控制器创建的,它使Mount Evans能够模拟NVMe设备。第三个让人感到兴奋的技术创新是下一代可靠的传输协议。Intel与CSP合作伙伴共同创新了这项技术,以解决有损网络上的长尾延迟问题。最后,可以跨各种用例使用的第四个启用技术是Intel的高级加密和压缩加速器,利用Intel QAT技术。

最后,Intel希望IPU成为超越云计算领域的一项引人注目的技术。这意味着让软件开发人员能够做他们最擅长的事情。

Intel从为灵活性和可编程性而设计的创新性能硬件开始。Intel还利用收购Barefoot时获得的专业知识,推动P4语言在业内的使用,作为将网络数据平面编程集成到IPU上的标准框架。Intel还将扩展DPDK和SPDK等知名SDK,以利用IPU的数据和存储处理能力。

WeChat Image_20210909103725.jpg

在这里,Intel展示了Mount Evans的高层框图。如图所见,Mount Evans被组织为左侧的网络子系统和右侧的计算子系统。

WeChat Image_20210909103727.jpg

Mount Evans支持每秒200G的吞吐量连接多达4台Xeon主机。Intel认识到,云性能需求将推动许多应用程序(如存储、消息传递和高性能计算)迁移到基于RDMA协议。Mount Evans通过ROCEv2和我前面提到的新的可靠传输技术的实现来支持这一点。

Intel的Optane衍生NVMe引擎将高性能NVMe设备公开给主机处理器,使基础设施提供商能够使用IPU来实现他们选择的存储协议,无论是通过Fabric的硬件加速NVMe还是计算系统的自定义软件后端。

可编程包处理器为vSwitch卸载、防火墙、遥测功能等用例提供领先支持,同时在现实世界实现中支持高达每秒2亿个包的性能。最后,Mount Evans提供内联IPSec来保护通过网络发送的每个数据包。

WeChat Image_20210909103730.jpg

在右边,计算系统建立在使用N1 Ares核心的ARM Neoverse架构上。这16个高频核心配备了由3个LPDDR4控制器支持的大型系统级缓存。计算综合体与网络子系统紧密耦合,允许网络子系统加速器使用系统级缓存作为最后一级缓存,在两者之间提供高带宽、低延迟连接,并支持硬件和软件包处理的灵活组合。

后备加密和压缩引擎源自英特尔的QAT技术,你可以在Xeon路线图中看到,但Itnel已经针对IPU使用模型进行了调整。还包括对Zstandard压缩算法的支持。最后,双核管理处理器提供了一个到平台和编排层的接口,支持健壮的系统可管理性。

Intel从软件至上的理念设计了Mount Evans。在IPU上启用应用程序需要强大的软件基础,后续Intel会持续发布相关技术细节的介绍。

END

作者:Intel
来源:https://mp.weixin.qq.com/s/yUUjdKLimBoXyPJRVrSe0A
微信公众号:
软硬件.jpg

相关文章推荐

更多软硬件技术干货请关注软硬件融合专栏。
推荐阅读
关注数
2802
内容数
104
软硬件融合
目录
极术微信服务号
关注极术微信号
实时接收点赞提醒和评论通知
安谋科技学堂公众号
关注安谋科技学堂
实时获取安谋科技及 Arm 教学资源
安谋科技招聘公众号
关注安谋科技招聘
实时获取安谋科技中国职位信息