44

集微网 · 2021年07月14日

【芯视野】欲与CPU、GPU试比高 DPU开启新战事?

集微网报道(记者 艾檬)尽管是新生事物,但“暴得大名”的DPU战场已然硝烟弥漫。

自去年10月英伟达将基于Mellanox的SmartNIC卡命名为“DPU”以来,这一概念一炮而红。尽管追根溯源,其实DPU概念是初创公司Fungible最先提出的,但英伟达却“接棒”将其发扬光大。

不到一年时间,DPU已俨然成为最亮的“芯”。这里不仅有英伟达、Marvell、英特尔、博通等一众老将争锋,以及云供应商阿里、腾讯、亚马逊、微软等巨头们的竞折腰,还有众多新贵Fungible、Pensando以及国内的中科驭数、星云智联、芯启源等也在摩拳擦掌,欲与天公试比高。

DPU为何成为新一代战略“要冲”?引发的核战将走向何方?群雄逐鹿谁又将成功问鼎?

image

潜能

DPU可谓是大数据时代应运而生的产物。随着带宽的不断提升,数据量的指数级增长,数据的处理也愈加复杂,包括网络协议处理、存储压缩、数据加密等,加上端边云一体化以及存内计算到网内计算的进阶,让传统的CPU和GPU难免“心力不逮”,也让“身怀绝技”的DPU开始崭露头角,冲上C位。

Arm基础设施事业部全球高级总监邹挺认为,DPU正在取代CPU作为数据中心服务器的中央控制点,以建立以数据为中心的计算架构,而以数据为中心的计算架构提供了传统以计算为中心的架构所没有的几项关键功能。

邹挺介绍,一是DPU可充当网络和主机系统之间的安全边界,也能强制执行安全的信任根并证明固件更新。二是DPU 可运行自己的操作系统,完全独立于主机系统,这使得DPU可以从主机卸载存储和网络处理等功能。如此一来,就可从主机 CPU中释放内核,并将这些内核租赁给云服务用户。通过运行自己的操作系统,DPU还可在主机 CPU上提供裸机服务,从而允许主机运行VMware等虚拟化技术。三是DPU可将特殊资源(如 GPU、NPU 或NVMe存储)通过网络汇集并共享给大量的服务器。这使网络上的所有服务器都可访问这些昂贵的加速资源,从而允许云服务提供商提供具有较低 TCO 的专用虚拟机服务。

“鉴于 DPU 的优势,可预期所有云、边缘和企业服务器最终都使用一个或多个 DPU 来提高安全性、优化网络和存储性能。”邹挺总结说。

既然“角色”如此关键,其市场潜能也在蓄势。据预测,用于数据中心的DPU量级将达到和数据中心服务器等量的级别。以服务器每年新增大约1500万台、每颗DPU以1万元计算,这将是千亿元量级的市场规模。而且,不止DPU已成为云服务提供商一项必不可少的技术,同时也看到DPU被部署于边缘网络和企业网络案例,这将是一个不可估量的增量市场。

核战

看起来DPU已成为不容错过的新赛道。但尽管玩家甚多,细究起来每家的DPU都有不同的路线“主张”,亦让DPU的“核战”愈加扑朔。

有专家分析,DPU核大体上分成几种,一是基于Arm或MIPS核,二是以FPGA为基础构建异构核阵列;三是采用独有的架构,如中科驭数的KPU架构。

核战对势力的此消彼长影响自然至关重要。邹挺认为,从能耗和性能要求上,Arm Neoverse 平台特别是N系列平台,是DPU ASIC方案的最佳选择。过去12个月中国内涌现了十多家DPU创业公司,不少团队已经与Arm开始了有效的技术沟通和讨论。Arm坚信在DPU赛道,基于Arm特别是Neoverse平台的SoC解决方案会是未来一个主流的趋势。

而Arm的Neoverse核未来的技术路线也在推进中,目前Neoverse平台的产品路线图共有三个系列平台:V系列平台:强调以性能为优先的新型计算系列,目前有Neoverse V1平台为代表。N系列平台:以PPA为考量重点,追求PPA的平衡设计,目前该系列的产品有Neoverse N1与N2平台。E系列平台:主要关注点是效率,在功耗和面积的缩减上进行了优化,对于网络流量和数据应用程序非常有效,目前有Neoverse E1平台为代表。

FPGA的拥趸英特尔自然也在全力布局。就在前不多英特尔推出了全新的基础设施处理器(IPU),其功能与DPU可谓异曲同工,包括可加速基础设施功能,如存储虚拟化、网络虚拟化和安全,进一步释放CPU核心以及灵活的工作负载分配等。据英特尔宣称,微软、百度、京东云和 VMWare等已成为合作伙伴。

作为业界黑马,中科驭数则以其KPU专用处理器架构来打造DPU。据悉,其在过去两年完成了两代KPU的迭代,在众多应用领域得到大量实战验证。下一代DPU将于2021年底流片,提供完善的L2/ L3/L4层的网络协议处理功能,可处理高达200G带宽数据。

值得注意的是,在国内乃至全球的头部互联网公司开始逐步部署和适配标准化DPU的同时,大部分也在探索自研或外包开发适合自己业务特殊需求的定制化DPU,因此邹挺判断DPU ASIC将是普遍的最后目标产品形态。

围绕DPU ASIC,拼核的关键直指生态。邹挺提及,Arm在Neoverse生态建设的投入跟积累长达十年,在软件生态系统的努力也初具成效,越来越多的软件合作已扩展至操作系统、虚拟机管理程序、Xen、KVM、Docker容器以及Kubernetes。可以说Arm已拥有最大的持续集成/持续交付(CI / CD)平台。特别是在工艺层面上,他表示,Arm正持续与领先的晶圆代工厂保持深入的合作,在多个先进工艺节点上开发出了性能和功耗优化的POP IP。

对决

DPU蕴含的巨大潜能,也让众多的初创企业争先恐后入局。

向来嗅觉敏锐的资本市场,以其大手笔押注来支撑未来的价值变现。今年4月,珠海星云智联宣布完成数亿元天使轮融资,由高瓴创投领投,鼎晖VGC、华登国际中国基金参与跟投。6月11日,DPU芯片企业“芯启源”宣布完成数亿元Pre-A3轮融资。

可以说,在这一新赛道上,老将新贵的交锋也将进入“短兵相接”阶段。

英伟达自然是全力押注,在将Mellanox纳入麾下之后,将其BlueField产品最初其实命为IPU更名为DPU之后,已推出第三代DPU BlueField-3。官方介绍称:一颗可抵300个CPU核才能实现的服务,这是继去年发布BlueField-2和 BlueField-2X两款DPU后的又一次升级。其CPU、GPU、DPU形成三大算力支柱的数据中心路线图也焕然新生。

近日Marvell也推出新一代OCTEON 10系列DPU,采用TSMC 5nm节点,具有最新的PCIe 5.0 I/O 功能以及DDR5支持等强劲性能。

对于初创企业来说,与巨头直接交锋,难度可想而知。不仅要在DPU性能、生态上一较长短,最重要的是应用端能否让其不断迭代进化。

国内某知名分析师谨慎分析说,因DPU的主流应用还是在数据中心,这是2B市场,因而决定权在End User手中,特别是以阿里、腾讯、字节跳动等这些公司为主。一方面DPU仍是新技术,国内数据中心能否用得起来用得好不好,还得看后续的进展。另一方面初创公司只有与他们深度绑定才有更多的机会,但如果这些厂商自研或找资深玩家定制DPU,面临着不确定性挑战。

无论如何,DPU的战鼓已经擂响,躬身入局之后仍需要实力与运气的加持。(校对/清泉)

推荐阅读
关注数
4364
内容数
629
集微网隆重推出“芯视野”专题,未来将客观反映行业高管对于热点事件的观点及分析报道。
目录
极术微信服务号
关注极术微信号
实时接收点赞提醒和评论通知
安谋科技学堂公众号
关注安谋科技学堂
实时获取安谋科技及 Arm 教学资源
安谋科技招聘公众号
关注安谋科技招聘
实时获取安谋科技中国职位信息