E企研究院 · 2022年07月12日

解锁DPU更多能力,NVIDIA这样干

俗话说,好马配好鞍,数据中心何尝不是这样呢?

NVIDIA BlueField DPU,它是一款非常强大的片上数据中心基础设施,可用于卸载、加速、隔离各种软件定义基础设施服务。但要想充分发挥BlueField DPU这颗强大的芯片在数据中心基础设施的硬件能力,就需要有个好的配套系统来让其发挥出最大潜力。

于是,简单、高效的NVIDIA DOCA软件框架应运而生。

DOCA软件框架:为BlueField DPU注入“灵魂”

DPU的设计初衷是要将部分由CPU处理的管理工作,如网络管理、安全扫描等卸载到专用芯片DPU上,从而让CPU专注更高价值的工作。

v2-910eef940f62631ece44904ebf84bd5b_1440w.png

但如果光有硬件,没有软件,那么DPU就失去了“灵魂”。DOCA软件框架可以解锁BlueField DPU的更多功能,调用DPU强大能力造福于实际业务。

DOCA是Data-Center-Infrastructure-On-A-Chip-Architecture 的缩写,也就是"片上数据中心基础设施体系结构"。主要的目的是为开发者打造一个全面的、开放的开发平台,支持广大开发者可以在BlueField DPU上进行简单、灵活的软件开发,让开发者可以快速地创建BlueField DPU加速的、高性能的应用程序和服务。

e44be0b811cd488bac4b64ba5aad1ee1.png

NVIDIA网络专家崔岩表示:“作为一个为BlueField DPU量身定做的一个软件框架,它的主要目的是为开发者打造一个全面的、开放的开发套件。”

据介绍,DOCA是依托于面向未来的、API驱动的思维模式来构建的,可以让BlueField DPU硬件加速器变得更加易用,从而实现非凡的数据中心的性能、效率和安全性。DOCA使开发者能够利用行业标准的API,在BlueField DPU上做快速的创建应用程序和服务,能够更好地向下平滑兼容持续演进的新一代BlueField DPU,并提供持续的支持。

DOCA可以加快应用程序和服务的上市时间,让合作伙伴和客户在各自的行业竞争领域里获得成功。并基于BlueField DPU的应用场景发挥关键的“灵魂”作用,释放DPU的巨大潜力。

从1.0到1.3,DOCA实现跨越式的技术跃迁

在2020年GTC秋季大会上,NVIDIA发布了最早的DOCA 1.0,后面持续演进到DOCA 1.1版本,更加完善了整个DOCA软件栈,提供了DOCA SDK、运行时与服务。到了DOCA 1.2版本,更是加强了在零信任分布式安全解决方案上的支持。

d6a5cb28f3074c5fbf60c8d51fd904d2.png

在2022年的5月份,NVIDIA发布了最新的DOCA 1.3,它提供了121个新的API开发接口,还有一些全新和增强的功能。

从DOCA软件开发套件来看,它主要囊括了创建和构建应用程序所需的所有组件,包括驱动程序、抽象的API库、各种开发工具、参考源代码、示例程序和开发所需的文档,开发者可以轻松地基于这个软件栈在本地BlueField DPU上或X86开发容器中搭建开发环境,快速地开发自己想要实现的应有程序或服务。

DOCA框架能够给开发者提供一个一致的开发体验,既可以统一访问BlueField DPU上各种硬件资源,从而简化网络、存储、安全和基础设施管理服务的开发,开发者无需担心开发环境构建和部署复杂程度。基本上,DOCA是个即插即用的方式,可以让开发者很容易地来使用这个软件栈。

同时,DOCA框架还为开发者提供了基于底层API抽象和封装的高级API库,这样对于开发者来讲,可以大大地节省他的开发时间,更早或更快地使所开发的应用投入到市场,获得更大的投资收益。当然,DOCA还提供了容器化的DOCA服务,可以在BlueField DPU上直接进行部署,来提供相应的应用和解决方案。

崔岩重点介绍了DOCA 1.3 优化的三项功能:

第一是正则表达式库Regular Expression(RegEx),RegEx是许多脚本语言中使用的标准模式匹配的工具,有了它可以创建与文本模式匹配的过滤器,而不仅是单个单词或短语的匹配。

26b931522e8b4ad8a681b42ea3916e77.png

RegEx是专为高吞吐量、低延时、深度包检测的应用程序而设计,这些应用程序需要对数据包进行负载检测和异常监测,通过RegEx模式匹配和字符串匹配来实现相应的应用功能。另外,RegEx还是一个重要的安全遥测的功能,在DOCA 1.3上更好地提供一些安全方面的应用,能为这些安全软件开发提供底层的API支持。

第二是基于OVN的数据路径加密功能。DOCA 1.2 版本实现了把主机CPU的IPsec相应加密功能卸载到DPU上,可以在vSwitch控制平面上构建IPsec控制平面来实现IPsec加密和解密。新版本把该功能扩展到整个OVN范畴,不同主机之间都可以用这个IPsec方式来创建不同的通道,实现数据加密传输。

cea3f9edd74f4d9bad0d1c1cd604e407.png

第三是DOCA基于主机的网络(HBN)。在NVIDIA BlueField DPU上,基于主机的网络有助于管理和监控同一节点上虚拟机或容器之间的流量,分析和加密进行节点流量,并实现路由。同时也会把一些原来是依赖TOR交换机上面的功能也在DPU上面得到了实现,这种方式会彻底改变客户构建和思考整个数据中心网络的方式。

随着BlueField DPU智能化程度的提高,在整个网络里把功能都会集中在BlueField DPU之上去做相应的实现,这样就会降低对TOR交换机的相关要求,BlueField DPU还为网络策略和配置和实施提供一个隔离的环境,这样可以做更好的安全性的部署。

f42da9efd6664bab80cc8ad840dcba75.png

归根到底,基于主机的网络(HBN)是一种DOCA服务。在BlueField DPU上实现动态的路由协议之后,使网络路由能够在服务器端运行,可以大大地加速整个网络数据流量处理性能,同时BlueField DPU还可以提供相应的安全保障,这是HBN会给BlueField DPU和未来客户在数据中心网络部署带来全新的方式。

多措并举,NVIDIA为DOCA良好生态增添活力

为了更好的扩展和支持DOCA中国开发者,有效的推进和适配DOCA中国生态体系建设,NVIDIA在2022年初NVIDIA授权两家合作伙伴设立DPU& DOCA卓越中心。首批获得NVIDIA授权设立DPU& DOCA卓越中心的合作伙伴为丽台(上海)信息科技有限公司和上海信弘智能科技有限公司。

两家合作伙伴从即日起为DOCA中国开发者提供在线实践的免费开发环境,实现编译、运行、测试DOCA应用程序,以便构建DOCA业务应用及行业解决方案。通过与DOCA中国开发者社区进行互动,相互分享和促进加速应用的创新,与NVIDIA一道构建DPU和DOCA生态体系。

在2022年初,NVIDIA举办了首届DPU中国黑客松竞赛。瑞奇网络团队获得赛事的亚军。这个团队是由一位博士后和两位博士生组成,主要研究方向是云计算和分布式系统。

3e611fc481554c0f89c909de8bb6838b.png

亚军瑞奇网络团队成员胡效赫表示:“在开发过程中,通过专家的指导和参赛团队进行的交流,团队充分地了解了BlueField DPU软硬件特性,积累了DPU的开发经验,同时也看到了其他团队在DPU上的创新实践。DOCA良好的可编程性让我们可以快速实现并验证创新的想法,同时,我们也可以对DOCA的API进行深度、定制化开发,实现更好的性能和更丰富的功能。”

从互联网发展普及至今,任何一次技术创新和基础架构变革,在业务可观测性上一定会产生新的产品和解决方案。瑞奇网络团队的参赛项目是着眼于基础设施的业务可观测性,他们提出了“DeepTrace”项目,面向DPU驱动的基础设施的网包级函数粒度业务可观测性。

d5f2d21121e64bc28822a43c3344aa22.png

“我们以DOCA提供的网流及粗粒度可观测性为基础,对应的是DOCA中的Netflow API库,结合BlueField DPU的高性能网络处理功能,对应的是DPU的ASAP2网包分类引擎,以及DOCA中的Flow API库,以及数据平面和控制平面的可编程能力,将可观测性的力度提升至网包级,并精确到每个函数功能。同时,我们也做到了几乎可以忽略不计的性能损耗。”胡效赫说。

基于DOCA开发DeepTrace的整体编程模式和在CPU上进行DPDK网络功能的开发功能类似,该模式提高了开发效率。

NVIDIA网络市场总监孟庆表示,黑客松竞赛给开发者带来一个学习的氛围,帮助大家学习、熟悉BlueField DPU和DOCA的应用场景,掌握编程方式,也可以通过和别的队伍同场竞技,互相学习和参考,获得启发。

据悉,今年下半年NVIDIA计划举办第二届DPU中国虚拟黑客松活动,在活动中将为广大的DOCA中国开发者提供训练营,并为开发者更新最新的BlueField DPU和DOCA发布信息,随后会组织DPU中国虚拟黑客松竞赛。

未来,NVIDIA授权合作伙伴DPU&DOCA卓越中心将继续为DOCA中国开发者提供在线实践的DOCA开发环境,构建和拓展DPU和DOCA生态体系。

不仅如此,授权的两家合作伙伴DPU&DOCA卓越中心将为整个中国的DOCA开发者提供一个免费的DOCA开发环境。该环境支持免费DOCA开发环境远程访问,并提供编译、运行、测试等完整的开发者服务,从而加速应用创新,拓展开发者社区。

开发者需要自备登录设备和相应的软硬件环境,卓越中心提供完整的软硬件DOCA开发环境。开发环境的开放时间是每周一到周四的9:00AM-15:00PM。申请人可以向卓越中心提交申请,审核批准之后可以获得2-6小时的免费开发环境。

817e307b972146599a8cabd45398ff59.png

开发者与开源总是形影不离。NVIDIA一直以来都是开源领域的贡献者,积极参与NVME、OCP等开放性组织。在网络方面,NVIDIA在SONiC、OVS、DPDK、OpenMPI等项目中做了非常多的工作。

1fd260c7388f405494f2fb0549bd2a46.png

最近,NVIDIA成为Linux基金会OPI(Open Programmable Infrastructure,开放可编程基础设施)项目创始成员。NVIDIA会开放DOCA的安全、存储加速、硬件卸载等特性,这样不管是客户还是ISV等合作伙伴都可以在DOCA开放架构之上编写应用程序。

结语

总的来说,新技术引领新的时代,新时代需要新的应用方式,DOCA 1.3的发布,为BlueField DPU应用铺平了道路。借助DOCA软件框架,开发者能够加快应用程序和服务的上市时间,并基于BlueField DPU 服务场景发挥关键的作用,释放出DPU的巨大潜力。

推荐阅读
关注数
5032
内容数
335
E企实验室由E企研究院专职产品技术分析师针对数据中心、云计算、AI和5G等领域最新技术和应用研究、验证、试用、分析,数据中心级新产品新技术的市场教育,国内唯一同时研究互联网和传统企业IT基础设施的机构和部门
目录
极术微信服务号
关注极术微信号
实时接收点赞提醒和评论通知
安谋科技学堂公众号
关注安谋科技学堂
实时获取安谋科技及 Arm 教学资源
安谋科技招聘公众号
关注安谋科技招聘
实时获取安谋科技中国职位信息