身兼多“职”,是目前数据中心CPU典型的应用方式。
CPU不仅负责处理计算任务,还要负责存储、安全等方面的工作,导致CPU效率没有办法充分运用到应用上,从而影响系统的性能和稳定。这就给我们提出了一个新的挑战——企业高性能业务上云时,应用性能不足的问题怎样解决?
最近,英伟达网络亚太区高级总监宋庆春接受采访时给出了答案:云原生超级计算。
英伟达网络亚太区高级总监 宋庆春
云原生超级计算是为解决现在数据中心面临的挑战应运而生,并成为数据中心的新架构,而其中的DPU/DOCA和InfiniBand网络是新型计算平台的关键,打开了业务性能优化的新思路,为高性能业务上云提供了新路径。
计算通信并行 扫清企业高性能业务上云障碍
在传统数据中心架构中,CPU负责处理应用,GPU对应用进行加速,通过网络进行大规模的连接。这样的架构带来的挑战是:除了计算,CPU还需要进行存储、安全、运维等多项事务,导致不同工作之间造成了“干扰”,直接影响整个系统性能的发挥。
而云原生超级计算架构,通过引入DPU卸载数据中心中CPU的一些存储、系统管理等基础设施操作,让计算和通信并行处理,这样的架构改进给了CPU一个干净的环境,将CPU和GPU的资源完全释放给业务,从而提升系统的性能。
云原生超级计算架构采用了异构网络的方式优化性能,通过高性能来支撑算力的苛刻需求,通过DPU对数据中心进行管理,并在整个数据中心内搜集遥测信息,然后反馈到数据中心的管理单元,通过AI技术来分析和训练这些数据,用以提高数据中心的安全性和运行效率。
除了BlueField DPU之外,NVIDIA InfiniBand网络能够将数据中心高效的连接起来,同时优化整个数据中心的设计,以最少的硬件达到最优的性能,符合当前节能减排的大趋势。最重要的是InfiniBand网络通过云原生超级计算架构可以让数据中心性能达到极致。
在两周前的超级计算大会上发布的TOP500榜单中,NVIDIA的GPU和网络处于绝对领先的位置。榜单中72%的系统采用了英伟达GPU或网络(InfiniBand、以太网),TOP100中,63%的系统采用了InfiniBand网络,可见构建越快的算力平台越需要更高性能的网络。
Top500榜单中,67%的系统选择了NVIDIA InfiniBand和以太网解决方案实现互连。相比去年,NVIDIA InfiniBand网络有了9%的提升。由此可见,NVIDIA InfiniBand网络已成为构建高性能算力平台必不可少的一个组成部分。
除此之外,今年NVIDIA InfiniBand网络和Hopper GPU强强联手获得Green500第一名。Green500前50名中74%的系统在用NVIDIA InfiniBand互连,前一百名中有75%在用InfiniBand网络互连。最新的IO500的10节点测试中,前5台系统中有4台在用InfiniBand网络,每年采用NVIDIA网络和NVIDIA GPU的系统数量都在增长。
而在2022年11月TOP500网络互联方案趋势中可以看到,市场对InfiniBand的需求量出现激增的趋势。
在东数西算、双碳、新基建等大背景下,绿色节能成为搭建数据中心重要的一个考量因素,利用InfiniBand能够把各种云原生设备高效的连接起来,减少硬件设备的同时实现降低功耗、提升能效比,让数据中心更绿色节能。
云原生超级计算 强劲力量加速业务创新
市场是最有力的证明,目前BlueField-2 DPU已经被市场广泛应用,BlueField-3 DPU指标全面升级,将提供更加强劲的BlueField DPU力量。
通过NVIDIA BlueField DPU和NVIDIA DOCA,从软硬件层面加速业务运行,甚至获得超越CPU的处理效率,从而大幅减少长尾延时,为应用贡献出更多的算力。同时通过DPU还可以实现计算和通信的重叠,将传统的通信操作的控制平面和数据平面都卸载到DPU上来,实现了CPU的零通信时间,如下图所示。
通过DPU卸载通信操作,将CPU的算力完全释放给了业务,让业务性能得到了进一步的提升,例如在测试中,分子动力学的应用已经实现20%的性能提升,数据建模应用场景实现26%的性能提升,天气预告模型实现24%的性能提升。
目前,NVIDIA性能隔离技术已经在微软公有云Azure得到验证。如下图所示,把性能隔离技术用到同种应用,蓝色的线是在一个平台上只跑一个业务,绿色的线是在云上跑多个业务,启用性能隔离技术即可实现两条线的重叠,即在云上跑多个关键业务的时候能像跑一个业务一样得到同样的性能保障。
由此看来,通过云原生超级计算技术,可以在云上实现超算中心里面一样的性能。
除此之外,行业内生态伙伴正在通过集成DPU提升系统性能。比如戴尔的高端存储PowerMax已经集成了NVIDIA BlueField DPU技术,让PowerMax的系统弹性大大增强。不仅如此,戴尔和VMware共同设计了支持在VxRail上运行的数据处理器(DPU)的HCI解决方案,大大扩展了VMware在边缘领域的功能。
在益企研究院举行的数字中国万里行活动中也发现,BlueField DPU通过可编程的多核处理器和加速引擎、高性能网络接口以及软件栈的支持,实现了传统计算与数据交互的分离,更符合未来、安全、高效云原生的更大规模计算应用时代。未来逐渐开始影响到各行各业,尤其是自动驾驶、元宇宙以及金融、医疗、零售等行业,BlueField DPU的到来将带来更快的速度,更低的延迟,从而带来新的产业变革。云原生超级计算架构也将助力越来越多的高性能业务上云,助力客户加速云端创新。
DPU中国黑客松竞赛 赋能开发者加速创新
DPU中国黑客松是备受开发者关注的一个竞赛活动,参赛团队可以利用DOCA驱动、DOCA库、开发工具和相关文档构建、优化NVIDIA BlueField DPU,去做基础设施相关的加速应用开发,并在此过程中展现其奇思妙想、创新精神和团队气质。
今年秋季,NVIDIA再次在国内举办了DPU中国黑客松竞赛,共有27支团队注册,13支团队入选最终竞赛,包括既有企业开发者也有高校学生开发者。
NVIDIA网络技术专家 崔岩
据NVIDIA网络技术专家崔岩介绍,与上一届相比,2022秋季NVIDIA DPU 中国黑客松以RDMA技术为核心题目,基于InfiniBand网络来实现对存储和人工智能应用的加速,同时将这种低延迟、高性能的IO能力聚焦到金融的高频交易等一些行业应用场景中。
10月22日,经过项目现场演示,国内评委和国际评委的审核和相应的评分,最终四支团队脱颖而出,获得一等奖的是SDIC团队,二等奖是知音牛码团队,并列获得三等奖的是网络需要配团队和极客天成团队。
获得一等奖的SDIC团队项目名称是《基于BlueField DPU数据中心RDMA虚拟化的研究》,主要是基于Virtio的方案。Virtio是IO半虚拟化的解决方案,对半虚拟化IO设备进行抽象,可对上层应用和各种Hypervisor虚拟化设备提供通信框架和编程接口,减少跨平台带来的兼容性问题,提高驱动程序的开发效率。VirtIO加速能为以太网和块存储设备解决设备解耦、云管理扩展、云管理(迁移)的问题。
项目目标是要在NVIDIA BlueField DPU搭建一套设备仿真平台,虚拟化RDMA硬件设备,通过主机侧运行vHost RDMA程序以及NVIDIA BlueField DPU运行Inverse Layer,能够在InfiniBand实现RDMA功能,利用Virtio半虚拟化解决方案为不同的Hypervisor提供兼容的、通用的Virtio RDMA通信框架和编程接口,从而减少主机性能的一些开销,实现更高效的虚拟化过程,便于云管理、云运维和云迁移。
二等奖获得者知音牛码团队的项目名称是《分布式智能键值存储引擎》,称为KV存储或键值存储数据库,属于一种非关系型数据库,每个键值都有唯一的Key相关联,所以称之为键值对。分布式键值存储也称为分布式哈希表,键值对分布在多台服务器,提供相应的数据库查询检索读写的功能。
本项目是在服务器采用英伟达BlueField DPU,DPU内存中构建一个哈希表,实现键值对的存储。主机会运行RocksDB这样一个分布式键值存储数据库,一方面通过内存哈希表的查询提供非常快的访问速度,基于RDMA技术可加速数据写入内存,另一方面利用DPU近数据计算的优势加速哈希表,快速缓存新写入的数据。这三大方面可大大提升分布式键值存储的写入性能,最终提升整个数据库键值数据的访问。
总 结
随着生命科学、金融、机械设计、学术研究、气候等各领域应用爆发,各行业客户对HPC计算需求越来越旺盛,同时,大规模AI训练任务和推荐任务等业务增速,在计算量不断提升的压力下,客户利用云原生超级计算技术,可以实现在云上和超算中心上一样的性能。
而DPU中国黑客松竞赛不仅给开发者带来学习和实践使用NVIDIA BlueField DPU和NVIDIA DOCA的机会,更给开发者创造一个学习的氛围,帮助大家学习、熟悉DPU和DOCA的应用场景,掌握编程方式,也可以通过和别的队伍同场竞技,互相学习和参考,获得启发。
现在,DPU中国黑客松竞赛已经吸引了越来越多的对DPU和DOCA有创新想法、开发能力的人才,为产业注入了更多的创新活力。