云中子〖计算杂谈〗 · 6月2日 · 北京市

2.2倍带宽提升,Spectrum-X为AI网络带来新变革

COMPUTEX 2024上,NVIDIA宣布了多项新产品和技术,包括搭载RTX的AI PC、RTX AI工具包、RTX语音AI、NVIDIA AI Enterprise-IGX、NVIDIA Holoscan、Spectrum-X AI 以太网平台、NVIDIA NIM容器化推理微服务等。这些技术和产品将加速AI在游戏、企业、工业等领域的应用,推动AI革命。

在当今的AI时代,大模型及相关应用正以前所未有的速度发展和普及。它们犹如强大的引擎,推动着各个领域的创新和进步。然而,这些先进的技术对算力和网络传输提出了极为严苛的要求。

传统的交换机已经难以满足当下对高速、稳定和强大数据传输能力的需求。在AI时代,数据量呈爆炸式增长,模型训练和实时应用需要在瞬间完成大量数据的交互。对于企业级用户而言,这意味着他们迫切需要一种能够适应AI时代挑战的网络交换机。

例如,在AI训练过程中,需要大量的突发式数据交互,而且传输的数据消息很大,GPU之间传输数据的耦合性很强;在智能图像识别应用中,大量的图像数据需要快速地传输到计算节点进行处理;在语音交互系统中,连续不断的语音流必须及时送达以实现实时响应。这就要求交换机具备更高的带宽、更低的延迟和更可靠的性能。

因此,只有更符合AI时代需求的交换机,才能为企业级用户搭建起高效的数据传输桥梁。

基于以上需求,NVIDIA推出了全新的Spectrum-X以太网平台,为用户提供了更高的带宽、更多的端口,及更为强大的软件功能集与可编程能力,构建领先的AI以太网网络性能。

NVIDIA网络高级副总裁Gilad Shainer表示:“随着生成式AI等前沿技术的迅猛发展,企业必须将网络创新置于战略核心,以获取竞争优势。NVIDIA Spectrum-X为以太网带来了革命性的变革,它使企业能够全面发挥其AI基础设施的强大能力,从而彻底改变其运营模式,并有可能重塑整个行业。”

NVIDIA BlueField-3 SuperNIC是NVIDIA Spectrum-X 网络平台的核心组件之一,它是一款高性能的网卡,专为加速数据中心和云计算环境中的计算网络和存储工作负载而设计。BlueField-3 SuperNIC源于NVIDIA的BlueField-3 DPU(数据处理器),集成了强大的网络、安全和计算功能。

据官方资料显示,BlueField-3 SuperNIC可提供高达400Gb/s的网络速度,能够提供大规模的数据吞吐量,同时提供低延迟的数据传输,并支持AI训练网络必需的动态路由和增强拥塞控制技术,这对于现代数据中心至关重要。

一直以来,传统以太网络设备都未曾优化过各个服务器之间GPU在进行分布式计算时的互连性能。现如今,用户需求有了很大变化,基于AI的应用需要大范围调用海量GPU来完成单一任务,所以GPU之间的通信效率将决定整个AI云的性能。Spectrum-X的设计目标就是为了解决这些痛点,它极大增强了GPU之间的互连性能,与传统网络设备相比在AI训练过程中可提升2.2倍的Allreduce通信带宽,全双工全网通信效率提升1.6倍,还有1000倍的遥测数据收集能力。

NVIDIA Spectrum-X将NVIDIA Spectrum SN5600以太网交换机与NVIDIA BlueField-3 SuperNIC进行了整合,构建起一个能够全方位满足生成式AI云需求的端到端平台,兼具高性能以及丰富的云服务功能。此平台借助动态路由和先进的拥塞管理技术,达成了带宽利用率的提高及对应用性能干扰的最小化,进而为AI应用打造了具备更高性能的以太网网络基础设施。哪怕是在处理数以千计不同规模的AI任务时,也能够确保每个作业都能达到理想的性能水平。

并通过与NVIDIA BlueField-3 DPU在南北向的集成,该平台对先进的多租户云架构、GPU 计算资源的弹性扩展以及零信任安全保障予以支持。这就让云服务提供商可以加快 AI 应用程序的开发与部署,从而得以实现更高的投资回报率。

随着AI技术的不断发展和应用场景的不断扩大,NVIDIA Spectrum-X凭借其先进的网络交换技术和强大的数据处理能力,无疑将成为推动AI创新和业务增长的关键力量。对于企业而言,这意味着能够更快速地部署AI应用,更有效地处理大规模数据,从而在激烈的市场竞争中脱颖而出。对于云服务提供商来说,NVIDIA Spectrum-X不仅能够提升服务质量和用户体验,还能够带来更高的商业价值和市场影响力。

据NVIDIA官方资料显示,率先采用NVIDIA Spectrum-X的AI云服务提供商包括CoreWeave、GMO Internet Group、Lambda、Scaleway、STPX Global以及Yotta等,他们的AI基础设施也由此收获了强大的网络性能。此外,在继戴尔科技、慧与、联想以及超微等将Spectrum-X平台融入到其产品之后,又有诸多NVIDIA合作伙伴也发布了基于Spectrum-X的产品,像永擎电子(ASRock Rack)、华硕(ASUS)、技嘉科技(GIGABYTE)、鸿佰科技(Ingrasys)、英业达(Inventec)、和硕(Pegatron)、云达科技(QCT)、纬创(Wistron)以及纬颖科技(Wiwynn)等。

因此,随着AI技术的不断发展,NVIDIA Spectrum-X将成为未来AI基础设施的重要组成部分,引领AI网络技术的新潮流。

推荐阅读
关注数
853
内容数
102
目录
极术微信服务号
关注极术微信号
实时接收点赞提醒和评论通知
安谋科技学堂公众号
关注安谋科技学堂
实时获取安谋科技及 Arm 教学资源
安谋科技招聘公众号
关注安谋科技招聘
实时获取安谋科技中国职位信息