E企研究院 · 2021年06月29日

从云到边缘 NVIDIA构筑 AI竞争壁垒

做为新基建浪潮的先锋力量,5G、云计算和人工智能的飞速发展,正在不断重构各行各业,为产业数字化转型注入新动能。

但对于企业来说,随着数据量的增多,更需要将计算靠近数据,快速做出反应或降低数据传输成本。

作为AI加速计算的主要力量,NVIDIA的GPU算力近年来不断提升、突破,与此同时,部署AI基础设施软件栈始终存在挑战,在全面的加速AI生态进程中,NVIDIA正在从边到云开足马力,高筑竞争壁垒。

AI基础架构:从集中式转向分布式

现如今,越来越多的数据在边缘生成,对于任何企业来说,将边缘的数据集中再传到云中进行处理的做法使得成本更高。与此同时,数据处理将跨越公有云、边缘设备、私有数据中心等,出于成本和性能方面的原因,AI 解决方案还需与不同数据源安全高速连接。

ai.png

而在自动驾驶汽车、工厂机器人自动化和基于 AR/VR 的预测性维护等应用场景中,还需要非常低的延迟,因此,在边缘层执行 AI 推理势在必行。

这些都推动着AI基础架构从集中式向分布式 AI 基础架构转变,AI 处理不能仅在集中式公有云中进行,还需要再私有数据中心、边缘中运行,但对于私有数据中心来说,其实无法承载下一代基于 GPU 的 AI 硬件,毕竟这些硬件要具有更高的功率和特殊的冷却要求。

对于企业来说,需要一种端到端的 AI 解决方案,可以轻松在从集中式公有云到不同类型边缘位置的分布式位置上进行训练和推断其模型。

这也是NVIDIA所关注的问题,上周NVIDIA发布NVIDIA AI LaunchPad,这是一个通过混合云供应商提供的综合程序,企业能够通过该程序即时访问由NVIDIA提供的基础设施和软件,从而简化整个AI生命周期。

AI LaunchPad的首家供应商是 Equinix,将通过Platform Equinix在全球220 多个互连数据中心提供由NVIDIA支持的混合云解决方案。

显然这种做法提供了交钥匙的、最先进的、边缘到云的 AI 计算基础设施,对于客户来说是个大利好,可以通过该基础设施将无缝集成到客户自己的基础设施中。

构建混合云AI全球生态系统

AI LaunchPad作为一个端到端的解决方案,既提供用于使用NVIDIA DGX系统进行模型训练的 AI 核心基础设施,也提供使用基于NVIDIA EGX 平台构建的NVIDIA认证系统的推理和 AI 边缘基础设施。
ai2.png

AI LaunchPad

Equinix Fabric 在这些分布式训练和推理位置之间提供高速和安全的连接,以软件速度按需连接数字基础设施和服务,扩展混合部署,实现网络敏捷性,这样一来,Equinix 基础设施在几分钟内就能部署完毕,能够为企业提供对所有NVIDIA资源的访问,实现从数据中心训练和推理到边缘上的全面部署。

这些行业标准服务器建立在NVIDIA EG平台之上,非常适合用于在VMware vSphere上运行NVIDIA AI Enterprise软件套件来部署一个可以在混合云中扩展AI的AI-Ready Enterprise Platform。

放眼全球来看,全球性企业选择人工智能解决方案的重要考量是能够实现本地处理数据,全球企业越来越需要在多个国家/地区拥有本地 AI 方案,以符合数据驻留要求。

而现在,客户子需要选择AI LaunchPad一套方案即可,Equinix互连服务提供从分布式数据源到 NVIDIA AI 模型训练堆栈的快速、安全的数据传输。同样的私有互连解决方案还支持将新开发的 AI 模型转移到 Equinix 的 NVIDIA AI 边缘基础设施。企业可以在横跨五大洲 26 个国家的 63 个都市市场的 Platform Equinix 上部署他们的 AI 培训和边缘基础设施。所有这些分布式 Equinix 站点都通过 Equinix Fabric 高速、低延迟和安全的虚拟连接互连。Equinix 为全球组织提供一致且可靠的数据中心和互连平台体验,而无需处理来自全球不同供应商的多个数据中心流程。

面向企业的即时 AI 基础架构

显然,Equinix 提供了一个数字生态系统,包括云和网络服务提供商和企业在内的 10,000 多家企业。通过 AI LaunchPad,Equinix 客户可以在 AI 开发中心 NVIDIA Base Command Platform 管理的 NVIDIA DGX SuperPOD上运行先进的 AI 工作负载。

现在,企业客户就能够通过Base Command Platform对戴尔和联想企业级厂商提供的NVIDIA认证系统上的主流AI工作负载进行管理和部署。而这些服务器建立在NVIDIA EGX平台上,适合用于在VMware vSphere上运行NVIDIA AI Enterprise软件套件来部署一个可以在混合云中扩展AI的AI-ready enterprise platform。

这也意味着,未来企业可以通过AI LaunchPad这个一站式解决方案实现快速部署、管理和扩展AI工作负载。

这其中,AI LaunchPad的关键组成部分是NVIDIA AI Enterprise,是一套端到端云原生AI和数据分析软件,由NVIDIA提供优化、支持和独家认证,可在VMware vSphere上运行并带有NVIDIA认证系统。

通过在NVIDIA认证系统上运行 AI Enterprise 和 VMware vSphere,企业可以在 Equinix 数据中心部署 AI,在多个节点上实现近乎裸金属的性能,为大型、复杂的训练和机器学习工作负载提供支持。

除了提供 AI 计算、网络和存储基础设施,NVIDIA AI LaunchPad 还提供必要的基于软件的编排服务,以使用云技术以无缝方式在分布式站点之间移动数据和 AI 模型。客户可以使用NVIDIA Base Command和NVIDIA Fleet Command来管理他们的 AI 开发工作流程,后者可在边缘轻松、安全地管理和部署 AI。

这里的NVIDIA Fleet Command是AI LaunchPad中的托管式边缘AI服务平台,与AI LaunchPad同步发布,可以使企业能够快速构思、部署和管理边缘和工业AI。

这个平台中的远程管理软件让企业在不牺牲边缘计算的实时处理能力的前提下,能够安全发布和管理其AI应用。专为减轻企业IT负担而设计,通过让用户能够从中央位置快速安装、更新和管理软件,帮助各处实现AI。

从数据中心训练和推理到边缘的全面部署,让企业可以通过一整套 NVIDIA 方案实现,对于企业来说又多了一个选择,NVIDIA也开启端到端 AI 基础设施的重要旅程。

推荐阅读
关注数
5033
内容数
335
E企实验室由E企研究院专职产品技术分析师针对数据中心、云计算、AI和5G等领域最新技术和应用研究、验证、试用、分析,数据中心级新产品新技术的市场教育,国内唯一同时研究互联网和传统企业IT基础设施的机构和部门
目录
极术微信服务号
关注极术微信号
实时接收点赞提醒和评论通知
安谋科技学堂公众号
关注安谋科技学堂
实时获取安谋科技及 Arm 教学资源
安谋科技招聘公众号
关注安谋科技招聘
实时获取安谋科技中国职位信息