英伟达推出首个 CPU，基于 ARM 架构主攻巨型 AI，性能超 x86 十倍

“Grace”CPU采用高能效的Arm核心，针对训练巨型AI模型的系统，实现了10倍的性能提升。

以 Grace 为代表的 CPU 产品性能大幅提高

北京时间 4 月 13 日凌晨，英伟达在 GCT 2021 大会上宣布了 Grace、BlueField-3 DPU，还有用于自动驾驶的汽车 SoC 芯片三款处理器，均基于 Arm 架构打造。

其中最引人瞩目的当属名为 Grace 的 CPU 产品，这款产品主要为现代数据中心设计。这是英伟达首款服务器 CPU。

英伟达认为，AI 模型的数据量和规模正在成倍增长。当今最大的 AI 模型包括数十亿个参数，并且每两个半月就会翻一番。训练它们需要一个新的 CPU，可以与 GPU 紧密结合，以消除系统瓶颈。

NVIDIA 创始人兼首席执行官黄仁勋表示：“前沿的AI和数据科学正推动当今的计算机架构超越其极限，以处理规模难以想象的海量数据。NVIDIA 借助 Arm授权的 IP设计了 Grace，这是一款专为大规模AI和HPC设计的CPU。与GPU和DPU一起, Grace为我们提供了计算的第三种基础技术，以及为了推进AI发展重构数据中心的能力。NVIDIA现在是一家拥有三种芯片的公司。”

Grace 名字来自于计算机科学家 Grace Hopper，她曾是哈佛首批 Mark 1 程序员，并且发明了第一个链接器。据了解，Grace 芯片基于 Arm 打造，内置 Arm Neoverse 核心。

Grace 整个 SoC 由多个芯片组合构成，它主要有三个部分，分别是 CPU、GPU 和内存 /IO 子系统。英伟达表示，Grace CPU 将能够在 SPECrate2017_Int_base 中提供 300 分以上的成绩。对于这样的跑分，英伟达宣称 Grace 的性能基础是第四代 NVIDIA NVLink 互连技术，该技术在 Grace 和 NVIDIA GPU 之间连接速度超过 900GB/s，相当于目前服务器 14 倍的带宽；从 CPU 到 CPU 的速度超过 600GB/s。

据英伟达官方透露，Grace 还将采用 LPDDR5x 内存子系统，与 DDR4 内存相比，可提供两倍的带宽和 10 倍的能效，也就意味着，如果服务器使用这款 CPU，那么整套系统可以提供相较于 x86 CPU 的最新 NVIDIA DGX 快 10 倍的性能。此外，新的架构提供了统一的缓存一致性和单一的内存地址空间，将系统和 HBM GPU 内存结合在一起，简化了可编程性。

在 Grace 发布尾声，英伟达透露，Grace 将得到 NVIDIA HPC 软件开发包和全套 CUDA 和 CUDA-X 库的支持，这些库可以加速超过 2000 个 GPU 应用，加快科学家和研究人员对世界上最重要挑战的发现。

GraceCPU 预计将于 2023 年初上市，瑞士国家超级计算机中心（CSCS）和美国能源部的洛斯阿拉莫斯国家实验室（Los Alamos National Laboratory）将率先建造 NVIDIA CPU 驱动的超级计算机。

两大 AI 框架应对网络安全和语音对话需求

如今，网络安全已经成为每个企业乃至国家安全的重要防线。为了促进网络安全合作伙伴拥有检测和缓解网络安全攻击的 AI 技能，英伟达发布了一个“云原生”应用框架—Morpheus。Morpheus 运行时可以让网络中的计算节点充当传感器，对网络安全威胁进行监测，以作出自主响应。

Morpheus 内置机器学习模块，开发者可以使用深度学习模型创建自己的 Morpheus 技能，以此为基础，Morpheus 可以更加智能地识别、捕获威胁和异常情况，包括敏感数据的泄露、网络钓鱼企图和恶意软件，并对其采取行动。与传统网络安全框架相比，Morpheus 可以在同等投入下分析更多安全数据，且不会影响其性能。

除了 Morpheus，同样引人瞩目的 AI 框架还有 Jarvis。

在疫情大背景下，语音消息成为企业间相互联系，甚至是生活中线上沟通最常用的方式。为了应对日益增长的语音消息传递需求，英伟达宣布对话式 AI 框架 Jarvis 开始提供对手机和消息的普遍适用性。

简单来说，Jarvis 为开发人员提供预先训练的 AI 模型和软件工具，以创建交互式对话体验。据了解，Jarvis 模型的预览版在 2020 年 5 月首次推出，可为对话代理提供自动语音识别，语言理解、实时语言翻译和文本转换语音功能。

与此前相比，此次发布新版本的主要特性在于，该框架为更多开发人员开放了预先训练的开发模型和软件工具。据了解，Jarvis 的模型训练投入了超过 10 亿页的文本和超过 6 万小时的语音，如今，这些模型可以通过自定义数据进行调整、优化、微调，同时还能根据不同的任务、行业和系统进行定制，具有更优秀的普适性。

本文转自公众号：AI前线，作者施尧，点击阅读原文

以 Grace 为代表的 CPU 产品性能大幅提高

两大 AI 框架应对网络安全和语音对话需求

推荐阅读

目录