英伟达：让AI计算无所不能，无处不在

如今要是没有自动驾驶，都不好意思叫自己是新能源汽车。

相对于电力的应用，如今不少新能源汽车都更强调科技感——原本的自动泊车已经远远不能满足大众的需求，L2甚至L3级别的自动驾驶才是当下应用的重点。借助于强大的算力和神经网络技术，许多新能源汽车都可以在本地对驾驶状况进行计算；当然为了了应对复杂状况，这些汽车也都提供了对于5G网络的支持，这样可以保证随时随地都能实现高效的数据传输。

这也可以看作的是5G与AI应用的巧妙结合，即我们现在经常提到的AI-on-5G。其实如今的智能化社会下，许多行业都面临着前所未有的转型，这种转型的显著特征就是实现了算力与智能化的融合，比如在基因工程、工业制造、科研探索等多个领域都是如此，比如加州大学就在研究如何利用GPU和深度学习技术展示新冠病毒的感染全过程。从这个角度来说，越来越多的企业都在实现高性能计算与AI的融合，而这种融合正在称为一种全新的趋势。

这也正是算力应用的多元化。以往，许多计算应用必须借助于X86平台才能实现，但是在GPU出现之后，我们慢慢发现如今许多AI算力都可以借助于GPU来完成，而在这一过程中CPU所扮演的角色越来越趋于辅助性，甚至如今的绝大部分AI应用中，GPU完全称为了计算主力，而是将系统协调工作交付给了CPU。

这就是业界所说的“高性能计算革命”，从传统数据中心到边缘计算，从私有云、公有云到混合云，如今这种趋势已经越来越明显，多样化算力也称为了行业发展的必然趋势。甚至在号称“计算桂冠上明珠”的高性能计算TOP500榜单中，使用ARM架构处理器的日本超级计算机富岳一骑绝尘，成为了世界排名第一的超级计算机，这更是证明了ARM应用已经是大势所趋。
男人站在墙边

因此，在日前召开的ISC世界超算大会上，NVIDIA 首席执行官黄仁勋旗帜鲜明的表示：“我们正处在行业高性能计算革命的开端。我们相信，将 ARM 模型应用到高性能计算的时机已经到来”，他补充说，“NVIDIA 可以快速启动ARM 高性能计算生态系统”。

事实也正是如此，继日本的富岳之后，SiPearl将称为欧洲百亿亿级 (Exascale) 超算系统的CPU、亚马逊的Amazon Graviton也表示将使用ARM、甚至包括我们前面提到的5G 基站也在使用Marvell提供的ARM芯片……这一切都说明，ARM应用与数据中心、建立强大的高性能计算生态系统已经势不可挡。这同时也表示着，在拿下移动和嵌入式市场之后，ARM同样也适合企业级市场。

英伟达恰恰是这个市场的积极布局者。应该说在最近这5-6年时间里，乘着AI应用的春风，英伟达GPU已经称为了智能化的代名词，而在ARM处理器生态和市场的积极布局，更让人对数据中心市场充满了期待。按计划，英伟达已经立了丰富的高性能计算生态系统，未来如何加上与ARM的携手，则可以彻底引领高性能计算生态的发展，同时对于整个生态也会代理来全新的、彻底的“大洗牌”。

许多人或许还记得英伟达在今年GTC大会上宣布的DPU平台，这也是其践行“高性能计算 + 加速计算 + 深度学习”趋势的一部分。对于这个趋势，黄仁勋信心满满，他更认为“行业面临的问题不再是计算机能够做什么，而是谁率先利用它来推动行业的革新。”很显然，在这个“后摩尔定律”时代，英伟达敏锐把握到了算力多样化的时代、把握了全球对于数字化、智能化转型的强烈需求，也通过努力实现了“高性能计算 + 加速计算 + 深度学习”的行业格局，奠定了全新时代的基础。

在满足了大众算力与应用的需求之外，英伟达更是积极布局互联需求。也是在这次ISC大会上，英伟达推出了面向AI与高性能计算领域推出了最新的NVIDIA HGX 加速服务器平台，将强大核心算力NVIDIA A100 80GB PCIe GPU、NVIDIA NDR 400G InfiniBand网络系统，以及NVIDIA Magnum IO GPUDirect Storage软件融入其中，推动更多行业充分利用高性能计算的力量。

据悉，这次发布的全新NVIDIA A100 80GB PCIe GPU实现了运行内存容量的倍增，同时GPU内存带宽增加了25%，达到了惊人2TB/s。大容量和高速带宽为大规模神经网络的运算提供了充足空间，最大限度降低了节点之间通信和能耗所带来的性能损失；巨大内存容量再加上高内存带宽，可以将更多数据和网络保存在内存中，最大限度地减少节点间通信和能耗。凭借其更快的内存带宽，研究人员能够获得更高的吞吐量和更快的结果，实现IT投资价值的最大化。

从传统的高性能计算到全新的AI计算，英伟达的身影一直都在，并通过加速为用户提供更强的算力、更快的传输和更好的解决方案。通过这次TOP500榜单我们也看到全新的变化——
有139套系统采用了英伟达的GPU加速器，大约占据了整个榜单份额的27.8%；

有169套系统采用了英伟达的InfiniBand网路，超过了榜单份额的三分之一，并且其中有76套采用的都是HDR网络，接近了上榜系统的近一半；

微软Azure集群Pioneer-EUS 占据了榜单24到27的4个名额，Amazon EC2 实例集群也在榜单排名第41位；

这说明越来越多的AI应用正在崛起。其实除了微软和亚马逊这种代表性企业之外，包括剑桥大学CSD3 云原生超级计算机、再比如美国国家能源研究科学计算中心 (NERSC) 的超级计算机Perlmutter，这些设备都在不同程度上采用了英伟达的产品和解决方案，比如A100 Tensor Core GPU、HDR 200G InfiniBand网路和BlueField DPU等等，这都证明了英伟达在高性能计算领域的不可替代性。

伴随着智能化应用的进一步发展，伴随着我们对于算力、网络和加速等应用的进一步需求，伴随着AI计算应用的大面积普及，无论是在5G、自动驾驶、工程制造、生物医疗等任何领域，我们都将看到越来越多看到英伟达的身影，也将加速整个社会的数字化步伐。

推荐阅读

目录