18

麦斯科技 · 2022年02月07日

Arm CPU抢占HPC市场

https://www.nextplatform.com/2022/02/04/arm-cpus-to-take-a-bite-out-of-the-hpc-market/

基于Arm的服务器有一段曲折的历史,经历了许多挑战X86处理器霸权的失败尝试,但该公司似乎看好其在高性能计算(HPC)领域的机会,认为其许可模式和体系结构的能源效率使其具有优势。

Arm负责HPC业务的高级总监Brent Gorda在戴尔(Dell)主持的HPC社区活动上表示,Arm“在HPC社区真的很努力”,并强调了它与英伟达(Nvidia)、Silicon Pearl和富士通(Fujitsu)等公司的合作关系,以开发基于Arm的硅来驱动HPC和AI应用。

事实上,Gorda指出,Arm已经在HPC行业占据了一席之地,日本RIKEN实验室的“Fugaku”超级计算机凭借152064个 48核富士通A64FX处理器位列世界最快。

然而,富士通遵循了从Arm获得架构许可的道路,这意味着它能够设计和制造自己的定制Arm兼容处理器,以满足自己的需求。这意味着增加了512位可伸缩向量引擎单元(Scalable Vector Engine),以支持富士通所考虑的那种计算,再加上它自己的Tofu D高速互连。

但很少有HPC站点能够从头开始设计自己的芯片。Gorda解释说,幸运的是,Arm的商业模式还允许合作伙伴采用现成的核心设计,并向其中添加定制模块。

他说:“有一种叫做核心许可证的东西,你可以通过它来许可Arm Neoverse,这是我们的IP。它为你提供了核心构建块,逻辑本身,你可以围绕它定制和构建你想要构建的芯片。”。

Arm1.jpg

围绕这一切的是Arm ServerReady合规计划,该计划证明特定芯片符合Arm服务器生态系统的兼容性要求。

“一旦您通过了此认证,您就可以使用大量的软件。它保证了软件的功能,然后您就可以购买受支持的操作系统版本,如Red Hat。”

Gorda称,这种为特定应用或一组应用定制芯片的能力正是Arm的优势所在,尤其是在HPC和人工智能这种正在发展的领域。客户可以使用Arm核心引擎和片上网络,并为其目标工作负载添加定制加速器。

他说:“来自英伟达的Bill Dally说,通过在芯片上定制自定义门电路,你可以获得高达三个数量级的性能改进。这正是Arm的发展方向。”。“每个人都有一个加速器的想法。如果你足够了解自己的工作负载,你就可以优化它,并获得非常好的性能。事实上,这就是A64FX如此优秀的原因。他们花了十年时间,研究了他们拥有的十到十二个应用程序,并最终解决了它。处理器问世后,它的性能非常好,彻底地把日本人想要的应用程序运行在了他们的系统上。”

Arm早在2018年就推出了Neoverse,目标是数据中心基础设施,而不是移动设备市场。Neoverse设计在去年进行了扩展,现在包括三个处理器设计系列:强调性能的V系列;N系列专注于扩展应用程序,如云基础设施;以及E系列,它更多地针对边缘应用。
Arm2.jpg

Gorda透露,参与欧洲处理器计划(EPI)项目的公司Silicon Pearl正在使用Neoverse V1设计。与此同时,N1设计已被用于Ampere Computing的“Quicksilver”和“Mystique”Altra服务器芯片,Ampere Computing是由英特尔前高管Rene James创立的初创公司。亚马逊的Graviton2芯片为一些AWS EC2实例提供动力,它使用N1核心,而Graviton3则使用V1核心。Neoverse V系列内核显然也包含在Nvidia计划中的“Grace”芯片中,该芯片旨在实现超级计算,以及韩国电子和电信研究所(ETRI)正在开发的服务器芯片中。

阻碍Arm进入服务器市场的问题之一是软件支持,许多关键软件包都是为X86处理器平台开发的。当被问及在Arm上部署HPC的所有部件是否都准备就绪时,Gorda说,总体而言,答案是肯定的。

他解释说:“你会发现一些软性的地方是,虽然我认为准确地说所有ISV都在开发Arm端口,但并非所有ISV都公开支持硅芯片上的Arm。因此,如果你依赖ISV许可证和软件,你必须对ISV进行投票,以了解情况。”。

然而,Gorda引用了Lustre并行文件系统的例子,该系统广泛用于HPC环境。Lustre客户端的Arm支持已经有很多年了,但Gorda说,“基于Arm的存储服务器非常少”,因此,用于Arm的Lustre服务器组件目前不受DDN内负责Lustre开发的部门Whamcloud的支持。他补充说,这是Arm正在努力解决的问题。
屏幕截图 2022-02-05 231111.png
Gorda还指出,大约五年前,Arm收购了HPC软件工具的领先供应商Allinea Software,以增强Arm对HPC软件生态系统的支持。

Gorda表示,另一个有利于Arm的因素是更高的能效。随着超级计算机扩展到exascale领域,持续的能源成本成为HPC运营商更关心的问题,这一点可能会变得更加重要。Gorda称,尽管Arm的Neoverse V架构强调性能而非能效,但基于它的芯片仍比竞争对手的X86处理器消耗更少的能源。

他说:“X86的保证是,你可以在它上面运行286二进制,而作为一个具有RISC底层的CISC体系结构,所有这些历史遗留下来的东西都需要在解码、重新排序、修复指令时预先使用大量逻辑,所有这些都是进入芯片并消耗能量的开销。”。相比之下,在某种程度上,你可以把Arm想象成一张干净的纸。

Gorda还声称,终端用户不再关心他们的软件运行在什么芯片上,理由是AWS等公司采用了Arm驱动的云服务器。

他说:“有新的大玩家来控制架构。他们关心的事情与以往不同。他们关心的是成本,他们关心的是能耗,他们关心的是周转时间,以及最重要的软件堆栈。”。

“如果你看看Amazon用Graviton2做了什么,他们会说它便宜40%。从终端用户的角度来看,他们不关心芯片是什么,他们关心的是它便宜40%,而且周转时间和他们习惯的一样。”

HPC分析公司Hyperion Research的首席执行官Earl Joseph表示,他预计未来几年基于Arm处理器的HPC服务器将高速增长。

Joseph说:“我们预计五年的增长率将超过31%,而基础市场的增长率将在7%到8%左右。”。他补充说,这相当于到2025年,基于Arm的系统将占HPC市场的10%左右。

然而,Joseph也警告说,收入数字可能会产生误导,因为大型超级计算机项目可能会扭曲数据,就像2020年接近10亿美元的Fugaku系统那样。

因此,由于如此大规模的独立安装,市场可能会发生巨大变化。Hyperion Research表示,预计2025年将有两台基于Arm处理器的欧洲exascale机器。

他补充说,许多即将推出的HPC系统预计将混合使用Arm和X86处理器以及其他处理器类型。

推荐阅读
关注数
5856
内容数
525
定期发布Arm相关软件信息,微信公众号 ArmSWDevs,欢迎关注~
目录
极术微信服务号
关注极术微信号
实时接收点赞提醒和评论通知
安谋科技学堂公众号
关注安谋科技学堂
实时获取安谋科技及 Arm 教学资源
安谋科技招聘公众号
关注安谋科技招聘
实时获取安谋科技中国职位信息