John Linford 2021年11月22日
SC,年度ACM/IEEE超级计算会议,是HPC社区每个日历上的一个里程碑,吸引了HPC领域各个角落的杰出人士和新手。目光敏锐的学者交流知识,竞争对手插入他们的产品,高管们在一两杯饮料上交换故事。但SC21在两个重要方面与之前的SC完全不同。
首先,Arm前所未有地突出。在过去几年中,基于Arm的HPC已经从低功耗集群中的可爱实验发展到连续四次在500强中占据1席。Arm IP也出现在中国的一个隐形exascale系统中,作为一个强大的国产矩阵加速器的主机。随着Arm从Raspberry Pi迅速升级到RIKEN的Fugaku,Arm HPC社区走到了一起,形成了Arm HPC用户群,简称AHUG。AHUG是一个以用户为主导的非营利组织,旨在为HPC社区推广最新的基于Arm的硅、系统和平台。
其次,SC21还标记了该事件的第一个混合的个人/虚拟实例化。这种新的格式使录制和共享变得更加容易,并降低了无法前往美国的参与者的障碍。Arm和许多Arm关键合作伙伴选择了纯虚拟参与,这意味着会议的许多最佳时刻现在都可以免费观看(见下面的链接)。AHUG为HPC社区组织了三次公开活动,以聚集在一起,交流想法并分享与使用Arm设备和工具进行HPC相关的知识:一次研讨会、一次hackathon和一次birds-of-a-feather。
物以类聚
SC21 BoF“Arm HPC用户组:极端规模Arm系统的经验和预测”介绍了从目前正在生产的基于Arm的HPC系统中获得的经验和教训。这次活动的亮点之一是洛斯阿拉莫斯国家实验室(LANL)。LANL透露了他们基于Arm CPU和NVIDIA尚未公布的下一代GPU的2023系统的名称。它的名字叫维纳多,是兰尔所在的新墨西哥州陶斯山脉的一座山峰。BoF还围绕Arm针对HPC的编译器生态系统的状态以及最终用户对SVE(Arm的可伸缩向量扩展)的需求展开了一些生动的讨论。SVE是Fugaku中的一个关键设计特性,在许多基于Arm的cpu中都有望实现。
AHUG黑客马拉松
这次高能量活动召集了学术界和工业界的个人和团队,以快速识别和解决四种不同基于Arm的HPC系统的性能问题。AHUG的成员和合作伙伴,如NVIDIA、Oracle、AWS和Fujitsu,加入进来指导我们的黑客,帮助快速解决或分类供应商特定的问题。
因为AHUG SC21 Hackathon是虚拟的,所以我们追逐太阳,在三个不同的地方进行了三次比赛:亚洲、欧洲和美洲。黑客竞速赛进行了大约两天,将近60人报名参加。我们的黑客可以选择四个(实际上是五个)不同的系统:
- Isambard是英国最大的基于Arm的HPC系统,拥有富士通A64FX和惊奇漫画ThunderX2 CPU。它是由GW4联盟运营的一个生产系统,并在布里斯托大学托管。
- Ookami是富士通A64FX CPU的技术试验台,位于石溪大学。这是一个开放的研究系统,全世界的研究人员都可以自由使用。
- AWS提供了两个并行集群实例,一个在欧洲,一个在美国。集群动态扩展,在高速EFA互连上提供多达16个AWS Graviton2的全尺寸c6gn实例。
- Oracle云基础设施提供了Ampere A1计算裸机实例,每个实例都有160安培的Altra CPU内核和1TB内存。这些“便士核心”实例提供了hackathon最大的内存容量。
我们在黑客攻击中休息,听取专家的简短介绍,并“导游”参观著名的HPC应用程序,如SPECFEM3D、OpenFOAM、GROMACS和NWChem。所有这些演示均可在YouTube上获得,您可以下载实践材料,并在活动网站上找到应用程序构建/运行/配置文件说明:https://arm-hpc-user-group.gi... 我们的黑客在所有四个系统上运行机器学习、地震建模和地球系统建模应用程序,并比较了不同体系结构的性能。来自美国地质调查局的Pytork、AlphaZero.jl和COAWST在整个活动中表现良好。“甲骨文吞下了大象!”一名黑客在通过PBRT成功渲染迪斯尼的莫阿纳岛场景后说,PBRT是一个考验核心性能和内存容量的基准。最后,许多黑客一直呆到最后一分钟,还有一些甚至在第二天出现在Slack feed中,希望继续前进!幸运的是,所有系统的帐户都可用,许多黑客计划利用自己的时间继续攻击。我们甚至听说美国地质调查局的一份报告将包括这次事件的一些结果。
AHUG研讨会
AHUG的主要活动是AHUG全球成员的研讨会。科学家、研究人员、工程师和Arm合作伙伴介绍了基于Arm的高性能计算机在科学和发现方面的最新发展。例如,无线电开发副总裁和Altair Solver HPC Eric Lequiniou演示了Altair无线电领先的碰撞模拟软件现在如何在Arm上得到支持。借助Ampere Altra 80核Neoverse N1 CPU,收音机在Arm上具有优异的性能。KAUST的Hatem Ltaief展示了利用低秩矩阵近似如何提高Fujitsu A64FX上地震代码的性能。几位演讲者强调了科学家和工程师使用基于Arm的HPC系统是多么容易:“这太正常了!”爱丁堡并行计算中心的一位用户说。在科学计算中几乎没有比这更高的补充了。你可以在YouTube上观看整个研讨会。
收尾
与传统的SC形式相比,混合式的现场直播/虚拟SC有一些优势,我希望SC组织者保留一些用于录制和广播会议的新基础设施。我相信阿胡克会的。AHUG全年都在举办活动,所以请关注a-hug.org。但我也期待着回到面对面的会议。虚拟会议根本无法取代高带宽的当面交流。下一次主要HPC会议是在德国汉堡举行的ISC 2022,SC22将在德克萨斯州达拉斯举行。再见!