本文作者:吴铭心 中国仿真学会副秘书长
近年来, 人工智能、数字孪生、量子技术、物联网、网络运算、数字设计与仿真、增强现实/虚拟现实/混合现实(AR/VR/MR)等前沿技术正不断发展,广泛应用于影视娱乐、教育、设计、医疗、航空航天、工业等多个领域,为数字经济及企业数字化转型提供了重要支撑.。以仿真为灵魂,算力为引擎的元宇宙技术正在推动互联网进入下一个元年,元宇宙的迅猛发展对仿真计算存在强的路径依赖,所以在仿真计算领域,对算力的追求没有止境。
AMD 和 Intel 在X86服务器市场相爱相杀多年,有着苏妈加持的EPYC是否真能实现弯道超车?此次我们有幸拿到一台搭载有双路 AMD 第三代 EPYC(霄龙)7763处理器的服务器, 让我们看看这款处理器在仿真计算领域有怎样的表现。
服务器配置:
首先介绍一下本次测试使用的服务器配置。
AMD 方面我们拿到的是AMD EPYC第三代7763处理器,它拥有64个物理核心,256MB三级缓存,主频 2.45GHz, 最大超频频率 3.5GHz,两路服务器上可以实现 256个线程!
Intel 方面我们使用的是 Xeon Platinum 8358,作为Ice lake中的铂金系列, 它拥有32个物理核心,主频 2.6GHz,睿频3.3GHz。
为了公平起见,我们在两台服务器上分别创建了一个 16 核的虚拟机,在虚拟机中进行测试,同时为了测试AMD处理器的高核心并发性能,我们单独在AMD服务器上创建了一个 58个核的虚机进行测试。测试虚机的处理器和内存配比统一为 1:8 。
测试一:三维重建测试
测试环境:
本次测试以colmap+OpenMVS组成三维重建流水线,使用colmap进行图像的位姿解算,然后发送到OpenMVS中进行模型重建。
COLMAP 是一个通用的structurefrom-Motion,SfM和Multi-View Stereo,MVS流水线,具有图形和命令行界面。它为有序和无序图像集合的重建提供了广泛的特性。
OpenMVS是一个比较经典的MVS(Multi-View Stereo)开源库,集成三维重建整个完整的技术方案(相机模型,多视立体几何,稠密重建,曲面重建,点云融合,纹理贴图)。我们在每个重建环节使用的都是非常经典有效的算法,例如包含目前三维重建非常经典的深度图重建算法SGM以及PatchMatch。
测试结果如下:
上图中对比的是运行时间,时间越短越好,可以看到在相同核心数量的情况下,AMD处理器相对Intel在三维重建方面具有一定的优势,而当我们在58核的虚机里测试时,性能提升也基本上是线性的,达到了我们的预期。
测试二:Colmap(纯CPU计算)
在上一个测试的基础上,依次测试colmap的特征提取、特征匹配以及稀疏重建(纯cpu计算),测试结果如下:
在高性能计算情景下,频率更高的AMD EPYC 7763相比于Intel Xeon Platinum 8358表现更好。
在特征提取阶段,相同核心的AMD处理器耗时仅为Intel处理器的73%;特征匹配阶段为93%;稀疏重建阶段为91%。
将AMD处理器核心数从16核增加到58核后,特征提取阶段耗时减少68%,特征匹配阶段减少49%。
测试三:神经辐射场重建
本次测试是缘由一篇论文“NeRF: Representing Scenes as Neural Radiance Fields for View Synthesis” 的pytorch版本工程流水线。需要的具体库及版本如下:
Nerf神经辐射场技术的具体流程是:通过使用稀疏的输入视图集来优化底层的连续体密度函数,从而实现合成复杂场景的新视图的效果。
具体流水线如下图所示:
实验中使用的网络结构均为全连接网络。
其中使用的数据是官方提供的low-res-fern数据,所有实验均迭代20万次。
测试结果:
参考以上的官方数据,AMD以及Intel服务器,相同任务运行时长都有所降低。
AMD服务器相比于官方数据,减少了1小时22分钟41秒,约减少17.2%的运行时间;Intel服务器减少了51分钟55秒,约减少10.8%的运行时间。
从结果看, AMD服务器能够在更短时间内完成迭代,运行效率更高。
总结:
从上面的三个测试结果可以看出, 目前主流服务器处理器的单核性能相差不是很大, 而AMD EPYC第三代处理器通过先进的封装技术和制程工艺可以集成更多的物理核心, 相对 Intel 就占据了一定优势. 希望两家未来可以持续竟争下去, 为消费者提供更优惠的价格以及更强的算力.
仿真计算领域对算力的要求多种多样, 本次测试只能尝试做到管中窥豹, 还无法全面的衡量处理器的水平, 我们希望通过此次测试更全面的了解服务器硬件的发展对仿真行业起到的推动作用, 并在服务器选型时提供一些参考。