近两年来,随着新冠疫情等不确定因素的激增,HPC(高性能计算)作为一种算力领域的“确定因素”,反而获得市场增长的机会。
2020年,全球疫苗的研发和生产推动了对HPC的新需求;2021年,全球灾难气候事件频发,让HPC在相关气候预测项目中获得增长;同时,随着HPC在云端需求的激增,HPC也在人工智能、数据分析以及元宇宙等创新领域得到新的市场突破。
当然还有,生命科学、汽车、金融、制造业、航空航天等HPC的重点领域,对快速处理数据和高精度日益增长的需求,仍是未来几年推动HPC应用增长的主要因素。
从早期科研院所拥有的“计算金字塔尖上的明珠”,到如今推动了工业4.0、智能语音、人脸识别、智慧医疗、可穿戴设备等多个领域的快速发展。HPC产业不断拓宽赛道,同时也将众多技术融合,并形成了HPC+AI+大数据+云的多样性算力融合创新。
全球HPC市场,稳中有升
从全球看,HPC市场发展的状况仍然处于稳中有升的态势。
Hyperion Research的最新调查显示:2021年全球HPC的整体支出(包括本地、云和人工智能)达到了348亿美元,并有望在2022年达到400亿美元,预计到2026年可以达到500亿美元的规模。
这表示,HPC 市场增长的前景非常强劲,尽管没有爆发性的增长,但胜在稳健。
市场增长的亮点来自于云端HPC的旺盛需求,但这并不代表本地化的HPC市场在衰退,只是云端HPC的增长速度更快。Hyperion预计,到 2026 年,HPC云市场的规模将超过 110 亿美元。这意味着从 2021 年到 2026 年的五年中,复合年增长率超过 17.5%。
Hyperion还认为,HPC的未来市场增长将步入常态化的阶段,超级计算机销量的飙升、云端 HPC 的兴起、无处不在的人工智能计算这些正面因素,与HPC的人才稀缺、新冠疫情的反复带来的供应链压力等负面因素相互交织,让HPC市场发展处在螺旋形上升通道中。
从市场格局看,由于HPC考量的是在计算领域综合技术的实力,因此主要供应商均是市场中成熟的老牌企业,戴尔凭借稳定的市场表现,在HPC市场中取得了明显领先优势。
值得注意的是,包括戴尔在内的前两家供应商的市场份额,超过了HPC整体市场的55%,这意味着前两名供应商凭借综合实力的优势,已经形成了市场的寡头效应,地位短时间内难以被撼动。
从垂直赛道来看,政府科研、教育科研、国防、CAE和生物科学占比排名前五,依然是HPC最主要的需求领域。
而在创新领域方面AI、ML和DL驱动着HPC的增量市场:超过2/3的用户在同样的HPC系统上运行仿真应用和分析应用;超过一半的用户在外部云上运行HPDA/AI负载。与此同时,相比线下传统通用服务器,专用的AI服务器以4倍的增长速度在持续增长。
技术发展趋势,决定未来格局
在数字经济当中,产业集群的数字化是重中之重。帮助产业集群提升生产力,构建强大的算力集群中心被认为是一个有效途径。因此代表多样计算能力的HPC技术发展不可或缺。同时,HPC作为构建下一代基于数据产业和科学计算的基石,更是开启未来数据文明的钥匙。
当然,在HPC的技术发展路径中,也出现了很多新的趋势和难题。
首先,是算力异构化成为超算技术发展的趋势,处理器开始多样性发展,多元应用也在驱动算力的多样化。面向多样性计算时代,系统从单一算力到多样性算力,从单机部署到集群部署,从传统应用到融合智能应用,给企业开发者带来了更加复杂的挑战。
其次,数据密集型超算需求激增。最新发布的报告显示:HPC整体市场预计从2019到2024 年,都将以6.8%的复合年增长率(CAGR)增长,其中高性能数据分析HPDA的市场份额(包括支持HPC的人工智能)预计将以5年平均17%的CAGR迅猛增长。
HPDA/AI基础设施的应用与日俱增,来源于几个方面:E级超级计算机对国家工业和经济产生的重要影响;传统HPC应用的更高精度建模和仿真正在产生越来越多待分析和存储的数据;机器学习和深度学习中,新硬件、算法、应用和场景,激发出更多HPC的需求;HPC和企业计算的不断融合;数据密集型HPC负载推动的新的存储需求。
第三,随着HPC系统性能基数的持续增长,高性能和高能耗已经成为高性能计算机系统的显著特征和一对矛盾体,高能耗是未来超算产业面临的一大核心技术挑战。在低碳时代,未来的超算中心要求能耗可监测、可管理,而且可预测、可定制。未来的HPC产品和系统设计,也必然与低碳技术相结合。
第四,进一步驱动数据中心网络创新。连接数据中心内部通用计算、存储和高性能计算资源,服务器间的所有数据交互都要经由网络转发。随着IT架构、计算和存储技术都在发生重大变革,驱动数据中心网络从原来的多张网络独立部署向全以太化演进。而传统的以太网无法满足存储和高性能计算的业务需求,能够匹配新一代HPC高性能的网络转型在所难免。
随着这些技术趋势的发展,HPC正在发生具有转折性意义的演进,这既是算力异构化和数据密集型应用需求的驱动,也是大数据、AI等新应用发展的使然。
处理器决定产品的极致性能
HPC的本质,还是追求计算能力的极致,而处理器则是算力提供最核心的单元。
AMD从2017年推出“Zen”核心之后,就一直在挑战算力性能的巅峰。2021年,AMD在做米兰-X处理器的架构设计时发现大容量的缓存对于提高性能至关重要。更多的L3缓存可确保关键数据更靠近核心,可以降低系统的延迟。因此AMD看到了一个巨大的机会,可将AMD创新的3D V-Cache运用于这些应用,做到进一步提高性能水平。
简单的说,与标准的米兰处理器相比,米兰-X处理器拥有3倍的L3高速缓存,正因为额外的L3高速缓存,可缓解内存带宽的压力并减少延迟,所以反过来加速了应用性能。
因此,从场景的角度,更广泛的应用可以从米兰-X的大缓存中受益。例如在数据挖掘、风险分析和异常检测等应用中,通过米兰-X处理器,更多的数据可以被保存在处理器附近,从而实现更快的处理结果。而对于人工智能而言,将更多的模型权重和激活装入更大的L3缓存有助于实现实时推理。
同样为了在HPC服务器设计上追求更高的极致性能,并满足更多数据处理和人工智能场景的需要,戴尔PowerEdge服务器家族,全面采用第三代AMD EPYC处理器,为客户提供更强劲的算力。
例如戴尔PowerEdge C6525,作为一款计算密集型服务器,旨在提升数据中心性能,以应对各种高性能计算(HPC)工作和应用,比如在数字制造、研究和网络技术上会有出色的表现;戴尔PowerEdge R6525,作为一款双插槽1U服务器,该高性能创新型处理器可处理高性能计算、虚拟桌面基础架构和虚拟化等工作;再有戴尔PowerEdge XE8545,适用于开发、训练和部署先进的机器学习模型,对应企业快速创新,可以应对复杂环境的挑战。
可以预见,搭载AMD EPYC处理器的戴尔PowerEdge服务器家族,不仅能够在市场端更好的匹配客户的需求,也能够帮助戴尔进一步巩固市场的领先地位。
在中国,位列2020年全国HPC TOP 100前三甲的北京超级云计算中心,采用了搭载AMD处理器的戴尔PowerEdge系列服务器,通过其高度可扩展性,强大的性能和灵活的配置,帮助北京超级云计算中心提高了数据中心性能,轻松应对各种高性能计算的负载和工作需求。在“在中国,为中国”的战略指引下,戴尔PowerEdge服务器家族还将继续服务于中国的HPC客户去追求算力的巅峰。
客观地说,HPC产业的发展,代表了对算力极限的追求结果,随着HPC产品逐渐走向标准化和通用化,越来越多的场景,可以通过HPC的高算力得以赋能,越来越多的企业可以利用HPC的高性能和稳定性,更好的通向数字化转型。