近日,中国移动发布集中网络云资源池三期工程计算型服务器采购招标公告,ARM平台的需求数量为14710台,采购规模与采购金额均超过总量的三分之一。
据悉,这也是中国移动在网络云集采中首次明确ARM平台的采购数量与比例。对于想进入服务器领域ARM架构来说,这是一个重大利好。
自上而下的突破
据IDC数据统计,2020年ARM架构的服务器销售额大幅增长430.5%。即便基数很小,这也是一个惊人的成绩。
稍微了解ARM历史的人都知道,从2008年开始,ARM就立志上攻服务器市场。但诸多条件的不顺,使得AMD、博通、Cavium、高通、英伟达、三星等一众芯片盟友都无功而返。
局面的打破最终来自于系统厂商。出于成本和可控性的考量,云计算巨头亚马逊在2018年推出了首款基于Arm架构的自研处理器芯片Graviton。这颗芯片也是亚马逊收购了ARM芯片设计商Annapurna Labs的结果,其运行应用的成本要比英特尔或AMD的芯片低45%。
这颗芯片的意义在于亚马逊网络本身就是一个生态系统,Arm服务器芯片终于有机会在大规模的数据中心中一展身手,而软件合作伙伴也可以加入并证明其堆栈和应用程序可以与ARM架构所兼容。
一年之后,第二代服务器芯片Graviton 2如约而至。Graviton2基于 64位Arm Neoverse N1微架构设计,该架构也是ARM第一款专门为数据中心定位的CPU架构。与第一代 AWS Graviton 处理器相比,AWS Graviton2性能达到前者 7 倍,与同配置x86实例相比,Amazon EC2 M6g、C6g 和 R6g 实例的性价比提高了40%。在2021年,亚马逊也把这款芯片配置到国内的服务器当中。
所谓英雄所见略同。华为也展开了同样的研发,并在2019年正式对外发布了Arm服务器芯片鲲鹏920。从性能参数看,鲲鹏920基于ARMv8架构,采用7nm工艺,可以支持64个内核,主频可达2.6GHz,集成8通道DDR4。典型主频下,SPECint Benchmark评分超过930,超出业界标杆25%,能效则优于业界标杆30%。
根据披露的资料,华为其实很早就展开了服务器芯片的研发。鲲鹏的内部代号是Hi16xx,首颗于 2015 年首次推出,面向高线程或高吞吐量应用。2016 年海思又推出了第二代处理器芯片Hi1612,2017年第三款服务器芯片鲲鹏916(Hi1616)。
随着鲲鹏920的发布,华为还推出了基于该处理器的三款TaiShan(泰山)服务器。
系统厂商的直接切入,源于对市场最直观的感受。在云计算的时代,越来越多的边缘数据中心加入,带来了与以往不同的延时、散热、功耗等需求。
电子科技大学电子科学与工程学院副教授黄乐天指出:“ARM服务器越来越受重视主要因为是差异化竞争的需求,相比于X86而言,ARM的硬件设计生态更为开放和丰富,可以提供更多样化的选择来满足一些定制化的需求。”
有了明确需求的指引,芯片厂商也开始再次发起冲击。在美国,英特尔前高管Renée J. James于2017年创立了Ampere公司,主要专注于数据中心中增长最快的超大规模计算云和边缘云市场。在2020年3月,Ampere发布了新一代基于Arm架构的Altra处理器,其拥有80个64位ARM核,采用了Monolithic die(即单芯片设计)工艺,所有的核都在Mesh网络下连接在一起,具备了非常高的内存带宽和内存密度,能提供很高的可预测性。
另一位芯片老将Marvell则收购了Cavium公司,在已获成功的ThunderX和ThunderX2基础上,推出了ThunderX3,目标直指云计算。
在国内,获得了Arm V8指令集架构永久授权的天津飞腾也推出了其新一代多路服务器芯片腾云S2500。其也为64核架构,2.0到2.2GHz频率,16nm工艺,集成64个FTC663内核,在大容量L3缓存、多端口高速低延迟互联通路、内存镜像存储可靠性增强及面向应用的安全增强技术四方面做了提升。该产品也补齐了飞腾补齐高端芯片最后一块拼图。
做为整个体系的构建者,ARM也在加快前进的步伐。在今年,ARM对服务器芯片平台Neoverse进行了革新,引入了V1和N2系列,其处理能力比上一代N1提高了40%~50%。Neoverse V1平台首次支持可伸缩矢量扩展(SVE),N2平台则率先采用全新Armv9架构的平台,拥有比N1更高的核心数、性能和能效。
国外的行业观察家就此表示,这代表了市场的一个转折点:ARM处理器的性能表现已经接近了Intel和AMD处理器,且ARM有信心保持每年25~30%的性能提升,大幅超越Intel和AMD的迭代幅度。
生态渐全 信创成推手
ARM军团以前在服务器所以失败,很大的原因就在于生态的匮乏。
意识到这个问题的ARM,一直在补这个短板。经过几年的努力,形势已经发生了改变。当前,所有大型的操作系统,如Linux、BSD、windows都可以得到ARM架构的支持。容器化,包括虚拟化工具如docker、VMware、KVM和Kubernetes都可以在ARM架构运行。编程语言,包如CUDA和Java也都可以得到ARM的支持。
图 ARM服务器生态
还有一个重要原因。据一位业内人士介绍,目前超大规模数据中心的工作负载、应用都具有源代码,而且还允许改变源代码、改变程序来加速,这对ARM服务器处理器的引入带来极大的方便,可更轻松应对兼容的问题。
除了技术生态的改进,市场环境也越发对ARM架构友好,特别是国内信创产业的发展更是起到了巨大的拉动作用。
整个信创CPU的潜在市场主要包括党政、特殊部门和金融、电信、能源、电力、医疗、教育、交通、公共事业8大行业。华泰证券预计,信创服务器CPU 潜在空间约为 240 亿元。
从2020年开始,多个行业客户已陆续开启国产ARM 服务器采购。2020 年5 月21 日,鲲鹏服务器中标中国农业银行2020 年重点服务器项目,根据框架协议,供应商北明软件将为农行提供2000 台基于鲲鹏处理器的TaiShan 服务器,落地了金融行业首个“基于ARM 架构多路服务器+全开源中间层软件+自研应用”的业务系统。
2020 年7 月,广发银行亦发布年度总行华为软硬件采购,其中包括鲲鹏服务器。2020 年12 月,中国长城双路服务器参与工行开放平台关键产品供应链安全项目测试,同年12月23日,中国长城首批EF860双路服务器设备交付贵州电网电信云机房,这些服务器均搭载了飞腾腾云S2500。
进入2021年,新华三集团成功中标中国光大银行集采项目,为光大银行首个创新ARM系统架构的新一代IT基础建设,提供高性能、安全可靠的服务器产品和强有力的技术支持。
随着银行、电网、运营商等行业客户率先开启行业信创采购,ARM生态在行业领域应用逐渐展开。
华为公司轮值董事长徐直军近日就表示,“鲲鹏生态的进展超出了我们的预期。”据他介绍,目前已经有12家整机伙伴推出鲲鹏系列服务器和PC产品。2020年,伙伴服务器出货量达到鲲鹏服务器出货的50%以上,今年预计达到80%以上。同时还有8家伙伴发布了openEuler操作系统商业版本,6家伙伴发布openGauss数据库商业版本,2000多家合作伙伴的4500多个解决方案通过了鲲鹏兼容性测试认证,目前在关系国计民生的行业获得了规模应用。
而飞腾也同样壮大了自己的朋友圈,根据其交出的2020成绩单:中国长城、浪潮、同方、曙光、中兴通讯等15家国内厂商发布了基于腾云S2500的多路服务器产品群,携手生态伙伴发布了 90 余个行业联合解决方案,覆盖电信、金融、能源、交通、医疗、数字城市、工业制造等行业领域。
对于ARM服务器CPU在国内的发展态势,行业人士指出,ARM处理器的低功耗、高稳定性、小体积、长续航以及和CPU芯片的高整合度带来的低开发成本,在数字化转型过程中正在引领底层架构的新一轮重构。随着移动网络和互联网融合互通日趋明显,依托ARM架构发展后台数据中心已成为大势所趋。
不过,ARM架构进入服务器时日尚浅,仍要面临很多挑战,其中一个就是价格昂贵。有业内人人士告诉记者,单颗64核心的ARM服务器CPU价格在10000~20000之间,与之配套的操作系统收费也不便宜,算上内存、存储、显卡、网卡等外设,售价一般企业无法接受。
此外,“服务器/云计算毕竟是要服务于应用软件的,而这些方向的应用软件栈太“深”了,是依靠很多基础软件一层层堆上去的,少了这些基础软件的支持自然是很大的缺憾,而这个在短时间内是无法解决的。”黄乐天指出了另一个挑战。
好在这些挑战只需时日都是可以化解的,因为发展ARM架构已成业内共识。
近日在京举办的“多样性算力产业峰会”发布了《多样性算力技术愿景白皮书》。该白皮书就指出,多样性算力产业体系建设应从运营商网络云、IT云、公有云三大数据中心场景切入,初期以ARM为主,推动多样化服务器整机和部件成熟。
ARM架构服务器,已经接近爆发的临界点。
(校对/Andrew)