xucvai · 2020年03月11日

云端Arm处理器卧薪尝胆,Ampere笑对x86

内容由公众号半导体行业观察(ID:icbank)原创
授权转自半导体行业观察
作者:张健keya

当下,市场对云计算的需求量越来越大,基于传统数据中心的企业级计算已经难以满足应用需求。从软件角度来看,现在的需求更多的是朝向云原生的,如微服务这类计算模型,而不是以前那种企业级内部的计算模型。

此外,现在有越来越多的边缘侧数据中心,在延时、功耗等方面的要求与以前有很大不同。这样,超大规模的云,包括边缘云计算需求的增长,对CPU的部署密度和能耗要求越来越高。

总体来看,新兴的云计算具有三大特点:一是要具备可预测的高性能;二是整个平台的可扩展性,包括内核、I/O和内存等;三是需要非常高的密度和非常好的能效。

这样,市场需要一种新型的、专门针对云的计算能力,这就需要很多高效的CPU内核,需要具有高能效的基础设施,以及非常好的可扩展性。而且新一代面向云的计算架构需要更加开放,因为只有更加开放,才能有更好的创新。

1.jpg

在这样的背景下,多家厂商正在打造完全面向新一代云计算的CPU,以满足上面提到的需求。在这些厂商当中,有传统的x86阵营,也有新兴的Arm阵营。

而在数据中心和云服务CPU方面,Arm产品一直都颇具争议,以前,在数据中心应用中,Arm做过一些尝试,在之前的那些尝试当中,相应的IP、内核等与x86相比,确实存在着一定的差距。也正是应为如此,在过去几年,Arm一直致力于推进可用于数据中心的高性能、高能效的内核的研究,以推动Arm性能的不断改善。随着经验的积累,这些IP能够提供的服务器CPU性能出现了快速提升。还有一点也很重要,那就是随着台积电7nm制程技术的成熟,Arm阵营可以使用体积更小、能效更高、速度更快的晶体管了。

Arm在终端设备领域已经取得了巨大的成就,在此基础上,它在服务器这块的生态系统建设也在不断成熟,所有大型的操作系统,如Linux、BSD、windows都能够支持Arm。另外,虚拟化工具如docker、vmware、KVM和kubernetes都可以在Arm上运行了,还有编程语言、工具,如CUDA和Java都可以支持Arm了。

基于Arm开发新的CPU

Ampere是一家刚成立两年多的公司,一直致力于打造面向云计算和边缘的新一代Arm处理器。该公司研发的目标是开发面向云计算的新一代云原生CPU,这里的“云”是指从超大规模的云到分布式边缘云。

Ampere的团队经验非常丰富,在服务器领域平均具有20多年的积累,特别是专注于服务器里面的云,在服务器市场当中,如前文所述,针对云的服务器是比较特殊的。Ampere团队设计过很多代的服务器处理器,出货量在市场上都是非常大的。这个团队对整个行业的合作伙伴生态环境非常了解,包括IP供应商、软件供应商等。Ampere公司产品高级副总裁Jeff Wittich表示:“我们在设计理念方面也非常有优势,这使我们的迭代非常快,而且向市场推出产品的节奏也非常一致。在设计方面,我们非常注重仿真,还有虚拟平台。这使我们对流片非常有信心。”

在Ampere产品与Intel差异化竞争方面,Jeff Wittich表示:“有一个最大的差异点,我们的产品在设计时,是纯粹针对云的计算模型设计的,因此,与其它CPU相比,我们能提供针对云的性能和特点的专属设计。另外,我们设计的CPU能够和行业里的GPU、FPGA供应商合作,这样就能非常灵活地为客户提供他们所需要的解决方案组合。”

由于是基于Arm架构,Ampere使用了相对于x86而言简单的指令级,功耗更小,而且整体效率更高。精简指令集(RISC)已经能够提供非常好的性能了,而且功耗非常低,目前来看,已经能够提供运行云计算的所有性能要求了。

80核的Ampere Altra

Ampere Altra则是一款基于Arm v8.2+架构的云原生处理器,据Jeff Wittich介绍,该CPU是世界上第一款,从一开始的设计、制造就是完全面向云,为满足新的云对云计算需求的处理器。Ampere Altra单路具备80核,都是64位Arm的CPU内核,每核最高频率是3.0GHz,所有内核都能在turbo模式下持续运行,这在所有核满负荷的云计算工作流中都能实现。该CPU利用Monolithic die(单芯片设计)工艺,所有核在Mesh网络下相互连接,还能提供非常高的内存带宽和内存密度。

3.jpg

据Jeff Wittich介绍,与传统服务器CPU架构相比,Ampere的80个内核架构具有以下创新点:一是单线程,单线程的目的是为每一个用户提供稳定、可预测的性能,此外,在云计算领域,单线程还能够提供非常好的安全隔离;二是架构进行了优化,以提供最多数量的内核,我们这个核数比市场上同类处理器的核数都多,而且是基于Mesh网格化部署的,密度非常高,能够提供非常好的一致性和非常高的效率;三是内核能效非常高,内核优化的结果是只让内核提供云计算所需要的性能,传统那些非云计算所需要的功能特性就不再提供了,这样就减少了耗电量,提高了每个核的功耗效率。

这里具体谈一下单核单线程的设计,通过消除单物理核多线程设计中多用户共享资源引起的 “相邻干扰” 问题,可提供100%的可预测性能。这是一种非常好的用户隔离机制,因为执行引擎、寄存器、一级、二级缓存都是内核独享的,不用与其它核分享,这样可以减少来自于相邻核的干扰和“攻击”,降低了侧信道攻击风险,现在,侧信道干扰已经成为一个非常重要的行业痛点。总之,单核单线程的设计,能够保证在运算或执行的时候具备一致性的、可预测的性能。

4.jpg

该处理器还能提供很高的可扩展性,这是基于领先的每核功耗性能,其每瓦性能是业内最高的,从边缘到超大规模云,在不同部署环境下提供多种可选的处理器配置,它还能提供多路支持,非常灵活的I/O连接以及高带宽。

Altra可提供很大的一级、二级缓存,能减少延时,除了每个核专属的L1和L2缓存之外,在整个系统级别还有一个32MB的大缓存。

Altra处理器提供八个DDR4通道,每个通道能插两个DIMM,运行的时候能够提供单路200GB/秒的速度。他还提供单路4TB的内存或者双路8TB的内存容量。此外,还有非常好的I/O子系统,还提供四个支持CCIX协议、x16的PCIe接口,用于缓存一致性连接,单路128个PCIe Gen4通道,两路192个PCIe Gen4通道,这是目前行业最高的。用户可以将四个支持CCIX协议的设备连接到该CPU上。

除此之外,该CPU还提供两个128BT的SIMD单元用于浮点计算。现在,云计算中的AI推理能力越来越重要,Altra提供int8和FP16的支持,可以提高AI推理加速性能。

对比x86

传统上,Arm处理器与x86处理器相比,最大的劣势就是性能,但是,随着Arm的研发推进,目前其处理器性能有了大幅度的提升,再加上其固有的低功耗特性,竞争力提升不少。

Jeff Wittich就Altra处理器与AMD的64核EPYC,以及28核的Intel 至强(Xeon)处理器做了对比,对于一些基于云特别多的应用,如搜索、AI推理、解码、数据库等,Altra能提供非常好的性能。Jeff Wittich表示,Altra不仅仅性能更高,功耗也更低。每瓦特性能比EPYC和至强都要高。这样不仅可使整个数据中心的容量不断增大,还能横向扩展到边缘侧。对于一些以能耗为中心(power-centered)的应用,如存储网页游戏、云游戏、存储边缘云等,这是一个非常好的解决方案。

5.png

此外,由于单核功耗很低,所以每个机架能部署的核数密度比任何其他解决方案都要高,每个机架能够部署3500多个Altra内核。每一个机架的单核密度,比AMD的EPYC高38%,比Intel至强高173%。Jeff Wittich称其单机架性能是目前市场上最好的,而且单机架内核密度也是最大的。由于性能更好,功耗更低,所以Altra处理器的总体应用成本(TCO)也更低。

Jeff Wittich称Altra的TCO比EPYC高41%,同样的总体应用成本情况下,所带来的性能,比EPYC高41%。和Intel至强相比,包括其2月24号公布的最新版本相比较,Altra的单位总体应用成本比它高63%。

产品路线图

关于产品发展路线,Jeff Wittich表示:“由于我们积累了大量经验,比较有信心,所以我们会保持每年推一款新产品的节奏,并能够使处理器的性能不断提升。今年推出的是Ampere Altra,我们计划2021年推出Mystique这个新产品,Mystique核数更多,性能将更好,并且与Altra平台兼容。我们也制定了2022年的计划,推出名为Siryn的新产品,Siryn要比之前的两款产品核数更多,性能更好,功耗更低,而且还会有更多基于云的设计特色。

6.jpg

客户与生态

Altra处理器现在已经有样机出货了,主要有两款,一个是双路的Mt. Jade,另一个是单路的Mt. Snow,有很多客户在试用,目前能够公开的是微软和甲骨文(Oracle),据悉,这两个客户的反馈非常好,Ampere上周收到了他们的书面声明,表达了对Altra处理器的支持。此外,中国的一些厂商也在试用该产品。

7.jpg

在客户拓展和生态系统建设方面。过去一年,Ampere一直在与最主要的云服务商合作,如微软、甲骨文等。Jeff Wittich表示:“我们预计今年下半年会有部署,我们规模量产是在2020年中。Ampere之所以赢得了客户认可,是因为我们深入这个行业很长时间,并且非常投入地进行创新,能够在性能、可扩展性和能效等方面保持领先。”

*免责声明:本文由作者原创。文章内容系作者个人观点,半导体行业观察转载仅为了传达一种不同的观点,不代表半导体行业观察对该观点赞同或支持,如果有任何异议,欢迎联系半导体行业观察。



推荐阅读

推荐阅读
关注数
3
内容数
4
目录
极术微信服务号
关注极术微信号
实时接收点赞提醒和评论通知
安谋科技学堂公众号
关注安谋科技学堂
实时获取安谋科技及 Arm 教学资源
安谋科技招聘公众号
关注安谋科技招聘
实时获取安谋科技中国职位信息