麦斯科技 · 2021年12月14日

云实现定制化

https://www.arm.com/blogs/blueprint/custom-cloud-chips

来自AWS、阿里巴巴、Ampere Computing和其他公司的越来越多样化的Neoverse处理器阵列正在使数据中心获得更高的性能。

2021年12月7日发布

作者:Eddie Ramirez,Arm基础设施业务副总裁

datacenter.jpg

在过去的五年中,我们Arm非常高兴和自豪地看到我们的合作伙伴通过Arm Neoverse技术提供云创新。

仅在过去六个月内,阿里巴巴云就发布了用于优化云计算服务的新服务器芯片,该芯片由128个Arm内核提供支持,谷歌云还公布了与英特尔在基于Arm Neoverse的Mount Evans IPU上的合作,Oracle云基础设施(OCI)向OCI推出了基于Arm的云实例,并提供了80核基于Arm的Ampere A1计算,腾讯云推出了基于Ampere Altra处理器的基于Arm的云实例SR1的试用版。

最新信息是上周AWS宣布推出Graviton3,这是一款服务器应用程序处理器,与前代处理器相比,性能提升了25%,同时能耗降低了60%。

AWS继续通过各种工作负载的成功案例为性价比设置标准,包括媒体服务(NextRoll:50%的TCO改进)、ERP(Globe3:20%的性能改进和20%的价格改进),风险评估(LexisNexis:流量增加30%)和3D建模(S-Cube:性能提升30-45%,价格降低20%)。

这些里程碑还突出了另一个对数字基础设施具有深远影响的行业趋势。也就是说,整个行业都趋向于可扩展的定制。

定制之路

云最初是通过部署具有共同工作的对等节点的横向扩展系统构建的。扩展系统可以用商品化硬件构建,因为你追求的是数量而不是质量。这种方法带来了显著的成本效率,并推动了一种新的基于需求的计算服务消费模型。

云服务不断增长,但随着时间的推移,它们开始看起来更像是一种商品化的基础设施服务,直到AWS重新设计了服务器并投资于底层计算芯片。这掀起了新一轮的差异化浪潮,为客户创造了更多价值。现在,他们可以大规模提供独特、优化的体验。

附件A:数据处理单元(DPU)

AWS Nitro,一个基于ARM的系统,用于管理网络、存储、安全和其他操作功能。这些功能可以占用30%或更多的CPU。Nitro是一个拥有自己软件堆栈的专用系统,它以并行、优化的方式处理这些功能,而不是从CPU上offload。结果如何?减少了存储延迟、提高了网络速度、加快了应用程序工作负载、降低了客户成本,同时减少了攻击面。

Nitro还通过允许AWS对新服务采用构建块方法来加速产品开发。自2017年全Nitro stack可用以来,AWS提供的实例数量增加了300多个,成长4倍。

其他云提供商也在使用数据处理单元(DPU)实现类似的结果。DPU资源还将激发新类型的服务。想象一下,DPU支持人工智能支持的云安全服务,以应对日益严重的深度伪造问题,或为零日攻击开发零延迟防御。展望未来,您可能不会看到许多没有DPU的数据中心,这与今天的数据中心有很大的不同。

用于专门构建性能的新定制处理器

同样的定制多样化也在应用程序处理器之间发生。虽然来自Ampere 和AWS的基于ARM的NeFuSE芯片和将来来自阿里巴巴和其他公司的芯片可能共享一个共同的基础,但它们在速度、内核数量、设计、性能和功能方面有所不同。

例如,Graviton2的功能是自动256位系统内存加密,以改善一个长期存在的安全问题:即客户无法将加密作为一种普通的商业实践。Graviton3将提供显著的性能改进,包括ML推理工作负载增加3倍,并且将是第一个启用DDR5内存的服务器CPU。Graviton3将为AWS云上的新EC2 C7g实例赋能。随着Neoverse基础设计的更多变化进入市场,因价格、性能和应用程序而异的实例层级将激增。

在高性能计算(HPC)领域,来自英国、印度、韩国、美国和其他国家的研究人员目前正在根据不同的目标打造下一代Arm Neoverse芯片。一些人希望建立突破性的能耗性能水平。其他人的目标是能够商业化的架构。

可扩展定制的好处也将渗透到整个网络和边缘。这是必须的。正如我的同事Panch Chandrasekharan所指出的,5G网络需要管理更多的数据和更复杂的工作负载,同时保持成本与4G持平,同时控制能耗。开放式体系结构和定制的专用芯片的结合使这成为可能。值得一看的一个项目是DISH Networks在AWS主干网上建设的全国5G网络。这将是美国的第一个云化网络(DISH将采用Graviton服务器满足其计算需求)。

十年以前

如果你在2011年问人们未来的数据中心是什么样子的,他们可能会想象一个他们已经知道的更大版本。它可能有更多的闪存,或者有一些“软件定义”的元素,但总的来说,核心元素是一样的:机架式的双插槽服务器,CPU处理线程并大量输出热空气。

如今,数据中心正围绕处理器和云本地软件堆栈的组合而构建。而且,尽管系统是兼容的,但它们比以往任何时候都更加不同。随着越来越多的客户使用Arm Neoverse作为推动发展的平台,多样性也将不断增长。

推荐阅读
关注数
5845
内容数
525
定期发布Arm相关软件信息,微信公众号 ArmSWDevs,欢迎关注~
目录
极术微信服务号
关注极术微信号
实时接收点赞提醒和评论通知
安谋科技学堂公众号
关注安谋科技学堂
实时获取安谋科技及 Arm 教学资源
安谋科技招聘公众号
关注安谋科技招聘
实时获取安谋科技中国职位信息