24

IT大嘴巴 · 9月6日 · 天津市武清区

为什么云服务商都爱霄龙多核心?

2000多年前,汉高祖刘邦与大将军韩信曾有过一场统兵能力的对话。

上问曰:“如我能将几何?”信曰:“陛下不过能将十万。”上曰:“于君何如?”曰:“臣多多而益善耳——西汉·司马迁《史记·淮阴侯列传》

在刘邦看来自己能带10万兵已经算是非常出色了,但是韩信的回答显然出乎了他的意料。所谓“多多益善”,就是突破了统领的极限,也是自古以来兵家所向往和努力的目标。而在如今的数字化时代,我们对于算力和数据的需求也在不断提升,由此也对网络传输速度带来了新的挑战——从这个角度来说,谁能够提供算力、存储、网络的全面服务能力,谁就能够成为数字化时代不可或缺的基石。如今,云服务商对于IT基础设施的要求也越来越高,更多的核心数量、更强大的处理能力、更广泛的生态覆盖,成为了大家选型时的核心出发点。而这一切都指向了一个名字——AMD EPYC霄龙平台。

7nm制程工艺打造x86领域最多核心数量

许多云服务商选择AMD霄龙平台的理由简单又直接,就是看中了该平台单处理器64核心的数量。早在2019年发布的第二代AMD霄龙处理器开始,AMD就使用了当时颇为领先的7nm工艺,也将单颗处理器的最大核心数量提升到了64个。在此之前,业内x86处理器最高的核心数量是32个,而AMD则将这个数字提升了一倍。之所以带来这么大的飞跃,除了芯片架构层面的提升之外,首先就要归功于7nm工艺的加持。也正式从这一刻开始,AMD为云服务商市场提供了更多核心、更高效率的选择,也赢得了众多云服务商的青睐。
1.jpg

其中最大也是最重要的品牌,就是号称云计算“鼻祖”的亚马逊云科技(AWS)。说起亚马逊云科技,整个产业的人都不会陌生,从最早的S3对象存储到后来的EC2虚拟机再到如今的Serverless,正是亚马逊云科技为整个云计算产业指明了方向也提供了技术模型,进而让全球云计算市场迎来了如今的繁华。而如今,在看到AMD霄龙处理器的表现之后,亚马逊云科技也携手AMD打造出了更具性价比的解决方案,通过云服务的核时方式帮助越来越多的用户实现数字化转型。

为什么7nm工艺会带来核心数量的巨大提升?这还要从处理器的制造工艺说起。我们通常意义上的7nm,其实指的是处理器晶体管中的栅极宽度,它也是整个芯片电路中最窄的线条,可以视为晶体管的组成模块。这就意味着,晶体管的长度越小,就意味着单位面积内能够蚀刻的晶体管数量越多,进而提供的核心数量也就越多,性能就更强。当然这其中我们谈到的晶体管长度不是真正的沟道长度而是等效长度,但这依然不影响制程工艺的价值,而制程工艺的提升则可以带来更高的晶体管密度、更强的性能以及更低的功耗。由此看来,7nm工艺就决定了AMD可以提供更多的核心数量,也就是我们现在看到的64核心。

时至今日,AMD霄龙处理器已经演进到了第三代,7nm工艺经过多年的市场验证也变得越发成熟。那么问题来了——7nm一定代表更多的核心数量吗?也不一定,7nm只是代表了多核心的可能,而如何实现更多的核心则需要更专业的设计。这就好比房子外墙固定了,但是其内部的房间格局还是需要仔细规划才行。在最新的霄龙处理器平台上,AMD采用的是Chiplet的架构创新,提供了64个计算核心,并且支持超线程,最高可达128个,是目前x86平台核心密度的最高水平。那么,AMD又是如何实现这一点的呢?这还要从第二代AMD霄龙处理器说起。

Chiplets模式创新,新架构带来新特性

如果说亚马逊云科技是云计算“鼻祖”的话,那么AMD就是Chiplets模式的“领路人”。

这并不是溢美之词。Chiplets通常被翻译为“粒芯”或“小芯片”,单从字面意义上可以理解为更为“粒度更小的芯片”。它是一种在先进制程下提升芯片的集成度,从而在不改变制程的前提下提升算力,并保证芯片制造良品率的一种手段。虽然在此之前也有公司发布过以Chiplets理念的产品,但是真正将这一理念发扬光大的,非AMD莫属。
2.png

早在2017年AMD发布第一代霄龙处理器Naples的时候,就已经融入了Chiplets理念的萌芽,当时AMD就将每个EPYC处理器内放入了4个Zeppelin Die,甚至当时使用的还是2D的 MCM (Multi-chip module)封装。虽然那时候AMD还没有迈入7nm时代,不过得益于革命性的Infinity Fabric,AMD在互联上还是获得了突破,也让Naples的性能达到了行业主流水平。
3.jpg

而在随后2019年发布的第二代霄龙处理器Rome上,AMD采用了全新的设计,从第一代的“四海一家”变成第二代的“八星伴月”,也将Chiplets理念进一步发扬光大——通过模块化的组合方式,把不同工艺、不同架构的芯片电路按需搭配,组合成为不同核心的处理器。这样每个CCD(Core Chiplet Die)由两个CCX(CPU Complex)组成,每个CCX包括4个核心与各自独立的L1和L2缓存,以及共享的16MB L3缓存,实际上每个核心实际上能够直接访问的L3缓存为16MB。
4.png

再到如今的布第三代霄龙处理器(代号Milan),AMD进一步优化了设计,让每个核心都可以直接访问所有的L3缓存,即32MB直接访问L3缓存,更大的缓存意味着更好的性能。与此同时,AMD Milan-X处理器(以字母X结尾的第三代霄龙处理器)中还增加了3D V-Cache技术,实现了在传统芯片的平面上的双层堆叠,使得每个CCD芯片上堆叠64MB SRAM作为额外的三级缓存,叠层小芯片提供的三级缓存是第三代 AMD EPYC™(霄龙)处理器的三倍,从 256MB 提高到 768MB。,这就在处理器内部打造了“海量缓存池”。
5.png

如此一来,面对当下热门的云计算应用。AMD也可以凭借多核心与大缓存提供更多的虚拟机或者容器数量,进而提升单位空间的计算密度。测试显示,在同样核心数量的情况下,使用3D V-Cache技术的第三代霄龙处理器(代号Milan-X)在Synopsys VCS应用中的性能要提升66%,同时包括生命科学、流体力学、工业制造、结构分析等多个行业的科研与应用中,3D V-Cache技术都能够发挥价值,帮助行业客户获得更好的应用体验。

凭借着先进的制程工艺和更高的的计算核心密度,如今的AMD第三代霄龙处理器也成为数据中心市场的“新宠”,不少云服务商也用其作为自己的主流应用平台。根据 Mercury Research提供的单位和总收入估算得出的收入份额计算,AMD在服务器市场的收入份额在2022年第一季度达到16.5%,比上一季度增长2.2%,与去年同比增长5.7%。在全球服务器采购量整体下滑的今天,这样的数据尤为难得,也体现出整个行业对于AMD的信心与认可。正如金融业的那句名言——信心比黄金更重要。
6.png

更值得一提的是,Chiplets架构不仅仅让处理器能够专注于计算用CCD的性能提升,从而达到更高的计算能力,同时IOD也可以提供更好的内存和网络互联能力也同样为数据中心的应用实现加速,进而使得系统的整体性能也有所提升。正是有了AMD Chiplets的成功“示范”,整个芯片产业也开始朝着这个领域发展,AMD也再度成为了芯片行业的引领者,并与亚马逊云科技、腾讯、微软等众多云服务商携手,打造性能更强大、能效更出色的云服务平台。

这样一款处理器,谁能不爱呢?

推荐阅读
关注数
1889
内容数
162
专注开放计算、大数据应用、人工智能、企业数字化转型、云计算等领域产业观察及产学研合作。
目录
极术微信服务号
关注极术微信号
实时接收点赞提醒和评论通知
安谋科技学堂公众号
关注安谋科技学堂
实时获取安谋科技及 Arm 教学资源
安谋科技招聘公众号
关注安谋科技招聘
实时获取安谋科技中国职位信息