E企研究院 · 2021年04月09日

看图识至强:10nm、40核、液冷、云优化…

(本文所配图片均可点击放大观看)

近期,英特尔(Intel)正式推出代号Ice Lake-SP的双路处理器,与2020年6月中旬发布、代号Cooper Lake-SP的四至八路处理器,共同构成了第三代至强可扩展处理器(3rd Gen Intel Xeon Scalable processor)家族。

01 英特尔芯片.jpg

与前两代相比,第三代至强可扩展处理器最主要的任务,就是增加服务器的CPU核芯数,并直接从最少8核芯的银牌系列起步,去掉了核芯数最少的铜牌系列。

02.jpg

注意中间有字母的小色块,第三代至强可扩展处理器家族已经没了铜牌(Bronze)系列

但是,4~8路的Cooper Lake-SP,和1~2路的Ice Lake-SP,增加核数的方式,全然不同——因为它们本来就不是一回事儿,从制程到架构都不一样。

四八路,14mm老路
Cooper Lake-SP与前代Cascade Lake-SP一样采用14纳米制程、最多28核芯56线程,旨在以四路替代双路,用更多的CPU提供更多的核芯。

03.jpg

四路替代双路,提供同样核心所用的服务器和网络设备等都减少,意味着需要管理的设备变少,机柜成本也下降

这种思路可以看作是第二代至强可扩展处理器家族中Platinum 9200系列的延续。代号Cascade Lake-AP的至强Platinum 9200系列,采用把2个28核die封装在一起的MCM(MultiChip Module,多芯片模块)方式,将单个CPU的核芯数量增加到56个。所以,2个Platinum 9200系列处理器组成的双CPU系统,本质上还是用UPI(Ultra Path Interconnect)互连起来的四路平台,只不过两两封装为一体(胶水)而已。
04.jpg

把2个全核die封装在一起的一大弊端,就是CPU的热设计功耗(Thermal Design Power,TDP)飙升到350~400W,对服务器的散热设计提出了更高的要求,1U的紧凑型平台,基本要标配(冷板式)液冷了。

在第二代至强可扩展处理器推出的2019年,英特尔已经在推动2U四路服务器设计。继而,在2020年推出四路起步的Cooper Lake-SP,在10nm制程到位前,先以四路堆积更多的核数,抵御竞争对手双路系统的攻势。

05.jpg
采用散热器高低、纵横搭配(低的为T型,将CPU发出的热量通过热管导出到横向的远程散热片,增大散热面积)来解决四路CPU散热问题的2U服务器。基于这一类2U四路服务器产品,阿里云等服务商在2020年推出了基于Cooper Lake-SP的新一代云计算实例

4个CPU要(在整体性上)抗衡2个CPU,就需要强化CPU之间的通信,所以每处理器的UPI数量,从Cascade Lake-SP(CLX)的3个,倍增至Cooper Lake-SP(CPX)的6个,四路系统中任意2个CPU之间都有2条UPI直连。PCIe的规格和数量不变,内存也仍然是(每CPU)6通道,只有规格“与时俱进”,提升到DDR4 3200。

06.png

单双路,10nm新核
Ice Lake-SP(ICX)终于用上了10纳米制程,单个CPU(die)的核芯数量从28个增至40个,相应的,I/O能力也有不同程度的增长:

· UPI数量还是2或3个,但速率从10.4GT/s上升到11.2GT/s;

· 内存升级为8通道,DDR4 3200;

· PCIe规格从3.0升为4.0,数量也从48个增加为64个。

07.png

核芯、内存通道、PCIe等数量的增加,都要从至强可扩展处理器的2D Mesh架构说起。

前两代至强可扩展处理器(Skylake-SP和Cascade Lake-SP),都是6×6的2D Mesh,UPI和PCIe等互连单元占去一条边上的6个,再减去网格另外两条边上的各一个3通道内存控制器,剩下正好是28个(36 - 6 - 2)核芯。

08.jpg

每CPU 8个DIMM插槽是Ice Lake-SP平台相比前代的主要外观特征

要增加CPU的核心数,就要扩大2D Mesh的网格规模。Ice Lake-SP增加了1行2列,变成7×8的网格架构。

2D Mesh架构有两大特点:

  1. 所有I/O单元(UPI、PCIe、内存控制器等)都布置在矩阵的边上;
  2. 核芯访问共享Cache(LLC)和I/O(特别是内存)的时延,随矩阵规模的扩张而增长。

09.jpg
Skylake的6×6矩阵(XCC)

所以,如果核芯数量不是很多,矩阵的规模小一些会比较好。譬如第一代至强可扩展处理器(Skylake-SP),就有XCC(eXtreme Core Count,最多核or极多核)、HCC(High CC,高内核数)和LCC(Low CC,低内核数)之分:

§XCC是完全体6×6矩阵,可支持到28个核芯;

§HCC是6×4矩阵,可支持到18个核芯;

§LCC是4×4矩阵,可支持到10个核芯。

10.jpg

Ice Lake-SP也有XCC和HCC之分,我还没看到HCC的架构(也许就是之前的6×6?),但XCC应该是7×8无疑。下面就以两个XCC的完全体简单对比一下。

Skylake-SP/Cascade Lake-SP的I/O单元都集中在矩阵的一半(里的边缘位置),另一半(6×3)的18个全都是核芯,离内存控制器仍不算远,因为矩阵的规模不大。
11.png
Ice Lake-SP采用Sunny Cove微架构,新的核芯功能更强大,L1和L2 Cache容量也更大,IPC性能据称有20%的提升

Ice Lake-SP则把矩阵的4条边都用上,一方面是可以容纳增加的I/O单元(如内存控制器),一方面让I/O单元(如PCIe和UPI)的分布更为均匀。Skylake-SP/Cascade Lake-SP有一条边完全不布置CPU核芯的做法得以延续,哪怕是放上了3个占位的Dummy,而不是用来把核芯数量扩展到43个——或许42个更为合适,因为紧邻UPI单元的那个(Dummy位)离内存控制器过于遥远。

12.jpg

6×6 → 7×8,红框内可理解为增加的12个核心

如果把这3个Dummy位换成核芯,会拖累整个CPU的平均内存访问时延,拉开与Cascade Lake-SP的差距。现在已经有40个核芯了,再增加2~3个的意义,不是很大。

可以简单的认为,与Skylake-SP/Cascade Lake-SP相比,Ice Lake-SP净增了两列6个核心(6×2),也就是40与28的差值。
13.png

既然顶着“第三代至强可扩展处理器”名头的是两种差异很大的产品,那么,从型号上怎么区分Ice Lake-SP和Cooper Lake-SP呢?

第三代至强可扩展CPU全览
至强可扩展处理器的命名规则并没有变,它只是“扩展”了:在4位数字后面的字母后缀,如果有H,就代表适用四路和八路平台的Cooper Lake-SP,目前共有10余款,分属铂金和金牌系列,包括一些后缀为HL的机型。

14.jpg

L代表每插槽可以支持4.5TB内存的大内存型Cooper Lake-SP,而Ice Lake-SP每插槽可以支持多达6TB内存——当然,这些都需要傲腾持久内存的配合。

15.png

然后是为不同应用场景优化的Ice Lake-SP产品。先看不带后缀的,包括4款铂金系列,核心数量从32到40不等,L3 Cache最大60MB,热设计功耗在250~270瓦(W)之间。

16.png

8款金牌6系列和2款金牌5系列,其中有高基频、核数少的6334,也有频率较低而核数多的6338和6330。

17.png

傲腾持久内存PMem 200系列在第三代至强可扩展处理器家族得到了广泛支持,银牌系列除外——只有1款支持。

18.png

Y后缀代表支持Intel Speed Select Technology - Performance Profile 2.0 (Intel SST-PP) ,可以理解为一种更全面的变频技术。

19.png

N后缀代表为网络和NFV应用优化,核数较多,频率变化灵活,其中5318N还兼具Y后缀的特性。

20.png

T后缀代表长生命周期(10年)和NEBS热设计友好,Tcase温度高,适合电信行业应用。

21.png

还有两款为云计算的虚拟机应用优化,都具有较多的核数。其中:

· P后缀代表为IaaS优化,为虚拟机提供更高的频率;

· V后缀代表为SaaS优化,针对高密度、低功耗虚拟机环境提高编排效率。

22.png

8352V还兼具Y后缀的特性。

14nm的Cooper Lake-SP最大TDP已经达到250W,10nm的Ice Lake-SP在大幅增加核芯数量之后来到了270W,下一代就奔着350W去了,液冷越来越接近必选项。

23.png

Q后缀即代表为液冷环境优化,与核数、Cache容量和TDP相同的8368相比,8368Q的运行频率要高100~300MHz,初步体现了液冷加持的效果。

24.png

S后缀代表为SGX(Software Guard Extensions)提供最大的飞地(enclave)存储空间,单CPU可达512GB,双路系统就是1TB,不带S后缀的8380、8368和8368Q也在此列。

25.png

M后缀代表为AI处理和媒体工作负载优化,8352M运行频率不算高,在32核产品中是TDP最低的一档。

26.png

U后缀代表单路型,8351N也属于这类产品。

DT时代Logo图片.png

推荐阅读
关注数
5033
内容数
335
E企实验室由E企研究院专职产品技术分析师针对数据中心、云计算、AI和5G等领域最新技术和应用研究、验证、试用、分析,数据中心级新产品新技术的市场教育,国内唯一同时研究互联网和传统企业IT基础设施的机构和部门
目录
极术微信服务号
关注极术微信号
实时接收点赞提醒和评论通知
安谋科技学堂公众号
关注安谋科技学堂
实时获取安谋科技及 Arm 教学资源
安谋科技招聘公众号
关注安谋科技招聘
实时获取安谋科技中国职位信息