IT大嘴巴 · 2021年10月28日

四年三级跳,第三代AMD EPYC(霄龙)处理器成就最强x86平台

超过83%的员工都是技术研发,这家公司得多强大?

正所谓“科技是第一生产力”,一家企业掌握了顶尖科技,自然也就能够在市场竞争中拔得头筹,而这家公司就是大家非常熟悉的AMD。日前,以“智算赋能 · 共赢未来”为主题的2021年度全国高性能计算学术年会在珠海国际会展中心召开,AMD 全球副总裁、中国区企业及商用事业部总经理刘宏兵进行了题为《芯驭智能 共创未来》的主题演讲,也向在场专家们介绍了AMD最新的成果。

image

全新一代EPYC处理器登陆,引发智能计算新热潮

image

AMD在会场门口有一个非常醒目又特殊的展台。说它特殊,是因为相对于其他品牌来说,AMD在展厅门前嵌入了一块裸眼3D屏幕,每一个从这里经过的人都可以发现它的与众不同,而屏幕上循环播放的就是第三代AMD EPYC(霄龙)处理器的特写镜头,这款处理器也有大家熟悉的研发代号——“MILAN”。

image

说到当下处理器技术的最新工艺,熟悉的网友肯定会脱口而出——7nm。没错,7nm是当下市场中能够找到的最先进x86处理器工艺,而早在2年前AMD发布第二代 EPYC (霄龙)处理器的时候就已经使用了这一工艺,如今发布的第三代处理器更是将这一先进技术应用到底。也正是得益于先进制程工艺,第三代EPYC可以提供高达64个计算核心,并且支持超线程,最高可达128个,达到了业界顶尖水平。

出了核心数量众多之外,在内存及扩展性上,“MILAN”也可以支持8通道 DDR4-3200的高速内存,并提供了对于128个PCIE 4.0通道的支持。要知道,如今主流应用都是基于PCIE 4.0通道实现的,而高达256M的三级缓存相对于上一代也翻了4倍。总体说来,“MILAN”提供了更高的 内存带宽和更多的I/O通道,这已经达到了业界领先的水平,在这个强调能效比的时代更是可以将整体的IPC提升了19%,成为了当之无愧的x86能效比之王。

多核心创造传奇,AMD引领芯片设计新时代

曾几何时,多核心被许多网友诟病。。但让人始料不及的是,如今几乎所有的芯片都采用了类似的设计,尤其是在多元化算力与多重负载的今天,小芯片的好处在于“可分可聚”,既可以满足高强度、高性能的计算需求,也同样可以面临多场景的高负载状况,正所谓——聚是一团火,散是满天星。

image

这张图可以清楚的看到AMD是如何执行“小芯片”策略的。对于第二代EPYC(霄龙)处理器来说,每个CCD(Core Chiplet Die)由两个CCX(CPU Complex)组成,每个CCX包括4个核心与各自独立的L1和L2缓存,以及共享的16MB L3缓存,实际上每个核心实际上能够直接访问的L3缓存为16MB。但在第三代EPYC处理器中,每个核心都可以直接访问所有的L3缓存,即32MB直接访问L3缓存,更大的缓存意味着更好的性能。

“小芯片技术带来除了7纳米以外,带来的是保证CPU单核性能的同时,可以一颗CPU里做更多核,从32、48、64核,到业界开始做128核CPU,同时在降低成本,小芯片成本比大芯片成本更低,这是工艺带来的好处”,刘宏兵介绍说。与此同时,他还透露这种架构还可以将CPU与GPU封装在一起,或许在不久的将来还可以将x86与ARM架构封装在一起,以获得更好的性能或者能效比。“这并不是梦想”,刘宏兵解释说。

image

协同工作也是第三代 EPYC(霄龙)平台为用户带来的“新福利”。“AMD是一家做CPU又做GPU的公司,混合异构已经非常的常见。能不能在CPU和GPU之间通讯的时候统一内存地址、无障碍统一访问?随着科技的进步,这已经不是幻想”。记得在去年11月,AMD发布了首次采用新设计的、面向HPC高性能计算和AI人工智能的CDNA加速卡,而从图中来看CDNA2距离我们也似乎并不遥远了。正如这张图的标题所说的,AMD正在全面释放加速计算的力量。

四年三级跳,AMD生态拓展如火如荼

一直以来,高性能计算领域对于算力就有着无尽的追求,而各种加速计算的出现就是希望能够将算力提升若干等级。从2017年重返数据中心市场发布第一代 EPYC(霄龙)处理器开始,AMD便以出色的产品赢得了业界的关注,其市场占有率也在快速提升。仅就高性能计算领域来说,在短短3-4年的时间里,AMD就实现了份额的跨越,其成绩甚至可以用“耀眼”来形容。

image

每年的6月和11月,国际高性能计算咨询委员会都会针对当时的全球高性能计算机进行大排名,这在业内被称为TOP500榜单,而能够进入这个榜单的设备都是同业中的佼佼者,尤其是顶尖部分的TOP100更是成为了众多品牌争相角逐的目标。而在最新一期的2021年6月榜单中,基于AMD霄龙平台的系统就在TOP100中占据了28席,尤其是考虑到AMD刚刚回归市场,这个结果更是让人感到惊讶。

image

也正是看中了AMD霄龙平台的强大性能,美国能源部宣布了名为Frontier和EL Capitan的两套E级超算系统均采用AMD平台。其中Frontier系统采用的就是刚刚提到的第三代EPYC处理器,其设计理论峰值算力为150亿亿次FLOPS(ExaFlops),这个数字也将超过当前Top50的超算总和,甚至可能成为当今全球排名第一的超算系统。而EL Capitan采用下一代AMD EPYC CPU和Radeon Instinct GPU,计划在2023年交付,其性能更是达到了惊人的200亿亿次FLOPS(ExaFlops)。

image

除了专业的科研领域之外,AMD在短短几年间也打造了属于自己的生态系统,如今支持第三代EPYC平台的ISV和IHV已经达到了上百家,而EPYC平台打破的世界纪录也高达200多项,仅在HPC领域中就有80项,包括了性能、能效、应用等多个层面。

“千淘万漉虽辛苦,吹尽狂沙始到金”。回到我们文章开头所说的,当研发人员占据公司80%以上的时候,AMD所要实现的就是尽可能为客户提供强大的算力,这些算力或许是来自CPU或许是来自加速卡,但毫无疑问这些算力都是基于最新制程工艺所实现的,也代表了当下计算领域的顶尖水平。虽然重返市场的时间很短,但无论在产品品质、市场占有率还是生态建设上,AMD都证明了深耕技术的重要性。

正如刘宏兵在主题演讲中提到的:“AMD的理念不追求大而全,而是希望在专长的领域提供更好的产品、在专长领域能够为大家提供更好的平台。”

1 阅读 1.4k
推荐阅读
0 条评论
关注数
1862
内容数
94
专注开放计算、大数据应用、人工智能、企业数字化转型、云计算等领域产业观察及产学研合作。
目录
极术微信服务号
关注极术微信号
实时接收点赞提醒和评论通知
Arm中国学堂公众号
关注Arm中国学堂
实时获取免费 Arm 教学资源信息
Arm中国招聘公众号
关注Arm中国招聘
实时获取 Arm 中国职位信息