IT大嘴巴 · 2021年04月25日

斩获近半冠军 浪潮成MLPerf榜单最大赢家

斩获近半冠军 浪潮成MLPerf榜单最大赢家

每个领域都有自己的顶级荣誉。

在科技界,叫做诺尔贝;在娱乐圈,叫做奥斯卡;在AI领域,就是MLPerf榜单。

image001.jpg

MLPerf是由图灵奖得主大卫•帕特森(David Patterson)联合谷歌、斯坦福、哈佛大学等顶尖学术机构发起成立的,也是影响力最广的国际AI性能基准评测。时至今日,MLPerf基准联盟现有50多家成员,除了谷歌、阿里巴巴、微软、Facebook等著名公司之外,也包括斯坦福、哈佛、多伦多大学等名校。因此,MLPerf也被看作是AI领域的风向标——谁能够在这个测试中取得更多的领先,谁的AI能力也就更为突出。

而在最新一期的榜单中,MLPerf共邀请到浪潮、NVIDIA、英特尔、高通、阿里巴巴、戴尔、HPE等17家厂商参与了竞赛,这些企业都是各自领域的领先者,也为推动AI技术发展和应用上也做出过不少贡献。评测以最新MLPerf Inference V1.0为基准,涵盖了图像分类、目标检测、医疗图像分割、自然语言处理、语音转文字和推荐系统6类AI应用场景,分为数据中心和边缘两类处理场景,每类场景都包含固定任务(Closed)和开放优化(Open)两类性能竞赛。

据统计,在众所瞩目的数据中心固定任务“主赛道”中,共有13家厂商提交了584项竞赛成绩,是竞争最激烈的赛道;在边缘固定任务重要赛道中,共有11家厂商提交了326项竞赛成绩,显示出厂商对边缘与AI融合的关注度日益提升。

image002.jpg

2021 MLPerf V1.0 比赛各赛项冠军数量

而最终结果显示——浪潮在固定任务(Closed)的全部33个赛项中获得18个冠军,其中在数据中心固定任务(Closed)的16个赛项中,浪潮获得11项性能第一;在边缘固定任务(Closed)的17个赛项中,浪潮获得7项性能第一。整体算来,浪潮拿下了数据中心、边缘场景全部42条赛道的近半数冠军,表现非常亮眼。

这可以看作是浪潮深耕AI多年的里程碑,证明了这么多年的努力没有白费。还记得在2017年的IPF合作伙伴大会上,浪潮就正式对外公布成立人工智能部,持续推出面向AI应用的创新计算平台。但是那时候整个行业对于AI的认知还处于萌芽阶段,虽然当时已经有不少的AI应用出现,也有包括商汤、旷视等“AI四小龙”公司的成立,但在2017年大众对于AI的整体态度还是陌生的,尤其是对于AI算力,无论是客户还是同行都觉得与传统计算并没有太大的区别。

image003.jpg

是浪潮最早发现了算力的价值,并早在2018年就提出了“计算力就是生产力”的著名论断。其实如今回头再看,伴随着人工智能的发展,算力一直扮演了极为重要的角色,这种趋势在智算时代愈发明显。随着人工智能算法突飞猛进的发展,越来越多的模型训练需要巨量的算力支撑才能快速有效地实施,而计算力受芯片工艺的物理限制,其在技术层面的提升速度已经落后于算法模型,某些模型已经逼近人工智能的算力极限,算力如果无法得到保障,未来算法模型本身的进一步创新也会造成影响。因此,算力已经成为未来人工智能应用取得突破的决定性因素。

IDC数据统计显示,2020年,中国人工智能服务器市场规模高达31.96亿美元,占人工智能基础架构硬件市场的87%,在包括软件、硬件、服务的整体人工智能市场占比也超过50%,数据直观地反映了算力在整个产业的重要性。正是早在几年前就看到了这一明显趋势,浪潮才在第一时间布局AI计算市场,并且从产品研发到应用场景都针对AI进行了优化,也才有了如今MLPerf测试中排名第一的成绩——从结果来看,浪潮甚至超过了英伟达这个AI望着和阿里巴巴这种互联网巨头,也说明了它对AI的理解已经达到业界顶尖的水平。

image004.png

不可否认的是浪潮在AI领域的呕心沥血,而这些心血的结晶以及这次比赛的优胜者,当归功于NF5488A5和NE5260两款机型。NF5488A5是浪潮自研的AI服务器,也是业界率先实现500W 80GB A100 GPU液冷散热的超强AI服务器,在系统拓扑上采用了超低延迟设计,最大限度提升处理器到AI芯片间的通信性能,并通过深度优化系统结构设计,确保设备可在高温、高负载环境下稳定运行,AI计算效能显著提升。其实早在2020年7月30日,浪潮NF5488A5服务器就在最受关注的Resnet50训练任务中创下AI性能记录,在所有提交的单服务器性能成绩中名列榜首。

而如今,NF5488A5再次卫冕“性能王”。它获得的殊荣在于囊括了数据中心固定任务(Closed)的11项性能第一,并将2020年MLPerf DLRM的最高推理性能提升了23.4%,同比2019年MLPerf Resnet50的单机最高推理性能提升326%。而在性能之外,NF5488A5在能效上的表现也是可圈可点——4U尺寸的设计更适用于广泛的数据中心部署环境;优化的供电策略可提高供电稳定性并降低TCO;先进的散热系统实时保证散热稳定可靠,完美满足高负载工作。

image005.png

如果说NF5488A5是数据中心“王者”的话,那么本次大赛的黑马NE5260M5则是边缘平台的“霸主”。虽然是第一次代表浪潮出战,但是NE5260M5的表现也是非常惊人——拿下边缘固定任务(Closed)7项性能第一。相对于数据中心对于性能的侧重来说,边缘领域所要考虑的因素更多,从结构设计到散热效率,从性能表现到高温高压……可以说,边缘领域更考察品牌对于应用场景的理解能力,也对参赛的所有平台提出了更高、更苛刻的要求。

但是NE5260M5顶住了这种压力。通过极致优化的信号传输,结构散热,供电等设计,浪潮NE5260M5边缘服务器,完美兼容高功耗CPU和GPU、FPGA和SmartNIC等多种异构加速卡。在追求边缘场景极致AI性能的同时,浪潮NE5260M5打破物理空间限制,机箱深度较普通服务器缩短近二分之一,长度只有430mm,更小的体积让它适应更多空间受限的边缘计算场景(例如电信、零售等)的部署,也具备了更广阔的适用性。

正如我们之前提到的,浪潮在本次MLPerf竞赛中的成功绝无侥幸,更多还是得益于它早起的布局和不断的坚持。随着AI在各行业领域的不断深化,AI应用的场景不断丰富,也就需要更多像浪潮这样熟悉AI应用场景、理解AI客户需求的解决方案提供者,也就更需要强大的算力支持和创新的体系架构,以实现多元算力的高效聚合,从而实现融合创新。为此,浪潮也提出了“智算中心”的概念——即从智慧计算整体发展的视角入手,通过创新智算体系结构、构建智算产品体系、推动智算中心建设,并整合元脑生态,才能系统性的化解当前智慧计算所面临的发展瓶颈和挑战。

image006.jpg
如今,数字经济成为十四五时间发展的强劲引擎,十四五规划中也明确制定了“打造数字经济新形势”的目标。这就需要改变基础设施供给模式,让智慧算力成为汇聚产业资源、提升产业创新能力,释放社会全量数据价值的核心支撑。作为响应,在近期结束的IPF2021峰会上浪潮也是动作频频,一方面发布了最高效能AI视频加速器和全球最强服务AI服务器 NF5488,另一方面也联合寒武纪发布AI服务器“扬子江”,也为AI生态建设添砖加瓦。由此看来,浪潮提供智慧算力的决心仍在不断增强,也愿意携手更多业内伙伴打造创造全新的AI时代。

在AI算力突破的这条路上,浪潮仍在砥砺前行。

推荐阅读
关注数
1932
内容数
249
专注开放计算、大数据应用、人工智能、企业数字化转型、云计算等领域产业观察及产学研合作。
目录
极术微信服务号
关注极术微信号
实时接收点赞提醒和评论通知
安谋科技学堂公众号
关注安谋科技学堂
实时获取安谋科技及 Arm 教学资源
安谋科技招聘公众号
关注安谋科技招聘
实时获取安谋科技中国职位信息