申耀的科技观察 · 2021年04月21日

浪潮:融合多元算力,开创智算时代

我们知道,数字化技术在去年的疫情中迎来了创新的爆发期,特别是类似“健康码”这种新应用的全面铺开,不仅为“科技抗疫”提供了关键支撑,同时由此产生的数据要素,对智慧城市的建设、数据治理乃至数字经济的发展都产生了深远的影响,此外更多基于人工智能的新兴业态及业务场景的纷纷涌现,在加速政企数字化转型的步伐,同样也对整个社会的基础设施提出了全新的挑战。

基于此,2020年浪潮前瞻性地提出“智算中心”的理念。所谓“智算中心”指的是智慧时代面向社会全域多主体的新型公共基础设施,它集算力生产供应、数据开放共享、智慧生态建设和创业创新聚集四大功能于一体,能够为海量数据存储、处理、分析及应用需求的各种场景提供支撑的载体和平台。

浪潮集团执行总裁、首席科学家王恩东院士

但是,从传统数据中心向智算中心的转变是很难快速完成的,正如日前在苏州举办的主题为“智算·向新”的2021浪潮数据中心合作伙伴大会(IPF2021)上,浪潮集团执行总裁、首席科学家王恩东院士所言:“智慧时代,计算需求呈指数级增长,计算技术、产品与产业面临着多元化、巨量化和生态化的新挑战。”

在此背景下,面向未来浪潮将全面布局元脑,从创新智算体系结构、构建智算产品体系、推动智算中心落地、建设元脑产业链生态四个维度着手,以技术、产品、方案和生态四个方面不断创新,解决智慧转型面临的多重挑战,推动智算成为智慧进化的核心引擎。

毫无疑问,浪潮以前所未有的决心和信心推动计算到智算的转型,不仅会加快智算架构的创新速度,催生出更多有竞争力的差异化智算解决方案,还能够推动整个智算产业生态的丰富性,进而为整个市场提供多元化的选择,对重构智算产业未来的新格局,并开创智算新时代,起到更加关键性与决定性的价值和作用。

智算三大挑战可以看到,IDC发布的《2020全球计算力指数评估报告》中,就通过对中国、美国、日本、德国、英国等十国的计算力与经济现状研究,发现全球的数字化转型已进入倍增创新阶段——各个国家的数字经济占比将持续提升,而计算力是数字化技术持续发展的重要因素,更是数字经济时代的核心生产力。

而数据显示,在过去的15年里,中国的数字经济年复合增长率超过20%,对整体经济增长的贡献达到70%。目前,中国数字经济的规模接近40万亿元,总量也跃居全球第二位,在最近的“十四五”规划中加速数字化发展,建设“数字中国”更被列为单独篇幅,并且提出了数字经济核心产业增加值占GDP比重由7.8%提升到10%的目标。

在王恩东看来,随着以人工智能为代表的新一代信息技术的进步,人类社会正在加速度进入智慧时代,而“十四五”期间数字经济也将会推动智慧算力加速普及和升级,特别是相比以往传统信息化的应用对计算能力的需求将会出现非常大的飞跃,由此也让计算的技术、产品、产业面临着巨大的挑战,具体来看:

一是,多元化挑战,主要体现在随着AI在各行业领域的不断深化,AI应用的场景不断丰富,而不同的应用场景意味着不同的计算场景。比如,针对传统的地震波模拟的科学计算,对于数值精度要求很高,而AI训练则可以适用数值范围大、精度相对低的16位浮点类型。对于AI推理,由于推理要求的速度快、能耗少,则可以更低的数值精度下处理,像4位、2位甚至1位的整数类型。

不过,不同数值精度的计算类型对计算芯片的指令集、架构等要求也是不一样的,这样就导致之前一直使用的通用CPU没有办法满足多元计算场景的要求,因此也催生了计算芯片种类越来越多,包括GPU、FPGA、xPU等各种芯片的应运而生。又进一步增加了计算的复杂化。

二是,巨量化挑战,突出表现是模型参数多,训练数据量大。以自然语言处理为例,基于此训练模型兴起之后,模型精度随着模型尺寸及训练数据的增加显著提升,在2020年GPT-3模型的参数量首次突破了千亿大关,达到了1750亿。

另一个表现是模型应用规模大,目前仅市场上提供的AI开放平台每天的承载就有数万亿次的调用量,数百万小时的语音识别,超过百亿张图像识别,超过万亿句自然语言理解,如此巨量的调用对算力中心的应用支撑能力也产生了极大的挑战。

三是,生态化挑战,主要体现在产业链脱节、生态离散,目前供给侧与落地侧的供需无法有效结合,导致有技术的找不到产品,有产品的找不到技术的难题。埃森哲的数据显示,70%以上有技术的研究机构和科技公司缺少需求场景、领域知识和数据;而70%以上的行业用户则缺少技术人才、AI平台和实践能力。

与此同时,由于AI开发中各芯片厂商采用了不同的技术路线,从而也导致了芯片架构五花八门,相互无法兼容,且编程库与芯片绑定,带来灵活性不足的问题。此外,AI开放框架虽多,但往往兼容性差,再加上AI平台之间服务接口标准不一,使得目前的AI产业不得不面临生态离散的挑战。

IDC数据也显示,到2023年全球计算产业投资空间1.14万亿美元,而中国计算产业投资空间1043亿美元,即7300亿元,接近全球的10%,是全球计算产业发展的主要推动力和增长引擎。可以说,数字经济和智算需求蓬勃的发展在带来巨大机遇的同时,其中面临的多元化、巨量化、生态化的挑战和困难同样也急需化解。

融合多元算力那么,如何才能打破这种局面呢?浪潮信息总裁彭震认为,关键就是要推动算力多元化发展,通过融合多元算力,推动算力供给基建化,才能为整个社会创新提供基础设施支撑。

浪潮信息总裁彭震

为此,浪潮提出创新元脑体系结构,以实现多元算力的高效聚合和按需定义。浪潮创新元脑体系结构通过控制计算分离实现灵活可重构,通过异构资源池化实现多元高效能,通过计算数据结合突破存储墙,通过高速互连网络规模可扩展。同时,通过软件定义实现应用智能感知和资源随需组合,让底层资源随上层应用按需定义,具体来看:

首先,在体系架构上,浪潮认为唯有要打破传统体系结构设计,才能从根本上解决多架构引发的无法兼容、效率不高的问题。事实上,浪潮早在2014年就提出了“硬件重构+软件定义”的理念,即在硬件层将计算、存储、网络等资源分类进行资源整合,同类资源形成资源池,同类资源中不同设备间可任意重组;同时,在软件层面利用主动业务资源需求智能感知技术,进行自适应硬件资源重构,实现硬件资源的动态组合和智能分配,满足各类应用的需求。

截至目前,浪潮打造的融合架构已经从1.0走到了2.0,以IO方式实现了存储资源和FPGA、GPU等各种加速设备资源池化,正在逐步进入到融合架构3.0阶段,能够为智算中心的建设提供更加高效灵活智能的体系结构。

其次,在产品创新上,浪潮也发布一系列新的异构融合产品,包括最强效能视频AI加速器M10A、与寒武纪联合打造的AI服务器“扬子江”、超强性能AI服务器NF5488、业界首款智算操作系统元脑OS,算力最强全可编程智能网卡N20X、边缘计算微服务器EIS800等,它们将成为浪潮创新元脑产品体系的重要组成部分,在具体的应用场景中发挥价值。

对此,浪潮信息副总裁、AI&HPC产品线总经理刘军说:“这次发布的产品刚好契合了我们对于产业的判断——产业的多元化需要我们去支撑,每个产品都会发挥自己的价值;而且在技术上,因为应用场景的不同,不同的产品所能发挥的作用也不同。浪潮希望的就是让它们实现高效率、高性能的运行,这也是我们要针对应用场景做特制化的优化方案和产品目的所在”。

最后,在操作系统上,浪潮正式发布业界首款智算操作系统元脑OS。元脑OS是面向智算时代最强有力的武器,它能够融合多元算力,让算力生产、聚合、释放浑然一体;融合云边数智,实现业务资源池化、弹性挑战;融合异构多云,构建开放的生态平台。

同样,元脑OS也是由此前的浪潮云海OS不断“演进”而来,去年11月该系统成功完成全球最大规模单一集群达1000节点的云数智融合实践,实现了规模、场景、性能的整体突破,而这种验证不仅证明了元脑OS作为智算操作系统的极致的扩展性、可用性和稳定性,同时也为未来大规模智算中心的落地提供了重要支撑。

回头来看,作为中国最早的服务器厂商,浪潮早在1993年推出了中国第一台服务器SMP 2000;2008年,浪潮在高端服务器领域立项,并在2010年推出了中国第一台高端容错服务器,逐渐在高端服务器市场实现了突破与领先;2010年,浪潮推出首款整机柜产品SR 1.0,并成为天蝎联盟主要参与者,并且在互联网算力市场遥遥领先;2017年,浪潮率先在业界推出AI服务器AGX-2,连续多年在AI计算市场处于领导者位置;而最新提出的元脑体系结构,则标志着浪潮在技术创新上又再一次实现了更大的突破和跃迁,这对构建计算产业新发展格局,完成多元算力的融合,实现算力供给的基建化将奠定坚实的基础。

开创智算时代当然,也要客观的认识到,要释放智算时代更大的潜能,让它在数字经济中发挥更多的作用和更大的价值,不仅是个技术问题,更是一个生态问题。

因此,早在IPF2019上浪潮就正式发布了元脑生态计划,在IPF2020上,浪潮宣布投入亿元资金成立“E 基金”发展元脑生态,在联合技术创新、市场推广、AI人才培养等维度对生态伙伴提供更大的支持,加速重点行业的产业AI进程;而在今年的IPF2021上,浪潮再次宣布升级元脑生态2.0,提出做“智算合伙人”的生态主张,并发布全新元脑生态平台AIStore,加速生态聚合,应对生态离散化挑战。

据了解,全新元脑生态平台AIStore将成为元脑伙伴能力的“聚合器”和“孵化器”:一方面,AIStore聚合了芯片和算法公司等左手伙伴优质的技术和产品,通过ISV、SI、分销商等右手伙伴强大的解决方案和渠道能力,快速推动各类智慧场景解决方案的行业落地和复制;另一方面,伙伴间的能力融合将有助于孵化出更多的多元复合场景智慧解决方案,加速AI全场景融合进程。

对此,彭震表示:“AIStore代表了浪潮在未来生态建设上的一种全新模式,现在左手拉右手、点对点的合作模式面向智算时代是不足以应对挑战的,因此这就需要通过平台化的方式来构建一种矩阵式的合作模式,未来我们希望与伙伴共建、共享AIStore,促进智算创新技术、场景应用与交付服务的融合落地,为创新者提供成长的平台,帮助伙伴把价值和能力发挥出来,为客户创造更大的价值。”

从这个角度来看,AIStore不仅是一个生态平台,更是商业和技术创新平台,而未来借助浪潮搭建的这个平台化的大舞台,更多市场中的合作伙伴就可以借助AIStore提供的力量,找到更多的生意机会,探索出更多的新商业模式,并一起迎接智算时代的到来。

值得一提的是,除了加大对生态的投入之外,浪潮在标准和落地方面也持续展开探索与创新。其中,去年9月,浪潮就联合国家信息中心发布《智能计算中心规划建设指南》,明确智算中心的概念、内涵、功能定位和技术架构,初步探索智算中心建设的技术路线和实施路径,探讨建设智算中心的经济社会价值,为地方健康有序开展智算中心建设提供借鉴和参考。

不仅如此,由浪潮和寒武纪联合承建的南京智算中心也已经投入运营使用,该中心对外可以提供的算力达到了每秒百亿亿次,采用了最先进的AI处理芯片和AI计算平台,可以说代表着当前我国智算中心建设的最高水平,将为区域的公共算力服务、创新应用孵化、产业聚集发展、科研创新和人才培养提供助力和支撑。

总的来说,智算中心正在成为数字经济发展的底座与支撑,而在此过程中,浪潮“以行践言”,通过融合多元算力,加大合作伙伴投入,以及不断在市场中进行探索与创新,由此加速了智算中心的落地,可以预期在“十四五”期间,浪潮必将会对算力供给基建化,以及数字经济的可持续发展贡献出更高的价值。

正如在电影《梅兰芳》中,邱如白对年轻的梅兰芳说:“你的时代来了!”是的,智慧时代的来临,不仅让整个计算产业迎来了从未有过的大变局,也催生出了一个万亿级的智算大蓝海,而属于智算的新时代无疑也正狂奔而来! 

推荐阅读
关注数
2395
内容数
426
专注产业互联网、企业数字化、渠道生态以及汽车科技的 观察和思考。
目录
极术微信服务号
关注极术微信号
实时接收点赞提醒和评论通知
安谋科技学堂公众号
关注安谋科技学堂
实时获取安谋科技及 Arm 教学资源
安谋科技招聘公众号
关注安谋科技招聘
实时获取安谋科技中国职位信息