IT大嘴巴 · 2023年09月28日 · 天津市

从业务出发,用多元异构算力打造应用新蓝海

当时间进入2023年,整个IT市场都在努力寻找算力,并为之疯狂。

根据英国《金融时报》报道,包括阿里、腾讯、字节在内的诸多互联网公司都在布局AIGC应用,进而向英伟达提供了高达50亿美元的订单。而受限于产能,最早交货时间也要等到今年年底,甚至许多订单排期到了2024年。这样一来,英伟达的高端GPU也出现了供不应求的情况,最顶级的H100显卡售价超过了25万元,而且是期货。

1695864388500.png

一卡难求成为了市场的真实写照,却也体现再次体现出了场景差异化的价值。其实早在多年前,计算力就是生产力”的观点就被提出了“,而现在回头看看,这句话似乎有一些“先知”的意味,尤其是在智能化应用的发展之后,除了AIGC的大规模应用之外,包括自动驾驶、智能制造乃至云计算、物联网等多个应用场景下也需要有差异化的算力支撑。正如浪潮计算机服务器产品部副总经理张磊所说:“我们对算力的需求,也从之前单一的通用计算,转变为包括关键计算、专用计算甚至、加速计算在内的多种模态”。

浪潮计算机为客户提供异构多元化算力

既然计算力就是生产力,那么在浪潮看来,后续生产力的大幅提升背后也必须要有计算力的大力支持。为此浪潮计算机也专注于打造计算力的底座,无论是“通用的服务器、边缘服务器,甚至还有存储和网络,我们也是都有非常多的场景,在国内也是遥遥领先的”。

在许多人看来,浪潮计算机只是一家整机集成商和解决方案提供商,但其实凭借多年在行业的深耕,浪潮计算机已经能够提供从底层基础设施到操作系统与云服务,再到软件应用的一整套解决方案。用张磊的话说,从下游到上游,浪潮更多起到了链接的作用:“我们还是聚焦在客户需求,以满足客户需求为最终目标,包括对产品的细化,对下游合作伙伴产品发展的指导作用”。

这也是浪潮计算机着力打造的“创新技术先行者与实践者”。放眼整个市场,无论是传统冯诺依曼架构瓶颈,还是国际竞争加剧,抑或是海量数据的爆发更强调了I/O、算力、网络等价值,这些变化都让算力成为当下产业界的主旋律,而浪潮计算机要实现的多元异构计算,也为解决这些行业难题提供了新的手段,更成为了大势所趋。

如今,越来越多的场景开始引入CPU、DSP、GPU、ASIC、FPGA等多种不同计算单元来进行加速计算,而我们提到的AIGC就是借助于异构计算大幅提升计算效率,充分发挥GPU在通用计算上的灵活性,提供高性能的计算能力。随着视频、音频等应用的多元化,算力的多元化已经是大势所趋,并将随着应用的普及而长期存在。

“浪潮计算机 在多元计算不聚焦于单一路线”,浪潮计算机研发部总经理李岩介绍说。在他看来,无论是主流的x86还是异军突起的ARM,甚至还有许多人关注的RISC-V、Power乃至于其他架构,浪潮计算机都已经或准备进行布局。“浪潮计算机就是要为数据找到它合适的计算模型,推广它往下走。我认为聚焦在一个模型,最终一定是局限的,最终还是只能解决一个方面的问题,但是在整个业务发展过程中是解决不了所有问题的”。

俗话说,“一把钥匙开一把锁”,在计算领域,一套架构也更擅长于某个类型的应用。一直以来,在通用计算中大众习惯了x86架构,但是在移动端、边缘侧更多人会选择ARM平台,甚至包括GPU、TPU、DPU等许多解决方案也受到用户的青睐。究其原因,就是不同场景下客户的需求不同,传统的高精度浮点运算需要CPU的支撑,但是在智能时代,单精度甚至半精度算力需求的场景下,就需要与之适配的算力平台,这也是多元算力出现的直接因素。

对于,浪潮计算机也有自己的判断。在谈到如何适配多元化算力发展的时候,李岩认为:“现在是一个数据爆发的时代,现有的算力基本上也是多元化的一个时代——哪一种算力架构能够匹配你现有的数据模型,我觉得可能是在多元计算应该是一个长期并行的情况”。

高门槛强适配,浪潮计算机如何打造多元生态

为此,浪潮计算机也研发出了整机柜解决方案。但是不同于业界传统的单一计算或者存储节点,这套解决方案中采用了多元算力、多元架构的耦合方式,也就是说在同一套整机柜当中不仅有计算节点,也包括了存储、加速乃至其他设备。换句话说,浪潮计算机实现了“机柜与节点解耦”,你也可以将其理解为一套池化的模型,而这一模型可以切实解决客户的实际问题,通过统一化的资源管理帮助客户实现本地化的管理,这样相比云端应用来说在效率、灵活性上都有了提升。

事实上,对于用户来说只在意使用了多少的算力,至于算力的底层平台是什么,许多用户并不关心。浪潮计算机实现了底层算力等多元化生态的兼容,无论是硬件、软件还是操作系统,都在努力提供支撑,这样用户只要通过资源调度就能实现上层应用,至于使用的是什么架构、什么品牌的处理器,这并不是核心问题。

1695864405919.png

为了实现高效的资源调度,浪潮计算机在整机柜层面建立了统一的接口标准去管理不同异构的算力资源,实现了异构算力和相关的存储和网络等资源的统一纳管——它能够进行不同平台、不同技术路线算力资源的应用部署、资源调度、策略设定、安全管理,可实时监控各算力单元的运行状况、使用情况等多指标项,并提供定期巡查、智能监控告警和故障自动报修,掌握和处理突发情况,帮助用户实现不同平台、不同技术路线算力资源的无感迁移,屏蔽异构差异,提升资源利用率,降低运维成本。

更值得关注的就是绿色节能,这也是当下整个产业都在讨论的话题。就浪潮计算机来说,低碳可以从IT和供电两个层面来解决。所谓IT层面,就是针对IT基础设施,浪潮计算机也提供了当下热门的液冷技术解决方案。当然面对整机柜多元化的设备,冷板式液冷是性价比更好的选择,如何通过混合散热实现低碳节能也是浪潮关注的话题。

而另一种节能则要从供电层面努力,为此浪潮计算机创新技术整机柜服务器采用的是集中供电模式,支持N+N或N+2冗余80Plus钛金电源,48V输出通过Busbar给整机柜供电,满足多节点供电需求的同时,均衡负载输出;结合动态PSU节能调节技术,整个设备满负载时电源工作在50%负载效率点;相比分布式供电模式,浪潮整机柜服务器综合能耗最大降低4.6%,对于千台机柜规模的数据中心,每年最多节能250万千瓦时,降低数据中心运营成本。

由此看来,多元算力平台的构建是一项巨量工程,其中要跨越众多的技术门槛、实现产业配套,也是打通从芯片到应用之间鸿沟、高效释放多元芯片算力的关键。目前浪潮计算机所实现的,是为客户提供了一套行之有效的、高性价比的解决方案,一方面可以通过整机柜的形态解决数据中心密度、效率、散热等难题,另一方面也满足了不同用户对于多元异构算力的需求,整机柜形态可以让用户更好的“组合”适合自身业务的产品,真正做到按需服务,有的放矢。

以往我们谈到算力,总会聚焦于产品本身,聚焦于何种架构、何种配置,但是浪潮计算机提供了全新的思路,结合用户的应用场景提供多元化、差异化的异构算力解决方案,这或许也能开启属于算力时代的新蓝海。

推荐阅读
关注数
1932
内容数
249
专注开放计算、大数据应用、人工智能、企业数字化转型、云计算等领域产业观察及产学研合作。
目录
极术微信服务号
关注极术微信号
实时接收点赞提醒和评论通知
安谋科技学堂公众号
关注安谋科技学堂
实时获取安谋科技及 Arm 教学资源
安谋科技招聘公众号
关注安谋科技招聘
实时获取安谋科技中国职位信息