申耀的科技观察 · 2023年08月23日 · 山东

打造以AI为导向的基础设施,联想锚定AI算力“主航道”

毫无疑问,人工智能对人类社会来说并不是一项简单的技术革命,它象征着一个时代的到来,如同工业时代之于农业时代一样,会带来天翻地覆的变革,影响人类社会百年、甚至千年的进程。

而AI算力对于推动人工智能应用的重要性毋庸置疑,特别是随着今年整个生成式AI市场的爆发,更带来了对AI算力的巨大需求,为确保人工智能应用的进一步快速发展,AI算力可以说已成为其中至关重要的因素。

在此背景下,在8月18日举办的2023中国算力(基础设施)大会上,联想顺应当下AI算力的需求,正式发布联想AI算力战略,从“AI赋智 绿色赋能”两大特征出发,全面打造以AI为导向的基础设施,同时以联想服务器双品牌完善联想智能基础设施的全面布局,以此促进未来“普慧”算力的落地。

可以看到,目前智能化已成为当下中国产业升级和企业数智化转型中的新动能和驱动力,尤其是由于线上线下生态及场景远比其他国家丰富、多元,中国经济结构性的差异,以及细分行业中不同的应用场景需求,都给了基于AI等新技术的创新以巨大的想象力,而联想本次提出打造以AI为导向的基础设施,促进未来“普慧”算力的落地,不仅可以帮助中国企业解决人工智能应用落地过程中遇到的AI算力需求问题,同时也能够进一步加速AI“走深向实”,更好地推动中国数字经济走向高质量发展。

AI算力进化的两大新趋势

当下,算力就是生产力已成为整个业界的共识,特别是算力作为数字经济时代的关键生产力要素,更成为了挖掘数据要素价值,推动数字经济发展的核心支撑,加上今年生成式AI应用的问世,更推动了AI算力需求呈“指数级”攀升。

2018年以来,随着Transformer大模型的推出以后,算力已经不是像过去一样,每18-20个月翻一倍,也不是在深度学习时候,每6个月翻一倍,而是现在每年数百倍的增长。根据IDC的报告显示,AI算力已成为中国算力发展的主要方向,2022年规模达268百亿亿次/秒(EFLOPS),同时未来几年的复合增长率高达52.3%。

在联想集团副总裁、联想中国区基础设施业务群服务器事业部总经理陈振宽看来,随着生成式AI的爆发式增长,也让中国算力行业迎来了新算力时代——智算时代的到来,而智算相比过去的通用计算,则出现了两大新的进化趋势,具体体现在:

一方面,和通用算力需求不同,AI算力基础设施需要依据AI数据和算法的特性而设计和优化。背后的原因在于,AI算力与通用算力存在明显的差异,从千万级的参数量到千亿级的参数量,从深度学习需要中等规模的训练和推理到现在要全面地去实现超大规模的训练,也正因此AI算力需要依据AI数据和算法的特性设计和优化,同样AI算力基础设施层面也需要根据特性“与时俱进”的进行针对性的优化。

另一方面,在国家大力发展绿色低碳的大背景下,同样也对AI算力提出了新的挑战,而其中液冷是赋能绿色算力发展的关键技术。确实如此,数据中心走向绿色低碳和可持续发展已成为“不可逆”的大趋势,特别是随着全国一体化大数据中心、新型数据中心等政策文件的出台、“东数西算”工程的正式启动,数据中心的建设规模和数量呈现出快速的增长态势,这也意味着数据中心行业所面临的“双碳”任务更加艰巨与紧迫,同样也对算力产品的“节能减排”提出了更高的要求。

基于这样的市场变化,联想提出了AI算力战略的两大特征,即“AI赋智 绿色赋能”。其中,“AI赋智”指的是让100%算力基础设施产品支持AI,50%基础设施研发投入在AI领域,全面AI技术覆盖全域AI应用。而经过几年前瞻布局智能化变革,联想目前已实现对AI大模型、超大模型训练,到AI模型训练推理的能力支撑,参数规模从千万级到千亿级。与此同时,联想已推出60多款支持人工智能应用的基础设施产品,包括服务器、存储等等。

而“绿色赋能”指的是联想将全面布局和引领液冷技术,打造液冷集群方案“灯塔”,以绿色算力基础设施助推智算产业可持续发展。据了解,目前联想的液冷技术覆盖了风液冷混合、全液冷、整机柜液冷、单相浸没式液冷主流液冷技术。与此同时,联想还在持续研发和引领未来液冷技术,解决未来千瓦级芯片散热难题,提高内存液冷覆盖效率,探索能效极致。

应该说,联想“AI赋智 绿色赋能”理念的提出可谓“正当其时”。从“AI赋智”维度看,在产业智能化的大趋势下,AI应用领域的多样化,市场规模的不断扩大,已对AI算力产生了巨大需求,而联想通过对AI算力的持续投入,打造以AI为导向的算力基础设施,可以说能够加速人工智能在千行百业的落地,从而推动各行业乃至整个社会的智能化变革进程;从“绿色赋能”维度看,在绿色低碳已成为未来“确定性”趋势的背景下,联想围绕客户的最迫切需求,在液冷领域以创新的产品和解决方案打造新型的算力基础设施,同样也能够为各行业数字化转型和数字经济发展,提供稳定、可靠的绿色澎湃算力。

在此基础上,联想坚持“普慧算力”的价值主张,希望让算力成为电力一样的公共资源,让人人都可以用上普适和智慧的算力。陈振宽指出,“普慧算力”包含“普适”和“智慧”。“普适”指的是算力能够像水和电一样,可以人人即取即用而不必见——人们随时可以用,但是无需看到它;“智慧”更多是指人人可以随需使用而不必问——人们无需在使用算力前,询问它能否满足要求,需要使用、随需使用就可以。

不难看出,随着生成式AI的爆发,让整个算力产业发展步入了一个全新的阶段,这也倒逼着整个算力技术创新也要随之进化与演进,而联想率先在业界发布全新的AI算力战略,背后离不开联想对AI技术发展的前瞻性洞察,可以说为本次生成式AI的爆发,做足了准备;而基于大量的技术创新和业务实践,更为联想提出“AI赋智 绿色赋能” 的两大战略特征奠定了基础,而这也能够为未来AI算力的持续创新和进化指明方向,并引领整个算力市场迈入全新的智算时代。

更难能可贵的是,联想在此过程中还始终坚持“普慧算力”的价值主张,而这无疑能够加快推动作为数字经济基础设施的AI算力在千百行业中发挥更大的价值,更快地打通AI落地行业的“最后一公里”,不仅能够为生成式AI为代表的超大模型提供关键技术支撑,也能够加速让AI进入行业中各个核心生产环节,更好地赋能千行百业。

联想AI算力的沉淀与释放

值得一提的是,联想在2023中国算力(基础设施)大会上发布的联想问天WA7780 G3 AI大模型训练服务器和联想问天WA5480 G3 AI训推一体服务器,就是联想以AI为导向的基础设施策略中的最新“代表性”产品。

对此,陈振宽表示,两款全新的AI服务器将延续联想问天“本地创新+敏捷高效”的品牌价值主张,传承联想服务器高性能、高可靠、高扩展、低功耗“三高一低”的特性。

其中,联想问天WA7780 G3是一款专为AI大模型训练所打造的服务器。这款服务器为打破AI算力供给困境而来,能够为训练提供强劲的算力支撑。在性能方面,与上一代产品相比,联想问天WA7780 G3 AI大模型训练服务器可为大模型AI训练速度带来高达9倍提升,可将大模型AI推理速度提升高达30倍。

在灵活架构方面,为了满足AI超大模型训练场景下,GPU服务器间高速数据通信的需求,联想问天WA7780 G3 AI大模型训练服务器还支持IB、RoCE等多种对外网络连接方案。最高可以支持8张RDMA高速网卡,提供3.2Tb/s聚合带宽,充分满足了超大模型训练并行计算时,跨节点的通信需求;而在本地存储的设计上,采用了GPU Direct Storage (GDS) 技术。通过GDS技术,GPU与NVMe实现了快速低延迟互联,能够有效提高训练数据载入的速度,提升大模型训练的性能。

在节能高效方面,此产品在设计中采用了三重独立风道设计,针对不同部件的散热特征,进行了系统性的优化,有效降低了由风扇带来的散热功耗。相比同级别产品,联想问天WA7780 G3 AI大模型训练服务器功耗降低约10%。同时,为了满足未来智算中心对PUE值更低的要求,该产品还预留了液冷冷板设计,未来将支持液冷,这将大幅度节省在AI大模型训练过程中,因系统散热带来的额外能耗,PUE值有望低于1.1。

联想问天WA5480 G3 AI训推一体服务器,则是联想问天品牌中的一款4U机架式AI服务器,支持多元算力和丰富生态,能够为AI模型的训练推理提供极致可靠的算力。在多元算力方面,该产品支持多类型、多品牌AI加速卡,可以灵活应用于AI通用模型训练、大模型推理、AI生成、云游戏、科学计算等多种应用场景。

不仅如此,联想问天WA5480 G3 AI训推一体服务器还采用了“灵活多变”的设计理念,其基于不同AI工作负载,能够为企业提供包括直通、Balance、Common多种CPU-GPU互联方式,避免了因为CPU-GPU数据通信方式单一与工作负载不匹配,带来的潜在性能瓶颈和系统效率下降。同时,结合不同种类,不同数量的加速卡选择,能够实现对AI各种复杂场景的完美匹配。

此外,该产品还充分考虑了设计冗余,为AI算力提供了安全稳定的运行环境。支持电源N+N冗余,节点内电源间互为备份,对外可以连接双路市电,保障服务器24小时在线运行。支持CPU、GPU、内存等关键部件的功耗监测,整机功耗封顶调控,动态保障服务器运行在合理的功耗区间,保证性能的稳定,以及风扇N+1冗余等多种安全设计保障高环温无间断运行。

陈振宽强调说:“这两款产品分别应对不同场景和需求,二者的差异可以从应用和战略两个层面来看,应用层面上,联想问天WA7780 G3 AI大模型训练服务器有着极致的算力来支撑超大规模训练;联想问天WA5480 G3 AI训推一体服务器则支持更多元的算力,适合算法的训练和推理,这两款产品将助力联想以全面AI技术,支持AI全域应用。在此基础上,全新的AI服务器也能够与推理服务器、边缘AI设备等配合,进一步完善和丰富联想AI算力基础设施的产品组合阵容。”

根据IDC数据显示,联想集团是2022增长最快的AI硬件基础设施(服务器和存储)提供商,同比增长139%,全球排名第三,这也印证了联想在AI基础设施领域具备强大的实力和能力;而展望未来,联想也将持续推出AI导向算力基础设施的产品组合,加速实现智能算力基础设施的全面布局,同时还将把实现“双碳”目标印刻在产品基因中,在支持国家打造绿色算力的同时降低算力的获得成本。

“普慧”算力落地全新价值

随着联想以AI为导向的算力基础设施产品组合的推出,联想“全栈智能”战略也形成了完整的“闭环”,这对联想推动“普慧”算力的落地,也将起到更大的叠加作用。基于智能化转型战略的前瞻布局,联想目前已打造了AI内嵌的智能终端、AI导向的基础设施和AI原生的方案服务,由此形成全栈智能的产品及方案服务布局。

客观地说,本次联想以AI为导向的算力基础设施产品组合的发布,以及“全栈智能”布局的产品及方案服务的完整展示,不仅能够持续推动中国产业智能化的升级,同时更让AI能够真正“扎根”在千行百业奠定了关键基础,而背后也体现出了三重全新的价值。

第一,是为AI超大模型的训推一体化提供了坚实的技术支撑。随着关键技术与基础理论不断突破,大算力、大数据、大模型将成为未来AI发展的重点发展方向,由此带动自然语言处理、翻译模型、生成算法和数据集等细分要素持续提升,推动产出的内容细节、类型更丰富、质量更高。

而联想打造以AI导向的算力基础设施,充分融合“AI赋智 绿色赋能”的两大战略特征,可以说将切实为AI超大模型训推一体化提供技术支撑。在具体的应用中,也可以看到联想自主研发的海神温水水冷技术将PUE值降低至1.1,散热效率可高达98%。受益于此,上海交通大学“思源一号”液冷集群计算密度达到通用算力中心的5倍,而所需机房面积仅为通用机房的1/10。

第二,是极大的促进了未来AI于各行业的落地与实现。随着生成式AI的大爆发,AI算力需求正持续呈现出“指数级”上升的势头,越来越多的行业均出现了明确的人工智能应用场景,这也导致了AI算力需求高于供给,形成了供给的“缺口”,而唯有通过AI导向的算力基础设施为AI算力提供坚实的支撑,才能更好地解决供需的矛盾。

第三,是加速了AI在行业和产业领域的“走深向实”。数字经济时代,算力作为“底层动力”对经济社会发展的影响广泛且深刻,而联想以AI为导向算力基础设施的产品组合,以及“全栈智能”布局的产品及方案服务,同样也能够加速AI在行业和产业领域的“走深向实”。

事实上,作为中国领先的智能解决方案服务商,联想目前已赋能多个垂直行业和领域,包括智慧城市、智慧园区、智能制造、智慧交通、智慧教育、智慧能源、智慧金融等。

正如陈振宽最后所言:“在未来,联想将以AI导向的基础设施以及‘全栈智能’的优势,助力人工智能在千行百业中的普及和渗透,同时以联想问天品牌本地创新的优势赋能中国本土客户。通过领先的AI技术,覆盖全域应用,加速实现‘普慧’算力,领跑中国智能化变革。”

总的来看,中国产业智能化的转型升级,中国数字经济的落地和发展,任重而道远,而联想以AI为导向算力基础设施产品组合的持续创新,加上“全栈智能”布局的产品及方案服务所构筑的领先优势,相信将能够进一步加速AI“走深向实”,释放智能化生产力的“乘数效应”,在中国千行百业的智能化转型进程中,持续贡献出更好的价值。

推荐阅读
关注数
2395
内容数
428
专注产业互联网、企业数字化、渠道生态以及汽车科技的 观察和思考。
目录
极术微信服务号
关注极术微信号
实时接收点赞提醒和评论通知
安谋科技学堂公众号
关注安谋科技学堂
实时获取安谋科技及 Arm 教学资源
安谋科技招聘公众号
关注安谋科技招聘
实时获取安谋科技中国职位信息