申耀的科技观察 · 2023年06月25日 · 山东

新华三:数据中心可组合架构创新,提供多元算力的“最优解”

今天,以ChatGPT为代表的AIGC大模型,已经在国内形成了“海啸效应”,几乎所有的科技公司都在想方设法进入大模型的赛道。背后的核心驱动力,就在于大模型的最大价值在于普遍提升个人生产力,而各行各业的公司都在积极寻找应用大模型和生成式AI的机会,则是希望能够更好地提升全员生产力。

其实,AIGC仅仅只是日新月异的新技术发展趋势中最火热的一种,进入2023年以来,整个技术创新领域发生了很多的变化,如整个世界正在加速数字化和智能化,而数字世界的底层,则是庞大且不断产生、汇集、运算的数据;而云作为百行百业最为重要的数字化“底座”,也成为了今天数据最有力的承载平台;此外,随着产业数字化转型的加速,绿色发展,数实融合也成为业界十分关注的话题。

那么,这些新的数字技术究竟有何新的演进趋势?日前,紫光股份旗下新华三集团正式对外发布《以远见,见未见——新华三2023十大技术趋势白皮书》(以下简称“白皮书”),就对未来十大技术趋势做了前瞻技术预测和深度行业洞察,通过《白皮书》也可以发现,技术创新与产业应用融合已成为科技变革的“主旋律”,同时数字经济和实体经济也在加速深度融合的步伐,一个由数字技术驱动的未来社会图景更是已“徐徐展开”。

正如新华三集团副总裁、技术战略部总裁刘新民所言:“任何技术趋势预测,都是当下需求的延伸,既是前一阶段科技积累的聚沙成塔,也是后一阶段科技创新的指路牌。”

技术创新演进方向

事实上,这是新华三集团连续第四年发布十大技术趋势预测,从过去四年的技术趋势预测中,可以看到目前整个科技行业正进入技术代际的变化周期,特别是新技术的快速发展更导致了整个软硬件基础设施出现了重大的变化,主要体现以下几个方面:

一是,计算架构迈入新发展阶段,伴随着芯片技术的飞速发展,整个计算架构正发生着“翻天覆地”的变化。目前芯片正从单一的CPU发展到了包括GPU、DPU和IPU在内的多样化形态(2021年),同时计算架构也逐步演变为灵活且可组合的模式(2023年),此外量子计算也正探索大规模商业化的可能性 (2023年),这些新的变化都将推动计算架构迎来新的发展阶段。

二是,AI技术经过了多轮迭代和落地实践,技术通用性得到全面增强。这其中以2022年底ChatGPT的“横空出世”为代表,大模型带来的人机交互能力全面提升,使得距离通用人工智能更近了一步,相信人工智能也将在未来几年继续朝着通用化、 标准化、普惠化的方向演进。

三是,万物互联迈入到万物智联,网络技术的不断迭代升级,从管道到智能,人们的体验感也在不断升级。特别是这几年5G的商用,硅光的融合,全域超宽突破通信时空限制以及确定性网络也正成为市场的刚需,未来整个网络也将以升级用户体验为目标,从过去满足“能用”层面升级到“好用”层面,推动整个社会迈入万物智联的新时代。

四是,数据价值正在加速释放。数据的重要性不言而喻。特别是过去几年随着大数据技术、数据孪生以及隐私计算的出现,整个数据总量、数据维度和数据质量也正不断提升,数据的价值更呈现出了“指数级”增加,相信随着数据融合的发展,未来数据的价值将得到全面释放,并进一步促进数据经济高速高质量发展。

五是,视听感受逐渐升级为全感体验,最近几年数字孪生,扩展现实和元宇宙,以及脑机接口等技术的进一步发展,同样也让计算机和人类在感官和情绪交互成功可能,未来的技术发展也将会让人们从视听感受逐渐升级为全感体验。

回头来看,早在20多年前,尼古拉斯·尼葛洛庞帝就在《数字化生存》一书中预言到:数字化生存是现代社会中以新技术为基础的新的生存方式。在数字化生存环境中,人们的生产方式、生活方式、交往方式、思维方式、行为方式都呈现出全新的面貌。

而随着数字经济的蓬勃发展,尼葛洛庞帝的预言其实早已被逐个验证。今天新技术带来的数字化和智能化可以说正全方位影响着经济、文化、社会、环境等方方面面。同时向数字化和智能化转型也成为了目前整个业界共识度最高、确定性最高的趋势,而背后的关键,正是这些新技术的不断演进,由此真正驱动了整个社会的生产力从“量变到质变”,同时其也变成了整个经济发展的核心引擎。

多元算力破解之道

在此过程中,由AIGC所带来的算力需求的挑战更成为了当下业内关注的焦点。不仅如此,随着“新基建”的提速以及“东数西算”工程的启动,如今无论是产业变革还是技术迭代都在以惊人的速度向前演进,同样也对算力提出了更高的要求,我们可以从几个维度来做观察:

一方面,AICG背后的大模型的兴起催生了更大的算力需求,如训练大模型首先就需要大规模算力资源做支撑;同时大型训练对显存以及数据集缓存要求同样很高,训练过程中还会面临显存墙问题(模型是否能跑起来)以及计算/通信墙问题(能否在合理时间内完成训练);此外,大模型的训练同样对网络也提出了更高的要求,即需高性能网络满足节点间参数同步,且GPU服务器节点间需要高速网络来实现模型训练参数交换和存取等。

另一方面,随着各种新业务的出现,目前传统数据中心在面对各种业务应用创新时,往往需要不同的算力支撑。因此,如何通过异构的方式提升服务器的系统级性能,用异构的算力资源应对不同的计算需求,已成为业内的共同课题,更倒逼着整个算力体系和计算架构也要随之进化与演进。

在此背景下,数据中心可组合架构的出现应该说为应对多元算力的需求提供了“破解之道”。根据《白皮书》中的定义,数据中心可组合架构是下一代IT基础设施解决方案,它由解耦的CPU池、内存池、存储池和GPU加速器池等硬件资源组成,并通过高速低时延网络和新一代互联总线协议相互连接,根据特定工作负载需求,这些资源可以按需“组合”,灵活地创建适应不同需求的物理系统。

数据中心可组合架构的优势主要体现在,各类计算任务如人工智能(AI)、机器学习(ML)和高性能计算(HPC),可在虚拟逻辑服务器上运行,该服务器由多种异构资源池(如CPU、内存、GPU和存储)构成。由于数据和模型参数的爆炸式增长,应用程序对内存、存储容量和带宽的需求不断提高,为了满足这些需求,可组合架构系统能够通过自定义,根据应用程序对计算、存储和加速的需求实现精确的资源匹配,从而实现灵活分配硬件资源。更为重要的是,数据中心可组合架构由于实现了资源的按需随时调配,避免硬件资源浪费,大幅提高了数据中心的资源利用率,充分释放数据中心的多元算力,将为客户真正降低TCO成本。

不仅如此,数据中心可组合架构除了上述显著优势外,还具有更高的可靠性、更快的响应速度以及更强的可伸缩性。其中,可靠性方面,它能够实现计算资源与数据存储资源的分离,实现资源池化和负载均衡,从而对数据进行更有效的管理和保护;响应速度方面,其也具有更快的响应速度,通过可组合模块化架构,企业能够迅速地部署、管理和维护数据中心,同时轻松实现应用程序的更新与升级;最后,数据中心可组合架构具有更高的可伸缩性,通过灵活地管理计算和存储资源,企业可以根据需求变化快速调整数据中心规模,从而提升企业的数据处理能力和服务质量。

作为数字化解决方案领导者,新华三集团也在数据中心可组合架构方面进行了大胆的探索与创新,在日前举办的2023 NAVIGATE领航者峰会期间,就通过异构“xPU”的高效组合、先进计算架构、异构多元算力资源的统一管理和智能调度三方面的进化,打造更符合智能时代所需的多元算力平台。

其中,最新发布的H3C UniServer G6 系列服务器,就实现通用算力53%提升,AI算力3倍提升以及数据分析性能3倍提升。同时,为了更好地调度和管理算力,新华三集团推出了全新一代智算解决方案,包括傲飞算力平台、计算、存储、网络、能耗管理等关键部件。傲飞算力平台支持异构计算资源统一管理、多元算力资源智能调度。网络联接部分,同时支持400G RoCE和400G IB 两种组网,其中新华三400G RoCE解决方案经实际部署和第三方Benchmark测试,性能可与IB 媲美,进而支持高效率的AIGC计算的连接。

此外,智算解决方案还支持8000节点的AI集群的调度能力,60万IOPS的分布式存储能力,匹配高性能并行数据处理的特殊需求;而在能源管理方面,也集成了液冷解决方案,以应对大规模智算和高性能计算的能耗挑战,以最优的TCO提供多元算力的“最优解”。可以预期的是,随着新华三集团在数据中心可组合架构的不断探索与创新,未来将会使计算更紧密地与数据相结合,实现多元算力的高效释放。

技术与业务深度融合

除了数据中心可组合架构之外,本次《白皮书》中也指出,未来量子信息技术、高品质服务化网络、能源系统数字化、云与行业应用深度融合、算网增强的隐私计算、AI技术通用能力、云原生安全架构、虚实融合技术、全栈可观测性都是未来值得关注的技术发展新趋势。

以高品质服务化网络为例,其指的是能够提供广泛的连接、端到端的质量保障、最优化的算力调度、智能化的网络调度和服务运营,从满足基础服务的“能用 ”纬度,升级为以应用为中心的升维体验,而这种体验包括业务可视化无感抖动 、成本最低 、个性化服务等“好用”纬度,能大幅提升用户体验,以满足数字经济时代各种场景的服务需求。

在2023 NAVIGATE领航者峰会上,新华三集团推出了包括全球首款单芯片51.2T CPO硅光交换机、标准交换机、DDC交换机在内的全新一代数据中心交换机,支持全系列800G以太网接口和无损网络RoCE解决方案;全光解决方案旗舰S7500X-G+50G-PON以及5GtoB确定性网络解决方案,都是其在打造高品质服务化网络方面取得了最新进展。

再如,AI技术的通用化能力方面,未来人工智能作为一项通用性技术的能力逐渐显现,具备通用化、标准化、普惠化的属性,而其逐渐与各领域技术进行深度融合,也推动各个专业领域的创新突破。在这方面新华三集团也走在了市场的前沿,最新发布的“百业灵犀”LinSeer私域大模型,既支持“百业灵犀+新华三ICT基础架构”模式,还提供“客户自选大模型+新华三ICT基础架构”模式,为百行百业的AIGC提供强大算力保障。在此基础上,最新发布的新华三集团绿洲平台3.0,也正加速AI创新,在更深层次上帮助客户释放数据价值。

除此之外,全栈可观测性也是十分值得关注的新技术趋势。背后的重要原因是,随着企业数字化转型的深化,IT系统变得越来越复杂,存在系统庞大、组件多、应用多、接口多、数据多等诸多问题,对企业的运营运维提出了挑战,而系统全栈可观测性是指通过对系统从基础设施、云、安全、应用性能、用户体验、业务影响的端到端状态的全栈监控,对监控数据的关联分析,快速得出对业务有帮助的决策,以提升IT效率、优化企业业务。

在本届领航者峰会上,新华三集团发布的U-Center 5.0就实现了统一门户、统一告警、统一资源、统一流程、统一分析的“五个统一”,给行业用户交付“一张作战图、一个遥控器”,解决复杂多变的运维难题,让创新更有效率。同时,新华三集团还发布了全新一代的操作系统全景图,在原有的Comware网络操作系统基础上,发布磐宁(NingOS)主机操作系统、MegaOS终端操作系统,就此打通云、网、端的操作系统布局,实现了一致性的体验和端到端的解决方案能力,可以说在“全栈可观测性”方面率先给业界“打了个样”。

从《白皮书》发布的十大技术趋势中,其实可以看到一个很清晰的方向,那就是数字化和智能化已经成为了当下中国产业升级和企业数字化转型中的新动能和驱动力,特别是新技术和业务的深度融合发展,更为百行百业的智能化转型和升级创造出更多具有想象空间的新业态、新服务和新模式。

对此,刘新民也表示,技术创新和社会进步带来未来图景构想,图景构想的具体需求又带来对应的技术缺口,牵引着百行百业尤其是ICT产业投入其中,而新华三未来也将始终坚持以“云智原生”战略为引领,依托“数字大脑”全栈实力,秉承“精耕务实,为时代赋智慧”的理念,以技术实力赋能百行百业的关键业务场景智能化升级,为客户提供“全栈式”的数智创新。

总的来看,新技术的不断迭代和进化,其影响无疑都会远远超过技术本身,不但会影响商业模式和人的思维模式,也将会引发了一系列新的商业创新革命,最终推动中国数字经济迈入高质量发展新阶段。在此过程中,新华三集团不仅前瞻性地保持着对新技术的深入洞察,更以“以行践言”的方式推动技术的落地,并和业务深度融合,不仅筑牢了百行百业数智化转型的关键底座,同时也成为了驱动中国数字经济高质量发展的重要力量,其价值也可谓“不止于现在,更关乎未来。”

推荐阅读
关注数
2395
内容数
428
专注产业互联网、企业数字化、渠道生态以及汽车科技的 观察和思考。
目录
极术微信服务号
关注极术微信号
实时接收点赞提醒和评论通知
安谋科技学堂公众号
关注安谋科技学堂
实时获取安谋科技及 Arm 教学资源
安谋科技招聘公众号
关注安谋科技招聘
实时获取安谋科技中国职位信息