昇腾生态:构建长稳可靠算力底座,加速行业智能化“走深向实”

今年年初,DeepSeek的“横空出世“成为人工智能发展历程中的一座重要里程碑,这一技术突破如同一颗投入行业深潭的“重磅炸弹”,激起的涟漪正推动着AI产业范式发生结构性变革——从过去单纯追求模型参数规模的“军备竞赛”,加速迈向以实体经济需求为导向的价值创造新阶段。

DeepSeek的核心创新亮点,无疑在于其开创性的“集群式”MoE(混合专家)架构,该架构在模型结构、训练范式以及强化学习算法等多个关键维度均做了大量创新。其中,“集群式”MoE 堪称其最具标志性的创新成果,它深刻融入了中国哲学所蕴含的东方智慧,这也正是“中国 AI 不能永远跟随”这一理念的核心体现。

反观以 OpenAI 为代表的 MoE 模型,它们走的却是“精英路线”,即模型中的每个 MoE 专家都拥有庞大的参数量,但专家数量相对较少,如GPT-4 的每个专家参数量高达110B,而整个模型仅配备 16 个专家,这种设计理念与西方“个人英雄主义”哲学可谓高度契合。

与之形成鲜明对比的是,中国哲学所倡导的东方智慧,更注重“集体主义、天下大同”理念,而 DeepSeek 的“集群式”MoE 架构,正是这一东方智慧在 AI 领域的鲜活实践。以 DeepSeekV3/R1 为例,该模型集成了256个 MoE 专家,每个专家的参数量仅约2.3B,但通过多个“小专家”的组合与集群协作让DeepSeek 同样达到了世界顶尖水平,这一实践也充分说明,在单体技术竞争异常激烈的当下,中国完全能够凭借集群化、组织化的创新模式,开辟出一条具有中国 AI 特色的发展路径。

基于这样的行业趋势与创新实践,华为也积极行动,以算力基础设施为基石,以昇腾AI生态为纽带,构建了开放协同的技术创新体系,打造了适配不同场景的AI大模型底座。这一举措大幅缩短了行业客户从技术认知到应用落地的转化周期,更通过持续迭代的技术解决方案,加速了大模型技术向产业核心价值环节的渗透进程。

正如华为昇腾计算首席架构师赵英俊,在日前举办的华为中国行2025·广东新质生产力创新峰会上所言:“华为致力于打造长稳可靠的算力底座,赋能中国AI持续创新,并加速行业智能化转型走深向实。”

华为昇腾计算首席架构师赵英俊

01.

昇腾生态进化,

加速行业智能化升级进程

过去两年时间中,AI领域经历了从ChatGPT大火到DeepSeek“现象级”惊艳登场的变化,这场技术嬗变不仅仅体现在软件和大模型层面的技术演进上,更深刻地反映在硬件与算力基础设施生态的变革上。当前,大模型发展正步入“技术摸高+工程创新”并行的新阶段,由此也大大推动了算力需求的持续增长。

所谓“技术摸高”,是指行业内的头部玩家坚定不移地投入预训练基础模型的创新研发,不断丰富模型组合,全力追逐“Scaling Law”(规模定律),以加速通用人工智能(AGI)的探索进程;而“工程创新”则侧重于通过范式革新,降低模型后训练与知识蒸馏的技术门槛,这种技术普惠化的趋势,催生出了算力“平权”现象,进而形成了“百模千态”的繁荣生态格局。

最为典型代表就是DeepSeek团队,其通过系统级工程创新,研发出兼具成本优势与性能表现的模型蒸馏/微调方案,就显著降低大模型部署门槛,促进了大模型应用的普及,并推动AI技术加速渗透至千行百业。

可以看到,DeepSeek技术范式的突破,加速推动了大模型向生产力工具的蜕变。一方面,DeepSeek催生的模型轻量化技术,显著降低推理部署门槛;另一方面,市场上也涌现出了越来越多“开箱即用”的AI一体机,也进一步加速了大模型在千行百业的落地。

在此背景下,昇腾生态也持续进化,在过去两年时间内构建起了覆盖全场景的大模型推理引擎与开发框架,还率先在业界完成了DeepSeek核心算法适配,“0Day”支持DeepSeek V3/R1,由此打造出了适合不同场景的AI大模型底座,满足了不同行业对的DeepSeek需求。

具体而言,昇腾推出了针对不同客户对易运维、易部署、可扩容等方面的诉求,打造出了极易运维、极简部署、弹性扩容的DeepSeek算力底座解决方案,并支持各版本DeepSeek模型的推理、微调、强化学习方案部署。与此同时,昇腾还积极携手合作伙伴,目前已有19+家合作伙伴基于昇腾平台,针对金融、电力、交通、政务等垂直行业,结合DeepSeek不同模型版本推出了定制化AI一体机。

对此,赵英俊说:“这恰是华为的核心价值主张,通过提供坚实的算力底座与开放的软件平台,能够让合作伙伴与客户能够基于华为的软硬件打造行业场景的解决方案,最终实现AI技术对实体经济的深度赋能,并加速行业智能化升级进程。”

02.

持续技术创新,

降低大模型应用落地门槛

毫无疑问,当DeepSeek的开源生态与昇腾的硬件优化深度结合,为中国企业在算力受限情况下,开辟出一条“低成本、高性价比”的AI普惠之路。那么,昇腾为何能够成为DeepSeek快速落地的“最优解”呢?其核心在于昇腾持续突破的集群推理技术创新体系。

首先,针对行业级大规模推理场景,昇腾推出革命性的大EP集群推理方案,实现了系统的高吞吐低延时并存,加速助力各行各业大模型应用落地。

该方案的核心在于,将专家分布到更多卡上,由此降低单卡权重加载延时,实现了更低的解码延时,同时在单卡预留更多内存容量支持更大并发,实现单卡性能提升3倍,进一步提升系统吞吐性能。以DeepSeek “满血版“,即16机128卡大EP推理方案为例,如果用的卡数量越多,每张卡需要处理的数据量越少,占用内存就会降低,从而每张卡能同时处理的任务量(并发)会更大,从而实现整体吞吐量质的飞跃。

其次,昇腾大EP集群推理方案,实现了从算子到推理系统的全面创新,打造了集群推理的极致体验。

其中,针对并行优化,昇腾采用多层次专家动态均衡,亲和部署,资源利用率提升20%,通过自动寻优、自动配比、自动预测、自动降解四大关键技术,实现了备份节点和副本专家的“可扩展、高可用和极致均衡”。可扩展指的是路由专家与共享专家隔离部署,实现更大的灵活性;高可用,是能够支持定时迁移和动态迁移;而极致均衡,主要体现在支持专家热度在线感知和热度预测,还支持专家间、卡间以及机间的负载均衡。

此外,多举措通信优化,使系统性能大幅提升。其中,Prefill micro-batch双流并行,在Prefill阶段,通过拆分Batch成两组更细粒度的Batch,实现计算和通信相互掩盖;而Weight预取双流并行,实现了通信和权重加载,访存和通信并行,该技术利用利用L2 Cache大容量,通信和权重加载采用两条Stream并行,降低权重加载时间,提升matmul算子性能。

最后,从软硬件到推理服务,进行全链路可靠性设计,为行业客户提供极致稳定的推理解决方案。

硬件可靠方面,采用电信级器件选型、全链路压测验证、系统级散热优化,实现设备更稳定;软件可靠方面,通过故障自愈、备份升级、N+1热备份等,实现系统更韧性;故障后快速检测、快速恢复、多数情况下无需人工干涉,助力系统稳定运行。

在此基础上,昇腾大EP集群推理方案,还通过多档典型配置支撑不同场景的需求。如轻量级部署方案,可通过8-10台服务器组成64+8卡组网,满足单一行业场景/边缘计算需求,实现性价比最优解;企业级部署方案,则可通过16-20台服务器构建128卡集群,适配大型企业/行业推理服务,提供高性能计算底座;而面向超大规模部署方案,则通过双层组网架构实现万卡级集群部署,其已验证可稳定承载日均数亿级访问流量,能够支撑复杂业务流及应用系统。这种丰富和多元化的配置方案,让大模型推理系统既能像“经济型轿车”般灵活部署,又能如“货运重卡”般承载超大规模负载,真正实现“按需配置、弹性扩展”。

由此可见,昇腾之所以能够成为DeepSeek快速落地的“最优解”,关键的支撑在于昇腾大EP集群推理方案,这犹如为大模型应用装上了一台“涡轮增压”引擎,不仅可以完美匹配DeepSeek的技术特性,也从根本上解决了大模型产业落地的“最后一公里”难题,重新定义了大规模推理技术的算力经济性。

03.

长稳可靠算力底座,

赋能中国AI持续创新

客观地说,在全球AI竞争升维为国家战略、关乎人类未来的关键时刻,构建长稳可靠算力底座,已成为关乎国运的核心命题。面对这一时代命题,昇腾生态也正着力构建“三位一体”的技术创新体系,通过系统性突破重塑AI发展新范式,为中国AI产业发展持续提供新动能。

第一,在技术创新维度,当前大模型发展已突破单纯参数规模扩张的路径依赖,转向涵盖模型架构设计、训练方法论、推理部署的全流程工程化创新,而昇腾生态也将通过持续的技术攻坚与工程实践,建立覆盖AI全生命周期的优化体系,实现从实验室技术到商业价值的精准转化。这种转化不仅体现在算法效率的提升,更在于构建可复用的工程方法论,推动AI技术产业化进程。

第二,在平台赋能维度,昇腾生态致力于构建普惠的AI创新平台,让更多玩家具备能力构筑更高性能的模型。为此,昇腾生态将降低对先进算力依赖,在同等算力规模下实现训练效能的跨越式提升,加速基础模型与行业模型的迭代创新;同时创新数据利用范式,运用强化学习等前沿技术,在同等数据规模条件下实现模型能力的指数级提升,显著降低AI创新对原始标注数据的依赖门槛。

三是,在产业使能维度,目前头部玩家已形成思维转变,即从单点算力性能竞赛转向追求算力底座的稳定性、可靠性与能效比,而昇腾生态也将持续打造长稳可靠的算力平台,通过构建稳定高效的算力平台,让行业客户可以更好聚焦模型工程优化,降低试错成本,加速商业创新。

赵英俊最后表示:“华为坚信唯有构建长稳可靠的算力底座,才能为中国AI创新注入持续动能。面向未来,华为也将持续投入根技术创新,与产业伙伴和行业客户共建开放协同的昇腾AI生态,共同迎接AGI时代的到来。”

总的来说,当下的中国AI产业正谱写着智能时代的创新史诗。这场变革不仅关乎技术路线的选择,更是对产业发展逻辑的深刻重构。从昇腾在技术创新与生态开放协同上的一系列举措中,我们也可以清晰地看到,通过构建长稳可靠的算力底座,昇腾生态不仅实现了AI算力效能与经济效益的最优平衡,更以开放协同的生态理念推动了AI大模型技术的普惠化进程,加速了AI走向千行百业,真正书写了中国科技力量在智能时代中的新答卷。

推荐阅读
关注数
2399
内容数
458
专注产业互联网、企业数字化、渠道生态以及汽车科技的 观察和思考。
目录
极术微信服务号
关注极术微信号
实时接收点赞提醒和评论通知
安谋科技学堂公众号
关注安谋科技学堂
实时获取安谋科技及 Arm 教学资源
安谋科技招聘公众号
关注安谋科技招聘
实时获取安谋科技中国职位信息