E企研究院 · 6 小时前 · 北京

以RAS理念,实现智算中心基础设施“精细化免疫”

大模型与AI的快速发展与应用,让算力成为了新质生产力的核心引擎,智算中心的建设与运维也就成为了备受关注的焦点。

作为算力承载的关键底座,智算中心正面临着高密化、智能化和低碳化的严峻挑战。如何才能够更好地应对这些挑战?如何设计新的智算中心、如何帮助既有的数据中心和智算中心转型?

到底应该遵循什么样的原则来进行建设与改造,作为智算中心应对挑战的核心抓手?

在10月18日举办的主题为“全链更安全 智算赢未来”的2025华为中国数字能源数据中心碳索峰会·运维论坛上,华为数字能源再次强调了RAS理念(安全可靠、弹性敏捷、绿色低碳),认为数字化、智能化技术是提升AIDC安全和高效运维的必然选择,数据中心将从运维走向运维与运营的并重。

https://www.bilibili.com/vide...

智算中心的新“四座大山”

为实现高性能的算力资源供给和服务,满足大模型、人工智能的应用需求,智算中心的建设正如火如荼,基于智算的服务场景也不断涌现。

根据信通院的报告显示,相关的智算服务涵盖了能源、工业、金融、教育、交通等多个行业,智算成为了推动行业发展的关键驱动力。迅猛发展的算力需求,对智算中心的基础设施建设提出了诸多挑战,包括功率密度飙升、建设周期压缩、能耗与安全等,被称为智算中心建设的新“四座大山”。

更高的安全要求:智算服务器成本激增,高密带来故障响应时间越来越短,有效响应时间从30分钟缩短至30秒;

更快的上线速度:AI竞争驱动业务快速上线18个月→6个月,传统建设方式难以满足要求;

更快的IT演进:芯片演进突破摩尔定律,能源基础设施需要避免建成即落后的窘境;

更多的资源消耗:AI单机柜功率从传统15kW向50kW甚至200kW的跃升,带来能耗急剧增加,能源供需矛盾凸显。

正如华为中国数字能源数据中心能源拓展部部长石忆在此次论坛上所强调的,“安全可靠是数据中心最根本的需求,必须保证它的万无一失,核心是通过技术创新,实现数据中心全生命周期收益最大化、运营风险最小化。”

微信图片_2025-10-31_141013_925.png
华为中国数字能源数据中心能源拓展部部长石忆

而要做到这样的目标,他认为,数据中心的设计思路,需要从“大系统”向“标准化+模块化分布式架构”演变,更弹性应对未来需求的不确定性。

“精细化免疫”减轻压力

对于智算中心而言,保障业务连续性当然是首要任务,为何华为数字能源要强调“设备安全运行优先”?

石忆表示,保障设备安全的终极目标,正是为了确保业务连续性。两者并非对立,而是手段与目的的关系。

就智算中心而言,传统的 “业务连续性优先”设计思路,往往侧重于在系统层级构建冗余(如2N架构),这是一种宏观的、系统级的保护。而华为数字能源引入的“最小故障域”理念,是一种更为精细化、深入内核的“防御纵深”思想。

与 “业务连续性优先”,“设备安全运行优先”体现了从“粗放式冗余”到“精细化免疫”的演进,只有实现“精细化免疫”才能够更好地保障业务的连续性。

传统思路类似于数据中心基于备电系统配备的消防系统,一旦某个房间起火,系统会启动扑灭,但整个大楼的业务可能都会受到波及甚至中断;而华为数字能源的“最小故障域”理念,旨在限定每个房间备电容量,并建立防火隔断和独立的灭火装置,确保火情在发生的瞬间就被控制在最小的单元内,其他所有房间的业务完全不受影响。

因此,石亿强调,华为的“最小故障域”理念,不是改变了保障“业务连续性”的初心,而是用一种更先进、更精密、更具确定性的工程方法,将业务连续性的保障水平提升到了一个的新高度。它使得智算中心的基础设施具备了类似“免疫系统”的能力,能够将局部风险瞬间隔离、自愈,从而让AI业务这颗“数字大脑”能够在一个真正安全、可靠的环境中无忧运行。

以 “RAS理念”解放智算中心

如何才能够“设备安全运行优先”,实现“精细化免疫”?

石亿在接受DT时代采访时表示,华为数字能源正基于RAS理念(安全可靠、弹性敏捷、绿色低碳)高质量建设和改造智算数据中心。

对于全新建设的超大型智算中心,应该采用“前瞻规划,全栈优化”的路径:

安全可靠 (Reliability) :从选址阶段就深度介入,优先布局在绿色能源富集、电网结构坚强的区域。在架构上,采用“最小故障域”理念的分布式系统设计,确保局部维护或故障不影响整体集群运行;

弹性敏捷 (Agility) 的体现:全面采用全预制化、模块化的建设模式。将电力模块、制冷模块(如间接蒸发冷却、液冷集群)等均在工厂预制、测试,现场像搭积木一样快速拼装。这能将传统1-2年的建设周期缩短至6-9个月,极致敏捷地响应业务上线需求;

绿色低碳 (Sustainability) 的追求:从源头设计上就引入最前沿技术,如将液冷与自然冷源结合,目标PUE可降至1.15以下,从全生命周期角度为客户锁定最低的运营成本(OPEX)。

而对于现有数据中心的AI化改造,华为数字能源则建议采用“精准注入,平滑演进”的路径:

事实上,在相关RAS理念的实现方面,华为数字能源具备着众多核心的解决方案,包括智能供电FusionPower、智算微模块FusionModule2000、智能锂电、算电协同等,这才是能够真正实践 “RAS理念”的关键。

先进带来领先

石亿强调,华为数字能源的相关解决方案具备全栈优势,是一个经过深度协同、充分验证、并凝聚了全链条智慧的有机整体,能够为客户提供面向未来、持续卓越的AI算力基石,也因此获得了包括数字政府、能源、教育、金融、智能制造等在内的众多行业客户的青睐。

例如,东莞滨海湾新区通过部署DeepSeek大模型,加快推进AI在政务领域的深度应用。其数据中心采用华为智能微模块6.0,打造弹性部署、快速交付、安全可靠的数字底座,单柜功率最高支持50kW,可以混合部署智算和通算服务器。

此外,赛力斯超级工厂数据中心,采用了华为智能微模块,通过一体化集成,实现7天快速部署,创造数据中心建设高速度,依托43英寸智慧大屏,实现数据中心可视化管理。同时,采用华为UPS5000-H,实现超级高效率的同时,保障高可靠供电。

正是因为华为数字能源先进的产品与解决方案,得到了客户的广泛认可,也因此在市场上获得了领先的地位。根据介绍,截止目前,华为数字能源已经助力全球累计建设超过1000家大型数据中心,智能供电—UPS累计发货容量超过40GW。

这背后的关键,正是华为对数据中心发展趋势的精准洞察,以及与之相对应的RAS理念以及解决方案。正如石亿强调的,华为正以统一的RAS理念为纲,通过场景化的解决方案,帮助客户找到通往智算时代的最优路径,确保每一项投资都精准、高效、面向未来。

推荐阅读
关注数
5087
文章数
486
对数据中心、云计算、5G、AIoT 等科技领域的最新技术和应用的信息交流、新产品新技术的引导、技术创新与品牌打造,降低用户对新技术的接受成本
目录
极术微信服务号
关注极术微信号
实时接收点赞提醒和评论通知
安谋科技学堂公众号
关注安谋科技学堂
实时获取安谋科技及 Arm 教学资源
安谋科技招聘公众号
关注安谋科技招聘
实时获取安谋科技中国职位信息