云中子〖计算杂谈〗 · 1月24日 · 北京市

数据中心节能变革进行时:全液冷冷板服务器参考设计全球首发

“我们的目标是在2025年实现风液同价”,液冷走进千行百业指日可待。

2024年伊始,浪潮信息与英特尔就率先发布了全球首个全液冷冷板服务器参考设计,并面向业界开放。目的在于加速推动液冷产业化,促进数据中心朝着更环保、低碳的可持续发展方向前进。浪潮信息推出的全液冷冷板服务器,实现了部件接近100%的液冷散热,从而达到PUE值接近于1的极致水平。

作为国内服务器市场的头魁,浪潮信息有着强大的品牌、产品和研发实力,并一直高度重视开放数据中心生态的构建。此次全液冷冷板服务器参考设计的推出,也意在推动整个产业快速前行,进而让液冷普惠全行业,帮助用户实现“双碳”目标。

绿色计算,从液冷开始

数据中心液冷,真的那么迫在眉睫吗?

中国信通院产业与规划研究所副总工程师王青表示,2022年我国数据中心的能耗达到了1300亿千瓦时,已经占到全国总供电量的2%,未来将会涨至6%的规模。同时我国也在践行双碳战略,通过东数西算等政策推动数据中心区域的优化和绿色化发展。对于用户而言,更加高效、节能、低PUE值的数据中心可有效降低运营成本,在这个功耗爆发的时代,液冷技术成为了实现这一目标的关键所在。

从发展绿色算力来看,重点在于聚焦在算力输出设施能源消耗方面,来做设备或技术的迭代更新。在这些技术中,液冷的出现起到了颠覆性作用。众所周知,从目前这个时间节点来看应用到服务器上的液冷技术已经非常成熟了,它拥有高效散热、低噪音、低能耗、高密度、高可靠性、节能环保,并可支持大规模扩展等特性,但制约其快速普及的关键点就是成本和标准化。

液冷数据中心普及,需要标准化与成本控制

“纵观前几年液冷发展可以看到,大部分服务器厂商都推出了液冷产品,但其设计相对独立,所配套的冷却模组普遍采用了定制化,因此很难控制成本。这也使得液冷服务器一直给人一种价格高高在上的印象。”谈到液冷的发展,浪潮信息服务器产品线总经理赵帅这样介绍道。

浪潮信息服务器产品线总经理 赵帅

液冷一旦有了行业通用标准,那么就可以实现超大规模工业化生产,这样一来成本便能够迅速摊薄,也就让液冷的普及成为了可能。

目前,浪潮信息已经参与并发布了十余项与液冷相关的设计技术标准。他们还牵头编制并发布了国内首批冷板式液冷数据中心核心部件的团体标准,填补了这一领域的标准空白。

此外,浪潮信息还制定了《集装箱式数据中心机房通用规范》和《模块化数据中心通用规范》等国家标准。这些标准的制定推动了产业链上下游的高效协同,为数据中心基础设施的模块化、可拓展、高部署和绿色低碳的有效实现提供了重要的前提保障。

这些努力将进一步推动绿色数据中心产业的快速发展,以及液冷等绿色节能技术的大规模普及。通过这些标准和规范的制定,浪潮信息正在为整个行业的绿色发展做出积极的贡献。

赵帅表示:以上这些都是浪潮信息在整个算力标准体系中所做的产业引领工作。作为一个服务器的产业龙头,我们希望通过这些标准,以一个更加开放、开源的心态,与行业共同分享。并用这样的方式去拉动新型技术产业化的推广,让更多的用户能够体验到新技术所带来的变革,从而更快地推动我们整个国家绿色算力的发展。

全液冷冷板参考设计,普惠全行业

IT设备占数据中心总能耗约45%,而制冷的能耗仅次于此占据了43%。因此液冷技术是解决制冷能耗非常重大的关键技术保障,也是绿色计算发展的一个重要支撑。

浪潮信息通过“All in液冷”战略,全栈布局液冷,实现服务器全产品线支持冷板式液冷。具体来说,浪潮信息实现了通用服务器、高密度服务器、整机柜服务器、AI服务器四大系列全线产品的液冷支持。

为了推进液冷产业化,浪潮信息还建成了亚洲产能最大的液冷数据中心研发生产基地“天池”,年产能超10万台,完成了业界首次冷板式液冷整机柜的大批量交付。同时,浪潮信息也打造了“端到端服务”的全栈液冷方案,具有从室外液冷一次侧循环冷源到室内 CDU、集液器、液冷二次侧循环、液冷服务器等全线布局,为用户全方位打造液冷数据中心交钥匙工程,提供液冷数据中心全生命周期整体解决方案。

此外,浪潮信息、英特尔还与中国电子技术标准化研究院、开放计算标准工作委员会OCTC联合发布了《全液冷冷板系统参考设计及验证白皮书》,囊括了从方案的设计、应用的验证到未来规划,对全液冷服务器设计和规模应用中面临的主要难点和痛点提供了设计参考,对全液冷冷板技术在通用产品上实现快速导入和推广具有重要指导意义。

在此之前,我们常见的液冷散热方式是通过液冷解决了一些高功耗部件的散热,再用风冷辅助散热。这种方式比较简单,但在一个数据中心之内需要两套系统来维护,整个PUE的优化难度比较大。

当升级至全液冷的冷板服务器设计架构后,其所有机器部件都能实现100%液冷散热,全部无风扇设计。这样就构建起了真正无风冷“空调”的数据中心,在静音的同时还可进一步优化PUE值。

浪潮信息全液冷冷板服务器就是基于全液冷冷板系统参考设计的最佳实践。2022年起,浪潮信息联合英特尔率先针对基于通用服务器架构的全液冷冷板技术方案进行研究与实践,对CPU、GPU、内存、硬盘、OCD网卡、电源、PCIE转接卡以及光模块等散热进行了深入研究,构建起一整套全液冷冷板技术解决方案,满足了用户多种液冷覆盖占比的部署要求,打造了目前行业里最高液冷覆盖率的全液冷冷板服务器,为用户大规模高密度计算场景需求提供了最优选择。

在《全液冷冷板系统参考设计及验证白皮书》中,首次提出了液冷热捕获效率(HCR)的效率指标,用以评估全液冷服务器和整机柜的冷却性能。通过HCR值可以验证设备是否实现了真正的全液冷效果,未来用户可以简单地通过HCR值来检验设备的液冷占比,而无需再通过复杂耗时的测试来验证了。

用新技术构筑未来液冷

在技术创新方面,浪潮信息通过单节点内热流分区的导风、智能风扇调控等散热策略来减少整机的能耗。在浪潮信息M7平台上,每台服务器内置了超过400个传感器,能够有效对于节点内整个的热能管理做更精准的调控,并拥有17种调控策略,可以实现一键场景化的适配。

浪潮信息在业界率先开发出支持3.2KW氮化镓钛金电源,其功率密度高达业界顶尖的100W/in³。这款电源的损耗降低了30%,在20%-50%的宽负载范围内,它都能保持钛金级电源转换效率,达到94%以上。这一创新大幅降低了功耗,并增强了系统的稳定性。

此外,浪潮信息还特别关注产品的环保特性。产品选用了无铅的关键部件,如网卡、RAID卡、显卡、内存和硬盘等,这些产品都通过了ROHS认证,并实现了包材100%可回收,为环保事业做出了积极贡献。

浪潮信息推出了创新的液环式真空冷却分配单元(CDU),彻底解决了传统冷却系统中的漏液问题。同时,推出的全液冷机柜,其算力密度之高相当于传统机柜的十倍,使得年均功率使用效率(PUE)降至1.1以下,从而为数据中心每年节省高达21万元的电费开支。

在架构设计上,浪潮信息采用了IO均衡架构,有效降低了跨处理器的业务访问延迟,提升了20%的效率。此外,通过集中供电和前置IO的整机柜架构,实现了额外的10%节能效果。

众多行业开始关注液冷

谈到用户对液冷的态度,赵帅表示:目前最为关注液冷的有两类用户,一类是有超大规模部署需求,另一类是做智能计算的用户。前者更加关注规模效应,液冷数据中心可以有效降低运维成本、降低碳排放,并更易于管理;后者则需要构建超高密度数据中心,以目前日趋增长的CPU、GPU功耗来看,唯有液冷才可提供支撑,并且同样有利于通过液冷获得TCO收益。

例如互联网企业,它们积极拥抱液冷新技术,也更期待设计、接口等实现标准化,这样有利于产品对接与未来扩容,因此它们也是液冷数据中心标准化发展的主力军之一。

风液同价,将改变未来

据赵帅介绍,在2023年液冷实现了几十万台的部署,成本有了大幅度降低,可以说已经实现了第一阶段目标。相信随着行业标准的不断推进,液冷的成本还会有进一步的降低。整体上维持2025年风液同价的目标不会有变化。

而在2024年,用户还会重点关注TCO收益,当其发展至一定水平后,将成为用户选择液冷的关键因素,也同样会加速液冷的普及。

总的来看,浪潮信息与英特尔共同发布的全液冷冷板服务器参考设计,进一步完善了液冷产业的标准化,推动了液冷技术的普及和应用。通过推动开放标准化,降低生产成本,该设计为液冷服务器的广泛应用打开了新的可能,进一步促进了绿色数据中心的发展。在未来,我们期待看到更多的企业和组织加入到这一领域,共同推动液冷技术的进步与产业化应用,为全球的可持续发展做出更大的贡献。

推荐阅读
关注数
853
内容数
99
目录
极术微信服务号
关注极术微信号
实时接收点赞提醒和评论通知
安谋科技学堂公众号
关注安谋科技学堂
实时获取安谋科技及 Arm 教学资源
安谋科技招聘公众号
关注安谋科技招聘
实时获取安谋科技中国职位信息