今天给大家写一点简单的分享。
我在《CPU的温度、功耗 & 风扇噪声控制模型》一文中,曾讨论过台式机/入门级工作站的散热设计。散热首先要控制组件温度以保证可靠性和正常的性能;温控可降低风扇转速,进而降低噪音、风扇自身的耗电和磨损等。那么PWM控制风扇的功耗与其产生的风量是完全正比的关系吗?
图 1:风扇功率(W)和系统气流(CFM)与风扇转速的函数关系(仅示例曲线)。点开后可放大,以下同
如上图,连接蓝色圆点的直线,应该是某款服务器里多个风扇的CFM(风量)值之和;由橙色圆点连接起来的曲线则是这些风扇的功耗。首先可以看出,在57W/对应134CFM这个水平以下,增加相对较少比率的风扇功耗,就能获得更高比率一些的气流风量;而在这条线的右侧,功耗增长的曲线就要比风量直线更加“陡峭”了,越往右则相对效率越低。
三条竖线对应CPU的温度。当风扇达到57W/134CFM时可以把CPU控制到80℃;而在25W/96CFM时CPU会达到90℃。对于一款DTS\_MAX(核心温度传感器)设计值95℃的CPU来说,控制到不超过90℃显然能降低风扇的转速和能耗。当然这里的温度还与服务器进风温度有关,参考下图:
本文参考自Dell技术博客,上图应该就是PowerEdge服务器的BMC(iDRAC)在整机50-70个传感器中读取到的一部分数据,大家也只把它当作一个示例就好。其中包括的数据有:
- 风扇占空比%PWM
- 进风转速RPM(FAN 1-6)
- 系统整机功耗、风扇功耗
- 净CFM气流量
- CPU最高温度℃
- DTS_MAX温度℃(如果是Intel CPU可从ark.intel.com查询,超出就会降频保护)
- 整机进气环境温度℃、平均排气温度℃
很显然,这里的目标就是通过风扇的Duty Cycle来控制转速。“戴尔设计了一套专有的基于人工智能的模糊逻辑控制器,通过风扇和电源控制实现闭环热管理,嵌入到iDRAC(集成式戴尔远程访问控制器)”。其他品牌服务器应该也有同类的设计,具体的复杂度和效果可能有差别,我就不在这里展开讨论了。
记得我在《RTX 3090初测:双宽涡轮风扇设计,诀窍与“烦恼”》中分享过,NVIDIA显卡的风扇控制曲线大多可通过软件自定义调节。服务器的散热控制通常没有开放这么大的自由度(一方面是复杂,也是为了规避风险),BIOS/BMC设置里通常会有Balance/Performance/静音几种策略,以及限制(Cap)功耗、排气温度等选项。
上图来自Dell Precision 7960 Tower工作站的BIOS。塔式工作站需要比服务器设计得更静音,默认策略在风扇转速/温度的权衡控制上偏“惰性”一些,可能在负载突然增大时达到或接近CPU的DTS_MAX。当然在BIOS中也有对应的“性能优先”策略选项;比如5000、7000系列中高端工作站,还有上图中在自动控制基础上加速风扇的策略——喜欢降低温度的朋友可以往右拉“CPU/内存区域”,或者其它Zone的风扇转速。
上面这张图已经不新鲜了,右边就是我在《风冷双路350W:PowerEdge 16G服务器的Smart Flow机箱选项》介绍过的“中间开孔加强进风” 设计,下面再分享一张对应的气流热仿真图:
如上图,基于传统前进风的服务器设计,“中间开孔”会使两侧CFM风流量有一些减小(因为风阻比中间位置大),这一点我在《Dell PowerEdge R760服务器:风冷vs. 液冷散热限制》中也提到过。但整体的CFM特别是核心部件CPU的风冷散热能力肯定是提高了。
参考资料《Save Money with Innovative Air Cooling for Your Servers》
Harness the power of fan control to reduce waste system power consumption.
https://aijishu.com/a/1060000000385412
作者:唐僧 huangliang
原文:企业存储技术
推荐阅读
欢迎关注企业存储技术极术专栏,欢迎添加极术小姐姐微信(id:aijishu20)加入技术交流群,请备注研究方向。