企业存储技术 · 2021年07月09日

推荐一款Linux下监控CPU温度、频率、功耗的工具:s-tui

这两天我手头正好有一台配置较高的工作站,2颗Xeon Gold 6258R 28核CPU、1TB(1024GB)内存,跑了下功耗压测。

在Windows下我习惯用AIDA64、Hwinfo这些监控软件。Linux下能看CPU温度和频率的工具也有一些,而此次我还要同时监控功耗,另外要是再有个简单的图形界面就更好了。在网上搜了一下,找到s-tui,发现还挺好用,顺手分享给大家。

1.jpg

s-tui是一款开源软件,关于它的简介和安装方法可以参考《s-tui:在 Linux中监控 CPU 温度、频率、功率和使用率的终端工具》。

本次我是在Ubuntu下安装使用,具体的步骤比较简单:

$ sudo apt installpython-pip stress

$ sudo pip installs-tui(如果是Python 3.x,替换“pip”为“pip3”

$ sudo s-tui

2.jpg

图片点开后可放大(以下同)

上图是空载情况下(准确地说是把压力停了一会)的s-tui界面。柱状图从上到下依次显示:温度、频率、CPU占用率、功耗和风扇转速。

-温度:用红框标出的Pa(Package)显示CPU封装温度,Co代表各个核心温度;

-频率:红框标出的A(Avg)显示平均频率,C代表各个Core的频率;

-占用率:A(Avg)显示整体占用率,C代表各个Core占用率;

-功率:package-0,0 / 1,0分别显示2颗CPU功耗,dram,0、dram,1对应各自内存控制器所插的内存(注:由于Dell Precision 7920 Tower工作站多达24个DIMM槽,内存功耗这项监控不准);

-风扇转速:nouveau,0应该代表显卡(未安装NV驱动,也不一定准),dell_smm,1/ 2不知读取的机箱内哪2个风扇,这里仅作为一般参考。

图中左下方的Summaries是经过我筛选后列出的实时监控数字。由于测试机CPU核心数较多,因此默认设置在这里不能显示全,可进入上面Control Option对应的选项设置一下,如下图:

3.jpg

s-tui是基于Linux字符终端呈现,把上面的选项改成这样我也费了一番功夫。

4.jpg

CPU频率全核满载保持2.1GHz,后面我来讨论下是否达标?

当我把prime95压测软件跑起来,2颗Xeon 6258R CPU一开始可以到230W功耗,稳定后保持在205W TDP附近。2颗CPU封装的温度分别为70℃和78℃(室温25摄氏度左右);此时风扇转速有一定提高,我们看到dell_smm,1读数从800转提高到2596转。当然工作站整体上肯定比服务器静音,各风扇还没有到全速。

注:这里的温度读数来自CPU内部温度传感器,而CPU表面实际温度比这个要低。详情参见《Xeon Scalable CPU跑到90℃了:为什么风扇转速还不提高?》。

工作站BIOS中的监控、诊断功能

如果是服务器,我要想监控全部风扇转速的途径是BMC(如:iDRAC)管理。但塔式工作站的情况不同,没有BMC,但有另一个办法——启动时按F12,然后进入诊断界面。这时如果插满1TB内存,等待的时间会比较长,因为涉及到对系统各组件的检测,完成后我们进入下图的界面:

5.jpg

在《双Xeon SP只用一个风扇?Percision 7920工作站散热设计解析》中我介绍过这款主机的散热设计。除了CPU1 FAN之外,4个SYS FAN用于机箱前部进风,2个REAR FAN专用于CPU和内存风罩区域的排风,如果满配硬盘的话FB FAN的数量应该还可以多2个。

6.jpg

在SupportAssist | Pre-Boot System Performance Check界面的进一步测试选项中,可以看到内存测试就有若干项目。这个对售后工程师比较有用,在怀疑故障可能与操作系统/软件因素有关时,可以用来初步判断硬件是否正常工作。

为什么跑不到AVX 512最高全核Turbo频率?

Intel Xeon Gold 6258R的标称频率是2.7GHz,最高Turbo(单核)频率为4.0GHz,不过这是在运行Non AVX指令时才能达到的;如果是AVX 2.0浮点计算会有降低;而AVX 512则会进一步降低。

7.jpg

如上面Intel文档,Xeon 6258R在AVX 512浮点负载下的Base基础频率是1.8GHz(也就是没有Turbo的时候),28核跑满最高Turbo频率为2.5GHz。经过对比测试,prime95(如下图)的压力负载较重,所以同样功耗下CPU频率较低一些;如果换成AIDA 64等跑AVX 512就能达到高一点的频率。另外,Windows和Linux系统等因素也会有细微影响。

8.jpg

我看s-tui软件自己也有Stress压力测试功能,今天先不做更多讨论了。

祝玩得愉快!大家如有什么好东西也欢迎推荐给我:)

作者:唐僧huangliang
原文:https://mp.weixin.qq.com/s/78PyfnDxsGgy7iipuhSMoQ
微信公众号
企业存储.jpg

推荐阅读

欢迎关注企业存储技术极术专栏
推荐阅读
关注数
5555
内容数
236
关注存储、服务器、图形工作站、AI硬件等方面技术。WeChat:490834312
目录
极术微信服务号
关注极术微信号
实时接收点赞提醒和评论通知
安谋科技学堂公众号
关注安谋科技学堂
实时获取安谋科技及 Arm 教学资源
安谋科技招聘公众号
关注安谋科技招聘
实时获取安谋科技中国职位信息