企业存储技术 · 2020年10月14日

让45W TDP CPU稳跑75W的秘密:Blender渲染测试(含Optix去噪点)

image.png

接上篇:《_17寸全面屏轻薄本拆解:Precision 5750移动工作站(上) _》

《_性能、可靠性和音频设计:Precision 5750移动工作站(下) _》

这两天研究笔记本/移动工作站的散热性能测试,有点小收获。Intel Core i7-10875H CPU跑到75W功耗可能不算什么漂亮数字,之前我有看到资深媒体朋友这样写过:

“桌面温度25__到27__(电脑左右两边),后部脚垫垫高一个手机,dell power manager__设定为极速,充点阈值设定为50-60__。禁用Intel__智能调优以获得稳定数据,pwm__风扇拉满3300RPM__,屏幕亮度降到最低__(这个很重要)

单烤FPU35min__结果如下

最高跑到100__瓦单cpu__功耗,此时整机功耗154.5__瓦(个人见过最高是170w__瞬间功耗)长时间压力单U 75__瓦完全稳定,此时温度接近100__。可以看到这个时候整机功耗已经是123.5__瓦了”

这DIY精神没的说!其实我的“优化”方法也包含在其中,关键是对于大多数用户长期使用来说,不太适合搞的这么极端,在不破坏使用体验和RAS(可靠性、可用性)的条件下,我会给大家2点散热优化建议。

下面先看性能测试。

Blender 的GPU 和Optix (RTX 光线追踪)渲染支持

image.png

本次测试选用最新版本的Blender2.90.1——一个开源且比较流行的3D动画软件。Blender较早的版本就开始支持GPU渲染(CUDA),应该是从2.8.1之后又加入了RTX光线追踪(Optix)的支持。

image.png

首先是FishyCat模型,上面的2分38秒是用Quadro RTX 3000显卡渲染的速度,移动工作站的8核CPU还达不到这么快。

image.png

当前版本Blender对OptiX(RTX光线追踪)的支持还是实验性的。在我测试的N卡移动工作站上,只有CUDA和OptiX都选中才能使用Cycle渲染引擎中的GPU选项。

image.png
这台Dell Precision 5750移动工作站配置的显卡是Quadro RTX 3000 Max-Q 6GB,在GPU渲染时CUDA单元占用率100%,显卡部分整体功耗稳定在TDP 65W左右。

image.png

GPU渲染比CPU快早已是不争的事实,接下来我想重点说下Core i7-10875H CPU的性能发挥。上面图表大家都看到了,这颗8核CPU在75W功耗下的渲染时间缩短了13%。

注:无论何种测试条件,45W TDP__的CPU__在刚开始跑时都可能Turbo__到100W__出头的功耗,所谓 “@45W” _只是指没有任何优化动作_下的性能_,并不代表整个运行过程中都没有高于45W__。_

两个简单操作,CPU 轻松提升至75W (稳态)

image.png

上面的截图就是在Blender CPU渲染测试中,左边用AIDA64做的功耗监测(但没有同时跑它的压测)。在75W下Core i7-10875H(8核16线程)可以长时间稳定达到3.46GHz左右的全核Turbo频率。下面就是2点简单优化操作:

image.png

1、笔记本后部垫高一点

这个对散热进风比较有帮助

image.png

2、使用Dell Power Manager电源管理软件,在散热管理中设置为“疾速”,经我实际体验满载温度和噪音增加不大,均在商用环境可接收的范围内。

如果不愿安装Dell Power Manager,也可以在移动工作站的BIOS设置中修改,如下图:

image.png

这张照片来自Precision 7550,下一篇我争取再讨论它。Dell 10代Core CPU商用笔记本BIOS里都有这个散热管理选项,默认是Optimized(优化),改为Ultra Performance即可。

image.png

如果只垫高笔记本尾部,而不修改Precision 5750出厂默认的散热设置,在Blender测试中就会看到CPU功耗在45W-68W左右周期性波动变化。在我的测试中,3.26GHz大约就是这个过程中i7-10875H CPU频率的高点。

 

Optix 去噪点渲染 vs. CPU 去噪点算法

image.png

另一个Blender测试场景Classroom(教室)。无论选择CPU还是GPU渲染,如果直接用初始化后的默认选项达不到上面这个画质。

image.png
如上方对比图,Classroom场景渲染应该打开去噪点功能,才能获得正常理想的最终图像质量。

image.png

需要注意的是,只有在渲染设备设为GPU时,Denosing(去噪点)Optix选项才能正常工作。而在CPU渲染时,可以选择另外2种去噪点算法NLM或者OpenImageDenoise,初步观察画质差别不大。

也就是说,Blender在这点上与我在《_SolidWorks渲染测试:CPU & GPU光线追踪性能、画质对比_》中看到的情况不同。相比之下,SolidWorks Visualize渲染器可以说重度依赖NVIDIA GPU,如果用CPU在其中想达到类似Iray引擎去噪点的画质,需要提高通道数到1000(默认值10倍),速度就比较难看了。

image.png

根据测试数据图表,Quadro RTX 3000显卡在打开去噪点之后,只增加了14秒(5%)的渲染时间,比CPU使用去噪点之后的性能开销小一点。

在同样不开去噪点的情况下,(稳态之后)跑到75W的i7-10875H CPU渲染比散热优化前快了1分07秒,仍然有大约10%的性能优势。

总结 & 建议

image.png
Precision 5750移动工作站配置的QuadroRTX 3000 Max-Q Design显卡规格参数,分享给大家。

在真实应用中,能同时把CPU(全核)和GPU同时跑满的情况并不多,因此上文中我没有使用测试软件做极限的“双烤”;而CPU在单核Turbo到比较高(4.5GHz以上)时功耗只有20多瓦。根据多年来的经验,大批图形工作站用户对主频(单核)性能比多核更加敏感。

因此本文给出的建议,对于全核CPU负载,或者CPU和GPU同时有较大压力的应用效果更明显。Precision 5750毕竟是一款轻薄型17寸移动工作站,130W电源适配器,在双烤压测下GPU和CPU也分别能达到65W + 50W左右。如果用户还想要更好一些的性能,还可以考虑Precision 7550或者7750。

image.png

我再次认识到:对于笔记本散热支架/__底座而言,额外带风扇可能都是次要的,关键是要让进风口不被遮挡!

最后这张图来自jd.com,散热支架/底座如果选便宜的花不了多少钱。工欲善其事,必先利其器:)

推荐阅读

本文转载自企业存储技术微信公众号原文链接点这里

注:本文只代表作者个人观点,与任何组织机构无关,如有错误和不足之处欢迎在留言中批评指正。 进一步交流技术可以加我的微信/QQ:490834312。
尊重知识,转载时请保留全文,并包括本行及如下二维码。感谢您的阅读和支持!《企业存储技术》微信公众号:HL_Storage,也欢迎关注企业存储技术极术专栏,定期更新。
42.jpg

推荐阅读
关注数
5552
内容数
235
关注存储、服务器、图形工作站、AI硬件等方面技术。WeChat:490834312
目录
极术微信服务号
关注极术微信号
实时接收点赞提醒和评论通知
安谋科技学堂公众号
关注安谋科技学堂
实时获取安谋科技及 Arm 教学资源
安谋科技招聘公众号
关注安谋科技招聘
实时获取安谋科技中国职位信息