企业存储技术 · 2020年07月07日

SolidWorks渲染测试:CPU & GPU光线追踪性能、画质对比

本文内容非商业用途可无需授权转载,请务必注明作者及本微信公众号、微博 @唐僧\_huangliang,以便更好地与读者互动。

image.png

本次渲染测试使用最新版SolidWorks 2020__中的Visualize__组件

在上一篇《SolidWorks 2020__测试:__GPU__如何速度翻倍 & _赢画质?_》发表之后,我收到了不少读者朋友的反馈,下面列出其中2条。感谢大家关注这个话题,也鼓励我继续写下去。

image.png

补充一下,SolidWorks的“增强图形性能”模式,只有用专业显卡——即NVIDIA Quadro和AMD Radeon Pro系列才能打开,GeForce等游戏显卡是不行的。这点前提,就像_我在《_Precision 3540__移动工作站评测(__SolidWorks & Revit__实战)》中提到的RealView和FSAA(全屏反锯齿)2个特性一样。

Quadro P2000和P6000跑一样快?BenchMark基准测试的局限

关于A卡的话题,由于用户群体的原因以后有机会再写。既然有朋友关注图形工作站整机的综合性能,我也再来聊聊CPU与GPU之间的关系。

image.png

其实在前文的视频中,可以看到我测试那台Dell Precision 7540__移动工作站的CPU__是6__核45W TDP__的Xeon E-2276M__,其规格比9__代Intel i7-9850H__略高,当然至强是支持ECC__内存的。

CPU性能在工作站里的重要性,有时候甚至会超过显卡。对于CAD/BIM设计中的图形交互操作,主频(包括Turbo频率)是个关键因素,因为经常是1核有难N核围观的状态,就像我在《Win10 1803__性能损失40%__?__Siemens NX__图形测试真相》(后来有补充更正:_《_CPU__漏洞补丁复盘测试:__Win10 1803__性能问题有解?_》_)中所写的那样。

具体到Xeon E-2276M这颗移动CPU,在我的测试中与65W TDP的桌面处理器Core i7-8700互有小胜负,对于笔记本/移动工作站来说已经难能可贵。

一位同事说希望我在文中放些柱状图,应该是便于对比吧。在讨论SolidWorks渲染中的CPU vs. GPU之前,我先给大家列出另一个图表。

image.png
关于250W TDP__的Quadro P6000__显卡,可能还没有出现在Dell Precision 3630 Tower__工作站的官方支持列表内。不过我之前曾在该机型上测试过2080Ti__(参见:《460W__电源能否带动GeForce RTX 2080 Ti__显卡?》),如今3630__又多了850W__电源选项,高功率显卡技术上完全不是问题。

我用SPECapc SolidWorks测试软件主要对比来了2款专业显卡:5GB显存的Quadro P2000和24GB显存的高端P6000。看上去是不是有点奇怪,性能档次相差悬殊的显卡居然得分差不多?其中具体原因我想留待后续的文章中讨论,因为这种柱状图你要理解他反映了应用中什么样的操作。

在上面图表中还有一项CPU光线追踪。如今GPU在SolidWorks渲染中的表现又发展到什么水平呢?这就是本文要讨论的重点。

SolidWorks Visualize 2020:GPU渲染速度达CPU 100

image.png

测试仍在Dell 7540移动工作站上进行,由于配置了Quadro RTX3000显卡,默认就打开了CUDA GPU渲染并使用NVIDIA IRAY引擎

image.png

渲染测试的模型,这张是用CPU生成的1920*1080 1000Passes渲染图(点开图片后双击可放大,以下同)

image.png

上面图表是我的测试结果(时间越短越好),图例中Passes表示渲染中的通道数,Denoiser是去噪点。可以看出,如果只使用Xeon E-2276MCPU,HD分辨率1000通道渲染一幅图需要花2079秒(30多分钟);而Quadro RTX 3000 GPU只需要149秒。

如果用这块显卡进行100通道+去噪点的测试,则只需要19秒就能完成。按这个来计算时间比CPU缩短了100倍,那么对渲染画质有影响吗?

image.png

首先,如果同样是1000通道CPU和GPU渲染的图像我几乎看不出区别;若是使用100通道渲染,只用CPU的渲染效果难以接受,见下图:

image.png

上图是100 Passes CPU渲染的结果,由于关闭GPU选项之后无法使用去噪点功能,大家可以留意下放大显示文字的效果。

注:__上传后图片质量差别变小了:(
image.png**

以上是Quadro GPU使用100通道+去噪点渲染,其效果已经和1000通道CPU/GPU渲染相当接近。

单机替代渲染集群,工作站也是RTX Server

注:RTX Server__是NVIDIA__提出的一个概念,针对的应用就是多块QuadroGPU__做渲染,其中也包括一些工作站机型。

CPU和GPU在SolidWorks渲染中的巨大性能差距,使得传统多核+多处理器(如:Xeon Scalable)的渲染已经没多大意义了。至于多台主机的集群渲染?我们在工作站上还可以选配不同的GPU、塔式工作站上支持多GPU。就像以前一位同行朋友所说的那样,现在GPU主机在许多时候可以替代以前的渲染集群了,而当时还没有发布RTX这代显卡。

image.png

上面图表中引用了SolidWorks官网列出的性能数据,其中Quadro RTX 3000是我增添了自己实测的。

可以看出Quadro RTX的性能大致是上一代P系列的2倍,这应该就是加入Tensor Core和RT Core光线追踪计算单元的结果。移动工作站上的RTX 3000比用于塔式工作站的P4000、P5000也快了不少。

另外2块显卡性能还能翻倍,比如Precision 5820/7820工作站就可以支持到2块Quadro RTX 6000,塔式和机架式7920应该支持3块RTX 6000显卡。

image.png
大家可以再看下另一个SolidWorks模型的渲染图,还是采用GPU 100通道+去噪点,个别细节能看出与1000通道有点差别。如果有最高画质的要求,可以考虑GPU 1000通道+去噪点,对应的质量甚至超出CPU渲染,性能仍可达CPU的十几倍(Quadro RTX 3000 vs. Xeon 6核)。

image.png

 
上面这段GPU渲染的视频质量如何?我用960*540分辨率输出了共300帧,Dell 7540移动工作站上渲染时间只用了20分13秒。

小结:SolidWorks系列测试未完待续,敬请大家继续关注!

参考资料 https://www.solidworks.com/sw...

推荐阅读

本文转载自企业存储技术微信公众号,[原文链接点这里]。
注:本文只代表作者个人观点,与任何组织机构无关,如有错误和不足之处欢迎在留言中批评指正。 进一步交流技术可以加我的微信/QQ:490834312。
尊重知识,转载时请保留全文,并包括本行及如下二维码。感谢您的阅读和支持!《企业存储技术》微信公众号:HL_Storage,也欢迎关注企业存储技术极术专栏,定期更新。
42.jpg
推荐阅读
关注数
5552
内容数
235
关注存储、服务器、图形工作站、AI硬件等方面技术。WeChat:490834312
目录
极术微信服务号
关注极术微信号
实时接收点赞提醒和评论通知
安谋科技学堂公众号
关注安谋科技学堂
实时获取安谋科技及 Arm 教学资源
安谋科技招聘公众号
关注安谋科技招聘
实时获取安谋科技中国职位信息