本文内容非商业用途可无需授权转载,请务必注明作者及本微信公众号、微博 @唐僧\_huangliang,以便更好地与读者互动。
在之前的《_VR测试:8K、移动工作站和极端挑战_》一文中,我给大家介绍了移动工作站上NVIDIAQuadro P4200专业显卡的性能表现,同时也透露了后续想写一篇GeForce RTX 2080 Ti在VR(虚拟现实)测试中的效果。虽然耽搁了点时间,但我觉得这个对比应该还有参考价值,还是坚持分享出来。
上图截自另一套图形工作站配置运行的测试,如果点击放大可以看到当时使用了Quadro P4000__显卡,在VR Future__这种“极高”的质量效果下,平均帧数只有25 fps__左右。此时的面(三角形)数为753__万__,而光源数量则达到了94__个__。
Unigine Superposition这款测试软件,我在上面链接的评测中已经有过介绍,包括选用它的原因,这里就不再重复。
GeForce RTX 2080 Ti能否达到8K VR Ready性能?
下面直接上测试结果,再点评。
由于这2__款显卡测试平台不同,性能结果还会受CPU__等差异因素影响。下文中还有一组测试在同平台上对比GeForce GTX 1080__和RTX 2080 Ti__显卡。
由于上次在Quadro P4200上的测试,我最高使用的是单眼4096x4096分辨率(也就是一部分同行朋友所称的8K VR),这次我仍然在同样设置下测试了RTX2080 Ti。当然250W TDP的桌面显卡不可能还用Dell Precision 7730移动工作站测试平台,我换了另一套3630 Tower,也就是《_460W电源能否带动GeForce RTX 2080 Ti显卡?_》里面使用的那个台式工作站。
首先,RTX 2080 Ti显卡在单眼4096x4096这样苛刻的条件下都得到8893的分数,可以说达到了8K VR Ready的水平,同时性能也比Quadro P4200提高了一倍出头。
由于8K VR头盔(头戴显示设备)还远未成为主流,我看到有的厂商外设实际分辨率为单眼3840x2160(16:9,也算4K吧),这样性能需求就会比刚才说的降低不少。我特别增加了RTX 2080 Ti在这种8K的VR Minimum和VR Optimum测试,2080 Ti都能达到或者接近10000分的满分。(注:性能超出上限也会显示10000分)
而在单眼2048x2048这种4K VR分辨率下,RTX 2080 Ti与Quadro P4200的测试得分虽然拉不开(因为后者已经得到8860),但从接下来一张图表看帧速度就能对比清楚。也可以说,如今主流的VR分辨率和内容大多还不需要RTX 2080 Ti这么高端的显卡。
我使用这台Dell Precision 3630 Tower测试机配置了Intel Xeon E-2174G四核CPU,TurboBoost频率可以轻松跑到4.x GHz,与8代Core i7相比虽然核数减少但基础主频高,专门适合一些工作站应用且支持ECC内存等企业级特性。显卡是从技嘉借来的一片RTX 2080 Ti,公版频率+接近公版的涡轮风扇设计。(性能仅供参考,不完全代表Dell原厂配置的水平)
帧速度(FPS)是更直接、更有价值的测试结果,也是最终影响VR体验的东西。我们看到RTX 2080 Ti显卡在VR Minimum(4096x4096)下平均帧数跑到100,3840x2160更是达到179之高。
对于Quadro P4200这款移动工作站显卡,我觉得在DirectX VR应用中能取得台式机RTX 2080 Ti一半的性能也完全正常。因为前者的功耗只有100W出头,而后者则是250W,况且Pascal核心还是图灵的上一代。接着往下看,您就会发现,180W的GeForce GTX 1080桌面显卡在VR中也没比Quadro P4200快多少,专业显卡则另有其擅长的应用领域,比如使用传统OpenGL 3D图形接口的制造业设计软件西门子NX(UG)、达索CATIA、SolidWorks、PTC Creo(Pro/E)等。
VRMark测试:RTX 2080 Ti接近GTX 1080两倍性能
VRMark测试软件普及度可能更高一些,这里我拿它做个侧面参考,另外也在相同机型配置下对比RTX 2080 Ti和上一代的GTX 1080。
首先,Orange Room测试场景(默认分辨率2264x1384,也就是单眼1132x1384),两款显卡速度无差别,其实瓶颈完全在CPU(显卡性能过剩)。这就有点类似3DMark测试里面那个CPU子项,拿很低的分辨率(如640x480)和效果来尽量降低对显卡的需求,当然如果显卡太挫了另说。
Cyan Room和Blue Room子测试就能充分拉开显卡的差距了,RTX 2080 Ti的VR性能接近GTX 1080的两倍,即使在Blue Room(5120x2880,单眼2560x2880)这个高质量测试中,2080 Ti仍然达到了90帧。
此外我将Orange Room的分辨率修改为7680x4320(准8K VR)运行,RTX 2080 Ti仍然跑到88帧。
上图中显示的Xeon E3-1270 v6 CPU__,估计是我运行的VRMark__主程序版本有点老,Xeon E-2174G__“暴露”出了它之前设计的名字:)
不难看出,NVIDIA RTX这代显卡带来的不仅仅是光线追踪,除了满足8K VR Ready性能门槛之外,在下面的三维(动画)渲染测试中也显示出了应有的实力。
VRAY渲染测试:2080 Ti保持一倍优势、CPU超线程对比
CPU__逻辑核心显示8__,也就是4__核打开了Hyper-Threading__超线程
大名鼎鼎的VRAY渲染器也不介绍了,十几年前我就在3dsMax下用它测试过CPU性能。如今的VRAY Benchmark还能测试GPU,使用NV显卡时应该是调用的CUDA计算。
首先说明下,这个程序测试CPU和GPU渲染使用了不同的图片素材,所以上图中2个时间没有可比性。我们先记下RTX 2080 Ti的52秒耗时,关键是和下图进行对比。
这次测试的CPU__逻辑核心显示4__,是因为我关闭了Hyper-Threading__超线程
换用GTX 1080 GPU渲染耗时为1分41秒,比RTX 2080 Ti几乎慢一倍。别看二款显卡的功耗差距没有这么大(180Wvs. 250W),可见图灵这代显示核心的效率提高。
运行VRAY Benchmark CPU渲染测试时的“小窗”对应线程数,上图截自另一款6核移动工作站。
同时,我还顺便对比了超线程设置对CPU渲染性能的影响,默认打开设置时2分13秒,关闭后耗时达到2分51秒,也就是说Hyper-Threading对VRAY的速度提升达到28%。像图形渲染这类多线程并发应用,对超线程的优化已经很好了;不过在另一部分工作站用户的图形设计工作中,也有关闭该选项性能更快一些的时候。如果您对各种参数调优拿不准,不妨试试工作站附带Dell Precision Optimizer(DPO)工具的“傻瓜”一键优化。
扩展阅读:《AI性能调优:过去已解,未来可知?__》
小结
虽然RTX 2080 Ti的性能很强,但8K VR在今天还有些阳春白雪,在大多数主流需求下,虚拟现实内容观看还用不到这么高端的显卡。至于更多RTX显卡在VR应用中的表现,我恐怕没时间再撰文细讲了,有兴趣的朋友可以加我微信单独聊:)
现有的工作站机型,可以最多支持3片RTX 2080 Ti显卡,如今GPU渲染的需求已经明显不如深度学习多了。扩展阅读:《_AI计算GPU工作站选型与测试:Quadro GV100 vs. GeForce RTX 2080_》
推荐阅读
本文转载自企业存储技术微信公众号,[原文链接点这里]。
注:本文只代表作者个人观点,与任何组织机构无关,如有错误和不足之处欢迎在留言中批评指正。 进一步交流技术可以加我的微信/QQ:490834312。
尊重知识,转载时请保留全文,并包括本行及如下二维码。感谢您的阅读和支持!《企业存储技术》微信公众号:HL_Storage,也欢迎关注企业存储技术极术专栏,定期更新。