企业存储技术 · 2020年06月28日

VR测试:8K、移动工作站和极端挑战

本文篇幅稍长,文中含有大量测试点,通过专业角度深入探讨,内容较为细致,有兴趣的同学可以细细品读,相关测试总结于文章结尾处。

目 录:

- 8K VR带来的挑战

- 来自VR引擎的Unigine Superposition

- 丰富的测试选项、视觉对比和量化分析

- 移动工作站上Quadro P4200显卡能跑多快?

- 主流及4K、8K VR测试结果

8K VR带来的挑战

由于工作的原因,最近一年半我接触VR(虚拟现实)行业多了一些,到今天也算是有点小心得可以跟大家分享。

image.png

上图就是流行的HTC Vive Pro HMD(VR头显/头盔),它的整体分辨率为2880x1600,也就是左/右眼各1440x1600。

image.png
来源:根据中国信通院《虚拟(增强)现实白皮书(2017年)》

修订 __图10 虚拟现实近眼显示技术路标_

上图引用自不久前刚公布的,中国信通院《虚拟(增强)现实白皮书(2018年)》,其中提到了VR分辨率的发展趋势。如果按照这个行业预期,今明两年单眼分辨率2K的VR有望进入主流,2021-2025年估计是单眼4K(双眼分辨率加起来就是8K)的时代,而2025年之后可能会流行单眼8K分辨率。

显然对于分体式头戴VR来说,分辨率和画质效果的提升,将会提高对PC/图形工作站主机硬件的需求。一年多以前我曾与国内一家做VR外设的朋友聊过,他们试验8K(单眼4K)头显使用的主机配置就相当高,甚至尝试拿2台GeForce GTX 1080级别显卡的主机各自输出一个4K屏幕来解决。

而我这次测试也是想验证几个问题:

a. 当前主流的PC/工作站硬件配置,是否有可能支持8K(单眼4K)VR?

b. 如果是4K(单眼2K)VR能支持到什么程度?

c. GeForce游戏显卡和Quadro专业显卡哪个更适合VR?

d. 笔记本(移动工作站)能否比较理想地跑动VR?

测试软件选择:来自

VR引擎公司的Unigine Superposition

接下来,第一步是选择测试软件。关注游戏显卡测试的朋友估计对FurtureMark的3DMark都不陌生了,使用过VRMark的人应该也有一些。
image.png

如上图,VRMark 3个子测试场景中的Blue Room属于有些“变态”的,默认分辨率为5120x2880(也就是单眼2560x2880),说白了就是超前设计而不想让现有硬件跑流畅的。

而这次我却没有选用VRMark,如果只是站在游戏的角度似乎挺合适,VRMark也是那种CG动画感比较明显的内容制作风格。而我觉得不应该忘了VR(Virtual Reality)本来的定义——虚拟现实和视觉仿真(我是2002年最早听到这个词)。包括VRMark中提供的运行选项,对于我们**评估商业VR应用性能的需求来看,可能不算一个比较理想的选择。

一次偶然我了解到Unigine Superposition BenchMark这款测试软件。可能有些朋友还记得Unigine Heaven这个比较老的测试Demo;另外值得一提的是,Unigine是一家做VR引擎的公司。

image.png

上图来自国内VR领域老牌企业中视典的ppt。除了右边的Unigine之外,我最早了解到的Vega和OpenGVS用在军事模拟方面多一些,那年头VR还是阳春白雪阶段,民用的比较少;Unity3D和Unreal Engine(虚幻)是现在最流行的VR引擎,其中Unreal也因为在游戏制作中的优秀表现早已声名在外,Unity相对轻量级和易上手而更为普及。对于国产的VRP,我10年前就听说过,但毕竟我不是做开发的,在这方面还没有太多评价的发言权。

image.png

除了VR测试之外,Unigine Superposition也能支持常规3D测试,就是在普通显示器上输出单屏画面。虽然这次我们不是要测这个,但也可以简单看下——因为跑的是同一个场景。

image.png

Unigine Superposition会计算出当前测试设置所需的显存容量。从上图可以看出,“非VR”的Performance测试模式下,单个8K屏没有8GB显存几乎是玩不动的。**另外根据我之前在《玩转专业8K显示器:你需要知道的事》中做过的3DMark测试,GTX 1080等级的显卡基本上跑不流畅。

丰富的测试选项、视觉对比和量化分析

在上面的界面选择VR Ready,就可以进行VR测试了。

image.png

请大家留意下VR Minimum测试选项的画面效果(第17个场景)

如果没有连接VR头显,VR Ready测试就会在显示器上以左右分屏模拟运行。在屏幕右上角,Unigine Superposition会显示一些有价值实时信息,稍后我会具体讲。

image.png

默认设置的VR Minimum测试只需要1GB多一点的显存

除了VR Minimum之外,Unigine Superposition还提供了VR Optimum、VR Maximum和VR Future一共4个预置测试选项,具体对应不同**Shaders Quality(着色器质量)和Textures Quality(材质/纹理质量)。下图就是我在运行VR Future测试时拍摄的照片:

image.png
虽然与前面的测试照片同为第17个场景,__但明显

VR Future比VR Minimum测试的光照效果改善了很多

(后面还有量化分析)

image.png
Unigine Superposition VR测试默认的单眼分辨率为1332x1586 

在VR Future测试设置下,显存容量需求上升到了3610MB,这时如果用3GB或以下的显卡就不太合适了。以流行的VR Ready显卡GTX 1060为例,我们知道3GB显存的性能比6GB有一点差距,但是性价比更好些。对于VR内容制作者来说可以考虑优化场景来节省硬件资源,比如下面这个和思易的“铝热实验”。

image.png

“铝热实验”属于中小学物理/化学/生物VR实验中的一个代表作,能够在GTX 1060 3GB显卡上流畅运行到90FPS帧率。这个Demo我比较熟悉,画质和整体体验都是比较优秀的。**

image.png
VR Minimum和VR Future(第17个场景)测试中

屏幕右上角显示的实时信息

从上面的几个数值中,很容易判断出Unigine Superposition测试场景的复杂度,也就是画质差别。

——Triangles(三角形,或称多边形“面”):VR Minimum为330万个,而VR Future达到1000万出头;

——Light source光源数量:VR Minimum为36个,VR Future则多达70个;

——Material材质数量:VR Minimum为596,VR Future增加到694;

——Surface表面数量:VR Minimum为1904,VR Future多达4949;

image.png

虽然我们在测试中可以不用真的连接VR头显,但Unigine Superposition还是提供了一个Headset的选项:包括HTC Vive、Oculus Rift和自定义,其中前2者分别对应1512x1680和1332x1586单眼分辨率。不知这里是否有读者朋友产生和我同样的疑问:我在本文开头提到HTC Vive和Oculus Rift的单眼分辨率都是1080x1200,为什么测试(也就是显卡输出)会有更高一些且不同的分辨率呢?

我在网上找到一篇文章《深度对比分析VR头显Vive、Rift的分辨率:渲染、失真与校正》(链接:https://yivian.com/news/45299...),里面对这个问题解释的比较专业。尽管VR头显的液晶屏分辨率没有那么大,但主机显卡渲染输出时需要有一些“超标”。至于这个超标的比例范围应该没有一定之规,有些选择余地取决于内容开发者。

下面我总结了Unigine Superposition不同测试设置下需要的显存容量,为了考察4K(单眼2K)和8K(单眼4K)性能,我特别增加了2个自定义测试项目,还有2种“非VR”测试设置用于参考对比。

image.png

注:对于4K和8K VR整体分辨率,由于还无法准确预知

未来流行头显的参数水平,我只是选个数值来做大致的性能评估

通过对比不难发现,材质(纹理)质量和分辨率对显存需求都有直接的影响。比如VR Minimum在单眼4K(整体8K)分辨率下显存容量需要3152MB;而分辨率和材质质量都很高的“非VR” 8K Optimized测试则达到6214MB。

另一方面,如果您真的以为Shader Quality影响不大那就错了,着色器质量决定着特效水平(包括上文中的光照等),也是最吃显卡性能资源的。具体关系到GPU处理能力还是显存带宽这里暂不展开分析,咱们还是先看本次测试的硬件配置和结果。

测试平台:Quadro P4200硬件规格

与GeForce GTX 1070相当

image.png
本次测试使用了一台配置较高的Dell Precision 7730移动工作站

显卡为专业级NVIDIA Quadro P4200 8GB。

image.png

相比上面的P4200,用于桌面工作站的Quadro P4000规格为:CUDA核心1792、图形时钟(GPU频率)1202MHz、内存带宽243GB/s。作为升级型号的移动Quadro P4200反而领先。

如果只看硬件指标,定位桌面的游戏显卡GeForce GTX 1070(也可以跑VR)CUDA核心1920、图形时钟(GPU频率)1531MHz、内存带宽256GB/s。整体上看移动版Quadro P4200也算是旗鼓相当。当然专业显卡还有完整OpenGL支持、CAD/DCC等多种工作站应用软件的优化认证,贵有贵的道理。

测试结果:主流及4K VR通过,

8K、极端画质未达标

image.png

我们先测了VR Minimum选项,这台移动工作站跑到10000分以上(实际超过标尺右端都会显示10000)。具体来说,平均FPS帧速度192.44,最大336.81,最小FPS 111.40也超过了90FPS,这种完全的VR Ready不会有任何不流畅的感觉。

image.png
Unigine Superposition的VR Future设置确实是硬件杀手,我这台的测试机得分为2714,已经达不到Capable的水平。具体到平均FPS只是30刚出头,这一点对于贴近眼睛观看的VR来说无法达标。看来画质和特效不能搞的太“变态”。

我还注意到无论VR Minimum还是VR Future测试GPU最大占用率都接近100%,这表明系统其它部分不存在明显的瓶颈。45W TDP功耗的Intel Xeon E-2176M CPU还是很给力的,别看6核12线程的它基础频率只有2.7GHz,而最大Turbo频率可到4.4GHz。再加上超过100W功耗的显卡,本本的散热要设计好哦,在这一点上面向商业用途的移动工作站,通常要比游戏本的标准要高。

image.png

Unigine Superposition Benchmark默认使用的单眼渲染分辨率——1332x1586就是Oculus Rift的标准。我除了在测试中加入自定义分辨率之外,还简单对比了一下HTC Vive的渲染分辨率,以及OpenGL和DirectX的差别。

首先,在VR Minimum和Optimum设置下,这台配置Quadro P4200显卡的Dell 7730移动工作站都达到10000的满分。接着我选择将VR Optimum的分辨率提高到单眼2048x2048(整体4K),8860得分仍在VR Ready的范围内。

当我将VR Maximum的默认单眼分辨率从1332x1586提高到1512x1680,这时测试得分从8290下降到7329。如果是对应Windows MR或者HTC Vive Pro头显,估计VR渲染分辨率还要再提高一些,同时画面精细度也会有些改善。

即使在VR Minimum这样的基本设置下,将单眼分辨率提高到4096x4096(即8K VR)性能也无法达标了。这个在意料当中,在笔记本上100W出头功耗的显卡已经属于发烧了。上文中我也提到GTX 1080显卡的台式机都搞不定8K。如果换成新一代的GeForce RTX 2080或者2080Ti呢?

注:至本文截稿之时,我已经测得了部分2080Ti的性能数据,如果大家感兴趣稍后可以再撰文分享。

在资源消耗最大的VR Future设置下,OpenGL图形接口的测试结果要比DirectX(D3D)稍低一些,这也符合人们通常的认识——在Unreal、Unity这几个引擎制作的沉浸式VR头戴显示应用中,Quadro显卡的性能与同等硬件规格的GeForce大致相同,因为大家都用DirectX。不过,有的图形工作站在VR内容创作中还可以有别的附加值,比如Dell Precision Optimizer(DPO)优化软件最新版本5.0就加入了对Unreal Engine 4的性能优化选项。

另外,如果用户在VR制作的前期,还会使用到3dsmax、Maya等动画类软件,专业显卡提供了全面ISV认证也就是兼容性的保障。对于制造业VR就更不用说了,Quadro和Radeon Pro在Siemens NX、CATIA、SolidWorks、PTC Creo等CAD类软件中,显著的性能和兼容性优势都是GeForce之类望尘莫及的。这方面有些大厂的工作站同样会提供ISV认证和性能调优工具支持。

image.png

最后我们再来看下帧速度,这可以说是上面那个测试得分的原始数据。

首先,前面4种设置的测试平均FPS都达到90,证明配置Quadro P4200显卡的Dell 7730移动工作站可以较好地胜任当今主流VR应用,包括4K(单眼分辨率2K)在内。

60FPS基本是VR显示可以接受的基本要求(视频除外),那么这款主机除了比4K更高的分辨率和极高质量的“Future”测试设置几乎都可以达标。

 总 结 

大家还记得我在开头提出的几个问题吗?现在有结论了:

a. 无论笔记本/移动工作站,还是台式机,在GTX 1070/1080、Quadro P系列显卡这一代还不能胜任8K(单眼4K)VR。

b. 4K(单眼2K)VR支持的难度不大,显卡建议配置GTX 1080、Quadro P4200或者更高。

c. 如果是几大流行引擎制作的VR内容(特指头戴沉浸式),Quadro专业显卡和GeForce游戏显卡的表现,基本上只看硬件规格就好,因为在这个领域DirectX的效率已经比较高了。制造业VR可视化则是另一种情况,跑OpenGL基本上只能选专业显卡,不然很容易自找麻烦。

d. 笔记本和移动工作站在合理配置下跑VR没问题,要注意的同样是显卡应以GTX 1060起步,比如Dell另一款VR Ready的Precision 7530配置的Quadro P3200专业显卡硬件规格就明显高于1060了。

补充:VR的性能不只取决于显卡,比如我看到在Unreal的最终生成阶段(有点类似于动画场景渲染),多核CPU是可以跑满的,而显卡负担相对不大。这一点与内容制作公司的朋友反馈信息一致,所以VR设计人员和使用/观看者对硬件的需求又各有侧重点。

推荐阅读

本文转载自企业存储技术微信公众号,[原文链接点这里]。
注:本文只代表作者个人观点,与任何组织机构无关,如有错误和不足之处欢迎在留言中批评指正。 进一步交流技术可以加我的微信/QQ:490834312。
尊重知识,转载时请保留全文,并包括本行及如下二维码。感谢您的阅读和支持!《企业存储技术》微信公众号:HL_Storage,也欢迎关注企业存储技术极术专栏,定期更新。
42.jpg
推荐阅读
关注数
5609
内容数
260
关注存储、服务器、图形工作站、AI硬件等方面技术。WeChat:490834312
目录
极术微信服务号
关注极术微信号
实时接收点赞提醒和评论通知
安谋科技学堂公众号
关注安谋科技学堂
实时获取安谋科技及 Arm 教学资源
安谋科技招聘公众号
关注安谋科技招聘
实时获取安谋科技中国职位信息