企业存储技术 · 2020年10月30日

SPECviewperf 2020基准测试更新:Quadro专业显卡再排座次

image.png

SPECviewperf 2020和SPECviewperf 14 Linux Edition

SPECviewperf是图形工作站领域最权威和流行的综合BenchMark软件,上一次我介绍它已经是4年前了——《_图形工作站专业显卡测试:SPECviewperf 12》当时的版本,我就在《性能暴降62%?图形工作站老司机踩坑记_》里使用过。

后来的viewperf 13版本,其实我这几年也断断续续在测试中跑过,只是不常撰文讨论,在《_软硬兼施Win7:8核笔记本/移动工作站出坑记_》的结尾处我就用它做过性能验证。

而我第一次使用SPECviewperf系列基准测试软件则是20年前了,在前不久的《_NVIDIA Quadro 20周年记:专业显卡的前生今世_》中我其实提到过。那时第一代NVIDIA Quadro还没有推出,我还是在TNT2芯片ELSA Synergy II专业显卡上跑viewperf6.1.1。

早就看到SPECviewperf 2020将要发布的新闻,没想到它正式公开时,NVIDIA最新一代专业显卡RTX A6000和A40已经放弃Quadro的系列命名了。

image.png

image.png

大家没有看错,上图中的SPECviewperf 14 Linux Edition并没有一同发布。按照以往的习惯,viewperf 13 for Windows版本之后会有一个对应在Linux下运行的版本;那么SPECviewperf 2020其实就相当于Windows下的14版本。

image.png

SPECviewperf 2020 viewsets

上图是新版测试软件更新的8个子测试集,比上个版本SPECviewperf 13少了一项。其中使用OpenGL 4.5图形驱动接口的包括catia-06,creo-03, energy-03, maya-06, medical-03, snx-04和solidworks-05,基于DirectX 12 API和只有一个3dsmax-07,这就是专业显卡继续存在的价值。

之前同样使用D3D的showcase测试被去掉了,可能与该软件用户群体较小有关(不具有代表性?)。像Autodesk这样不断收购的大公司,内部存在交集/部分功能重叠的软件并不新鲜,在发展过程中此消彼长太正常了。

关于上面这些子测试对应的应用软件,稍后我会详细讨论。先看一下新版BenchMark在相同硬件上运行速度(FPS,即帧/秒)的变化。

引入新测试模型,提高复杂度/ 帧率降低

image.png

注意:这个界面只能显示出一个GPU__为Intel__集成显卡,但实际运行测试的是NVIDIA Quadro RTX 3000 Max-Q__独显。

关于测试平台的扩展阅读

《_17寸全面屏轻薄本拆解:Precision 5750移动工作站(上)_》

《_性能、可靠性和音频设计:Precision 5750移动工作站(下)_》

《_让45W TDP CPU稳跑75W的秘密:Blender渲染测试(含Optix去噪点)_》

首先,我在手头的Precision 5750移动工作站上分别测试了SPECviewperf 13和2020(下文中还会有3640塔式工作站),对比结果如下:

image.png

根据这个图表,我们发现以下特征。

- 运行_新版_测试软件帧速率显著下降的:3dsmax-07__、catia-06__、creo-03__、medical-03__、solidworks-05__;

-与上一代子测试集速度基本持平的:energy-03__、snx-04__;

-新版SPECviewperf 2020__得分不降反升的?maya-06__。

结合对测试截图的观察,可以初步确定的是energy-03、snx-04(Siemens NX)和maya-06这三个子测试使用的模型与上一个版本SPECviewperf 13基本没有变化,也就是新瓶装旧酒了。

注:下文中介绍如有翻译不准确之处,请参照文末链接中的英文原始内容。

1.3ds Max测试集

image.png

3dsmax-07__中引入的新模型

3dsmax-07视图集是使用默认的Nitrous DX11驱动程序根据3ds Max 2016生成的图形工作负载轨迹创建的。此视图集的模型来自SPECapcfor 3ds Max 2015基准测试和其他来源。为了最好地接近真实的用例,一些测试在屏幕上合并了多个视图集,每个视图集使用不同的渲染模式。视图集中的渲染样式反映了主流市面中最常用的样式,包括逼真的(realistic),着色(shaded)和线框(wireframe)。还合并了一些较少使用但有趣的渲染模式,例如刻面(facets),石墨(graphite)和粘土(clay)。视图集中的动画是模型旋转和摄像机视角位置变化的组合,取决于具体的模型。

Viewset tests

  1. Architectural model, shaded
  2. Architectural model, graphite
  3. Space model, wireframe
  4. Space model, clay
  5. Film/games model, shaded
  6. Film/games model, shaded
  7. Huge fish model, wireframe
  8. Huge fish model, shaded
  9. Office model, realistic
  10. Office model, shaded
  11. Office model, realistic, with materials

2.CATIA测试集

image.png

catia-06__引入的新模型之一

catia-06视图集是根据DassaultSystèmes(达索)的CATIA V5和3D EXPERIENCE CATIA应用程序生成的图形工作负载的轨迹创建的。模型大小范围从510万到2100万个顶点。视图集包括应用程序支持的几种渲染模式,包括抗锯齿(anti-aliasing),着色(shaded)和带有边缘的着色(shaded with edges)。

Viewset tests

  1. Catia V5 loft jet, shaded with edges
  2. Catia V5 loft jet, shaded with material
  3. Catia V5 ICD car, shaded with edges
  4. Catia V5 ICD car, multiple views, shaded with edges
  5. Catia 3Dexperience jet engine, shaded
  6. Catia 3Dexperience loft jet, shaded with edges
  7. Catia 3Dexperience ICD car, shaded with edges
  8. Catia 3Dexperience ICD car, multiple views, shaded with     edges

3.PTC Creo测试集

image.png

creo-03__引入的新模型之一

creo-03视图集是根据PTC Creo™4应用程序生成的图形工作负载的轨迹创建的。模型大小从2000到4800万个顶点不等。视图集包括应用程序支持的多种渲染模式。所有具有透明组件的模型均启用了Order-independent transparency。

Viewset tests

  1. Scorpion car, shaded with reflections, SSAO, bump map,     transparency with color, 8x anti-aliasing (AA反锯齿)
  2. Submarine, shaded with reflections, SSAO, bump map,     image background, 4x AA
  3. World car, shaded with reflections, SSAO, bump map,     transparency with color, 8x AA
  4. World car, shaded, no AA
  5. Scorpion car, shaded, no AA
  6. Submarine, shaded 4x AA
  7. World car, shaded with edges, 4x AA
  8. Scorpion car, shaded with edges, no AA
  9. Submarine, shaded with high-quality edges, 8x AA
  10. World car, hidden lines, no AA
  11. Scorpion car, hidden lines, 8x AA
  12. Submarine, no hidden lines, no AA
  13. Scorpion car, no hidden lines, 8x AA

其中由__PTC__提供的__Worldcar__模型也进化点了,终于不再是__SPECapc集测试中那个万年不变的黄色赛车。

4.Energy能源测试集(OpendTect地震可视化应用)

 

energy-03视图集基于开源OpendTect地震可视化应用程序使用的渲染技术。

image.png

与MRI或CT等医学成像类似,地球物理勘测生成穿过地下的图像切片,这些图像切片内置于3D网格中。体绘制提供了此3D体网格的2D投影,以供进一步分析和解释。除了体积渲染外,该测试还包括内嵌和交叉线平面(X和Y平面中的切片)。一些子测试包含视界(horizons),这些视界是感兴趣的地质地层边界,由勘探地球物理学家生成,并使用带纹理的三角形条带绘制。

此视图集中使用的3D数据集是在https://wiki.seg.org/wiki/Open\_data上找到的真实地震数据集。它们是从其原始SEG-Y格式转换而来的,并使用JPEG-2000进行了压缩。

Viewset tests

  1. Blake Ridge volume (1307x95x1300) and horizons
  2. F3 Netherlands volume (950x450x462) and horizons
  3. Opunake volume (1949x731x1130)
  4. Blake Ridge volume (with animated clipping plane) and horizons    
  5. F3 Netherlands volume (with animated clipping plane)     and horizons
  6. Opunake volume (with animated clipping plane)

5.Maya测试集

maya-06视图集是根据Autodesk Maya 2017应用程序生成的图形工作负载的轨迹创建的。

视图集包括应用程序支持的多种渲染模式,包括着色模式,环境光遮挡(ambient occlusion),多样本抗锯齿(MSAA)和透明度(transparency)。所有测试均使用Viewport 2.0呈现。

image.png

前面提到了这些测试比上一版本没有更新,那么测试速度提高只能解释为驱动的优化?

Viewset tests

  1. Toy store, smooth-shaded with wireframe on shaded mode,     ambient occlusion, and 4x multisample antialiasing
  2. Toy store, wireframe mode and 8x multisample     antialiasing
  3. Jungle escape, smooth-shaded with hardware texture     mode, ambient occlusion
  4. Jungle escape, smooth-shaded with hardware texture mode
  5. Sven space, smooth-shaded with hardware texture mode
  6. Sven space, smooth-shaded, ambient occlusion, and 4x     multisample antialiasing
  7. HSM satellite, smooth-shaded and 8x multisample     antialiasing
  8. Ship splash, smooth-shaded with all lights
  9. Ship splash, wireframe mode and 4x multisample     antialiasing
  10. Ship splash, smooth shaded with hardware texture mode,     ambient occlusion, and 8x multisample antialiasing

6.Medical医疗图像测试集

image.png

medical-03__中引入的新模型——__Alligator__(短吻鳄)_\_1103MB\_Raycast\_2Dxf_

medical-03视图集演示了几种医学可视化体积渲染技术的性能。第一个是切片渲染,其中许多2D切片通过整个体积投影并合成在屏幕上。第二个是光线投射,其中光线投射通过累积最终像素颜色的体积。

使用两种不同的传递函数:一维(1D,其中密度用于查找每个体素颜色)和二维(2D),其中密度和渐变幅度用于查找每种体素颜色。剪切平面用于多个测试中。Tuvok可视化库用于渲染。

Viewset tests

  1. Beating heart, 256x256x32, 1D transfer, slice rendering
  2. Beating heart, 256x256x32, 1D transfer, raycasting
  3. Stag beetle, 832x832x494, 1D transfer, slice rendering
  4. Stag beetle, 832x832x494, 1D transfer, raycasting
  5. Brain, 232x256x192, 2D transfer, raycasting
  6. Brain, 232x256x192, 2D transfer, raycasting, clipping     plane
  7. Broken arm, 512x512x102, 2D transfer, raycasting
  8. Broken arm, 512x512x102, 2D transfer, raycasting,     clipping plane
  9. Alligator, 737x511x1536, 2D transfer, raycasting
  10. Alligator,     737x511x1536, 2D transfer, raycasting, clipping plane

Tuvok渲染核心已获得MIT开源许可证的许可;参见https://github.com/SCIInstitu...。Tuvok包含一个希尔伯特曲线(Hilbert Curve)的实现,莱斯大学拥有1998年的版权。 Tuvok还包括LZ4,它已获得BSD2条款许可。

7.Siemens NX测试集

snx-04视图集是根据Siemens PLM的NX 8.0应用程序生成的图形工作负载轨迹创建的。2个模型大小分别为715万、845万个顶点。视图集包括应用程序支持的多种渲染模式,包括线框,抗锯齿,着色,带有边缘的着色以及工作室模式(studiomode)。

image.png

动力总成和SUV模型由Siemens PLM提供。

8.Solidworks测试集

image.png

solidworks-05引入的新模型大都来自SPECapc for Solidworks测试包,SW2020\_Space Crawler(NASA履带式运输车)是其中最大的一个模型,我在下面2篇中都使用过:

《_SolidWorks 2020测试:GPU如何速度翻倍 & 赢画质?_》

《_SolidWorks测试(3):五款显卡选择指南,AMD、GeForce也来凑热闹_》

solidworks-05视图集是根据DassaultSystèmes的Solidworks 2020应用程序轨迹创建的(_注:之前版本测试套件中的__sw-04__使用了SolidWorks 2013 SP1_)。视图集中使用的模型的大小范围从210万到2100万个顶点。视图集包括应用程序支持的多种渲染模式,包括着色模式,带边缘的着色,环境光遮挡,着色和环境贴图(environment maps)。

请注意,如果存在的专用GPU内存少于4GB,则该基准测试不能代表Solidworks 2020的性能,并且不应得出有关视频RAM少于4GB的Solidworks 2020应用程序性能的结论。

Viewset tests

1. Rally car in RealView mode with environment mapping, ambient occlusion,and shadows

2. Rally car in shaded-with-edges mode with environment mapping

3. Rally car in shaded mode with environment mapping

4. Excavator in shaded mode with environment mapping

5. Excavator in RealView mode with environment mapping, ambient occlusion,and shadows

6. Jet engine in shaded-with-edges mode with environment mapping

7. Jet engine in shaded mode with environment mapping

8. Jet engine in RealView mode with environment mapping, ambient occlusion,and shadows

9. NASA crawler in shaded mode with environment mapping

10. NASA crawler in shaded-with-edges mode with environment mapping

Play

我只录了这一段简短的SPECviewperf 2020__测试视频,还忘记把标清改为高清了。给大家省流量吧:)

车辆模型由TurboSquid和tiagoofernandes提供。要查看更多工作,请访问:http://www.turbosquid.com/Sea...

另有一个汽车模型由AMD提供。

测试软件先介绍到这里,下面轮到更多的硬件出场了。

Quadro RTX 5000 + Core i9-10900工作站测试

image.png
除了前面讲过的Precision 5750移动平台,我还在Dell 3640 Tower工作站上运行了SPECviewperf 2020测试。

image.png

由于当前spec.org网站上公布的测试结果中,恰好没有Precision工作站配RTX 5000显卡的成绩,所以我只好引用下HP Z2 Tower G5的同配置得分作为参照。

首先,Quadro RTX 5000(16GB显存)的速度比用于移动工作站的RTX 3000(6GB)还是快了许多,有的测试项目中达到2倍左右。不过别忘了RTX 5000的TDP功耗高达230W,而RTX 3000 Max-Q只有65W,所以后者还是挺高效的。

这里有的朋友可能会问:在实际应用中为什么经常看不出显卡有这么大性能差距呢?因为SPECviewperf针对性能瓶颈进行过处理,让CPU尽量少影响到显卡发挥;而实际应用中的图形操作,有不少情况下单个CPU核心的性能会成为瓶颈。

至于2款不同工作站上Quadro RTX 5000的性能对比,几个项目有出入也属于正常,毕竟使用的驱动版本、系统设置等应该有一些小差别。我只是验证下自己的测试数据正常即可。

可惜手头还拿不到NVIDIA最新一代的RTX A6000和A40,不然真得好好测下。

最后简单带大家看一下测试平台——Dell最新一代塔式工作站。

image.png
本次测试使用的Precision 3640 Tower工作站,Intel Comet Lake PCH-H W480芯片组,支持10代Core和Xeon W-12xx系列处理器(可高达125W TDP),可以选配高级前置I/O USB端口,其中包括:

• 1 _个 USB 3.2 Type A_ 第 1 _代_

• 1 _个 USB 3.2 Type A_ 第 2 _代_

• 1 _个 USB 3.2 Type A_ 第 2 _代,支持 PowerShare_

• 1 _个 USB 3.2 Type C_ 第 2 _代,支持 PowerShare_

image.png

机箱结构和散热,沿用了上一代Dell 3630就引入的设计。上面这张风道示意图我以前也曾用过。

image.png

打开机箱维护配件时,沿着转轴把“折叠”放置的电源竖立起来即可。这个金属转轴就如同Dell工作站机箱的钢板厚度一样稳固,用过的朋友应该会有同感。每一款稳定高效的图形工作站,大多能从硬件的用料和做工上反映出来。

参考资料

SPECviewperf 2020 benchmark介绍 https://www.spec.org/gwpg/gpc...

测试结果页面 https://www.spec.org/gwpg/gpc...

推荐阅读

本文转载自企业存储技术微信公众号原文链接点这里

注:本文只代表作者个人观点,与任何组织机构无关,如有错误和不足之处欢迎在留言中批评指正。 进一步交流技术可以加我的微信/QQ:490834312。
尊重知识,转载时请保留全文,并包括本行及如下二维码。感谢您的阅读和支持!《企业存储技术》微信公众号:HL_Storage,也欢迎关注企业存储技术极术专栏,定期更新。
42.jpg

推荐阅读
关注数
5609
内容数
260
关注存储、服务器、图形工作站、AI硬件等方面技术。WeChat:490834312
目录
极术微信服务号
关注极术微信号
实时接收点赞提醒和评论通知
安谋科技学堂公众号
关注安谋科技学堂
实时获取安谋科技及 Arm 教学资源
安谋科技招聘公众号
关注安谋科技招聘
实时获取安谋科技中国职位信息