企业存储技术 · 2020年10月13日

NVIDIA Quadro 20周年记:专业显卡的前生今世

\# _谨以此文献给每一位专业显卡和工作站爱好者 #_

目录

-RTX  A6000 & A40:告别Quadro品牌?

-ELSA Gloria II:NVIDIA Quadro的开始

-Quadro显卡价值新说:6大专业特性

   1、Mosaic多屏拼接、融合

   2、G-Sync同步子卡——从3DLabs Wildcat偷师来?

   3、无限制视频流——NVENC编码并发

   4、虚拟现实VR SLI与NVLink多卡

   5、生产力工具:Quadro Experience和Quadro View

   6、企业驱动 vs. GeForce Studio Driver

-后Quadro时代的专业显卡

昨天看到新闻,NVIDIA在GTC大会上发布了Ampere(安培)架构的新一代专业显卡RTX A6000和A40。二者同为48GB显存、300W TDP,RTX A6000为主动散热;被动散热的A40规格参数略低——针对服务器设计。

image.png

RTX A6000__——从这款专业显卡开始,NVIDIA__不再使用Quadro__品牌__了。上图左侧可以看到8pin__供电接口,这一点我会在下文中讨论。

在几个月之前NV宣布A100通用计算GPU时,也取消了Tesla的品牌,当时的说法是因为有个Tesla汽车。不过从现在来看似乎不是那样,除了在游戏/消费级/一般商用市场大名鼎鼎的GeForce品牌之外,NVIDIA未来的“Tesla”和“Quadro”型号看来都要直接以数字开头了,其中主动散热的(如:A6000)才会在前面加上“RTX”开头。

image.png

上图截自NVIDIA RTX A6000官网页面,其实NV还是默认它属于Quadro系列专业显卡。从20多年前刚开始接触专业显卡/图形工作站时,我就知道显示驱动在其中的重要价值,然而在今天的“Quadro专业功能”中,“企业驱动”却被放在了这个横排的最后一项。这又是为什么呢?

虽然本文拟了一个回顾的标题,但今天我不想单纯讲硬件发展历史,因为那样对读者来说,除了怀旧可能没有更多的价值。反而我想把上面Quadro这6大功能特性过一遍,以新的视角来审视下与GeForce显卡的差异。

image.png

正好我找到一份NV官方文档《_NVIDIA EGX™ SERVER FORSCALABLE VISUALIZATION SOLUTIONS DESIGN GUIDE_》,里面仍然写着Quadro RTX A6000。就像一位朋友所说的,NV想继续强调RTX光线追踪,也许是为了使型号命名不要太复杂,就放弃了Quadro。

我觉得可能还有一个原因,在GPGPU和专业显示领域,NV在市场份额上相对AMD占据绝对优势地位;Tesla和Quadro毕竟只在企业级/商用市场,品牌知名度远没有GeForce那样家喻户晓,所以改个叫法不会有啥影响。

ELSA Gloria II :NVIDIA Quadro 的开始

image.png

当年这款“刀版”专业显卡,与GeForce 256芯片的ELSA Erazor(影雷者)X长得差不多。都是Made in France。

本来想写“前生今世”,然后发现自己在3年前的《_20年变迁:图形工作站 & 专业显卡——ELSA GLoria-XXL篇_》中已经写到了上面这款卡,也就是NVIDIA Quadro诞生之前的故事。

最初还有人把Quadro称为“GeForce Quadro”(这2个品牌诞生就是前后脚),因为NV和ELSA(艾尔莎)当年也承认芯片的硬件设计几乎一样。Gloria II比GeForce 256大一倍的64MB显存只是个表象,区别关键在于驱动程序,那时NV已经收编了ELSA的专业显卡驱动团队。

当年在ELSA总代给我们做Gloria II显卡培训的钱总,后来开的公司规模发展不小,我还给人家打过工。强氧当年在国内工作站圈里也算有一号,这里就不展开聊了:)

我在网上找Gloria II老图片的时候,发现居然还有下面这块我没见过的的卡——GloriaII-Pro。
image.png
左上角的贴纸,看着有点眼熟哈:)

ELSA Gloria II-Pro最大的特色,我认为是下面的金手指——AGP Pro而不是普通的AGP。当年由于插槽供电的限制,应该也是Intel搞出AGP Pro-50(50W)和Pro-110(110W)两种加强供电的插槽。Gloria II-Pro应属于前者。

我想确定下GloriaII-Pro硬件上对应的就是GeForce256 DDR显存版,于是搜索驱动来查看显示芯片的代号,结果找到了Dell网站:

image.png

果然是20年前——2000年发布的驱动,注意它的版本号是3.8.1而不是v381。这驱动今天还能下载,厉害吧。

image.png

当年的Precision工作站420和620型号我就不熟了,那时我还在做白牌。还记得才华横溢的同事小马哥曾经说:“我们就要做中国的….”

image.png

ELSA Gloria II的Quadro芯片代号是NV10GL,这一点我记忆犹新;Gloria II Pro对应的果然是NV10DDR。

至于我没在中关村见到GloriaII Pro的原因,可能是这款只针对OEM市场吧——后来直接换代到ELSA Gloria III(Quadro 2 Pro)和Synergy III(Quadro MXR)了。普通GeForce256 DDR显卡不需要AGPPro加强供电;因为当时Quadro的频率略高,再加上64MB DDR显存,AGP Pro还是为了保险起见吧。这样主板也只能上工作站专用了。

Quadro 显卡价值新说:6 大专业特性

1 、Mosaic 多屏拼接、融合

image.png

我在去年底去苏州参会时写了一篇《_NVIDIA GTC随笔:实时光线追踪vs. 影视照片级渲染_》,开头就提到Quadro Plex 7000外置显卡箱子,这次放个图吧:

image.png

从硬件上看,Quadro Plex和主机连接是用PCIe电缆,里面就是2块双宽Quadro显卡,加上一块G-Sync同步子卡。当年显卡只能提供2个DVI输出,这样要拼4个或以上屏幕就要2块Quadro,或者再堆多台Plex,加上显卡驱动里的Mosaic支持。NV最初应该是想多赚钱,只限定Quadro Plex这种豪华方案才支持Mosaic;后来大概是卖的不好,干脆把Plex放弃、驱动里限制也取消了。

image.png

Mosaic到今天还是用于屏幕拼接、边缘融合。Windows下受16K分辨率的限制,4K屏最多也就是做到4x 4(块卡),Linux下可以玩8卡32屏的。

2 、G-Sync 同步子卡——从3DLabs Wildcat 偷师来?

image.png

NVIDIA G-Sync今天在游戏玩家中并不陌生,而在10年以前还没什么高刷新率的液晶显示器,G-Sync可不是用来防止游戏画面撕裂的——而是用来同步多块显卡输出的每一帧刷新的时钟相位,这在大屏拼接,特别是立体投影和VR这样需要高刷的场合很重要。那2个RJ-45网口和BNC同轴线缆接口,我最早是在高端的3DLabs(InterGraph)Wildcat野猫显卡上见到过——被用于多主机显卡之间的刷新同步信号。后来NVIDIA在Quadro FX 3000G上把它学过来了,再往后成为一个与Quadro连接的子卡,并更新了几代。

3 、无限制视频流——NVENC 编码并发

image.png

点开图片后可缩放(其余同)

显卡芯片里的NVENC编码器和NVDEC解码器,我想许多朋友都不陌生了。这里要讲的是除了处理能力,NVIDIA对GeForce显卡的最大并发视频编码流数做了限制——只支持3个会话,即使NVENC的资源有富裕。

image.png

相比之下,许多Quadro和Tesla专业GPU就不同了,Max# of concurrent sessions是没有限制的。这对于云桌面/云游戏/云VR类应用还是很有价值的,不知是否算蹭上5G的大潮?顺便提一下视博云和平行云——国内在云VR视频推流/无线串流技术上比较领先的两家国内公司。

4 、虚拟现实VR SLI 与NVLink 多卡

image.png

 

关于VR我以前写过2篇评测:

《_VR测试:8K、移动工作站和极端挑战_》

《_NVIDIA2080Ti两倍于1080性能?8K VR&渲染测试(续)_》

其中提到像2080Ti这样的显卡,8K分辨率(单眼4K)下也只能跑跑低画质。更高的需求我听说是用另一种方式——NVLink多卡来连接VR头盔。

NV网站在“沉浸式VR”部分也是这样写的:

“在极高分辨率的头戴式显示器(HMD) _上,利用加速的图形性能和更高的显示带宽驱动极具沉浸感的增强现实(AR)_ 和虚拟现实(VR) _体验。4_ 路直接 VR SLI _为每只眼睛分配通过 NVLink_ 连接的 2 _个 GPU__,从而提供极佳性能。”_

再想想GeForce RTX 30这一代消费级显卡上为啥取消了NVLink?一个是需要更大显存的GPU渲染,还有这里的高端VR,你只能用“Quadro”,买的不如卖的精吧:)

5 、生产力工具:Quadro Experience 和Quadro View

关于Quadro Experience我实在不想谈太多,因为感觉它就是GeForce Experience的一个翻版。至于Quadro View嘛,有些朋友可能还记得被冷落多年的nView桌面(窗口)管理器,其实也是延续发展出来的。
image.png

20年前最先在显卡上搞出双头(Dual Head)输出的是Matrox G400,时至今日Matrox仍是多屏领域的专业玩家。

记得曾经有个段子:Matrox显卡驱动的(多)桌面管理器部分据说是一个人写的,NV还是AMD(ATI)把他挖过去就搞出了自己的。最终结果是大家都支持多屏了,不过这些管理器工具用的人应该不多吧,毕竟显示器厂商也能提供这种软件。

比如我在《_为什么应用切换时会偏色?显示屏的自动调色与分屏功能_》里面介绍的Dell PremierColor和DDM,切分桌面窗口的功能都蛮有特色。NVIDIAQuadro View需要使用专业显卡,也不能说各方面功能都是最强的,不过有一点先天优势就是和自家的Mosaic技术结合的最好。

6 、企业驱动vs. GeForce Studio Driver

image.png

上图源自去年我在渠道培训时用的ppt。客观地讲,近些年工作站上跑的3D图形设计、视频编辑等应用,并不是所有都仍然强依赖Quadro专业显卡了(也有些用户就跑在普通台式机或笔记本上)。特别是媒体娱乐行业/DCC类应用,Autodesk和Adobe旗下的不少软件都支持Direct3D或者在GeForce上也能良好运行,ISV没必要提高用户的硬件配置门槛,这一点不是NVIDIAQuadro和AMD RadeonPro能自己说了算的。

我甚至还总结了一个表格,把自己经验里GeForce支持不错的软件都列出来。不过我不敢公开发,怕卖Quadro的同行打我…

从NVIDIA为GeForce推出Studio驱动开始,消费级显卡也支持30bit色深(3原色x10bit,之前只支持3 x 8bit)。如今GeForce和Quadro都有Studio Driver并且版本通用了,那么当年讲的专业显卡驱动优化神器还剩多少功力呢?

我觉得要从2方面来看吧:性能和兼容性认证。

image.png

Siemens NX__可以说是专业显卡试金石的代表

性能方面有基准测试软件可以参考,比如我在《_图形工作站专业显卡测试:SPECviewperf 12_》里介绍的,viewperf当前最新版本为13。20年前,NVIDIA第一代Quadro发布时的6.1.x版本我就在跑着玩了。

制造业CAD类软件,特别是Siemens NX、Dassault CATIA、SolidWorks、PTC Creo等三维设计,以及能源行业沿用传统OpenGL图形接口的应用,Quadro的性能优势还是明显的;GeForce有时会由于驱动原因跑的很慢、特效不支持或者出现显示错误。

image.png

上图应该是地震数据解释/__可视化

除非有过使用者的经验可以参考,还是ISV认证更加保险,专业显卡、工作站硬件制造商在这方面下的功夫不是白费。

image.png

上图截自SolidWorks__官网的硬件认证页面

比如我在《_Precision 3540移动工作站评测(SolidWorks& Revit实战)》和《SolidWorks 2020测试:GPU如何速度翻倍 & 赢画质?_》里都提到过ISV认证的重要性,除了保证工作站机型&显卡硬件最好的兼容性之外,还能提供最佳效能的专业显卡驱动版本,避免用户走弯路。毕竟对设计师来说浪费时间就是浪费金钱。

后Quadro 时代的专业显卡

上面写了这么多,读者朋友应该看出我对专业显卡的感情了吧。过去20年我虽然不是一直都在做工作站,但服务器、存储也算没离开IT硬件这个圈。最后再来简单看看本次的新品,尽管还没有更多的详细资料,更没有拿到测试卡。

image.png

如果从上一代QuadroRTX 6000、8000的295W TDP来看,A6000的300W功耗没提高多少。但别忘了之前是算上了VirtualLink的Type-C接口供电能力(约30W),所以这一代新卡对电源的要求还是提高了。

image.png

被动散热的NVIDIA A40

image.png

300W供电靠8+6pin PCIe供电搞不定了,RTX A6000和A40没有像RTX 2080Ti和3080那样用2-3个8pin或者新的专用供电接头,而是像Tesla那样选择了电流密度更高的EPS 12V 8pin CPU电源连接器。我认为这在多卡环境下会比较简洁。

由于之前已经有被动散热的QuadroRTX 6000和8000用于服务器,我对这次的A40也不惊讶,一点意外是它还加入了3个DP显示输出接口,看来“Quadro”的多卡应用在增加,其中应该包括vGPU虚拟化和GPU渲染。

我看到有的新闻中说A40是Tesla T4的下一代,我不是太认同。从性能和功耗上看,70W TDP的T4和300W的A40不在一个水平上,我觉得A40更像是以前Tesla P40(250W,24GB)的延续发展,并加入了Quadro的全部物理显卡功能。

至于双精度浮点和最强的AI算力,自然还是要看A100 GPU,那么Quadro这次还会有GA100吗?

噢对,我又忘记现在不叫Quadro__了:)

推荐阅读

本文转载自企业存储技术微信公众号原文链接点这里

注:本文只代表作者个人观点,与任何组织机构无关,如有错误和不足之处欢迎在留言中批评指正。 进一步交流技术可以加我的微信/QQ:490834312。
尊重知识,转载时请保留全文,并包括本行及如下二维码。感谢您的阅读和支持!《企业存储技术》微信公众号:HL_Storage,也欢迎关注企业存储技术极术专栏,定期更新。
42.jpg

推荐阅读
关注数
5613
内容数
260
关注存储、服务器、图形工作站、AI硬件等方面技术。WeChat:490834312
目录
极术微信服务号
关注极术微信号
实时接收点赞提醒和评论通知
安谋科技学堂公众号
关注安谋科技学堂
实时获取安谋科技及 Arm 教学资源
安谋科技招聘公众号
关注安谋科技招聘
实时获取安谋科技中国职位信息