企业存储技术 · 2022年09月26日 · 北京市

AMD 64核搅局工作站市场:Dell Precision 7865技术解析

前言:连Intel自己都承认,代号Sapphire Rapids的下一代Xeon Scalable延期到明年上半年,给AMD服务器CPU提高占有率创造了机会。如果Intel当初能预测到今天的局面,会不会在工作站上也引入第三代Xeon SP平台呢?我认为现在这个窗口,也是AMD切入主流工作站市场的一个好机会吧。

目录

- AMD Threadripper PRO 5000:EPYC3的单路工作站版本

- 硕大的6铜管底部直触CPU散热器

- 4+2+N存储盘位、整机散热风道设计

- 内存插槽:除了通道布局,还暗藏了什么?

- 从PCIe插槽和供电看显卡(GPU)支持

- NVMe存储优化设计:专用接口和温度传感器

接前文:《以“小”见大:从Precision 3660看工作站技术发展趋势

移动工作站DDR5内存频率之殇:怎么破?

AMD Threadripper PRO 5000:EPYC3的单路工作站版本

在今年聊过配置12代Core CPU的台式、移动工作站之后,一款在整体设计上让我更感兴趣的产品终于发布了——那就是AMD Ryzen Threadripper(线程撕裂者)PRO 5000WX系列。

image.png

如上图,这个针对工作站的处理器系列,从硬件结构上大致就相当于单路的第三代EPYC 7003系列服务器CPU。其最高配64核型号,也是采用8个8 Core的CPU Die(应该是台积电5nm工艺),加上中间那个尺寸较大的I/O Die(应该是14nm制程)组成的Chiplet小芯片架构。

前几年就关注我公众号的读者朋友可能看过下面2篇,对服务器CPU感兴趣的朋友也可以参考下:

AMD EPYC2服务器片上NUMA设置&应用建议

多Die封装:Chiplet小芯片的研究报告
image.png

在Windows 11以及较新版本的Win10系统中,Ryzen Threadripper PRO 5995WX都能正确识别为1颗64核128线程(逻辑处理器)CPU。

与Intel 12代Core CPU建议使用Win11的调度器,才能对大、小核架构最佳支持不同的是,AMD目前都还是大核,所以不用担心Win10影响效率。

image.png
Dell Precision 7865 Tower塔式工作站

在Dell当前工作站产品线中,Precision 5820/7820共用的机箱(结构)是2017年就已发布的。我感觉7865这一代更新将至少考虑未来2-3年的需求。不说远的,NVIDIA刚发布的GeForce RTX 4090显卡(450W功耗),我曾经猜测Dell 3660工作站上的1000W电源选项就是为它准备的。

image.png

注意:上图拍照时的DIMM内存插法,并不是最优化的。请参见下文中详细说明!

AMD Ryzen Threadripper的CPU插座是与EPYC完全相同的SP3(LGA 4096),比Intel一、二代Xeon Scalable的LGA 3647引脚还要多,这也是它能支撑64核心、8通道内存控制器的重要前提。
image.png
AMD“SP3”插座CPU有特色的安装方式
image.png
Ryzen Threadripper PRO5995WX背面照
image.png
尽管Threadripper系列CPU型号没有服务器那样丰富,只是12、16、24、32、64核心共5款。但我觉得要留意下280WTDP(热设计功耗),这能够确保它们在全核工作时还能保持较高的主频。
image.png
硕大的6铜管底部直触CPU散热器

根据上图中的比例关系,参照下内存槽就不难看出Precision 7865工作站的CPU散热器有多大个头。

image.png

我的拍照背景有点零乱,请见谅。有兴趣的朋友可以估一下这个散热器的成本大概多少:)

image.png

一共6根热导管,并且是贯穿散热器底部直接贴合到Ryzen Threadripper PRO CPU表面。这应该是为了尽量降低280W风冷散热的噪音,工作站用户普遍在乎这个。
image.png
4+2+N存储盘位、散热风道设计

打开Precision 7865机箱侧盖板之后,它上面有多少“机关”结构设计我先不在这里具体讨论,有2张示意图不容错过——Mechanical Overview和Electrical Overview,分别对应机械和电气。
image.png
先看上图中的3个红框,这是6个存储驱动器安装位(不算超薄光驱)。板载的M.2 PCIe SSD 0/1不用我解释了;Internal HDDs 2/3是内置的3.5/2.5英寸硬盘位;再往上的External Drives是可以从机箱前面板直接插拔的2个驱动器位(Flexbay),这里可以选配NVMe SSD或者SATA盘,两种接口1+1的组合也支持。

Precision 7865可以安装4个3.5英寸硬盘;NVMe SSD最多当然远不只4个,别忘了还可以加2/4个M.2的Ultra-Speed Drive转接卡(也更新为支持PCIe 4.0的新款),这取决于PCIe插槽还有多少剩余。大家还记得上次我在Dell 3660工作站上是怎么测试的吗?(扩展阅读《10GB/s存储方案设计测试:用PCIe 5.0单盘还是SSD RAID?》)

然后看上图中的那些箭头。其中机箱后部2个FAN Rear0/1主要负责CPU散热,同时稍带了内部HDDs 2/3;主板中间有个小的DDR Fan应该是辅助内存散热;右下方机箱进风口的大尺寸系统风扇,主要是针对PCIe扩展卡,稍带板载M.2 NVMe SSD 0/1;顶部的Fan HDD是用于2个External Drives的。

按照Dell工作站的习惯,BIOS设置里应该支持每个区域风扇转速单独调节(加速),比如使用在特殊环境(如超海拔高度),或者加了什么被动散热的大功率板卡。应该说这还不是所有的风道。首先PSU电源也有风扇向后排气;另外如果安装涡轮风扇的显卡,对整体散热容量也会有提高助益。
image.png
Precision 7865主板上的M.2 PCIe SSD 0/1安装位,散热片下可支持2个2280或者2230 SSD。
image.png
Dell工作站前面板的Flexbay可抽换驱动器,许多朋友应该都不陌生了。在上面照片中的2个5.25英寸宽度仓位上,可以都选配成NVMe SSD、SATA盘或者1+1。如果是图中这样支持M.2的转接托架,那么后面依然会有U.2 SSD的背板,4年前我就是在Precision 5820上测试了2.5英寸的Intel Optane 900P傲腾SSD

内存插槽:除了通道布局,还暗藏了什么?

image.png
7865工作站一共8个DDR4-3200 DIMM内存插槽,AMD Ryzen Threadripper PRO CPU的内存控制器正好是8个通道,也就是说8条插满时内存带宽应该是最高的。

在《Precision 7865塔式工作站设置和规格》里推荐的内存安装数量是1、2、4和8。经过我简单的尝试,发现要按照上图或者主板上标注的插槽顺序来安装才能实现理想的通道数。比如2条内存,要插在DIMM 1+2槽才能识别为双通道,而不建议插为左右对称的1+3或者2+4;4条内存时相对不太容易犯这个错吧。

image.png

Precision 7865最大支持8条128GB内存,在上述文档以及产品彩页中我看到的都是“ECC”,也有的地方写了RDIMM。以往Dell 7000系列工作站出厂标配应该都是RDIMM,一方面是Xeon内存控制器的要求,另外无缓冲的UDIMM最大单条容量只有32GB。

不过只是从纯技术的角度分享个信息:UDIMM内存曾经在我手头的测试机上“点亮”运行,当然Dell并不对非认证部件提供技术支持,我也不担保每一台7865都可以这样使用。特别是,不要混用RDIMM和UDIMM内存。

扩展思考:AMD的EPYC服务器CPU应该不能支持UDIMM吧?
image.png
固定在7865工作站导风罩上的DDR Fan内存风扇

从PCIe插槽和供电看显卡(GPU)支持

image.png

上图中我用红圈标注的3处,是为了指示那3个PCIe 4.0 x8插槽的末端是Open开放的,即物理结构上可以安装x16金手指的插卡。相比之下,当前Precision 5820/7820/7920工作站的PCIe插槽,无论电气上是x8、x4还是x1 lane,都使用了全长的x16 PCIe物理连接器。7865为什么不延续之前的设计呢?

这个问题不难解释,因为曾经遇到过几次,客户自行拆装显卡时插入了电气上PCIe 3.0 x4甚至是x1的插槽——特别是后者出现性能问题不难理解吧?无论你用蓝色、黑色来标明不同的PCIe插槽,以及在x16插槽旁边印上75W供电都可能有人不看。而如今以7865工作站上PCIe 4.0 x8的带宽(与PCIe 3.0 x16相同),像RTX A4000这个级别的单宽显卡,我反倒觉得性能发挥应该没问题了。

Precision 7865从电源引出4个8pin辅助供电针对GPU,从PCIe规范来看每组至少能提供150W的稳定供电。下面我想分几种不同的显卡讨论下(只闲聊yy,不代表官方):

- NVIDIARTX A6000或者最新发布RTX 6000 Ada(Ada Lovelace架构),每块卡300W,应该完全支持2块。

- GeForceRTX 3080、3080Ti、3090,每块卡320-350W,如果是2.5-3插槽宽度只能安装一块。但要是用双宽涡轮风扇的版本,2卡技术上应该可行——相比于当前的Precision 5820,一方面7865的1350W电源功率提高了不少;另外,大家应该也看到2个PCIe x16插槽的间距拉大了,这样2块GPU热源不像以前那样紧挨着,有利于散热。

- 新发布的GeForce RTX 4090450W,我感觉不会有双宽风冷散热的版型了?支持1块技术上应该ok。RTX 4080 16GB是320W,如果有厂商推出双宽、2个8pin供电接口的型号,7865工作站是不是也能支持2块?
image.png
上图是NV官网当前给出的4080 16G(左)和12G(右)规格

- 像RTX A4000这样的单宽、150W级别功耗的(也包括特定版本、单宽涡轮风扇的RTX 3060),最多能支持4-5块吗?其实我知道曾有客户在5820工作站上用过4块RTX 4000显卡,但为了严谨一些,稍后我写到电源时会讨论下PCIe插槽的供电是否足够。
image.png
在《Precision 7865__塔式工作站服务手册》里我看到上图,不经意间似乎透露了一个信息:画红框部分的显卡,如果我没看错应该是RTX 3070。既然电源足够,也就坚定了我对支持2块双宽大功率GeForce显卡的信心(只是从技术上讨论,不代表出厂配置)。

image.png

尽管Dell工作站之前也支持出厂配置部分型号的GeForce显卡,但像7865这样在公开文档中写明的可能还是第一次?关于DSC(Display Stream Compression,显示流压缩技术),当前应该只有DisplayPort 1.4a和HDMI 2.1接口才支持,限于本文篇幅先不展开讨论了。

image.png

如上表,Precision 7865配置了1350W 80Plus白金效率电源,3组+12V输出分别高达42A、36A和72A。

- 第1组12 VA供主板,包括内存、PCIe插槽,以及通过DC-DC电路转换输出给硬盘/SSD等使用。这一组的额定功率达到504W,如果有4个PCIe插槽跑满75W也才300W,实际情况能用满这个的显卡真不多。

- 第2组12 VB专供CPU(下面会在主板图中列出接口位置),432W额定输出相对于280W的AMD Ryzen Threadripper来说,考虑到主板VR损耗也有一定Turbo的裕量吧。

- 第3组12 VC专用于GPU显卡等PCIe设备的辅助供电接头,一共864W相当于4个8pin接头可以同时分配到216W(而不只是150W)。

NVMe存储优化设计:专用接口和温度传感器

image.png

上图是7865工作站的主板,数字标注在下表中都可以查看,我就不逐一解读了。标红框的部分:“21”是指出2个M.2 NVMe SSD的槽位;左上角的“3”和“4”,则是为了连线支持机箱前面板的2个NVMe SSD Flexbay。

image.png

参照图&表,Precision 7865为CPU提供了3个4pin电源接口。另外想说明一下的是THRM0和THRM1这2个热传感器连接器,它们的作用是通过温度来调节SSD/HDD Flexbay后面的风扇转速,其实在当前的Dell 5820/7820/7920工作站上也有类似设计。

image.png

上图是我拆下了位于Flexbay后面的金属支架(可以看到安装了一块NVMe SSD的背板),针对2个驱动器各有一个热传感器引线到SENSOR 0、1的位置。

image.png

最后再补充一张Precision 7865的主板实物图。

今天就分享到这里了,关于AMD CPU工作站适合跑的应用、性能什么的,以后有机会再写给大家吧。

作者: 唐僧 huangliang
原文:企业存储技术

推荐阅读

欢迎关注企业存储技术极术专栏, 欢迎添加极术小姐姐微信(id:aijishu20)加入技术交流群,请备注研究方向。
推荐阅读
关注数
5615
内容数
264
关注存储、服务器、图形工作站、AI硬件等方面技术。WeChat:490834312
目录
极术微信服务号
关注极术微信号
实时接收点赞提醒和评论通知
安谋科技学堂公众号
关注安谋科技学堂
实时获取安谋科技及 Arm 教学资源
安谋科技招聘公众号
关注安谋科技招聘
实时获取安谋科技中国职位信息