企业存储技术 · 2020年07月22日

Optane SSD 900P评测(3):一个非典型8K视频编辑方案

本文内容非商业用途可无需授权转载,请务必注明作者及本微信公众号、微博 @唐僧\_huangliang,以便更好地与读者互动。

接前文

Optane900P SSD评测(1):当热插拔工作站遇上CAS缓存软件

OptaneSSD 900P评测(2):比拼4x闪存NVMe RAID0

在写完上面2篇之后,有同事对我说:“写文章要让看的人觉得有用。” 这句话让我略感到压力…其实近年来一直也在向这方面努力,如果面对的读者是从事IT设备相关工作的技术人员,或者硬件发烧友,我倒是不太担心;而真正的用户呢?举例来说,如果我写数据库方面的东西,肯定没有DBA朋友们专业,但有时又想尝试着班门弄斧一下:)

无独有偶,还有位朋友也曾建议过,说我写的东西比较偏硬件以及产品技术本身,希望能多些结合案例和应用的东西。这与我的工作经历和知识背景有关,无论如何,听金石良言也要尝试着改变一下——就从本文开始吧,期待大家的反馈。

后期制作中的无压缩视频 vs. 压缩视频

记得1997年家里给我买的第一台电脑,里面有一块ISA接口的MPEG I解压卡——用来支持VCD视频硬件播放的,对应的分辨率是352x288(PAL)和352x240(NTSC)。

后来的发展我想许多朋友都不陌生,下图中描述的都是影视后期制作中的无压缩数据量,标清(720x480)对应DVD时代,然后是半高清(1280x720)——全高清(1920x1080)/2K(2048x1080)——4K视频中常见的UHD(3840x2160)和DCI(4096x2160),直到现在的8KUHD(7680x4320,仍以16:9作为代表)。

image.png
2020年__东京奥运会将提供8K超高清转播,__先不论这几年能普及到什么程度,8K已经成为包括2022冬奥会等项目所重点关注的技术。

之前我写过一篇《玩转专业8K显示器:你需要知道的事》,其中讲到的Dell UP3218K就是32寸7680x4320的分辨率,“UP”可以指代为专业级广色域面板。除了分辨率之外,决定视频原始数据量(无压缩)的还有色深和每秒帧率。比如上图中8K 16bit @ 60fps就是比较夸张的12GB/s带宽,一般的存储设备很难跑得动,而且其数据量也会比较惊人。

注:通常人们所讲的XX Mbps视频码流,许多时候指的是压缩视频,比如H.264等格式。

image.png

从标清时代开始,以后期制作为代表的广播级视频编辑,很长一段时间都崇尚无压缩格式,因为理论上每次剪辑后保存为压缩格式质量都会有一次损失。而到了4K时代之后,一方面对存储带宽和容量的需求大增,另一方面开始出现ProRes等可用于广播级的高质量压缩编码,存储方面的压力就得到了缓解。

如上表,无压缩4K 10bit 24fps视频的存储带宽需要807MB/s,而ProRes编码4:2:2(YUV)30帧和60帧分别只要111MB/s和221MB/s,更高质量的ProRes 4:4:4:4(RGBA)30帧也只要249MB/s。有朋友可能会问,这种接近无损的压缩有代价吗?当然有,就是依赖计算资源(CPU)。

以计算换存储,为容量而不牺牲性能?

image.png
本次测试源于同事提出的一个8K视频编辑演示需求。由于手头没有摄像机和I/O采集卡,我的设备还算不上完整的端到端,但具体到对工作站的要求基本上不打折扣。因为重要的一点——在显示器实际输出8K分辨率的情况下,无论视频播放还是剪辑,您的设备面对的压力都会比在HD、4K桌面分辨率时大得多(这一点经过反复验证),包括CPU和显卡。当然,也只有搭配真正8K的输出设备,您才能实际用眼睛看出对应视频的细节区别。

image.png
为了搭建8K的演示方案,我先后测试了2款专业视频编辑/调色软件:Adobe Premiere 12和BlackMagic Davinci 14(达芬奇)。

image.png具体到测试的视频素材,我从知名摄像机厂商RED ONE网站下载了几段帧率相对不高的8K视频文件。R3D是一种RAW原始格式,7秒1.52GB可以印证出其7:1的高质量压缩率。

image.png
样机上配置了2颗Xeon Silver 4112 2.6GHz4核CPU,这只是Dell 7820工作站支持的一款入门级处理器。

上一篇评测我使用的是新一代的Dell Precision 5820 Tower,本次8K视频测试换用另一台双CPU工作站7820Tower(_扩展阅读:__《_双__Xeon SP__工作站,我却没找到第二个__CPU__插槽?_》_),但却遇到了同样的问题——当我在Permiere中播放8K R3D压缩视频时,CPU占用率达到100%且不够流畅——因为2台样机配置的CPU不够高端。为此我也咨询了专业的朋友,如果更换足够核心数量(性能)的处理器就能解决这个瓶颈。

另类方案——用存储解决计算瓶颈

能达到流畅的视频回放,是非线性编辑平台的基本要求之一。无论CPU还是存储不达标,都会进一步影响到时间线拖动等基本操作的体验。下面用2段我们的录屏来做个对比示例:
image.png
这2个视频片段都是在Davinci软件中进行拖动时间线的操作。__上面__的就是CPU或存储__性能跟不上__的情况;__下面__则是理想状态下__应有的流畅度__。接下来就讲讲我们是怎样解决的问题。

image.png

一条8K视频流,其复杂度就相当于4条4K视频流,或者说相当于4K编辑4层特效的压力。而在我手头暂时没有更高的CPU可换,还有别的办法吗?如果将视频片段转存成无压缩的格式,是不是CPU的负担就会下来了?
image.png

在Premiere中,我将8K压缩视频转存成无压缩、10bit YUV4:2:2的格式。

image.png
新生成的视频文件容量达到了15.06GB,通过计算不难得出,它需要的存储带宽超过2.1GB/s,对于一般的HDD RAID或者SSD有些挑战。
image.png
 

于是,我再次使用Dell工作站上专用的Ultra-Speed Drives Quad高速SSD转接卡,先尝试用其中1个M.2 NVMe盘试下效果。

image.png
 

此时我播放的是转存后的无压缩8K视频文件,可以看到CPU消耗已经很低了,但仍然没有达到流畅回放,原因是单个NVMe SSD读带宽1.6GB/s成为了瓶颈。

可能大家还记得,在上一篇评测中我用Ultra-Speed Drives卡上4个NVMe SSD在Windows下组建软RAID 0(带区卷),最高测得了6560MB/s的读带宽。用这来应付8K视频应该比较轻松吧?
image.png

4个NVMe SSD果然不负众望,由于是软RAID 0,每个盘只需分摊500MB/s多一点的带宽。在8K无压缩视频流畅回放时,CPU占用率只有12%,大约相当于只用了1个核心。
image.png
由于手头正好还有使用3D XPoint Memory介质的Intel Optane SSD 900P,对它的单盘性能我比较放心,下面是测试截图:
image.png
 

由于软件处理视频时或多或少有预读处理,所以监控到的性能数值也不完全是一条直线,截图时Optane900P的读取带宽达到了2.6GB/s。

细心的朋友可能会意识到,每秒超过2GB/s的视频流,用280GB容量的Optane能存多长时间?这确实是一个问题。首先,我用来Demo测试的8K视频片段都很短;其次900P未来还会有更大的容量点,它同样可以配置多盘(当然价格也会因此而上升)。至于这样用值不值?我还是那句回答——“好钢要用在刀刃上!”

扩展阅读:《Intel Optane P4800X评测(1):好钢如何用在刀刃上?

8K视频编辑:8GB专业显卡提示“显存不足”

image.png

与Adobe Premiere相比,被Blackmagic design收购的Davinci Resolve Studio是一个相对轻量级,也比较受欢迎的视频处理/调色软件,同样能够支持8K编辑。

image.png

以上设置与Windows桌面分辨率有类似的效果——如果设置较低,那么处理8K视频时的性能开销就会降低。我们这次测试当然不想取巧,于是连Dell 7820工作站样机上的Quadro P4000 8GB中高端专业显卡,都弹出“显存不足”的报错来。

注:在《性能暴降62%__?图形工作站老司机踩坑记》一文中我测试过Quadro M4000显卡,P4000是其下一代产品,性能实力不可小觑。

image.png
 

为此,我找NVIDIA的朋友借来了24GB显存的Quadro P6000,再没有看到关于显存不足的提示。这时我就更容易理解为什么NVIDIA建议8K视频制作用P5000和P6000了,如果不是太复杂的应用,16GB显存的Quadro P5000我想应该也不错。

Davinci测试中4x NVMe RAID0的“意外”表现
image.png
 

如果是直接回放R3D压缩视频文件,Davinci软件遇到了和Premiere同样的问题——2x4个CPU核心耗满也未能流畅播放。在不更换测试样机CPU的情况下,我仍然选择将视频转成无压缩——Davinci有个“生成优化媒体文件”的功能。

image.png
在8K “无压缩视频缓存” 生成的过程中,我也简单比较了一下性能。
image.png
我一共测试了3个8K视频文件,效果都差不多

对于使用传统NAND闪存的桌面级NVMeSSD,容易遇到使用一段时间后写速度下降的情况,看到291MB/s这个数值(稳态性能)我并不感到意外。
image.png

当 “无压缩视频缓存” 生成完毕,Davinci播放的CPU的开销立即降下来。截图时我们记录到单个M.2 NVMe SSD的读带宽达到1.2GB/s左右,参考前面的Premiere测试不难判断,这对于无压缩视频本身是不达标的。

下面接着测试4个NVMe SSD软RAID 0。

image.png
这时我遇到一个奇怪的现象,在Davinci中“生成优化媒体文件”时,组成带区卷的4个NVMe SSD平均每块盘只能达到30MB/s左右的写带宽,加在一起也就是100MB/s出头。

是Windows下的软RAID 0不靠谱么?早在当年的NT4工作站上我就为非线性编辑工作站配置过“带区集”,那时还是用SCSI硬盘,因为当时主板IDE接口少且RAID效果不好。而后从Windows2000一路走来,除了数据安全性的短板之外还没怎么遇到过性能问题。我更倾向于认为,Davinci生成这种“无压缩视频缓存”文件的写I/O操作可能还不够优化。
image.png
上面这段视频是Optane 900P在Davinci中“生成优化媒体文件”,写入带宽大部分时间都在1.xGB/s,没能跑到更高很明显是8K解码把8个CPU核心都占满了。

记得有位朋友专门问过我Optane P4800X(900P与之性能相同)的写入带宽。现在确实有传统NVMe SSD可以读/写都跑到比2GB/s更快,但闪存有写放大和GC(垃圾回收)处理,使其写性能很难一直保持像3D XPoint Memory介质的Optane那样稳定。

image.png
带区卷的整体性能为563MB/s x4。此处省略一个Optane900P的测试截图,其实已经没什么悬念了。

最后,无论4x NVMe SSD RAID0还是单个Optane 900P,都能在Davinci中优化播放8K“无压缩视频缓存”——也就是超过2GB/s的读带宽。此时的CPU占用率比Premiere要高一些,我咨询了专业的朋友,他说Premiere的硬件加速做的更好一些。

影视后期8K视频编辑平台推荐

image.png

上图左边这款机器,我在《双Xeon SP只用一个风扇?Percision 7920工作站散热设计解析》中曾经介绍过。没有推荐中间那台本文中测试的7820,是因为7920有更多的盘位,机箱前/后侧一共可以支持10块3.5寸可插拔驱动器(兼容2.5寸,包括M.2 NVMe SSD和Optane 900P)。
image.png
在这里,我只是将4 x NVMe SSD的Ultra-Speed Drive存储卡或者Optane SSD 900P做为选配件的推荐。因为闪存以及更快的SCM(存储级内存)缺点也很明显——容量和价格,如今一块3.5英寸硬盘6TB、8TB都很常见,再加上12Gb/s SAS RAID卡,8块盘RAID 5/6之后达到1000MB/s左右的读写带宽也不错了。

就像我在上文中所说,除了真正电影级制作调色需要无压缩之外,如今4K/8K高清视频编辑的主流采用摄像机生成的高质量压缩文件格式,这样一方面避免容量占用太大,同时也缓解对存储带宽性能的需求。具体压缩比从3 : 1到1x : 1不等,相应的CPU就要配置较多核心数量,主频也是高一些比较好。

如果使用外置存储,Precision 5820 Tower是个不错的选择,因为这一代单路工作站上的Xeon W处理器最多支持到18核,而且不受软件是否对NUMA优化影响,非常适合影视后期剪辑。至于双CPU的7920 Tower,在转码或者输出中可以体现出优势。

那么,Ultra-Speed Drive和Optane 900P在这一领域还有应用价值吗?我尝试一下抛砖引玉:当用户配置了能够流畅处理1路8K视频的CPU,要是加第2、3层特效怎么办,还依靠当前的CPU来处理困难了吧?这时如果将有限时间长度的8K片段素材/特效以无压缩格式存放在高速盘上,减轻CPU压力的价值就能体现出来了吧?

要求再高的用户可以考虑FC存储阵列了,现在主流的16或32Gb/s主机连接加上多链路。顺序读写带宽超过Optane等SSD而且保持HDD的大容量。

致谢

在此特别感谢我曾经的两位同事:小赵和小胖,完成本文离不开他们的帮助:)

推荐阅读

本文转载自企业存储技术微信公众号原文链接点这里
注:本文只代表作者个人观点,与任何组织机构无关,如有错误和不足之处欢迎在留言中批评指正。 进一步交流技术可以加我的微信/QQ:490834312。
尊重知识,转载时请保留全文,并包括本行及如下二维码。感谢您的阅读和支持!《企业存储技术》微信公众号:HL_Storage,也欢迎关注企业存储技术极术专栏,定期更新。
42.jpg
推荐阅读
关注数
5613
内容数
260
关注存储、服务器、图形工作站、AI硬件等方面技术。WeChat:490834312
目录
极术微信服务号
关注极术微信号
实时接收点赞提醒和评论通知
安谋科技学堂公众号
关注安谋科技学堂
实时获取安谋科技及 Arm 教学资源
安谋科技招聘公众号
关注安谋科技招聘
实时获取安谋科技中国职位信息