麦斯科技 · 2022年05月08日

Ampere Altra Max提供可持续的高分辨率H.265编码

https://community.arm.com/arm-community-blogs/b/infrastructure-solutions-blog/posts/ampere-altra-max-delivers-sustainable-high-resolution-h-265-video-encoding-without-compromise

作者:Ravi Malhotra 2022年5月3日

用于在更大、更高分辨率设备上播放的高清视频内容的增长,推动了对H.265等更高效视频编解码器的需求。虽然带宽效率是较旧的H.264编解码器的两倍,但H.265需要消耗更高的计算资源来提供这种效率。控制成本(例如,带宽使用)现在是视频开发人员提到的头号挑战[1],这使得H.265具有吸引力。但是,如果较低的带宽成本被较高的计算和电力成本所取代,视频开发人员相当于在原地踏步。他们需要的是一个解决方案,该解决方案可以提供H.265效率,而仅仅花费较少的计算和电力代价。本博客认为基于Arm Neoverse的Ampere Altra Max服务器正是视频开发人员编码H.265视频流所需的解决方案。

背景介绍

在过去的几年里,由于更好的相机和更大、更高分辨率的设备,高分辨率视频内容的产生和消费都在稳步增长。与H.264等传统编解码器相比,H.265/HEVC、VP9或AV1等更先进的编解码器在压缩更高分辨率内容方面的效率提升超过50%。最近的市场研究表明,这种增长转化为这些编解码器的使用量的显著增加,其中H.265处于领先的位置。

Ampere-x265-video-codecs2.jpg

图1:Bitmovin 2021关于生产领域使用的视频编解码器报告(2020年与2021)

Netflix和Amazon Prime等流媒体服务的流行也推动了对高分辨率视频内容的需求。吸引和留住客户只会增加这种需求。因此,视频上传和接收(带宽需求)以及视频转码和处理(计算需求)在视频处理平台中占据最大份额也就不足为奇了[2]。

video_2D00_processing_2D00_platform_2D00_market_2D00_share_2.jpg

图2。2020年按应用划分的视频处理平台市场份额

H.265的改进压缩带来了更高计算复杂度,这可能比H.264高出一个数量级(10倍)。虽然基于云的编码的使用正在增长,但大多数视频编码仍然是一项预处理任务[1]。因此,H.265编码增加的计算需求(资本支出成本)和功耗(运营成本)对大多数视频开发人员来说是一个挑战。因此,在性能更高、能效更高的服务器上进行编码是很重要的。

技术媒体已经在SPECrate®2017 Integer等通用基准上验证了Ampere Altra Max相对于传统架构的性能和能效优势[3]。Ampere Altra Max拥有128个Arm Neoverse N1内核@3.0Ghz,性能优于英特尔至强“Ice-Lake”和AMD EPYC“Milan”CPU,后者的功耗(TDP)要高得多。在这个博客中,我们展示了Ampere Altra Max的这些性能和能效优势也扩展到了H.265等视频编码应用中。

为了说明这一点,我们对H.265进行编码,并测量系统满载时的实际性能和功耗。我们介绍了开源libx265编码器最近的一些优化工作,以便在64位Arm体系结构上使用Neon SIMD引擎。这些优化使性能显著提升了1.5倍到2.2倍[4]。

性能测试结果

我们在类似的基于Arm和x86的服务器上对libx265开源编解码器的最新快照(https://bitbucket.org/multicoreware/x265_git/)进行了基准测试。所有系统上的x265版本为3.5+20-17839cc0d。配置部分显示了基于Arm Neoverse N1内核的Ampere Altra Max服务器和基于英特尔“Ice-Lake”和AMD“Milan”架构的x86系统的系统详细信息。“配置”部分列出了输入视频。我们使用各种分辨率和编码预设来查看不同场景下性能的影响。

性能比较–扩展到完整的套接字级别

为了测试完整的套接字性能,我们启动了与系统中虚拟核数量一样多的H.265编码任务,并测量每秒累积帧数(FPS)。我们在Altra Max和AMD 7763 CPU上运行128个任务,在Xeon 8380 CPU上运行80个任务。我们观察到,Altra Max的全插槽性能比AMD EPYC 7763好10%到35%,在各种视频分辨率和编码预设方面比Intel Xeon 8380好2倍多。

Ampere-x265-relative-performance-FPS2.jpg

图3:Ampere Altra Max、AMD EPYC和英特尔至强之间的x265相对性能

值得注意的是,基于SMT架构的x86 CPU与Altra Max的单线程核心架构之间的性能扩展差异。使用Altra Max,性能与系统中的编码任务数呈线性扩展。在AMD EPYC 7763和Intel Xeon 8380上,性能扩展是非线性的,一旦使用虚拟内核,性能就会显著下降。

Ampere-x265-FPS-vs-Jobs-_2D00_-Ampere-Altra-Max2.jpg

图4:x265按作业数进行的性能扩展:Ampere Altra Max

Ampere-x265-FPS-vs-Jobs-_2D00_-AMD-EPYC.jpg

图5:x265按作业数进行的性能扩展:AMD EPYC 7763

Ampere-x265-FPS-vs-Jobs-_2D00_-Intel-Xeon.jpg

图6:x265按作业数进行的性能扩展:英特尔至强8380

耗电比较–扩展到完整的套接字级别

平台的功率效率是通过其在特定功率预算内编码的帧数来衡量的。为了衡量这一点,我们在所有平台上完全加载了一个套接字,最大数量的H.265编码任务。然后测量其的功耗,并计算每瓦FPS。

我们发现,在不同的视频分辨率和编码预设下,Altra Max的平均效率比AMD EPYC 7763高40-70%,比Intel Xeon 8380高出3倍。

Ampere-x265-relative-performance-per-watt.jpg

图7:Ampere Altra Max、AMD EPYC和英特尔至强之间的x265相对每瓦性能

结论

随着高分辨率流媒体的增长,云中的视频流应用需要使用更高压缩率的编解码器,如H.265。这种压缩带来了更高的计算成本和更高的功耗。在系统层面,基于Arm Neoverse的Ampere Altra Max服务器提供了更好的可扩展性和高达2倍的性能,同时与Intel“Ice-Lake”服务器平台相比,工作负载能效高达3倍。Altra Max服务器的性能比AMD “Milan”服务器高35%,工作负载能效高70%。最近针对Arm架构的x265优化开创了节能编码的新纪元,性能卓越,我们鼓励读者评估Ampere Altra和Altra Max系统的x265视频编码。

最后,我们必须认识到,提高计算效率不是视频编码的挑战,而是一般的处理挑战。Arm Neoverse等新架构和Ampere Altra Max等cloud first CPU设计有助于减少计算对on-prem和云碳端排放的影响。有关Neoverse和Ampere Altra Max的可持续性优势的更多信息,我们鼓励您阅读我们的2022年地球日博客(https://www.arm.com/blogs/blueprint/earth-day-cloud)。

配置

本次比较测试中使用的系统配置
屏幕截图 2022-05-08 225609.png

输入视频文件:

https://storage.googleapis.com/ugc-dataset/original_videos/Sports/480P/Sports_480P-0623.mkv

https://storage.googleapis.com/ugc-dataset/original_videos/Sports/720P/Sports_720P-00a1.mkv

https://storage.googleapis.com/ugc-dataset/original_videos/Sports/1080P/Sports_1080P-0063.mkv

参考资料:

Bitmovin Video Developer Report 2021 https://go.bitmovin.com/video-developer-report

Research and Markets Global Video Processing Platform Market report 2021

https://www.anandtech.com/show/16979/the-ampere-altra-max-review-pushing-it-to-128-cores-per-socket/5

Save on H.265 encoding using AWS Graviton2

推荐阅读
关注数
5842
内容数
525
定期发布Arm相关软件信息,微信公众号 ArmSWDevs,欢迎关注~
目录
极术微信服务号
关注极术微信号
实时接收点赞提醒和评论通知
安谋科技学堂公众号
关注安谋科技学堂
实时获取安谋科技及 Arm 教学资源
安谋科技招聘公众号
关注安谋科技招聘
实时获取安谋科技中国职位信息