LiveVideoStack · 2022年01月21日

未来已来,音视频江湖再起波澜

从通信为王的时代,到互联网高歌猛进的二十一世纪,音视频技术一直是众多科技公司的必备技能。一部手机联通全球各地,一个社交账号互动各国友人,已经不是什么新鲜事;就连超低延迟,超高清画质,沉浸式互动的元宇宙和全真互联,都在快速发酵,似乎马上就要被底层的摩尔定律催化过期。

新鲜的应用容易消逝,经典的技术一直散发光芒。如今的音视频技术可谓遍地开花。实时音视频通信网络(TRTC),即时通信网络(IM),流媒体分发网络(CDN),这些技术名词你可能没听过,但你每天接触的在线课堂、在线会议、电商直播、视频社交却离不开这些技术的支持。

然而,音视频技术的成熟与丰富,也给众多开发者带来了困扰。越来越多的多终端开发者在开发音视频通讯相关应用时,为了实现不同的产品能力,往往需要集成多个SDK,不但增加开发联调工作量,更增加工作难度。

与此息息相关的是,传输优化,业务适配,内容分发等应用层的需求直接影响用户体验。如何低门槛,低成本地满足这类需求也是一大难点。

十年磨一剑。腾讯云音视频历经21年的积累和沉淀,打造了全面的音视频产品矩阵,如今站在全真互联时代门口,面对众多行业痛点和难点,腾讯云音视频将三网合一,迎难而上,掀起音视频浪潮。

未来已来,全真互联时代三大特点

2020年12月,腾讯董事局主席马化腾在腾讯年刊中聊到互联网未来的趋势和转变,并预言全真互联网时代的到来。

马化腾提到,互联网走到今天,实时通信到影音视频等一系列基础技术已经成熟;计算能力快速提升,推动着信息接触、人机交互的模式发生更丰富的变化。这是一个从量变到质变的过程,它意味着线上线下的一体化,实体和电子方式的充分融合。虚拟世界和真实世界的大门已经打开,无论是从虚到实,还是由实入虚,都在致力于帮助用户实现更真实的体验。

全真互联时代的到来其实早有预兆。 正如腾讯云音视频专家工程师常青在一次采访中提到,纵观整个互联网行业,我们会看到最近几年应用层面凸显出三大变化。

一是追求越来越低的传输延时。 客户对延时的要求越来越苛刻。比如在线合唱解决方案中,两个用户的声音传输延时已经压缩到 70ms 以下,接近两点之间的网络传输延时。这和以往 RTC 的传输延时要求相比可以算很苛刻了。

二是对虚实结合的运用越来越普遍。 比如腾讯会议支持虚拟背景技术,让自己的影像可以跟漂亮的背景图片实现完美的融合。同时,伴随着 web assembly技术的普及,相关的推理库以及模型也开始在浏览器上落地,这使得 WebRTC 的网页用户,也能够享受到这一功能。

三是 VR 技术有可能会走出“花瓶”阶段进入稳定的发展期。 随着 Wi-Fi6 无线串流方式等技术的成熟,以及内置芯片越来越强大,VR 设备的舒适度和可玩性都比之前有了大幅提升。同时,相关的生态也越来越成熟,未来很可能会进入一个用户稳定增长的健康发展阶段。

从在线合唱,到视频会议,再到VR技术成熟,我们不难发现,其背后都有音视频技术作为关键支撑。换言之,全真互联时代的到来,离不开优秀的音视频技术。而腾讯云音视频,早已有备而来。

三网合一,打通企业音视频构建的“任督二脉”

从QQ时代开始,腾讯就一直致力于音视频技术的研发与应用。时至今日,腾讯在音视频领域早已是技术排头兵。而腾讯云音视频作为基础设施聚合的首要阵地,早已基于“云、边、端”基础设施打造了全球一流的三张网络——实时音视频(TRTC)网络、即时通讯(IM)网络和流媒体分发(CDN)网络。

如今,为解决SDK集成等行业难点,降低企业构建音视频应用的门槛,腾讯云音视频推出“三合一”的RT-ONE™音视频通信基础网络,整合上述三张网,为业界音视频通信PaaS平台构建网络通信基座。

RT-ONE™复用三张网络形成技术叠加优势,可以满足统一调度、统一接口方式、就近接入、传输优化以及业务适配需求,极大地降低音视频产品接入门槛。与之前孤立的网络相比,RT-ONE™ 具备两大核心优势:

一是技术融合更加彻底。 传统的 CDN 网络在完成融合以后,吸收了 RTC 的很多技术,推出了“快直播”这类兼顾 RTC 低延时和 CDN 高并发两个特点于一身的特色产品。用户可以享受到更低的延时和卡顿率,又能实现上百万人的高并发观看。此外,RTC 网络复用了很多 CDN 网络的高并发组件,吸收了分布式设计理念,从而获得了更高的并发能力和更强的稳定性。

二是产品互通更加自然。 以往使用腾讯云音视频的 RTMP 直播需要开通直播服务,使用 RTC 连麦需要开通 TRTC 服务,两套服务之间互相依赖。已经使用直播服务的客户要使用 TRTC 连麦就得重新对接方案,而使用 TRTC 做在线教育的客户要完成视频录制,则必须开启直播录制服务。而基于“RT-ONE™”网络,客户可以使用移动直播的 V2 接口,实现 TRTC 和直播服务的无缝切换,TRTC 的录制服务也可以通过升级工作的完成,实现了更好的用户体验和更加灵活的定制能力。

以 RT-ONE™ 赋能一场直播带货为例。在该场景中,客户需要同时用到TRTC、IM 和 CDN 的能力。

首先,主播向观众介绍商品,向观众赠送代金券,观众通过商品链接进行秒杀、抢购,发弹幕跟主播互动等等,这些行为都需要用到IM的消息能力;

有时主播还要与观众进行连麦互动,这时候就需要使用TRTC提供的实时音视频通信能力。

同时,一场带货直播所面向的观众是非常庞大的,峰值时观众人数甚至可能超过百万,这就需要依靠CDN的流媒体分发能力。

而上面提到的仅仅是电商直播场景中最基本的能力。除此之外,还有PK带货、点赞送礼、抢红包、抽奖、等等也都是常用的能力,也都需要依靠TRTC、IM、CDN三张网络来共同实现。

可见,RT-ONE™不单单是为了满足客户越来越多的三网并行需求,相比于传统独立的 TRTC+IM+CDN方案,深度融合的RT-ONE™网络通过复用三张网络的“云、边、端”基础设施,在接入门槛、网络质量、使用成本上都更具竞争力,并且在性能上,RT-ONE™>TRTC+IM+CDN。

如果把企业的“技术”和“产品”看作企业的“任督二脉”,那么 RT-ONE™ 的到来可谓是一本融汇贯通的武功秘籍,专为企业打通构建音视频应用的“任督二脉”。然而,只练内功不足以御敌千里--除了 RT-ONE™ 之外,腾讯云音视频在11月3日全球数字生态大会发布了“腾讯云视立方”,为企业整合终端能力,内外兼修。

终端能力整合,降低开发者使用门槛

图片

视频直播火热的当下,各行各业的音视频应用层出不穷。然而,为了实现不同的产品能力——如美颜美妆、主播观众连麦、弹幕评论等,开发者往往需要集成多个SDK,与此同时,不同功能模块之间杂乱不统一,API调用规则繁杂无章,都大大增加了开发者的开发联调工作量,

腾讯云视立方•音视频终端引擎(RT-Cube™)旨在整合终端能力,降低开发者门槛,实现集成一次SDK即可调用所有终端能力的开发体验。

从用户的角度来看,RT-Cube™是一个音视频终端一体化产品。其功能模块丰富而灵活,囊括了当下最热门而实用的六大功能,分别是:直播开播,主播观众连麦/跨房PK,视频录制编辑/发布上传,直播观看,点播观看,和音视频通话。

图片

以六大功能为基础,腾讯云视立方(RT-Cube™)为用户提供了多个预设的SDK版本以及诸多增值能力。其中,预设SDK版本包括移动直播SDK,短视频SDK,音视频通话SDK,播放器SDK,以及全功能SDK;同时,客户还可根据自身需求进行高级配置,自定义功能模块组合,打造专属于自己的SDK。真正做到了一次接入,处处调用,同时又不失灵活性。

增值能力旨在为客户打造高品质的视听体验。包含美颜特效SDK,正版曲库SDK以及数据质量监控等诸多优化功能。真正做到专业,稳定,高质量的终端服务。

以泛娱乐领域为例。腾讯云视立方结合自身能力,为众多泛娱乐客户打造了低代码解决方案。通过客户端、服务端的全码开源,丰富经典的玩法“开箱换皮肤”即可上线。在实时合唱场景中,腾讯云视立方带来了超低延时的体验升级,并针对企业普遍关注的版权问题,开设AME直播互动曲库直通车,提供超过20万首正版歌曲。

而在企业协作领域,腾讯云视立方推出了音视频通话组件、多人音视频协作组件和1v1在线客服组件,可以被集成到企业应用中使用,轻松拥有与微信/QQ通话、腾讯会议、企点客服同样品质的音视频通信能力。

不只是泛娱乐和企业协作。结合腾讯云RT-ONE™音视频融合网络以及腾讯云视立方(RT-Cube™)音视频终端引擎的“云+端”基础能力,腾讯云音视频目前已经在社交娱乐、直播带货、建筑地产、文旅等多个行业落地应用,在音视频市场一骑绝尘。

动态编码技术升级,明眸带来全新高清视野

用户体验决定一切。腾讯作为国内首屈一指的产品公司,深谙产品成功之道,在音视频领域也同样恪守这个规律。

腾讯云音视频基于智能动态编码技术,打造了明眸极速高清解决方案。通过智能场景识别,动态编码匹配,画质修复增强相结合,实现了以更低码率提供更高清的服务,旨在为用户带来全新的高清视界。

明眸极速高清解决方案主要有高清低码,超清视野,画质修复和高可定制四大优势:

  • 高清低码: 基于智能场景识别,动态编码技术,CTU/行/帧三级码率精准控制模型,明眸极速高清解决方案可以为直播、点播等行业以更低的码率(平均节省50%+),提供更高清的流媒体服务。
  • 超清视野: 基于超高性能的编码算法,明眸极速高清解决方案支持高达8K的高分辨率视频实时编码,融合超分辨率,HDR,拓宽色域等技术,可为用户生成超高品质的视频,提供极致清晰的观感。
  • 画质修复: 通过3D去燥,色彩增强,超分辨率,插帧等处理技术,明眸极速高清解决方案可以有效消除老片中噪点,马赛克,抖动,顿挫感等问题,提高画面清晰度,让画质重生。
  • 高可定制: 明眸极速高清解决方案具有插入简单,成熟稳定,高效灵活的 API 接口,相当于定制化的视频智能服务私有化中台,可为用户构建安全稳定,高效可靠,性价比高的视频云服务生态。

直播、广电媒体、在线视频和短视频是腾讯明眸极速高清解决方案的主要发力场景。以腾讯内部业务为例,使用明眸极速高清后,整体业务节省了大概70%的存储和带宽成本,同时由于文件的减小,视频首帧的耗时也降低了20%,整体播放的流畅度大大提升。对于点播场景的极限压缩,1080P的高清电影视频,极速高清H.264可以在1.5M的码率下,保持整体的主观清晰度,或者说保持VMAF在95分以上。H.265则可以在900kbps达到同样的效果,AV1甚至做到650kbps。

而对于课堂教育类场景,压缩效果则更明显,课堂类场景相对静止画面较多,可以利用更多的编码工具。对于PPT类课堂场景,极速高清H.264可以在67kbps下,同时保持主观清晰度,H.265可以做到35kbps, AV1可以做到28kps, 此时,视频的码率大部分已经低于音频的码率,极大的减少了视频的存储和带宽。

目前,腾讯明眸极速高清解决方案已经与CCTV、快手、斗鱼等多个行业领导企业达成合作,为这些企业带来全新的高清视频服务。

音视频拉开时代大幕,腾讯云音视频一马当先

全真互联时代的到来少不了音视频技术的加持,而音视频领域又以腾讯云音视频一马当先。

今年1月7号,IDC(国际数据公司)发布了《中国视频云市场跟踪(2021上半年)》报告。报告中提到,2021上半年中国视频云市场规模达到43.7亿美元,同比增长达到38.7%。其中,音视频解决方案市场增速达到47.6%,腾讯云排名行业第一。

而这行业第一,其实由来已久。

自2018年以来,IDC持续中国视频云市场,腾讯云解决方案市场份额均居首位,至今已取得“四连冠”。在腾讯云音视频持续领跑的背后,IDC提到,“腾讯云音视频在报告期内发布视立方(RT-Cube™)音视频终端引擎,整合直播、TRTC、IM等所有终端能力,并配套RT-ONE™音视频通信网络,复用三张网络的“云、边、端”基础设施,意在为全行业提供开箱即用的音视频应用开发工具”。

值得一提的是,IDC数据还显示,在RTC(实时通信)这个重点方向上,腾讯云音视频的增速在头部厂商中排名第一。

TRTC(腾讯云实时音视频)在QQ、腾讯会议、全民K歌、王者荣耀等国民级应用取得优异实践之外,已经服务于各行各业5000多家客户。其后台架构技术获得中国知识产权最高奖项“中国专利金奖”,音视频编解码、音视频处理等技术领域保持全球技术领先,并可联动腾讯云优势直点播能力,提供实时互动、直点播、视频处理等音视频全链路技术方案,一站式满足客户的音视频需求。

随着国内音视频技术的不断演进以及相关产业的成熟,腾讯云音视频作为音视频的行业领跑者将深耕于技术领域,并在未来不断探索,力求为无数前沿的开发者及正在崛起的各类尖端产品保驾护航。在5G+8K的超高清视频时代到来之前,腾讯云音视频也期待与全行业的发展齐头并进,迎来全新的格局。

推荐阅读
关注数
4161
内容数
363
分享音视频相关技术干货、产品研究与行业趋势
目录
极术微信服务号
关注极术微信号
实时接收点赞提醒和评论通知
安谋科技学堂公众号
关注安谋科技学堂
实时获取安谋科技及 Arm 教学资源
安谋科技招聘公众号
关注安谋科技招聘
实时获取安谋科技中国职位信息