视频不应该被看作一个单独的行业,就像云计算同样不该被看作一个单独的行业,它们都将渗透到各个行业、各个场景。在 2021.7.10 的 Imagine 阿里云视频云全景创新峰会上,艾瑞研究院副总经理徐樊磊,带来了主题演讲《云上视频新场景洞察》,从视频云产业链的供给与需求切入,深入行业与市场,探索云上新场景和新兴场域的想象空间,并将视线放远,瞭望视频云未来的技术极致化和全新体验。以下内容为演讲整理。
视频云,这不是一个独立的行业
它渗透千行,创变万物。
大视频产业
现阶段,我们提到的视频它到底是什么样的概念?
先看一组数字,在过去几年,以视频为代表的富媒体在所有互联网领域或者新的科技发展领域体现出非常快速的发展过程。
从数字上来看,它的增长速度要比你感受到的要更快。互联网整体的价值就是流量价值。从移动端的流量是它在每个月、每周覆盖多少设备。
而整体设备覆盖数,从 2018 年 1 月份 11 亿每个月阅读覆盖设备数到今年 1 月份 13.94 亿近 14 亿,增长相对比较温和,但从使用时间来看,在短短 3 年之内,大家花费在视频细分产品上的时间从一万六千亿分钟变成四万八千亿分钟。
现阶段互联网评估价值已经不再去用设备数评估,而是使用用户花费的时间数来评估,互联网在各个领域的红利似乎在枯竭或者在减低过程当中,我们不可否认,在整个视频相关领域在过去一年仍有非常大的红利,而且这个红利还将继续持续。
2021 年 4 月视频服务类 APP 月总有效使用时间比例展现出一些特点,现阶段的视频类 APP 使用时间,短视频占比已经超过了 50%,短视频的高占比体现出需求端视频消费趋向于碎片化时间、以及高频率的使用。
另外需要关注的点是多对多传播,原来的视频的分发是中心化,专业的内容生产者可能是很少的,同时需要将生产出的内容分发给所有用户,但现在随着短视频和新媒体的出现,视频创作者更加泛化的,视频生产从 PGC 转向了 UGC,未来进一步将会是 PUGC 的模式,这是视频行业在现阶段以及下阶段发展过程当中需要特别关注的一个点。
另外一个点,在整个视频发展过程当中,现阶段以及未来一段时间,是什么对视频行业发展快速推动?
高清化,想要提升视频的交互感、沉浸感、真实感,高清是无论如何绕不开的点,无论是业界还是政策,在整个视频行业,未来高清的 4K、8K 的视频应用,都是可以对产业发展起更大个推动力。
另外,现在所有视频应用都是基于实时音视频技术,需要实时、低延迟。这种情况下才能看到视频在教育、社交、资讯等领域大放光彩,未来视频会陆陆续续进入我们的金融服务、医疗、公共事业等,实时音视频是视频应用在各个行业必须的选项。
视频从传播的角度来看的话,它原本是信息传播的载体,信息传播分类分为多类,点对点进行传播、或者点对多、或者多对多,在另外一个维度上分为延时和实时,延时是博客、邮件等,信息通过录播重新整理的形式给受众传递信息。
我们简单看一下整个人类历史当中信息的传播的历程。
最开始人类没有文字、没有语言的时候,信息的交互就是肢体的手舞足蹈,大概描述需要表达的信息,这样的交互有很多的弊端,第一是沟通很容易产生歧义,并且耗费体力。当时对于体力劳动要求很高,在沟通上就耗费了大量时间和体力,所以之后人类诞生出了的语言,我们可以用不占用身体的手和脚部分的前提下进行沟通交互。
语言虽然解决了很大的问题,但依然有时间、空间的束缚,总结度也不够。口口相传无法解决文明传承的核心问题,当一个部落或者一个文明因为偶发性事件消失之后,它的整个积累、传承,含有文明价值信息的东西会消失殆尽。我们都知道文明是需要传承和延续的,所以各个文明都发明出了属于自己的文字。
再往后产生了文字,文字解决了传承的问题,东西方都会站在不同的角度产生不同的文字,有象形文字、字母形的文字。文字在人类几千年的历史长河中,解决了人类传承以及信息交互的问题,是人类历史上最伟大、最重要的发明。
但文字仍然有一些弊端,各种文字互不通用,需要学习成本。文字在古代的历史长河中只属于一部分人,因为文盲或者不经过学习是使用不了文字的,文字的信息传输速度相对比较慢,且所承载的信息丰富度也是不够的。所以人类文明发展历程中,文字带给人类的价值不可忽略,但随着人类生产力的发展,文字的局限性也越来越大。
我们说八九十年代看电视,PC 时代在浏览器中用播放器可以看到视频,现阶段我们接触到视频的场景越来越频繁、越来越深入。
视频的发展在整个过程当中是从需求端和供给端等几个方面推动的。需求端第一点我们认为是流量下沉,需求端的流量下沉是近几年经常被提及的话题,因为我们的用户并没有那么喜欢文字,很多时候需求端的视频、音频占的比例很高,也就是只有音视频这种形式才能抓住广大用户使用偏好。
另外是移动端的普及,可以在各地交互沟通,我们不会只拘泥于 PC 里面慢慢打字,我们可以使用的场景、使用的功能也会越来越丰富和具体。另外,疫情的出现导致大家被动的无法工作、学习,也会促进视频的使用。
在供给端的,比如提速降费,包括传输、解码等技术不断地演进也是促进视频行业发展的底层动力。
基于这几点来看,视频依然有它的问题,相对于文字和其他的传播形式,有两个最典型的问题,第一:视频是线性的,只能线性浏览,虽然可以快进跳到一个地方,但却无法全局看到它的信息,第二,视频的内容信息修改,相比较于文字是比较慢的,但我相信随着技术的发展慢慢这些困难不成问题。
基于目前的行业情况来看,视频不应该被看作单独的一个行业,就像云计算同样也不该被看作一个单独的行业,它们是行业的底层基础能力,不断创新,全面上云,云上创新,它们都将渗透到各个行业、各个场景。视频将会成为行业和应用的基础能力。
新时代大视频产业的底座
先跳开云计算具体的分类,把云计算放在更大的范畴里面去看,云计算本身是一个社会分工的体现,早时间人类有一些生产能力的分工,食物的分工,开始是物物交换,半径很小,随后火车、远洋货轮等更大运输半径交通物流的出现,就导致于人类的社会分工会越来越具体。
但在当时服务分工很困难,早些年搬家、家政服务都是周围本地化的公司,服务因为生产力制约很难实现全球化,除高价值的高端的服务之外,服务是很难全球化,但之后互联网的诞生,基于比特的分工(价值程序 / 数据化)的在线服务和云服务的出现,帮助互联网快速渗透多行业以及解决了很多多行业的问题。
云计算需要从社会分工视角来讨论。
基于社会分工大前提我想讨论的几个点。
第一,在历史上大项目的社会分工启动之后都是不可逆的,所以云服务在过去一段时间快速发展渗透到各个行业,未来基本会维持现状,并且还会有比较高的增长。
第二,所有的社会分工都有相同点,云计算也是,早期大家更多解决的是成本的问题,对云计算、云服务的需求,大多是云计算的基础服务能力,例如基础资源,存储、网络、CDN 等,但慢慢随着需求的增长,更多的社会分工需求是外包,从成本的诉求转向功能或者整体能力。
大家吃饭也是社会分工,现阶段不会因为在外面吃饭比你自己做饭便宜而去吃,你更多关注的是他能给你带来更多的更可口的菜品的选择,我可以随便选到我今天想吃的菜,这种类比也就说我们所说的云服务能力,是现在云服务加持给用户更多的附加功能,视频行业的需求也是这样。
需求端的另一个点是,视频云是不是可以将用户的视频能力或者用户的产品视频化,用户可以使用云服务来传输、生产。对于视频深度改造的很多行业,我们认为,视频能力的加持深刻改变了行业的格局。
在直播电商行业,整个电商主体在发生变化,过去业内只有几个大的直播电商,但现在很多内容平台甚至创业公司利用视频直播,占据了中心流量位置,主播可以是电商的中心,在过去它是不存在的。
另外在线教育领域,在线教育摸索很多年都没有办法进行整个变现。之前的录播、学习等不同的 APP,因为学习沉浸感的问题,一直没有得到大的市场份额,直播的出现解决了沉浸感的问题,学生可以跟老师有更多的互动,解决在线学习效率的问题。视频直播的出现,使在线教育在过去几年终于找到它变现逻辑。
所以视频在各个行业的演进和渗透过程当中,改变的绝对不仅仅是产品。
行业侧对视频能力的有哪些诉求?
第一是能力容易被集成、容易被调用、容易被计量。
第二是更低廉的成本、更弹性的扩容、更敏捷的试错、更快速的生产。
基于这些前提,视频云的在视频生产环节,消费环节,传输环节,处理环节都是有不同的解决方案,以及不同的流程的加持。
视频本身已经被云服务深度地去服务,以及前面的很多社会分工都可以交给别人去做,不用自己去做。
另外它大大降低了去制作高质量、有价值视频的这个门槛,体现了云服务对于视频加持来讲是极为重要的,更多垂直领域的公司可以把将主要精力放在主体业务上,不用花费太多精力处理视频的事情,制作高质量视频的门槛已经大大降低。
从云计算对于视频本身的渗透逻辑来看,视频企业使用云服务的目的,还是要解决传输这一问题,需要很多的 CDN 节点,来保证视频的传输。
CDN2.0 以缓存为主要标志,现在有很多深度学习,来提高它的效率,减低它的成本。另外分布式云、边缘云将很多视频转码包括计算放到边缘计算的资源里面去,更进一步提高整个传输过程当中的效率,以及减低整个传输成本。
在视频处理环节,视频最早跟云服务的结合,也就是最早的传输。因为用户的诉求,就要最低的成本,最低的带宽。
同样带宽之下传输最高清的画质,同样画质情况下使用最低的带宽,这里的处理过程当中需要解决载量高清的问题,需要更多进行视频的处理,这个处理交给谁?
而云计算在当中起到很大的作用,但在处理的环节里,现阶段绝对已经不仅限于去解决它的整体带宽以及成本问题,包括封装格式,整体编码,视频处理等多个功能多个模块供选择,让视频的生产更加快速。
整个过程当中,生产环节似乎最难渗透的,但是 AI 的出现,解决了从素材采集、生产、审核三个环节的问题。视频的生产速度、品质大大提高,对于生产环节的渗透,是下一阶段视频云更大价值的体现。
面对消费者这一端,以前相对来说云计算面对消费者还有一层隔阂,就是 2C 的互联网公司采购了云计算之后,将它的带宽分发给 2C 消费者仅此而已。
但现阶段在消费者过程当中云计算可以赋于更多的功能,例如美颜、瘦身等,消费环节云计算不在是单个助手或者软件,它更多是智能化的处理,这个环节的视频的交互和智能的互相沉浸感的提高都会创造比较大的价值。
在消费环节的另外一个是精准化营销,我们有海量数据、海量内容的时候,第一个将内容分发出去,第二在内容分发的同时是不是可以做好营销变现,利用各种算法刻画用户画像,使视频更好、更精准的找到用户。
云上视频新趋向
视频云本身基于由互联网泛娱乐出发,未来向更广泛的行业领域渗透,因为这些整体的行业对于传输或者处理的使用量更大,在视频云不断具备不同环境能力的同时,在各个行业进行演进。
服务的场景化当中有不同视频云解决方案可以去选,分为两个大分类,一个是平台级能力的公司和服务商,一个是应用级能力的公司和服务商,依据你本身的开发能力和行业属性的强弱来选择,其实在过程当中你可以选择行业型、通用平台型的这种公司。
我们对于云计算,似乎把它看成相对非常技术,非常软的这么一个领域,那么其实视频云在技术层面未来依然会去追求技术极致,虽然看到它有很多价值体现,但技术的前进,我们认为远远没有到它成熟的阶段,也就是既需要解决它的高清化、实时化和互动性的问题,这个过程当中绝对不是所说的软件单独一个环节可以解决的,我们经常会提到比如软件定义网络,软件定义存储,软件定义硬件等。
如何做到软件定义一切,基本上需要我们去协同我们的硬件,无论路由器、存储,更多的计算能力等这些环节,头部的云公司我们认为未来跟硬件公司前置的配合以及相应软硬件的协同会更加的频繁。
最后一点,现在都会提到低代码的开发,让很多现在做视频云或者视频的从业者可以更快速、更敏捷的调用我们的功能。
我们都知道创新的快速发展有时候基于两个特点,一个是更多的链接,第二成本更低的试错。
这也就是为什么在大数据校园,比如硅谷或者咖啡厅这种场景会导致很多弱链接的环节出现,你可以进行试错,但在这个过程当中如何提高弱链接的可能性以及试错的可能性?
我们认为在各个行业落地里面云这种形式是可以很好地做到这一点,我们也是非常期待视频云本身对于视频整体行业或者整个大视频的产业更好的起到它大底座的功能。
以上为演讲全文。
「视频云技术」你最值得关注的音视频技术公众号,每周推送来自阿里云一线的实践技术文章,在这里与音视频领域一流工程师交流切磋。公众号后台回复【技术】可加入阿里云视频云产品技术交流群,和业内大咖一起探讨音视频技术,获取更多行业最新信息。