18

阿里云CloudImagine · 2022年02月22日

揭秘2022冬奥黑科技,阿里云视频云「Cloud ME」如何实现全息会面?

2022北京冬奥会本是一届非凡的存在,这是有史以来第一次将奥运会所需的全部核心系统全面上云,以数字化技术创造奥运的新纪元。

但绿色奥运不止如此,在面临 Covid-19 限制和物理隔阂之下,千里之外,人与人的会面可以透过绿色科技之光而以全息形态实现,这便是阿里云视频云基于AliRTC(音视频通信技术)推出的云上创新解决方案——阿里云聚“Alibaba Cloud ME”,第一次在百年奥运史上跨越物理空间,创造了人与人之间的“云聚”时刻。(以下简称Cloud ME)

云聚现场的汩汩之温—Cloud ME创造传奇会面

“Cloud ME”本意出发,为物理空间限制下渴望探索真实会面感的人们,提供沉浸交互体验,使他们能够以真人3D形态见面,并享受彼此的实时对话与交互。

就在冬奥会刚刚开幕,身处北京闭环内的国际奥委会主席巴赫通过Cloud ME “现身”2022北京新闻中心云聚展区,与远在上海的阿里巴巴集团董事会主席兼CEO张勇,隔空“云聚”,以全息形态同台送出奥运寄语,又在“现场”隔空传递冬奥火炬,于众多媒体记者的见证下,Cloud ME让一切交谈和交互犹如真人临于现场,气氛真实而有流动感,惊叹元宇宙的提前到来,又深感科技涌出的汩汩之温。

张勇巴赫.png
远隔1300公里的巴赫与张勇先生,以全息形态现身北京新闻中心,同台云拜年。

在奥运世纪见面之外,更有温度的,是透过Cloud ME,让因疫情分离别北京、上海两地的医护人员家庭得以在“云上全家团聚”,孩子看到父母如临眼前的欢喜之相,和一张穿越空间的全家福,浓浓暖意,足以瞬间融化这背后所有技术的艰辛演进。而这一刻,技术也挥着人文的熠熠之光。

特殊会面.png
通过Cloud ME,一场特别的见面

整个会面过程通过Cloud ME,将会面者们的全身图像投射到远程全息舱中,以展示他们的3D形象,从而促成多人异地的远程会面交互。

Cloud ME全息舱装置简单,除典型的演播室设备(如摄像机和计算机来捕捉镜头)之外,基于强大的云计算能力,不需要任何额外的现场 IT 基础设施或优化的互联网带宽来助力录制和传输。正是Cloud ME易于落地的特性,让虚拟现实会面可以在更无限的场域向更广泛的受众开放,创造更多样、更有温度的云聚可能。

全家福.jpg
一张特殊而浓浓暖意的“全家福”

就此,无论多想见的人、多遥远的客户、多难相聚的团队,都能透过阿里云视频云的Cloud ME,以云聚之力,咫尺相见。

Cloud ME的魔法显现—发丝级全息复刻 & 眨眼般超低延时

基于阿里巴巴在数字化和智能技术的支撑,Cloud ME制作的音视频将在阿里云上进行压缩、传输、处理和渲染,在这过程中,经久打磨的RTC技术起到最为关键的作用,而阿里云先进的计算能力和广泛的全球网络覆盖也为RTC提供了坚实基础。

实现多人异地全息会面,Cloud ME的操作落地简单,但技术非同寻常。
https://www.youku.com/video/X...

冬奥黑科技Cloud ME的技术实现

传奇过程,如下所现:

首先,在影像采集环节,摄影机采集的画面是无法直接在播放端进行全息成像的,所有画面需要通过先进的编码器进行深度压缩,并在实时传输协议和QoS(Quality of Service)抗丢包策略的保障下发送到阿里云的音视频通信(RTC)网络,画面最终上传的格式和尺寸与普通4K电影无异。

随之,当画面到达云端之后,需要借助云上强大的处理能力完成包括转码、渲染、场景重建、光影处理在内的复杂流程,完成从“平面”到“全息”的蜕变,以真人1:1等比虚拟化复刻,生成3D全息人物,以高清方式重建所有互动细节,包括人物的微面部表情和服装纹理,达到“发丝级”全息全尺寸复刻,塑造全真实交互的沉浸感,一切犹如身临其境。

天下武功,唯快不破。在如此复杂和大跨度的技术链路上,为了实现顺畅的会面效果,技术实现的关键也在于“速度”,而保障“速度”的关键则是阿里云覆盖全球的音视频传输网络GRTN(Global Realtime Transport Network),及其在视频编解码、网络传输、超大规模音视频处理和调度等方面的核心技术。

基于这些技术,影像画面传输和处理的全过程,包括SDK编码、实时传输,云上处理和渲染,端侧解码和成像,仅需在眨眼间的200毫秒内即可完成,体感上与我们日常交流互动的综合体感相同,毫无延时顿感,极度真实。

由此,Cloud ME发丝级的全息全尺寸复刻、眨眼般的超低延时,和稳若磐石的网络传输力,让更多交互奇迹由而发生。

AliRTC极致技术的普惠之光—“零处理”时代顺势而来

Cloud ME的技术实现,核心依托于阿里云视频云曾提出的AliRTC“零处理”解决方案,即通过“云处理+端渲染”技术,让硬件端只进行简单的采集,传输,播放,同时,所有的复杂工作全部集中在云上完成,让终端实现“零处理”。

这是百年奥运史上,第一次利用云上全息RTC技术,实现跨场景远程会面的技术应用,在疫情期彻底打破了物理空间隔阂。通过Cloud ME,可将运动员、赛事工作人员、志愿者和媒体朋友们“瞬移”到指定地点,实时交互沟通。

湖南卫视《新闻大求真》栏目主持人在体验Cloud ME的过程中,就将北京冬奥会现场的志愿者”瞬移“到”节目现场“,进行“面对面”的超级采访,实现了时空同步。来自清华大学的志愿者许雯钧说道:“这感觉就像我们面对面交流一样!”。
芒果tv.png
湖南卫视《新闻大求真》栏目对Cloud ME进行现场体验与节目采访

阿里云视频云的 “ Cloud ME” 既可以应用在奥运会场景下,也可以在奥运会之外,向更多参与者和球迷广泛开放,让他们在虚拟现实中体验真实、沉浸、趣味的全息交互,真正开启百年奥运的新内容与新交互。

不仅如此,基于阿里云RTC的全球部署,还可实现“一地上线,多地同步互动呈现”的场景景象,拥有“分身不再乏术”的现象级能量。

事实证明,RTC音视频通信是一项有助于世界有效连接的关键技术。借助阿里云的全球网络和视频云的智能算法,阿里云视频云旨在将音视频通信能力带入更广泛的应用场景中,不仅在互动娱乐、智慧教育、视频会议,还有更多更具价值的企业服务和更具想象力的沉浸交互场域。

从图文到音视频,社会的第一次交互变革发生于2014年,而RTC技术在2017年驱动了互动视频技术和在线互动商业的颠覆性发展。随着5G技术的发展还会带来新一轮的交互演进,如VR远程协作、虚拟现实互动等。
零处理.png
在云厂商中,阿里云视频云曾率先提出“云处理+端渲染”技术,通过实时通信与云上处理的技术结合,前瞻性地解决了新交互体验因端侧算力受限而无法实现的虚拟交互场景难题,推动终端“零处理”时代顺势而来,而Cloud ME即是阿里云视频云在这一领域的创新实践。

未来,AliRTC会充分利用云端一体的混合计算能力,助力更多创新场景的商业化落地,例如全息演唱会、虚拟演唱会、创新云展会,全息交互娱乐等等,让场景向更低延时、更沉浸交互的极致化体验演进。

rtc.gif

RTC是技术,科技是工具,而其所有的终点,是人文涵蕴的温暖,那是打破尔疆我界的无形之力,是人与人、人与物、人与世界彼此存在的咫尺之间。

期待Cloud ME,期待AliRTC,期待未来。

「视频云技术」你最值得关注的音视频技术公众号,每周推送来自阿里云一线的实践技术文章,在这里与音视频领域一流工程师交流切磋。公众号后台回复【技术】可加入阿里云视频云产品技术交流群,和业内大咖一起探讨音视频技术,获取更多行业最新信息。
推荐阅读
关注数
7683
内容数
237
目录
极术微信服务号
关注极术微信号
实时接收点赞提醒和评论通知
安谋科技学堂公众号
关注安谋科技学堂
实时获取安谋科技及 Arm 教学资源
安谋科技招聘公众号
关注安谋科技招聘
实时获取安谋科技中国职位信息