从最初的追随者到如今的领跑者,中国的超高清视频编解码技术已经走过20年的漫长征程。从开始制定不同的视频编解码标准,如H.264/265、AV1、VVC、AVS,再到积极地探索基于AI的视频编码技术。视频编解码——这一将视频数据高效压缩、传输和解码还原清晰度的技术应用,每一次微小的提升都是技术者智慧的结晶。
面对越来越复杂的视频编解码算法,新一代的视频标准对计算算力的需求呈指数级增长。这也使得GPU、ASIC等硬件的依赖程度不断上升。技术研究人员和工程师们一直在不懈努力,以不断提高视频编解码技术的性能和效率。AI可以帮助优化编码算法,提高视频压缩率,同时保持高质量的视频输出。此外,AI还可以应用于视频质量增强,去除噪声、提高清晰度,使用户能够享受更加逼真和令人沉浸的观看体验。
在本次视频编解码与AI专题中,我们将了解JPEG AI的标准进展,聆听关于端到端图像编码的标准化以及前沿产品的落地实践,同时了解结合深度学习、AI增强的视频编码技术。视频编解码与AI的融合已经改变了我们观看和分享视频内容的方式,期待与您共同探索这一领域的未来。
01
基于深度学习的视频编码
王诗淇
香港城市大学 副教授
视频编码是数字视频应用的核心技术,推动了多媒体产业的快速发展。随着超高清视频、虚拟现实技术的进步,亟需高效视频编码技术以应对海量视频数据量的挑战。此外,随着智慧城市相关技术的应用,针对面向机器视觉的高效视频编码的需求与日俱增。
本次分享将为大家介绍实验室在基于深度学习的高效视频编码领域的近期进展,主要包括三个部分:1)基于深度学习的混合视频编码,主要包括利用深度神经网络对传统视频编码平台工具的改进;2)端到端视频编码,主要包括基于深度学习的语义编码、生成式编码等工作;3)面向机器视觉任务的视频编码,主要包括面向机器视觉任务的高效视觉表示压缩。
02
端到端图像视频编码及其标准化
李礼
中国科学技术大学 特任教授
传统图像视频编码基于混合编码框架,经过数十年的发展,其性能提升已经进入瓶颈。端到端图像视频编码作为一种新的编码框架,短短几年的发展,就达到了和传统图像视频编码相匹配的性能。本分享拟介绍端到端图像视频编码的基本思想,并介绍其用于图像、视频、三维生物医学图像等多个模态的发展现状和标准化情况。
本次分享将分为两个部分,第一部分介绍针对端到端图像视频编码的基本思想,主要包括自编码器,基于深度学习的概率估计网络等。第二部分介绍端到端编码方法用于图像、视频、三维生物医学图象等模态的发展现状和标准化情况。
03
全球领先的基于端到端图像编解码落地的产品及解决方案
曹磊
双深科技 创始人&CEO
信息化时代带来图像视频数据的爆发式增长,导致图像视频数据的传输、存储、分析和应用面临瓶颈。因编解码技术可以有效对数据进行压缩,进而成为近几年的研究热点。
本次演讲将聚焦AI端到端图像编解码技术上的应用落地研究,阐述双深科技对AI端到端编解码技术的理解和趋势判断,AI编解码技术在图小小相册APP的应用落地,在CDN场景的行业应用,以及将AI端到端编解码与跨模态语义检索模型进行融合探索。
04
JPEG AI图像编码标准进展和应用
赵寅
华为 视频编码技术专家
图像是互联网数据的重要组成部分。30年前JPEG标准组制订了JPEG-1标准(即为人熟知的JPG格式),并已发展成应用最为广泛的图像格式。随着AI技术的发展,图像不但能够被更高效地压缩,也正在被更多的AI应用所使用。面向更高图像压缩效率和AI任务效率的应用需求,JPEG标准组启动了JPEG AI图像编码标准,基于AI技术、服务AI应用。
本次分享主要包括三个部分:1)JPEG AI标准愿景、应用场景和标准化时间线;2)JPEG AI标准的整体架构、技术效果和优势;3)JPEG AI的重点技术、标准化过程中遇到的难点问题及其解决方法。通过本次介绍,希望能让大家走近JPEG AI,并给业务和研究以启示。
*本专题讲师陆续上线中,更多精彩请关注大会官网
如果你希望参与到音视频技术大会当中,此刻刚刚好:“LiveVideoStackCon 2023音视频技术大会深圳站”现在报名,与您相约深圳。
●时间:2023年11月24日-25日
●地点:深圳圣淘沙酒店(翡翠店)
票务服务:
微信同号13520771810
关于LiveVideoStackCon 音视频技术大会
LiveVideoStackCon是专注于音视频领域的技术大会,致力于分享一流的技术内容,在把握行业趋势和热点的同时持续挖掘技术深度。自首届以来的13场大会中,LiveVideoStackCon成为众多音视频技术人的舞台、国内多媒体生态的风向标,也成为大家技术交流、拓展专业网络、职场进阶的新方式。
LiveVideoStackCon 2023 深圳站,将以“沉浸·新视界”为主题,在2023年11月24日-25日在深圳和大家见面。本场音视频技术大会,依然聚焦在多媒体生态,精心打磨3场主题演讲、13场专题(包括一场圆桌专题)。本次大会规模约300+参会人员,50+技术分享,80+参会企业,并设有VIP社交晚宴、硬件体验区、扭蛋抽奖等各种活动,带来丰富、沉浸的技术大会体验。