LiveVideoStack · 2022年10月26日 · 北京市

对话天翼云AI产品研发总监陈金,谈谈产品研发与虚拟数字人

天翼云是中国电信旗下一家科技型、平台型、服务型公司,天翼云秉承央企使命,为客户提供全栈云服务,满足政府机构、各类企业数字化转型的需求。本次我们非常荣幸地采访到了天翼云AI产品研发总监陈金老师,和我们聊一聊产品创新所面临的挑战,并介绍了天翼云基于AI和NLP等技术所研发的数字虚拟老师目前的应用情况。

图片

陈金 天翼云AI产品研发总监

陈金,2020年加入天翼云,专注于创新产品设计与研发工作,主导构建了天翼云VR视频直播系统,AI中台和虚拟数字人应用,现为天翼云AI产品研发总监。

文 / 陈金

策划、编辑 / 李静Teresa

LiveVideoStack:陈老师好,很高兴您能接受我们的采访!请先和我们LiveVideoStack的伙伴们介绍下自己吧~

陈金: 李静你好,我是陈金,2020年加入天翼云,一直在从事新产品的设计与研发工作,先后设计研发天翼云VR视频产品、AI平台和虚拟数字人等智能产品。目前我主要负责天翼云AI产品的研发工作。

LiveVideoStack:您最近比较关注的技术有哪些,可以给我们分享一下吗?

陈金: 因为研发虚拟数字人产品,我最近主要在关注动作捕捉、3D建模、生成式AI、以及云渲染等方面的技术。

LiveVideoStack:看到您在天翼云专注于对创新产品的设计与研发 ,对于这种预研性的工作来说,可能一方面需要做大量的前期市场调研,另一方面就是现有的技术+预研技术能否达到预期的产品顺利落地。那么在一个产品研发的过程中,在技术预研方面面临的挑战是什么?

陈金: 我们认为可以把研发分解为预研和开发两个阶段,在预研阶段,又分为产品预研和技术预研。产品预研的目的是验证和引导客户的潜在需求,着眼公司未来发展和未来市场,把握正确的市场方向和抓住市场机会,一般在一年内不产生大量销售。技术预研的目的是验证产品的技术方案,一般技术难度较大,团队需要时间做技术储备,失败的风险也较高。由于预研工作具有较高的不确定性,我认为主要的挑战是如何获取支持,同时还要维护团队对项目前景的乐观态度。

LiveVideoStack:我们发现AI技术正在慢慢渗透到音视频底层技术中来,对传统技术进行助力与融合,比如基于AI的音频&视频编解码、利用AI算法对网络的优化等。从您的角度来看,您认为AI技术对音视频行业来说,最大的助力是什么?

陈金: AI确实给音视频行业带来了降本增效的效果。降本首先体现在以算力换带宽,基于端到端的网络编码已经在视频会议这种特定场景中将同画质视频的带宽降低了两到三个数量级。而视频智能生产,视频审批技术也可以大大解放人力控制成本。

增效体现在基于画质增强、图像超分等技术的老片修复,音频智能降噪、回声消除等方面。

LiveVideoStack:谈到AI技术,总会让人想到时下大火的虚拟数字人在不同的应用场景出现。AI技术是如何支持虚拟数字人实现的呢?

陈金: 可以说虚拟数字人就是由AI大脑+高颜值组成的,主要就是依赖于AI+CG技术实现。AI技术在数字人的建模、人机交互、识别感知和分析决策等方面都发挥了关键的作用。比如基于一张照片自动进行三维人脸模型的重建,可以大大提升建模效率。再比如基于AI的语音识别、动作识别给数字人提供了识别感知能力,而基于生成式AI技术的语音合成,动画生成等让数字人和人的交互更加自然。

LiveVideoStack:我们了解到天翼云研发了基于生成式AI和NLP等技术的虚拟数字人,作为虚拟老师形象并应用于线上教学。这个产品研发的出发点是什么呢?这款虚拟老师应用目前的落地情况如何?

陈金: 数字人虚拟老师产品不仅仅是希望帮助我国近1800万老师减轻工作压力,也希望帮助你我这样的演讲者或工作汇报者,更轻松自在地传递知识和价值。目前虚拟老师已经在企业的培训部门和高校有了初步的应用,用户反馈良好,学生和老师的接受程度比较高,特别是数字人的形象和声音的个性化定制功能很受老师的欢迎。

LiveVideoStack:如今充斥在我们生活中的虚拟数字人越来越多,如:虚拟偶像、虚拟形象客服,还有天翼云推出的虚拟老师等等。这些虚拟数字人形象大致会被分为2D和3D两大类,从风格上又会有二次元、拟真、3D卡通和超写实等,在您看来虚拟数字人的风格的选取方面主要取决于什么因素?您觉得在元宇宙这个场景虚拟数字人应该是哪种风格呢?

陈金: 2D数字人不管是二次元还是拟真风格的,都只适合在平面媒体上观看。而在元宇宙的场景中,人与数字人交互不再局限在二维的平面里,而是可以借助VR眼镜设备身临其境地走近数字人,这个场景中,数字人需要是3D的形象,其表面材质的渲染,必须要符合物理世界中的规律,比如物体表面的折射和反射光学特性,这样才能得到比较真实自然的观感。

LiveVideoStack:看到您在11月25-26日的LiveVideoStackCon 2022 北京站上也会有演讲分享,可以和我们稍稍剧透下您的分享内容吗?

陈金: 这次分享我将介绍基于生成式AI的虚拟数字人技术与应用,和大家共同探讨虚拟数字人在演讲、客户服务与宣传推广方面的价值。

LiveVideoStack:好的,感谢您接受采访,期待您在11月北京站大会上的精彩分享。


图片

推荐阅读
关注数
4162
内容数
363
分享音视频相关技术干货、产品研究与行业趋势
目录
极术微信服务号
关注极术微信号
实时接收点赞提醒和评论通知
安谋科技学堂公众号
关注安谋科技学堂
实时获取安谋科技及 Arm 教学资源
安谋科技招聘公众号
关注安谋科技招聘
实时获取安谋科技中国职位信息