脑极体 · 2020年09月11日

探路人与解题者:腾讯数字生态大会上AI语音助手+X的无限可能

日本声优(配音演员)花泽香菜官宣结婚的那一天,不少宅男都直呼“爷青结”(爷的青春结束了)。互联网上被奉为“大众情人”的男神/女神,哪个不是声形并茂的存在?

“颜控”如人类的情感就是如此不讲道理。所以尽管科技厂商们都努力将AI助手的声音“打扮”得亲切可人,但距离真正进入用户心扉还远远不够。尤其是对于智能家居、养老照护等重要语音落地场景来说,情感色彩的缺位就更加显现出不足了。

而近期,许多能说会道的AI人物,也逐步进入我们的视野。比如《时代周刊》刊发了一张马丁·路德·金的“肖像照片”,“他”还会在沉浸式展览《游行》中,重现马丁·路德·金的经典演讲《我有一个梦想》。

在许多岗位上,AI语音助手也开始被赋予真人一样的外貌,能够通过眼神、表情、动作进行自然流畅的表达。比如疫情期间许多办公楼里,都引入了数字人来执行测温任务,让这一行为更具温情,不再是机器语音例行公事一般冷冰冰的提醒。

图片1.png

腾讯全球数字生态大会上,一位来自《镜双城》动画番剧里的女主角那笙,就跟现场观众打起了招呼——“原本我只能出现在动漫世界里,现在的我能够读懂你、听懂你,还有自己的小个性、小脾气哦~”

一副娇俏少女的模样,让这样的“女神”成为自己的导游、助理、客服、老师等等,听起来就十分令人神往,是腾讯云小微和AI lab共同打造的数字虚拟人,也成为腾讯云小微“数字助手”解决方案的“颜值担当”。

微信图片_20200911111121.jpg

当然,让人类与数字助理自然相处,其中既受限于理性的技术发展周期因素,也会受到人类虚无缥缈的情感左右。那么作为一种另辟蹊径的实现方式,腾讯云小微所打造的形象化AI助手,其想象空间到底来自哪里?又将把AI语音技术引向怎样的下一站?

“颜控”企业的出现,折射出哪些现实需求

智能语音助手早已在许多商业场景中落地,比如拨打客服电话时的语音服务,亦或是会为儿童朗读绘本的智能音箱。那为什么大家突然又开始“看脸”了呢?

其实,从智能语音助手中广泛存在的手机/音箱等产品的交互尴尬,就可以解开这个问题。

首先是打开频率。许多主打智能语音功能的硬件(比如音箱),只有在刚拿到手的新鲜劲里,或者是网络上又出现了“调戏”语音助手的段子,才会想起来跟它们对话。背后的关键原因是语音助理所能承载的工具性需求,大部分都已经被智能手机等设备完成的很好了,只能作为“备胎”被偶尔提起。

图片2.png

二是情感联系。语音交互是即忘形式的,这就决定了它无法承载更具私密性、情感性的交互活动。我们会让语音助手帮我们打开电视、启动扫地机器人,但跟它进行充满情绪色彩、大段大段地闲聊?估计大部分用户都会产生抵触心理。就算自己不介意,被其他人撞到抱着一个音箱喃喃自语也很难不引起误会不是……

三是技术瓶颈。伴随着NLP技术的进步,语音助手已经能很不错地完成声纹识别、多轮对话、语义理解等复杂任务了,但距离自然交流显然还有一定的差距。动不动就“我听不懂”“难倒我了”,娱乐消费产品会被弃之高阁,万一企业不小心聘用了这种“智障型”AI助理为消费者提供服务,难以达到普通用户期盼的准确无误、近似真人的交互效果,带来的就可能是订单的损失和品牌口碑的下跌。

针对这些AI语音助手在产业端、市场端的落地尴尬,存不存在可能的解决之道呢?从“工具人”转变为“数字人”,让用户从“声控”转变为“颜控”,就是腾讯数字生态大会上给出的一个十分吸睛的解题思路。

让用户跟AI多聊两句,数字助理需要具备哪些超能力?

“如果那笙哪里做的不对,主人不要嫌弃我我有在努力呢”——试问听到这种对话,你还会吐槽语音助手偶尔出现的小失误,甚至还有点想反思自己是不是过于吹毛求疵了呢?

沿着这个思路,我们可以看到形象化之后,腾讯云小微在数字助手领域都打造出了哪些超能力:

1.语音+视觉交互,借助腾讯系海量IP打造出各种形象、生动、贴近现实需求的形象,提升交互频率,从而真正有效地减轻人类工作负担。比如疫情期间,就有老师表示希望有分身到每个学生身边指导他们,而数字助理的拟人化交互恰好可以完成这一任务;

2.丰富的知识体系,利用知识图谱与深度学习技术,数字助手可以快速调用海量信息,完成问答、资讯等服务,再通过拟人化的形象输出给用户,人们会在服务过程中对技术产生一定的包容和理解。为故宫打造的清朝内阁大学士“福大人”,就担任起了知识渊博的游览助手;

图片3.png

3.个性化情感关系:智能语音助手等新鲜事物的核心受众群以年轻人为主,而随着国漫崛起,年轻人对标新立异的虚拟形象更感兴趣。而对于渴求增长与变化的企业来说,与其按部就班地在声音世界里打转, 尤其是在线上化业务增多,用户的交互频率和方式增长的情况下,年轻市场也需要新的服务形态来被重新激活;

此外,伴随着产业数字化程度的推进,企业想要在数据洪潮中传达出具象的品牌形象,新的视觉载体是不可或缺的。消费者的行为和决策链路也在数字世界中变得更加隐蔽、复杂,如何保持黏性,建立用户与品牌的情感连接也成为应有之义……

上述种种,或许都可以通过一个人格化、陪伴式的“数字助理”,来触发全新的可能性。

AI语音的下一站,开启人机交互的“宁静时代”

技术领域有个名词叫“宁静技术”,简单来说就是通过对用户的情景感知能力,最小化用户的注意力,让人机交互变得隐匿和不可见(invisible)。

就像进入电梯间之后按下楼层键一样,已经成为现代人潜移默化的惯性动作,谁还记得曾经按电梯也是一种职业,甚至需要考证呢。

而人机之间的语音交互,也正在从“好像有点尴尬”进入到自然而然地唤起阶段。接下来,就是要让这种已经在一些场景(比如客厅)成为习惯的事,隐匿到更大的社会空间之中,让AI助手能够在更广阔的商业世界里与人们自然顺畅地进行交流。

这既是技术发展的必然趋势,也离不开科技企业们的不断努力。以腾讯云小微AI语音助手为例,就已经在出行、文旅、教育等等领域开始落地。

图片4.png

之所以能达成这一成就,首先来自于腾讯在语音技术上核心技术链的深耕。

通过ASR、NLP、TTS等技术,对声音进行降噪、文本转化、语义理解,这一才能让AI助手能够在复杂环境中依然能够识别不同的方言或者口音。

想要达成和真人一样的交流,机器还需要听得懂,才能避免“所答非所问”的情况,来真正帮助用户解决问题,成为一个业务能力强大的“数字员工”。因此腾讯除了在语义技术方面发力之外,还十分重视知识图谱的建构。等于为AI搭建了一个先验的知识库,让它能够及时调动庞大的知识储备,更好地理解用户言语的意图,来显示出“智商很高”的样子。

除此之外,数字员工的“情商”也很重要。利用利用个性化、沉浸式的TTS语音合成技术,再结合虚拟人技术,将对话内容以多模态、多层次的形式表达出来,就能很好地通过表情、动作传达出语言的情绪,让用户更加可感、可知。

图片5.png

而这一整个技术体系要真正落地,一方面需要打通数据闭环,从而训练出更可靠、精准的对话模型。因此腾讯云小微团队也建构了一套系统工程。从没有数据怎么办开始,系统地钻研数据如何打通,推动数据共享,到缺失数据的采集,系统化地为客户规划了基于数据智能化目标的数据采集和信息化建设方案。

另外,数字助理的最终目标不是“卖萌”,而是帮助企业提质增效,推动数字生产力变革,达成体验/服务到业绩/留存的真实转化。因此要具备统筹全局、贯穿业务周期的能力。所以也需要对企业的全业务场景进行覆盖,来保证无论是简单的问题咨询,还是复杂的业务流程办理,抑或只是想跟数字员工闲聊谈心,背后的语音技术解决方案都能够通过正确响应来满足用户所需、企业所想。在这一点上,腾讯云小微也通过流式语义+语义VAD技术,让AI在极低时延的情况下也能边听边思考。

也正是“数据+业务”的双重闭环,形成了数字助理进入产业规模化的能力谱系,得以为企业智能化转型全程护航。

AI语音助手+X=无限可能

毫无疑问,数字化、智能化潮流的全面喷发,未来会有更多的数字助理、AI助手被纳入到人类的工作环境当中。对于广大普通人来说,数字助理的能力蝶变真的有现实意义吗?

答案是肯定的。可以预期的是,至少有几种社会生活会被革新:

一是文旅导游。一场疫情让旅游行业元气大伤,而防疫的“持久战”也决定了限人限流会成为一段时期依赖的常态,如何在这样的情况下依然保持甚至超越原有的服务质量,将基础讲解工作交给数字员工,就是一个不错的选择。未来走进景区,打开手机,也许就是一个数字导游引领我们游览,实时讲解,互动答疑;

图片6.png

二是家居场景。你的家里有多少智能音箱在等着落灰?年迈的父母呼唤语音助手的名字时是否还是会感到一丝尴尬?而一旦语音助手有了数字形象,被赋予拟人化色彩之后,一切可能都会变得不同。从原本的一问一答,到有情感、更自然的交流,大概率会有不少人开始发帖“我觉得家里的AI助理才是我爸妈亲生的”。

三是教育产业。一进九月临近教师节,家长群们总少不了“送礼物担心老师不收,不送礼物担心孩子得不到关照”的年度讨论,而现实中,确实存在老师无法针对学生进行一对一特定辅导、难以记住所有学生的学情状况、教学压力大等情况。能化身虚拟老师的“数字助手”,无疑就是妥妥的多赢,老师们得以从机械工作中解放出来,学生们也能得到实时、个性化的辅导,而家长们也不用发愁怎样才能在AI眼里刷存在感了。

三是智能营销。对于企业来说,数字助手不仅仅是一位德智体美劳全面发展的优秀员工,还可以是辅助商业营销决策的“超级智囊”。举个例子,一些汽车小白用户,通过互联网的消费行为偏好分析,进而设计出一些“傻瓜式”产品功能,比如一键询问维修、一键呼叫客户、智能导航、辅助驾驶等等,而这些用户洞察,基于腾讯云小微所处的数字生态都可以转化为车机企业争取潜在用户好感度的关键武器。

图片7.png

一个能听会说、知识全面,又善于表达、喜怒形于色的数字员工,拥有的可能性还有很多。不难发现,不仅企业需要重新认知数字助理所带来的价值红利,想要扩大数字助理的商业价值与应用边界,还需要一套体系化的平台性技术解决方案,来降低各行各业引入数字员工的门槛及成本。

从这一点来看,数字生态大会上所展示的人机交互技术前景与商业宏图,不是一种偶然,而是腾讯云小微从长期实战与技术研发中生长出来的确定性。

腾讯云小微扳动了一下技术齿轮,人与机器如同精密仪器适配一样,在某个瞬间发出“咔”的一声,于是我们知道,一个全新的产业世界大门,开启了……

推荐阅读
关注数
6399
内容数
1555
写让你脑洞大开且能看懂的人工智能、流媒体、海外科技
目录
极术微信服务号
关注极术微信号
实时接收点赞提醒和评论通知
安谋科技学堂公众号
关注安谋科技学堂
实时获取安谋科技及 Arm 教学资源
安谋科技招聘公众号
关注安谋科技招聘
实时获取安谋科技中国职位信息