你是否发现,《钢铁侠》、《她》、《机械姬》等人工智能电影爆红之后,近年来似乎已经少有科幻电影以这一主题作为主题。
原因也不难发现,那个曾经让人着迷的 Jarvis,它的同类——称之为智能助手的物种,如今已经在我们真实的生活中,并且无处不在了。
智能助手无处不在
Google 在刚刚结束的 Google I/O 2022 开发者大会上宣布了两项智能助手相关更新:
- 新增 Look and Talk 功能,无需智能唤醒,看一眼设备的前置摄像头,即可开启对话。
- 新增快捷指令,用简短的语音指令对日常需求进行免唤醒词的快速响应。
回想 7 年前 Google Assistant 刚刚诞生时,智能助手还只能做常识性的应答,通常过不了三轮对话就能沦落为「人工智障」。
如今,伴随着 AI 多模态交互上的创新,无处不在的丰富的终端设备接入,以及海量的内容和应用服务接入,智能助手的能力变得前所未有的强大。
△ Look and Talk
在海外,全球每天有 7 亿人使用 Google Assistant 与设备交互。在国内,中文智能助手虽然起步略晚,但发展速度却是惊人的。
以国内首个月活用户数破亿的手机语音助手为例,OPPO小布助手在短短两年之间快速成长,截止 2021 年底已经累计覆盖 2.5 亿用户,月活用户数突破 1.3 亿,月交互次数达 20 亿。
△ 搭载小布助手的手机覆盖 OPPO、Realme 和 OnePlus 三大品牌,图为 OPPO Find X5 Pro 中的小布助手
随着移动用户群体的时间更加碎片化,智能助手的价值凸显,通过简化用户与设备的交互路径,缩短用户需求和服务响应之间的路径,智能助手可以帮用户处理很多事。
比如一句话查询天气、上倒计时闹钟、设定日程提醒等,都不需要找到并打开 APP。
在越来越庞大的手机服务生态中国,在越来越复杂的手机界面中,使用语音指令一步调用功能、启动 APP,已经成为用户的一种习惯。
打开 WiFi 打开蓝牙,需要几步?
人工智能的价值在于化繁为简,比快更快,高效是关键。
解锁手机、翻找 APP 图标、点击并启动应用、找到自己想要使用的功能,如今完全可以做到用一句语音指令来代替。
但 OPPO 小布助手可以更进一步,做到「一句话、多指令」的操作。
运用多意图多槽位匹配模型,将多个不同操作指令与手机设置进行匹配,一句话即可完成多个系统控制指令。
比如,在 WiFi 信号干扰较多的咖啡馆,你拿出主动降噪的耳机听歌,想要关闭手机 WiFi 打开手机蓝牙。
你无需多次唤醒、多次发出指令,用一句话「关闭 WiFi 然后打开蓝牙」即可一次完成两项任务。
与系统和常用应用的服务集成,将系统和应用控制的流程简化,小布助手做了很多。
比如,清理听筒灰尘、清理手机缓存、清理应用后台,通常情况下要在「设置」选项中找好久。如今,小布助手可以一句话解决,这对于家中长辈来说,体验翻倍。
查快递、发红包、或听我喜爱的歌,需要几步?
很多智能助手能做到语音打开 APP,但往往到了这一步智能就戛然而止了。比如,你让它「打开支付宝」,它就完成这一步,智能到这一步。
你可能是希望查快递、出示付款码、或是打开扫一扫功能,它已经帮不上忙了,只能靠你自己动手操作了。
如今,OPPO 小布助手可以用一句话启用 APP 内的功能。
比如,在支付宝中的查快递,只需「查快递」一个指令,即可调用支付宝的「我的快递」小程序。
听歌时候,也只要一句「打开 QQ 音乐播放我喜爱的歌」或「播放 QQ 音乐中我喜爱的歌」,即可完成连续操作,播放歌单里的歌曲。
连续调节媒体音量、切歌,都是一句话的事儿。
你还可以建议喜欢开免提打电话的长辈,下一次在厨房做饭腾不出双手时,直接语音「开免提给 xx 打电话」,一句话完成多个需要手指连续触控的操作。
开心的时候,不动手,就可以「打开微信给妈妈发100元红包」,一句话,一气呵成。
掏出手机,出示健康码,需要几步?
疫情当下,最常用的一个功能是出示健康码。掏出手机,出示健康码,你需要几步完成?
对于小布助手而言,只要你说出「健康码」这三个字,就能直接跳转到应用内的小程序页面。
以打开粤康码为例,一句语音指令,系统就能自动完成从打开微信、下拉小程序、搜索粤省事、播报「健康码打开了」这一系列操作,免去了翻找的过程。
类似的语音指令还适用于打开行程码、核酸检测报告等。
说出「查询附近的核酸检测点」,也是直接调用支付宝的小程序完成的,省去了很多查找路径。
在疫情反复的今天,通过小布,可以实时查询世界以及全国各地疫情地图、当地最新防疫政策、预约核酸检测、查询疫苗接种点、了解返乡还是原地留守,这些功能是再贴心、再方便不过了。
深化算法,让体验不被割裂
作为对话式 AI 产品,小布助手的交互流程与行业主流产品是一致的,唤醒、语音识别、语义理解、对话管理、对话生成、语音播报,其中每个环节都依赖于 AI 算法对于场景的理解。
在语义理解和对话交互上,如果算法做得很浅,就会出现体验上的割裂。常见的现象是,智能助手针对一些问题的响应,会经常跳到浏览器,通过传统触屏搜索的方式,把结果展示给用户。
针对指令型的操控类技能,OPPO 小布做了更深入的工作。
在单轮的语义方向上,OPPO 小布引用了大规模预训练模型,通过模型训练,使小布整体的语义理解能力提升了一个台阶,呈现出来的效果就是更容易听懂用户说的话、更准确理解用户的指令需求。
在对单意图语义理解到位的基础上,再对单意图分类方案进行优化,通过多分类、交互式匹配的方法,业内首次在手机上实现了「一句话、多指令」的快捷操作。
诚然,让智能助手方便地唤醒、清楚的听清、准确的听懂、并给出令人满意的响应,这不仅仅需要算法的深化,还依赖于 OPPO 小布助手在设备覆盖、内容和服务生态、第三方应用生态等综合能力。
过去半年里,伴随着 OPPO Find N 首款折叠屏手机、OPPO Find X5 首款自研芯手机、OPPO K10 首发天玑芯手机、OPPO Reno8 双芯影像旗舰几个系列的手机陆续发布,小布助手打造了多款定制技能,成为新品的卖点之一。
△ 小布为新机 OPPO K10 策划了联名彩蛋。对小布说:「雾山五行」、「神火降临」,见证高能时刻!
OPPO 自 2019 年启动「万物互融」计划后,小布助手陆续打通了很多第三方应用,在出行信息、购物检索、生活娱乐等场景,让语音直达页面,减少应用间的跳转,服务体验一步到位。
面向元宇宙未来人机交互的进化方向,小布不仅发布数字人(又称虚拟人)——布美美,成为首个基于虚拟人多模态交互的手机智能助手,还在愚人节之际上线小布数字人 3D 互动式聊天功能,用更新奇的玩法与创新 AI 交互方式,为用户增添更多生活乐趣。
打造 Jarvis 一样的智能助手是未来很长一段时间里科技界的大事,而生活中的很多事都是小事。
当智能助手进化到「从科幻炫技、到生活必须」的阶段,它就真的融入了我们的生活,成为无处不在的贴心伙伴。
主笔:周全 / 深圳湾
编辑:陈述 / 深圳湾