深圳湾 · 5月24日

从科幻尝鲜到回归生活,这位「朋友」一直与你智趣相投

你是否发现,《钢铁侠》、《她》、《机械姬》等人工智能电影爆红之后,近年来似乎已经少有科幻电影以这一主题作为主题。

原因也不难发现,那个曾经让人着迷的 Jarvis,它的同类——称之为智能助手的物种,如今已经在我们真实的生活中,并且无处不在了。

54f756206da811dc0f50213f

智能助手无处不在

Google 在刚刚结束的 Google I/O 2022 开发者大会上宣布了两项智能助手相关更新:

  • 新增 Look and Talk 功能,无需智能唤醒,看一眼设备的前置摄像头,即可开启对话。
  • 新增快捷指令,用简短的语音指令对日常需求进行免唤醒词的快速响应。

回想 7 年前 Google Assistant 刚刚诞生时,智能助手还只能做常识性的应答,通常过不了三轮对话就能沦落为「人工智障」。

如今,伴随着 AI 多模态交互上的创新,无处不在的丰富的终端设备接入,以及海量的内容和应用服务接入,智能助手的能力变得前所未有的强大。

Look-and-Talk

△ Look and Talk

在海外,全球每天有 7 亿人使用 Google Assistant 与设备交互。在国内,中文智能助手虽然起步略晚,但发展速度却是惊人的。

以国内首个月活用户数破亿的手机语音助手为例,OPPO小布助手在短短两年之间快速成长,截止 2021 年底已经累计覆盖 2.5 亿用户,月活用户数突破 1.3 亿,月交互次数达 20 亿。

xiaobu

△ 搭载小布助手的手机覆盖 OPPO、Realme 和 OnePlus 三大品牌,图为 OPPO Find X5 Pro 中的小布助手

随着移动用户群体的时间更加碎片化,智能助手的价值凸显,通过简化用户与设备的交互路径,缩短用户需求和服务响应之间的路径,智能助手可以帮用户处理很多事。

比如一句话查询天气、上倒计时闹钟、设定日程提醒等,都不需要找到并打开 APP。

在越来越庞大的手机服务生态中国,在越来越复杂的手机界面中,使用语音指令一步调用功能、启动 APP,已经成为用户的一种习惯。

打开 WiFi 打开蓝牙,需要几步?

人工智能的价值在于化繁为简,比快更快,高效是关键。

解锁手机、翻找 APP 图标、点击并启动应用、找到自己想要使用的功能,如今完全可以做到用一句语音指令来代替。

但 OPPO 小布助手可以更进一步,做到「一句话、多指令」的操作。

运用多意图多槽位匹配模型,将多个不同操作指令与手机设置进行匹配,一句话即可完成多个系统控制指令。

比如,在 WiFi 信号干扰较多的咖啡馆,你拿出主动降噪的耳机听歌,想要关闭手机 WiFi 打开手机蓝牙。

你无需多次唤醒、多次发出指令,用一句话「关闭 WiFi 然后打开蓝牙」即可一次完成两项任务。

Slice_3

与系统和常用应用的服务集成,将系统和应用控制的流程简化,小布助手做了很多。

比如,清理听筒灰尘、清理手机缓存、清理应用后台,通常情况下要在「设置」选项中找好久。如今,小布助手可以一句话解决,这对于家中长辈来说,体验翻倍。

%E6%B8%85%E7%90%86

weibo

查快递、发红包、或听我喜爱的歌,需要几步?

很多智能助手能做到语音打开 APP,但往往到了这一步智能就戛然而止了。比如,你让它「打开支付宝」,它就完成这一步,智能到这一步。

你可能是希望查快递、出示付款码、或是打开扫一扫功能,它已经帮不上忙了,只能靠你自己动手操作了。

oppo01

如今,OPPO 小布助手可以用一句话启用 APP 内的功能。

比如,在支付宝中的查快递,只需「查快递」一个指令,即可调用支付宝的「我的快递」小程序。

%E6%9F%A5%E5%BF%AB%E9%80%92

听歌时候,也只要一句「打开 QQ 音乐播放我喜爱的歌」或「播放 QQ 音乐中我喜爱的歌」,即可完成连续操作,播放歌单里的歌曲。

连续调节媒体音量、切歌,都是一句话的事儿。

QQ%E9%9F%B3%E4%B9%90%E6%92%AD%E6%94%BE%E6%8E%A7%E5%88%B6w540

你还可以建议喜欢开免提打电话的长辈,下一次在厨房做饭腾不出双手时,直接语音「开免提给 xx 打电话」,一句话完成多个需要手指连续触控的操作。

开心的时候,不动手,就可以「打开微信给妈妈发100元红包」,一句话,一气呵成。

wechat_redpack-final_ver-v2-w540

掏出手机,出示健康码,需要几步?

疫情当下,最常用的一个功能是出示健康码。掏出手机,出示健康码,你需要几步完成?

对于小布助手而言,只要你说出「健康码」这三个字,就能直接跳转到应用内的小程序页面。

以打开粤康码为例,一句语音指令,系统就能自动完成从打开微信、下拉小程序、搜索粤省事、播报「健康码打开了」这一系列操作,免去了翻找的过程。

粤康码2022-05-20_15_25_17

类似的语音指令还适用于打开行程码、核酸检测报告等。

说出「查询附近的核酸检测点」,也是直接调用支付宝的小程序完成的,省去了很多查找路径。

Slice_2

在疫情反复的今天,通过小布,可以实时查询世界以及全国各地疫情地图、当地最新防疫政策、预约核酸检测、查询疫苗接种点、了解返乡还是原地留守,这些功能是再贴心、再方便不过了。

poster

深化算法,让体验不被割裂

作为对话式 AI 产品,小布助手的交互流程与行业主流产品是一致的,唤醒、语音识别、语义理解、对话管理、对话生成、语音播报,其中每个环节都依赖于 AI 算法对于场景的理解。

在语义理解和对话交互上,如果算法做得很浅,就会出现体验上的割裂。常见的现象是,智能助手针对一些问题的响应,会经常跳到浏览器,通过传统触屏搜索的方式,把结果展示给用户。

针对指令型的操控类技能,OPPO 小布做了更深入的工作。

在单轮的语义方向上,OPPO 小布引用了大规模预训练模型,通过模型训练,使小布整体的语义理解能力提升了一个台阶,呈现出来的效果就是更容易听懂用户说的话、更准确理解用户的指令需求。

在对单意图语义理解到位的基础上,再对单意图分类方案进行优化,通过多分类、交互式匹配的方法,业内首次在手机上实现了「一句话、多指令」的快捷操作。

%E5%B0%8F%E5%B8%83%E5%A4%9A%E6%8C%87%E4%BB%A4

诚然,让智能助手方便地唤醒、清楚的听清、准确的听懂、并给出令人满意的响应,这不仅仅需要算法的深化,还依赖于 OPPO 小布助手在设备覆盖、内容和服务生态、第三方应用生态等综合能力。

过去半年里,伴随着 OPPO Find N 首款折叠屏手机OPPO Find X5 首款自研芯手机、OPPO K10 首发天玑芯手机、OPPO Reno8 双芯影像旗舰几个系列的手机陆续发布,小布助手打造了多款定制技能,成为新品的卖点之一。

%E8%81%94%E5%90%8D%E5%BD%A9%E8%9B%8B

△ 小布为新机 OPPO K10 策划了联名彩蛋。对小布说:「雾山五行」、「神火降临」,见证高能时刻!

OPPO 自 2019 年启动「万物互融」计划后,小布助手陆续打通了很多第三方应用,在出行信息、购物检索、生活娱乐等场景,让语音直达页面,减少应用间的跳转,服务体验一步到位。

面向元宇宙未来人机交互的进化方向,小布不仅发布数字人(又称虚拟人)——布美美,成为首个基于虚拟人多模态交互的手机智能助手,还在愚人节之际上线小布数字人 3D 互动式聊天功能,用更新奇的玩法与创新 AI 交互方式,为用户增添更多生活乐趣。

pasted-image-4696

打造 Jarvis 一样的智能助手是未来很长一段时间里科技界的大事,而生活中的很多事都是小事。

当智能助手进化到「从科幻炫技、到生活必须」的阶段,它就真的融入了我们的生活,成为无处不在的贴心伙伴。

主笔:周全 / 深圳湾

编辑:陈述 / 深圳湾

1 阅读 106
推荐阅读
0 条评论
关注数
4007
内容数
307
深圳湾是一个地标,一个 2013 年注册的微信公众号账号,一家成长中的创业公司的名字。 深圳湾是最早也是最活跃的硬件创新媒体和社区。深圳湾致力于连接全球硬件创新者,连接硬件生态链上下游,连接跨界产品的设计、技术、生产、渠道、商业、创新。
目录
极术微信服务号
关注极术微信号
实时接收点赞提醒和评论通知
安谋科技学堂公众号
关注安谋科技学堂
实时获取安谋科技及 Arm 教学资源
安谋科技招聘公众号
关注安谋科技招聘
实时获取安谋科技中国职位信息