集微网 · 2021年10月14日

一个眼神即可轻松交互 探境科技智能家电控制方案

【嘉勤点评】探境科技发明的基于人眼视线捕捉判定的家电控制方案,利用图像信号来判断用户是否需要使用某种家电设备,避免了唤醒词或命令词误识别的可能性,并通过结合人眼视线确认的方法来决定哪个设备进行响应,使得设备唤醒方案更加便捷和人性化。

集微网消息,近日,国内知名AI芯片公司探境科技发布了音旋风系列的第二代产品,共包括VOI311(轻量版)、VOI621(升级版)和VOI721(增强版)三款芯片。主要应用在联网生态、智能音箱和云端AI等领域方向。

随着信息技术的不断发展,人们生活水平的提高,智能家电设备进入到千家万户。语音识别技术日渐成熟,越来越多的智能家电设备都引入语音识别技术。现有技术通常利用通过语音的方式来对智能家电进行控制,如对智能家电进行语音唤醒等。

但是,在实际使用中,各种噪声、聊天等干扰都可能导致智能家电被误控制,导致控制准确率较低。为此,探境科技在2019年5月14日申请了一项名为“自然交互语音控制方法及装置”的发明专利(申请号:201910404081.4),申请人为北京探境科技有限公司。

根据该专利目前公开的相关资料,让我们一起来看看探境科技发明的基于人眼视线捕捉判定的家电控制方案吧。

image

如上图,为该专利中发明的自然交互语音控制方法的整体流程示意图,该步骤分为两步,首先由系统获取语音信号,如果该语音信号与预设语音控制指令一致,则获取图像信号。其次,如果该图像信号满足预设条件,则会通过预设语音控制指令对应的家电设备进行响应。

该方案中,主要利用这个原则:由于用户在通过语音方式有意识地唤醒家电设备时,其视线通常也是聚焦在家电设备上的;而若用户无意识地讲话触发了唤醒词时,其视线通常是不会聚焦在家电设备上的。

基于该原则,该专利中的方案在接收到语音信号后,会再捕捉图像信息,通过分析出图像中存在人眼视线朝向需要运行的家电设备时,就唤醒该家电设备,从而满足用户的使用需求。
image

在该过程中,其中很重要的一个功能就是识别用户的人眼视线特征,该专利中发明了如上图中的模型,该模型可以识别人眼视线朝向家电设备的样本感兴趣区域和人眼视线不朝向家电设备的样本感兴趣区域两种类型的图像。上图中为较为经典的深度神经网络结构,如在VGG、Inception以及ResNet中都有应用,可以较好地完成这两种类型的分类任务,由于分类模型的识别率较高,可以达到99%及以上,因此可以推测该专利中的方案具有较好的识别效果以及家电控制效果。

以上就是探境科技发明的基于人眼视线捕捉判定的家电控制方案,该方案利用图像信号来判断用户是否需要使用某种家电设备,避免了唤醒词或命令词误识别的可能性,并通过结合人眼视线确认的方法来决定哪个设备进行响应,使得设备唤醒方案更加便捷和人性化。

关于嘉勤

image

深圳市嘉勤知识产权代理有限公司由曾在华为等世界500强企业工作多年的知识产权专家、律师、专利代理人组成,熟悉中欧美知识产权法律理论和实务,在全球知识产权申请、布局、诉讼、许可谈判、交易、运营、标准专利协同创造、专利池建设、展会知识产权、跨境电商知识产权、知识产权海关保护等方面拥有丰富的经验。

(校对/holly)

推荐阅读
关注数
12739
内容数
1029
从专利出发,浅析一切关于柔性屏、折叠屏、10倍光学变焦技术等有趣的前沿技术
目录
极术微信服务号
关注极术微信号
实时接收点赞提醒和评论通知
安谋科技学堂公众号
关注安谋科技学堂
实时获取安谋科技及 Arm 教学资源
安谋科技招聘公众号
关注安谋科技招聘
实时获取安谋科技中国职位信息