时间倒退至 4 年前,国内上演「百箱大战」的焦点刚刚开始从智能音箱产品本身,转移到 AI 和支持 AI 运行的芯片平台。
2017 年 11 月,杭州国芯在深圳举办了一场物联网 AI 芯片的发布会,推出了适合音箱、家电、玩具、车载等 AI 产品的 GX8010 物联网人工智能芯片,支持本地离线神经网络计算,具备低功耗、低成本的优势,在国内较早地开启了「AI 赋能之路」。
国芯已经有 20 年的历史,是国内最早一批成立的芯片公司,是全球机顶盒芯片的顶级供应商之一,也是 AI 芯片的新兴企业。
经过了 4 年的发展,国芯的 AI 芯片已经植入到很多家居和家电产品,并从家庭延伸到了车内场景。
△ 家庭场景、车载场景,GX8010 的落地案例
而今天,2020 年 7 月 21 日,国芯在杭州召开了发布会,发布了首款超低功耗的应用在可穿戴领域的 AI 芯片,在极小体积的芯片上,实现了语音唤醒、指令识别、AI 降噪、模式识别等功能,开启了全新的基于「人-车-家」全场景的落地之路。
△ 实现「人-车-家」AI 全场景覆盖 / 杭州国芯 CEO 黄智杰
国芯在过去 4 年,见证了人工智能领域的飞速发展,见证了人工智能的产品形态演变。人工智能并不需要机器人一般庞大的躯壳,智能音箱就能解决很多问题。
而 2018 年苹果 AirPods 二代的推出,更是将耳机变成了随身的语音助手,不需要多大的体积,让 AI 可以跟着人走。
国芯认为,人工智能产品的形态未来还会演变,而国芯的思考,则是如何让产品端更便捷地接入到 AI 大脑,即「唤醒」功能的实现。
△ AirPods 二代、小米 Air 2S、vivo TWS Neo 等支持语音唤醒的 TWS 产品
过去,在智能音箱、家居、车载等领域,唤醒的体验已经相当成熟,但在可穿戴产品上却仍然面临着体积、功耗等挑战。而如今,国芯通过 GX8002 来解决了这些问题。
这是一颗集成度高的芯片
国芯 GX8002 是一颗超低功耗 AI 语音唤醒芯片,具备功耗低、体积小、成本低的优势。
△ 智慧穿戴,从芯启航 / 杭州国芯 AI 事业部总经理 凌云
从芯片的架构上来看,它的规格并不复杂,设计却很精巧。下图中的绿色部分的 VAD 模块,为国芯自研的高性能语音活动检测器,负责判断是否有人说话。
当麦克风检测到有人说话时,则启动 NPU 神经网络处理器。gxNPU V200 是国芯自研的第二代 NPU,支持 DNN/CNN/RNN 等。
而 MCU 则采用的是平头哥 CK804 处理器。与 Arm M4 处理器相当,平头哥 CK804 是一款轻量级的 32bit 低功耗 MCU,集成了 DSP 与浮点运算单元。
△ 国芯 GX8002 芯片架构
国芯 GX8002 可接入丰富的外设,除了蓝牙主控芯片外,还支持模拟麦克风、数字麦克风、以及当下流行的骨传导麦克风。
值得一提的是,国芯 GX8002 将过去外置的晶振也集成到了芯片里,从而节省了 PCB 的面积,进而节省了成本。
△ 国芯 GX8002 芯片实拍图
同时封装进芯片的还有 208KB SRAM 和 256KB/512KB Flash。
这是一颗超低功耗的芯片
在可穿戴设备里做语音唤醒,面临的主要挑战就是功耗。
对比过去用于智能音箱的传统智能语音芯片,其功耗为 1000mW;集成 DSP 的智能家居芯片,其功耗为 100mW;而即便是最小单元的数字麦克风,功耗也要 1mW。
△ 传统语音芯片功耗
国芯 GX8002 将语音唤醒的功耗带入了「微瓦」时代。
在 VAD 待机情况下,功耗可以低至 70uW;在 VAD 检测到人声,进行唤醒识别的工作状态下,功耗为 0.6mW,甚至低于一颗数字麦克风的功耗。
△ 国芯 GX8002 典型应用功耗
而在日常的使用中,平均 70% 为 VAD 的工作模式下,国芯 GX8002 的平均功耗小于 300uW。三种状态相对应的电流数据分别为:20uA、180uA、90uA。
(视频请访问:https://www.shenzhenware.com/articles/14239 查看)
△ 低功耗演示:1.8V/0.85V 供电,使用模拟麦克风,国芯 GX8002 在待机/短指令唤醒的切换中,实时功耗的数据
* 注:演示视频中是两路供电,功耗需要相加。
超低功耗 AI 语音唤醒背后的技术支撑
实现超低功耗 AI 语音唤醒,背后有两个模块的支撑,其一是 NPU,其二是 VAD。
在极小体积的芯片上进行语音唤醒、指令识别、AI 降噪、模式识别等运算,国芯第二代 NPU 较初代有了很多改进。
它可以实现更高的指令效率和计算效率,更好网络量化压缩能力,支持 DNN/CNN/LSTM 等主流神经网络计算,能效比是普通DSP的十倍以上。同时,它是一个完全可编程的结构,具有统一的工具链,可以无缝对接 TensorFlow 等训练平台。
△ 国芯第二代 gxNPU V200 神经网络处理器
VAD 的性能直接决定了这颗芯片的工作状态。
传统 VAD 基于能量做判断,人声高一些 VAD 就会被激活,反之则待机。当处于地铁车厢、公交车站等背景嘈杂的环境中时,人声淹没在环境噪音中,传统 VAD 常常就会失效。
国芯自研的 VAD 则通过多维度的特征分析和判断机制,辅之以自动调节阈值的策略,再通过声学计算,即便在复杂的环境噪音中,也能准确地判断出人声。
同时,国芯在 VAD 上运行的算法已经固化到了硬件上,不依赖于 CPU,因此进一步地节省了功耗。
△ 国芯自研 VAD 对人声的判断
在办公室、地铁、公交车、咖啡馆、马路边等日常佩戴 TWS 耳机的环境中,国芯的实测数据显示,设备日常使用 VAD 的待机比例大部分情况下,是大于 70% 的。
只有在咖啡馆等环境人声非常复杂的环境,VAD 只有一半的时间在待机,而另外一半的工作时间,VAD 在对背景噪音做实时判断和过滤,对于那些不符合唤醒标准的声音,则不启动 NPU。
这也就意味着,在日常随行的场景下,设备约70%的时间处在最低功耗的70uW待机模式,而传统 VAD 一旦失效会让整个芯片都需要全速计算,计算功耗可想而知。
△ 国芯团队 VAD 实测数据
在低功耗的支持下,对于只配备一块 60mAh 纽扣电池的设备来说,它的待机时间可以长达 27 天。如果配置 2000mAh 的 18650 锂电池,使用国芯 GX8002 做唤醒,其待机更是能持续 925 天。
这里需要指出的是,国芯 GX8002 还支持骨传导传感器,增加骨传导传感器可用于 OVVP(Own Voice Vibration Pick-up)校验,一方面实现更准确的 VAD,另一方面更可以判断唤醒设备的是本人说话还是环境音,这样再也不用担心别人喊一声把自己的设备唤醒的尴尬。
超低功耗 AI 语音唤醒的应用
国芯 GX8002 将 AI 语音唤醒带入了微瓦时代,从而为可穿戴设备打开了更大的应用空间。三大主要应用领域总结为:
- 语音唤醒,实现大于 95% 的综合唤醒率和小于每天 1 次的误唤醒率;
- 离线指令,支持 20 条自定义的快捷指令,如接听电话、播放控制等;
- AI 通话降噪,如基于单麦/双⻨/⻣传导 AI 通话降噪。
考虑到可穿戴设备的体积小,国芯不仅在芯片上集成了很多过去需要外设的器件,同时在封装上也为设备商提供了诸多便利。
国芯 GX8002 首推 3x3 的 QFN20 的封装,便于生产和贴装。国芯还计划在今年第三季度,推出更小、更紧密的 1.4x2.4 规格的 WLCSP 封装,适合更精密的设备。
如何在可穿戴设备上集成 GX8002 这颗芯片呢?
国芯 GX8002 与蓝牙主控芯片搭配使用,就如同为蓝牙芯片增加了一个语音开关按键,通过共用的麦克风,实现语音触发。
这就极大地方便了那些使用成熟蓝牙方案的设备商,在不改变原有芯片设计的情况下,花上半天到一天的调试时间,轻松、灵活地通过叠加 AI 芯片的方式,将蓝牙耳机升级为智能耳机,为设备增加卖点。
△ 国芯 GX8002 典型应用框图:模拟/数字⻨直连 - 内置 Flash - 内置晶振 - I2C/串口通讯
可穿戴设备为什么需要智能语音?
近年来,随着 TWS 耳机的横空出世,可穿戴设备再一次成为市场的焦点、热点。
△ IDC 可穿戴数据 / 杭州国芯 AI 事业部副总经理 陈沪东
毋庸置疑,TWS 耳机成为智能音箱后的下一个入口。而在随身场景,具备语音 AI 功能的 TWS 耳机,将成为手机之外更适合语音助手的载体。
对于手机厂商而言,耳机上的 AI 语音唤醒一来可以提高语音助手的应用频次,降低息屏唤醒的功耗。二来可以为手机中众多 app 提供便捷的语音调用入口,并结合 app 的内容实现智能的语音点播,从而极大地提升用户的使用体验。
而对耳机设备商而言,无论是品牌耳机还是白牌耳机,打通语音 AI 的硬件和软件,为用户提供更丰富的功能,也是未来的趋势。
△ vivo X50 Pro + vivo TWS Neo 语音唤醒
国芯敏锐地发现了「AI + 智能穿戴」的市场机会,以最快的速度推出了一颗专用 AI 语音芯片,相比市面上单芯片和外挂 DSP 的方式,它能更好地平衡设备的功耗、成本与性能。
为了更好地服务设备商,国芯还整合了包括技术、云端平台、算法、蓝牙芯片在内的诸多合作伙伴资源,共同为 TWS 耳机、智能眼镜、智能手表、以及带有离线功能控制的其他可穿戴设备赋能。
湾里小结
国芯 GX8002 超低功耗可穿戴芯片,虽小却并不简单,它继承了国芯在语音 AI 芯片领域多年的经验,并实现了很多跨领域技术的突破,包括音频信号处理、语音唤醒算法、 NPU 异构计算、多级唤醒、VAD 技术。
为了方便设备商的快速集成,国芯还在这颗芯片上做了低功耗 ADC、电源管理、无晶振设计,同时采用了低压工艺和立体 SIP 封装,把闪存和内存都封装了进去。
同时,它还很好地平衡了功耗与性能。每颗 0.65 美金起(按累计采购量阶梯优惠)的价格,更为这颗芯片在手机厂商和可穿戴设备商的应用推广,提供了成本保障。
过去因为功耗等原因不敢想、不敢做的事情,如今都不成问题了。在可穿戴设备领域,国芯将助力设备商,打开一个新的世界。
微信号:shenzhenware
主笔:陈壹零 / 深圳湾
编辑:陈达达 / 深圳湾