深圳湾 · 2021年08月06日

小米声学语音自研后的首款高端音箱要来了,可能还真有看头

小米 MIX 4 手机将在 8 月 10 日雷军年度演讲后正式发布。小米这周的预热一浪接一浪。

据爆料,小米 MIX4 也将采用屏下摄像头方案,合作供应商为华星光电。在前日深圳湾的文章中,我们已经分析了各大手机厂商在屏下摄像头战场上的军备竞赛情况。

新的爆料称,小米 MIX4 将基于 UWB 技术开发独特功能。无独有偶,小米首款高端智能音箱的预热海报也在这一天被放了出来,而经深圳湾与小米团队求证,该音箱也将支持 UWB 技术。

%E5%B0%8F%E7%B1%B3%E9%A6%96%E6%AC%BE%E9%AB%98%E7%AB%AF%E6%99%BA%E8%83%BD%E9%9F%B3%E7%AE%B1



小米如何做空间感知和音频流转?

去年 10 月,小米的一组 UWB 技术的应用展示曾一度刷屏。基于空间感知能力,手机指向设备即可定向操控。

视频中出现的小米 10 系列手机和一系列智能家居设备(包括电视和音箱),均内置 UWB 芯片和阵列天线,借助小米自研天线排列及算法,手机和智能设备之间具备了空间感知能力。(视频和技术解读传送门

小米uwb-控制电扇
%E5%B0%8F%E7%B1%B3uwb-%E6%8E%A7%E5%88%B6%E7%94%B5%E8%A7%86
小米还为我们勾勒了 UWB 技术的应用前景,指出,未来将与蓝牙、Wi-Fi 形成优势互补,以满足用户在不同场景下的无线连接需求。

苹果如何做空间感知和音频流转?

苹果将 UWB 技术封装在 U1 芯片内,U1 芯片最早出现在 iPhone 11 系列手机上,后来又出现在去年发布的 HomePod mini 上。U1 不仅让 iPhone 具备了空间感知能力,还让 iPhone 与 HomePod mini 之间实现了音频接力。

只要拿起 iPhone 靠近 HomePod mini 的顶部时,音箱就可以「接手」正在手机上播放的音乐。反过来,HomePod mini 正在播放的音乐,也可以用 iPhone 靠近后,再「接手」回来。

%E6%8E%A5%E5%8A%9B
苹果还优化了流转体验:iPhone 靠近 HomePod mini 时会有震感反馈,iPhone 屏幕上还会出现横幅通知,HomePod mini 顶部也将出现灯光指示。

%E8%8B%B9%E6%9E%9C%E8%BF%98%E4%BC%98%E5%8C%96%E4%BA%86%E6%B5%81%E8%BD%AC%E4%BD%93%E9%AA%8C
另一项应用是个性化聆听体验:iPhone 靠近 HomePod mini 顶部时,iPhone 屏幕上自动跳出媒体控件。不用解锁 iPhone,就可以直接操控媒体控件,而 Apple Music 等指定的音乐流媒体服务还会将你最近听的或喜欢听的音乐置于优先。

MAH09239

小米首款高端音箱准备怎么做?

小米最早在 2017 年推出了第一台内置了小爱同学语音助手的智能音箱,后来产品矩阵逐渐完善,包括无屏的、带屏的、迷你的、便携的、面向家居的等等。





%E5%B0%8F%E7%B1%B3%E6%97%A0%E5%B1%8F%E6%99%BA%E8%83%BD%E9%9F%B3%E7%AE%B1
△ 小米无屏音箱组队,从左到右:小米 AI 音箱(初代)、小爱音箱、小米小爱音箱 HD、小米小爱音箱 Play

小米自 2019 年开始就在很多公开场合强调「全自研」和「全链条的声学语音技术」。以物理声学、心理听觉、信号处理、深度学习为理论基础,开展阵列增强、通话降噪、智能感知、音频声场、声学测量等技术领域的研究工作,同时还支持小米集团各个业务线的声学算法需求,包括通话降噪、麦克风阵列、协同唤醒、组合立体声、全屋播放、扬声器均衡等算法。

%E5%B0%8F%E7%B1%B3%E5%85%A8%E9%93%BE%E6%9D%A1%E5%A3%B0%E5%AD%A6%E8%AF%AD%E9%9F%B3%E6%8A%80%E6%9C%AF
%E5%B0%8F%E7%B1%B3%E7%BB%84%E5%90%88%E7%AB%8B%E4%BD%93%E5%A3%B0%E6%8A%80%E6%9C%AF
小米声学语音技术在情感化语音交互、跨设备关闭闹钟、语音支持全屋播放、两麦阵列唤醒等方向上实现了业内突破:语音交互实现「情感化」,业内首家情感化 TTS 上线;通过 AIoT 放音技术,首次实现一句话全屋同步播放相同音频功能;业内首次上线就近唤醒,实现跨设备关闭闹钟功能;通过两麦阵列唤醒技术,兼顾了低功耗与高性能,高效降噪,获得干净人声。

尤其是在 AIoT 方向上,随着用户家里的智能设备越来越多,在使用和操作方面也变得更加复杂,小米通过全场景智能协同,实现了多设备跨场景的灵活应答和执行能力。这其中有几个层次:

1、协同唤醒:突破原本「就近唤醒原则」的限制,在控制功耗、不增加时延的同时,参考设备距离、活跃状态、形态等综合条件,对唤醒语音做判断,选择最优的设备进行应答。

2、协同响应:在解决了空间位置关系感知、设备能力统一建模、用户上下文状态管理等方面的技术难题后,小爱同学在接收并理解指令后,可以自主选择出设备能力最能满足当前语义需求的设备。

3、协同提醒:通过小米智能设备获知环境状态,通过机器学习对使用者的家居控制习惯进行记忆,从而预测潜在的设备控制需求,进行主动提醒和建议。

此外,小米还积极参与建立适用于智能语音交互产品的远场语音前端系统测评规范,旨在从用户体验角度建立一套科学完善的系统性能测评标准,为技术改进和方案选型提供有力支撑,促进语音技术产业良性发展。

去年推出的小米小爱音箱 Art 是以上这些技术成果落地的体现。

有意思的是,虽然这款音箱在外观设计上十分接近传统家庭音响(比如 Sonos),但它的这几项将声学和语音相结合的卖点功能,完全就是一套智能音箱的打法,和 Sonos 所擅长的全屋高端智能音响体验、以及全覆盖的流媒体音乐服务,并不在一个赛道上。

%E5%B0%8F%E7%B1%B3%E5%B0%8F%E7%88%B1%E9%9F%B3%E7%AE%B1_Art_%E5%BC%95%E8%B5%B7%E7%9A%84%E5%B0%8F%E9%A3%8E%E6%B3%A2
小米今年推出的音频产品并不多,包括一款(也是小米首款)为远程会议场景打造的音视频会议扬声器,强调的是智能语音的相关技术;还有一款高端 TWS 耳机 FlipBuds Pro,它在降噪、音质等方面,使小米 TWS 的品质(还有价格)推向了一个新高度。

据深圳湾分析,小米为下一款智能音箱打上了「首款」和「高端」的标签,其中「首款」指的是重组后的小米声学团队所交的第一份答卷,还是小米重新定义高端后的第一款音箱作品,我们还不得而知。

而「高端」则不止是通常理解的通过「堆料」和提升设计实现的高端,高端的背后是传统音箱与智能音箱的融合,音质和智能的融合。加上上文我们提到的基于 UWB 技术的音频流转的玩法,小米这款新音箱可能还真有看头





微信号:深圳湾 / shenzhenware
来源:深圳湾官网 / shenzhenware.com
版权声明:本文为深圳湾原创文章,极术社区经授权发布

推荐阅读
关注数
4351
内容数
60
2020 年产品、技术、应用、行业,全面汇总整合,关注智能音频产业上下游生态。
目录
极术微信服务号
关注极术微信号
实时接收点赞提醒和评论通知
安谋科技学堂公众号
关注安谋科技学堂
实时获取安谋科技及 Arm 教学资源
安谋科技招聘公众号
关注安谋科技招聘
实时获取安谋科技中国职位信息