Aaron 刘畅
2020.07.06
在人工智能大肆宣扬的年代,人们的生活与工作到底有多少内容是需要并且值得被AI所替代的? 日益渐强的硬件与软件的能力到底有多少是真实需求的场景中会被利用起来不被浪费的? 人工智能如何已较低的成本进入大众生活? 这是几个在整个时代与技术发展的过程中我们不断需要摸索并且反问自己的问题。现在面对依旧碎片化但是逐渐起量的消费级AI市场,又到了重新拿出这些问题重新审视的时候了。
AI的两大应用之一计算机视觉走的要比另一大领域智能语音要走的快一些。应用与落地方面,图像识别、人脸识别、智能监控、文字识别、工业与医疗检测以及智能驾驶的大方向已经较为成熟, 未来一段时间的发展无非是算力以及算法上的升级给应用带来更快更准的效果。而智能语音相比之下拥有更广域的应用机会,并且正在得到更广域的行业关注。为啥呢?这触及到了扯了许久的未来万亿物联AIoT时代如何植入大量AI的可能性,智能语音相比计算机视觉,技术上在体积小、内存小、成本低以及功耗低的芯片上更容易做到,市场上潜在能植入语音交互能力的电子产品甚至非电子产品的种类与量更多。所以,我们希望看一看并且深挖一下当前的智能语音发展到了啥子样子。
市场
首先从多方行研机构了解到,全球2019年智能语音市场为42亿美金。预计到2024年能涨到157亿美金。在智能语音发展的这么几年里(暂且以亚马逊2014年推出第一款带有人工智能语音交互的智能音箱作为消费类智能语音入市的起点),作为核心载体的智能音箱一直是大家对智能语音这个行业的研究标杆。技术和产品领先的美国形成了亚马逊和谷歌分割市场的局面,其他品牌的产品也都在努力与这两家公司的语音助手合作。而中国也形成了阿里巴巴天猫精灵,百度小度以及小米三国鼎立的局面。通过2018年到现在几年的推广,这几家智能音箱大厂已经利用了补贴战略和大国人口基数优势,在出货量上超越了美国(下图左)。在智能家居的渗透率上,中国也早已越过了全球平均水平并迎头赶超美国(下图右),完美响应了”超英赶美“的口号!
对于大方向的预测,数字都是浮云仅供参考,总体趋势上涨就是一个好的信号,精准的预测留给细分领域即可。如果需要一个更为精确一些的数字标准作为参考,经过对亚马逊几年来各类产品的发布以及财报研究,加拿大皇家银行资本市场(RBC captial markets)预计,围绕着亚马逊语音助手“Alexa“的市场在2021年能得到180亿到190亿美金的收入。那么面对拥有更加庞大以及更多可能性的市场(例如白牌市场)以及现在正处于庞大却又碎片化的AIoT市场的整合初始阶段,智能语音在中国的潜力无限。
作为主流的智能硬件芯片IP厂商, 移动与嵌入式领域的霸主Arm,也通过更深层次的技术与市场研究描绘了一张未来智能语音的蓝图。这张蓝图的起源是2019年年末亚马逊专门为物联网设备建立的语音服务平台(Amazon IoT Core/Amazon Integrated Services)。作为全球智能语音的领军企业,亚马逊看好了未来除了手机和智能音箱以外的“大系统“上的语音交互,同时也看好了更多的物联网设备(小系统)赋能语音交互能力的趋势。这类产品拥有更少的功耗以及成本。在2019年至2021年这三年类将是语音IoT产品起势阶段(大企业很多都会参考亚马逊的发展路径),借助于亚马逊的IoT平台预计出货量在2021年超过智能音箱,同时会带动各式各样的智能家居总量的上涨。最终理想的画面是每三个家庭智能设备中会有一个拥有语音能力,而每个作为家庭智能中枢的智能音箱会配备3个以上的可以用语音控制或者交互的智能家居产品,例如台灯,微波炉或是电冰箱。最终做到类似钢铁侠家里的贾维斯系统,去和你的家做对话。
应用场景
除了智能手机,哪些类型的智能语音应用或场景将会在今年有很大的发展?IDC给出了以下他们对三种情况的预测:
第一类是智能可穿戴。很多人对可穿戴设备的语音交互是否有人买单感到困惑,但一个TWS耳机的爆发就把智能可穿戴的语音交互机会提升到了第一位。TWS耳机中的切歌、查询、booking等能力在今年已经进入了各厂商的规划之中,现有耳机里的处理器确实能够完成一定效果的语音交互能力,而高端一些的厂商也正在朝更高能效的TWS语音交互能力做规划,例如离线的音量以及歌曲的切换。针对与耳机还会在后面的部分详细去聊。对于其他的可穿戴设备,手表、手环、眼镜也有了合理的应用需求,剩下的仍需在探索中。
第二类智能驾驶方面,前装的智能娱乐中控系统以及后装的行车记录仪、智能后视镜、抬头显示等都是植入语音的比较有价值的场景。
而最后一类就是碎片化最大但潜在市场最大的智能家居市场。一个家庭里的电器设备有非常多的种类,而众多种类的产品来自于更多不同的厂商。对于不同厂家的不同产品,产品运作的逻辑,唤醒词,云上的资源以及传输协议等的差异导致很难形成较为完整的生态。纵使一些大厂会去尽量铺开自己的生态从而布局于所有种类的家用电器,但根据消费者的消费习惯,大比例的消费者还是会去选择老牌的电器品牌。同时目前智能家居的操纵逻辑仍处于探索阶段,是用一个类似智能音箱的Hub作为智能中控,还是多个控制中心?是利用红外做控制方案还是Wi-Fi/BLE或者并存?这些都是影响多个产品整合成一个完美的家庭系统的因素。而在体验方面,不同产品的硬件、语音算法和云服务的成熟度也是影响使用体验的关键因素。如果唤醒加上最终完成操作的时间过长那么产品的意义就不复存在了。拿谷歌亚马逊作为智能家居生态领先的标杆来看,最近和他们两家公司合作的一些第三方品牌都在同时对谷歌和亚马逊的语音助手(Google Assistant & Alexa)做接入从而解决生态问题。而从算法上,无论是美国还是中国,都在进行消费者的行为和体验研究,从而推出更优质更人性化的操控方案。例如把唤醒词放在句子的末尾,把原先的“唤醒词“+”指令“变成整合的一句”指令 唤醒词“等等。碎片化和生态的问题需要时间来解决,但智能语音从更多的维度进入大众视野确实是一个很好的趋势。
欢迎大家对上述观点提出意见和建议:)
下一章:技术篇