37

深圳湾 · 4月18日

用 AI 专核跑语音,全志携手 Arm 中国定义下一代智能音箱 | ​R329 与周易 AIPU 详解

640.jpg

在上个月深圳湾的一篇行业解读中,我们提到了两份智能音箱市场报告:2019 年全球智能音箱销量达到 1.469 亿部,同比增长 70%,同年中国智能音箱市场销量 3682.2 万台,同比增长 126.6%。

单看国内市场,其中的贡献,一方面来自天猫精灵、百度、小米等榜单上的玩家,另一方面则是背后的几大头部芯片供应商全志科技、瑞芯微、晶晨半导体等。

据不完全统计,全志科技面向智能音箱的 R 系列主控芯片已经广泛应用于天猫精灵方糖 R、小度在家、小度音箱 Play、小爱音箱 Play、小爱音箱 mini、京东叮咚、腾讯听听、网易云音箱等多款产品。其中,R328 已经成为智能音箱市场客户认可的主流方案,并成为公司业绩增长的主要动力之一。

641.jpg

在深圳湾过往的多次交流中,全志科技都提到过智能音箱的往事:从 2011 年开始做 Wi-Fi 音箱(智能音箱的雏形)的主控芯片,没有成为第一波先烈,反倒是柳暗花明,坚持至今,最终成为智能音箱市场的一匹黑马,也是让我们看到了市场的机会。

转眼进入 2020 年,已经是全志科技涉足智能音箱领域的第 10 个年头,主打高性价比的 R328 的传奇还在继续,全志科技与 Arm 中国合作打造的 R329 横空出世。

642.jpg

4 月 16 日,深圳湾应邀参与了 Arm 中国和全志科技举办的媒体沟通会,与 Arm 中国产品研发副总裁刘澍、全志科技副总裁陈风,一起聊了聊成就 R329 的「周易」AIPU 和智能音箱的故事。

R329 是首款采用 AI 专核跑智能语音的芯片

全志科技副总裁陈风指出,去年推出的 R328 也是采用了 Arm Cortex A7 处理器的典型产品,但它是用 CPU 来跑智能语音。在与很多友商和算法公司进行了大量的交流后,全志科技发现,市场对专用算力是有明确需求的。因此,经过了 10 个多月的研发,R329 应运而生。

R329 是基于 Arm 的多核异构处理器,集成了高性能的 AIPU、DSP、CPU 等 5 颗计算核,具有高算力、低功耗的特点,是一款 AI 语音专用芯片。

先看一下规格:

643.jpg

基于主频 1.5GHz 的 Arm Cortex-A53 双核架构,相较于 R328,全新升级的 R329 提供高达 1.58 倍整数算力,1.94 倍浮点算力。

集成了 400MHz 双核 HIFI4,可以更大限度地达到优异的能效比,在使用中降低产品发热,体验更优。

配合芯片集成的 SRAM 与嵌入式第二代 VAD 硬件,更进一步降低功耗和发热。1 节 2500mA 的电池,可实现 1 周的待机时长。

644.jpg

R329 首次搭载了 Arm 中国「周易」AIPU,可提供最高达 0.256 TOPS 的运算能力。周易 AIPU 作为 AI 专核,其理论 AI 算力是单核 A7 1.2GHz 和单核 HIFI4 600MHz 的 25 倍。

在「周易」AIPU 的加持下,更充足的专用算力可以支撑更多的语音应用。用深度学习做端到端的算法,相对于传统降噪、回声消除和关键词识别算法,效果提升巨大,显著提升识别率和交互体验。

645.jpg

此外,R329 芯片还通过丰富的音频接口(集成多路音频 ADC 和 DAC、3 路 I2S 和 8 通道 DMIC,同时集成 LDOs),提供更多的功能扩展。

周易 AIPU 代表 Arm 中国首款自主 AIPU 进入商用时代

Arm 中国产品研发副总裁刘澍首先向我们介绍了周易 AIPU 名字的来源。他指出,全志科技 R329 所采用的 Arm Z1-0701 是 Arm 中国「周易」AIPU 第一代架构,其中,07 是它有 2 的 7 次方的硬件 MAC,01 表示它里面还有一个通用的 Tensor 处理单元。命名即表明了处理核的个数,也表明了算力的承载能力。

646.jpg

周易 AIPU 处理器是针对深度学习定制的,其架构包含以下几个部分:

  • 向量处理单元(Vector/Tensor process),类似 NEON 的向量处理指令集,通过 8 比特向量阵列进行向量计算。
  • AI Fix Function,将通用 AI 部件和单元固化下来成为硬件,。
  • Scalar,通用目的的 CPU 运行指令集,具有类似 CPU 的标量处理功能。
  • 可扩展的安全架构,可兼容 Arm 的 TrustZone 安全方案。
  • 可扩展的用户定义架构,如全志科技的案例。

647.jpg

Arm Z1-0701 是专门针对智能家居、智能楼宇、智能机器人场景深度定制的,同时也支持比较简单的视觉分析能力,如图像和人脸的识别和感知。

648.jpg

其最大的优势是在精度和算法移植的速度上也有很高的优化,它可以非常高效地运行本地的 KWS 和本地的 ASR 等各种语音算法。

而在用户端的体验则是功耗低,原先用 CPU 跑 AI,产品的发热需要在结构上做一些主动散热,现在用 AIPU 来接替 CPU 的运算工作,可以很好的缓解这个问题。这就为产品的进一步小型化、长续航提供了可行性。

其次是安全扩展。周易 AIPU 传承了 Arm 的 TrustZone 安全技术来保证整个设备里面数据的安全性。在设计之初,就已经考虑了安全保障,使用户隐私得到有效的保障。

649.jpg

那么,「周易」AIPU 与以往的语音加速器(DSP)有什么不同呢?Arm 中国产品研发副总裁刘澍指出:

从产品定义上来看,「周易」AIPU 不是一个 CPU 处理器,而是一个 NN 类型的处理器。其本质在于 Arm 定义了一套新的适用于 AI 算法的指令集,通过指令来驱动里面的向量处理单元和固定的 AI 算法处理单元,从而完成各种复杂网络的组合的操作,所以我们把它叫做处理器而不叫加速器。
架构的定义、指令集的定义、设计的定义都是由 Arm 中国的团队来完成,所以「周易」也是我们完全自主可控的中国产品。

650.jpg

周易 AIPU 具有高度的可配置性,可以实现单核上达到 0.2T~4T 的算力,而如果采用多核配置,可以增大到 64T,这样就能应用到汽车电子或其他大算力的服务器上。

而在开发的支持方面,可以实现 Tensorflow 模型 24 小时移植,接口也是和 Tengine 的接口是统一的,能够实现跨平台应用,给开发者很多便利。

651.jpg

此外,相比 Arm 的 U55 和 N77,周易 AIPU 更加通用,既可以与 Cortex-M 或 Cortex-A 一起工作,也可以作为处理器进行独立工作。

智能音箱之外,还有更大的语音应用蓝海

全志科技是 Arm 中国的战略合作伙伴,推动了「周易」AIPU 的首个落地应用。在技术选型上,全志科技陈风认为,传统的通用处理器 + DSP 的设计还不能支撑更高的算力,因此 R329 选配了「周易」AIPU 专核,来应对更大的语音智能处理需求。

得益于 Arm 的技术积累和工程化能力,周易 AIPU 将会是全球第一个大批量商用的 AI 处理器。
全志科技对于「周易」AIPU 的信心,不仅来自于其强大的 AI 运算性能,还来自于全志科技对于智能音箱、乃至语音 AI 应用前景的前瞻。

陈风认为,首先,语音解决的是人们从「动手」到「动嘴」的问题。语音不可能替代键盘、触摸屏、按钮、鼠标等所有其他的人机交互方式,而一旦语音 AI 能够像一个贴身佣人一样,语音的实用性会大幅度提升,从而解决人「懒」的问题。

其次,语音具有「非接触」交互的优势。这次新冠疫情就已经把非接触摆到了一个非常高的位置,免接触电梯成为热点。语音是有它独特的使用场景。

最后,全志科技坚信,语音将带来功能入口的扁平化。相对于 PC 时代的网站导航和 Google、百度等搜索引擎,语音可以把几百个功能点简化成一句话,直达搜索结果。最典型的应用就是电视,未来语音搜索将成为电视标配,这也是智能音箱以外,语音应用的巨大增长点。

652.jpg

未来,R329 与周易 AIPU 将以智能音箱为主要切入点,渗入到智慧城市,包括智能楼宇、智慧工业以及智慧生活的方方面面。

从产品形态上,也不仅局限于智能音箱,语音遥控电视、语音服务机器人、物流机器人、语音面板、语音电梯、道闸、门禁等等。

正如深圳湾在此前的分析中指出的,随着 AI 性能在提升、交互模态在增加,智能音箱行业将呈现出低功耗高性能、多模态交互能力、边缘计算和本地控制、分布式控制等趋势。全志科技与 Arm 中国携手打造的这一用例,或许就像一面镜子,为我们映射出了下一代智能语音应用的样子。


微信号:深圳湾 / shenzhenware
来源:深圳湾官网 / shenzhenware.com
版权声明:本文为深圳湾原创文章,极术社区经授权发布

37 阅读 408
推荐阅读
1 条评论
关注数
54
内容数
19
2020 年产品、技术、应用、行业,全面汇总整合,关注智能音频产业上下游生态。
目录
极术微信服务号
关注极术微信号
实时接收点赞提醒和评论通知
Arm中国学堂公众号
关注Arm中国学堂
实时获取免费 Arm 教学资源信息
Arm中国招聘公众号
关注Arm中国招聘
实时获取 Arm 中国职位信息