启英泰伦降低语音芯片成本新方法

【爱集微点评】启英泰伦将芯片中的CPU和各个硬件计算模块，采用有效的并行处理方式进行连接，通过数据并行搬运，可以减少CPU处理能力要求，从而降低了芯片成本。

集微网消息，启英泰伦第三代智能语音芯片发布后的短短三个月里，销量就高达百万，并位于离线语音芯片市场销售前列。

虽然采用云端语音识别可以解决语音所需要的算力问题，得到比较好的语音识别效果，但却存在语音隐私安全泄露、实时性差等问题，因此行业也需要离线的语音识别技术方案。而在离线语音识别中，由于无法调用云端硬件资源，终端硬件处理能力有限，且终端产品对成本和性能，包括响应时间、判断准确率等综合要求都较高，如何利用有限的硬件处理资源，结合算法软件设计高性价比，高实时性以及高识别率的语音识别方法是一个具备挑战性的技术问题。

为此，启英泰伦于2021年2月14日申请了一项名为“一种终端硬件和算法软件处理相结合的离线语音识别方法”的发明专利（申请号: 202110186016.6），申请人为成都启英泰伦科技有限公司。

图1 离线语音识别方法具体实施方式示意图

图1是本发明中离线语音识别方法具体实施方式示意图，包括CPU和直接内存访问模块，其中直接内存访问模块和CPU之间连接有第一缓存（连接语音预处理模块）、第二缓存（连接语音端点检测、直接内存访问和硬件计算模块）和第三缓存（连接直接内存访问和神经网络计算模块）。

图2 离线语音识别方法具体实施流程示意图

图2为离线语音识别方法具体实施流程示意图，麦克风实时抓取用户发出温度相关的模拟语音信号，发送到芯片内部的语音数据采集模块，语音数据采集模块将该模拟语音信号转化为数字语音信号，通过芯片内部的直接内存访问模块发到第一缓存（S1）。CPU对第一缓存的数据量进行监控，当第一缓存中的数据积累到预设的门限值时，由CPU将第一缓存中的数据搬运到语音预处理模块（S2）。语音预处理模块接收到CPU从第一缓存传来的数字语音信号时，对该信号进行处理，得到洁净语音信号，并通知CPU，由CPU将该洁净语音信号存放到第二缓存中（S3）。

直接内存访问模块将第二缓存中的洁净语音信号同时发送到语音端点检测模块和硬件计算模块（S4）。语音端点检测模块计算判断当前洁净语音信号是否是有效语音信号，以及有效语音信号的开始和结束端点，如果发现是有效语音信号，则通知硬件计算模块将端点信息发送（S5）。硬件计算模块根据语音端点检测模块的通知判断直接内存访问模块发来的洁净语音信号是有效语音信号，之后硬件计算模块计算得到语音声学特征并通知CPU（S6）。

最后，CPU将硬件计算模块计算出的语音声学特征结果数据存放到神经网络处理前置缓存，直接内存访问模块并行将语音声学特征结果发送到神经网络计算模块，神经网络计算模块实时读取芯片外部FLASH存储器中存放的声学模型参数，对语音声学特征结果数据进行神经网络计算（S7）。

简而言之，启英泰伦将芯片中的CPU和各个硬件计算模块，采用有效的并行处理方式进行连接，通过数据并行搬运，可以减少CPU处理能力要求，从而降低了芯片成本。

启英泰伦以自主的人工智能芯片计算架构和传感信息处理核心技术为基础，挖掘市场痛点及消费者潜在需求，为社会更好的提供服务，这次智能语音芯片出色的销量就是对启英泰伦实力的最好证明。

推荐阅读

目录