集微网 · 2023年01月03日 · 江苏

寒武纪提高AI芯片运算效率

【爱集微点评】寒武纪的AI芯片专利,通过相应的运算方法、处理器件等,可以提高人工智能芯片在进行矩阵乘法运算时的运算效率。

集微网消息,近日美国政府“制裁”的新一轮“实体清单”公布,其中AI芯片公司寒武纪就位于该清单中,那么寒武纪在AI芯片中有哪些最新的专利呢?

在人工智能技术领域,神经网络算法是最近非常流行的一种机器学习算法,在各种领域中都取得了非常好的效果,比如图像识别,语音识别,自然语言处理等。随着神经网络算法的发展,算法的复杂度也越来越高,为了提高识别度,模型的规模也在逐渐增大。用GPU和CPU处理起这些大规模的模型,要花费大量的计算时间,并且耗电量很大。因此,有必要针对上述技术问题,提供一种能够提高运算效率的运算方法、处理器及相关产品。

为此,寒武纪于2020年4月21日申请了一项名为“运算方法、处理器以及相关产品”的发明专利(申请号:202010318387.0),申请人为中科寒武纪科技股份有限公司。

image

图1处理器示意图

图1为本专利提出的一种处理器的示意图,多个处理元件PE(Processing Element)以二维矩阵的形式排列,每个处理元件与相邻的处理元件之间连接,每个PE中可以设置有至少一个寄存器。处理器主要由控制器和存储器构成,其中,控制器和存储器都与多个处理元件连接,且控制器可以连接存储器。

控制器可以从输入矩阵中确定待加载矩阵,根据处理元件的排列以及待加载矩阵的行数和列数确定是否对待加载矩阵进行分块。其中,处理元件的排列是指处理元件的行数和列数,待加载矩阵的行秩、列秩是指该矩阵的行数和列数。如果待加载矩阵的行数不大于处理元件的行数、且待加载矩阵的列数不大于处理元件的列数,则控制器可以不对待加载矩阵进行分块,若待加载矩阵的行数大于处理元件的行数,或者待加载矩阵的列数大于处理元件的列数,则控制器可以对待加载矩阵进行分块。
image

图2 运算方法的流程图

图2为本专利提出的一种运算方法的流程图。首先将第一矩阵加载到各处理元件的寄存器中,第一矩阵中的元素在矩阵中的排列方式和在处理元件的寄存器中的排列方式相同(S11)。将第二矩阵的每行和第一矩阵的每列元素对应存储到处理元件的寄存器,并与第一矩阵的每一列中的元素分别求乘积,计算一列乘积的和得到第一中间结果(S12)。将第一中间结果进行处理得到第一矩阵和第二矩阵的乘积(S13)。根据加载到处理器中的矩阵为左乘矩阵或者右乘矩阵,步骤S13中对第一中间结果的处理方式不同。比如第一矩阵为左乘矩阵,那么得到的第一中间结果作为第一矩阵和第二矩阵的乘积矩阵的一列元素,第一中间结果在乘积矩阵中的列数与进行运算得到第一中间结果的第二矩阵中的列的列数相同。

简而言之,寒武纪的AI芯片专利,通过相应的运算方法、处理器件等,可以提高人工智能芯片在进行矩阵乘法运算时的运算效率。

寒武纪成立于2016年,专注于人工智能芯片产品的研发与技术创新,致力于打造人工智能领域的核心处理器芯片,让机器更好地理解和服务人类。这次寒武纪登上“实体清单”,无疑是对寒武纪在AI芯片领域实力的最好证明。

推荐阅读
关注数
12739
内容数
1029
从专利出发,浅析一切关于柔性屏、折叠屏、10倍光学变焦技术等有趣的前沿技术
目录
极术微信服务号
关注极术微信号
实时接收点赞提醒和评论通知
安谋科技学堂公众号
关注安谋科技学堂
实时获取安谋科技及 Arm 教学资源
安谋科技招聘公众号
关注安谋科技招聘
实时获取安谋科技中国职位信息