10

集微网 · 2023年03月30日 · 江苏

地平线公开多处理单元数据系统处理方案 提高AI网络运算效率

【爱集微点评】地平线提出的用于多处理单元的数据协同处理方法及装置,该方案实现了在多个处理单元执行神经网络的运算任务期间,自动对各个运算阶段进行协同,从而提高了神经网络运算的效率。

集微网消息,异构多核处理器是由主处理器和加速器两种体系结构处理器搭建而成的计算机系统。通过协调地使用性能、结构各异的处理单元,能够满足不同的计算需求,以获取最大总体性能方式完成加速计算。

而神经网络由于结构复杂,数据计算量大,因此,可以设计专门用于神经网络计算的神经网络加速处理单元。集成在同一芯片内的多个神经网络加速处理单元可以并行地执行同一神经网络的计算任务,从而提高神经网络运算的速度。

多个神经网络加速处理单元在对同一帧数据进行处理时,可以将对该帧的处理任务划分为多个处理阶段,各阶段之间需要由CPU与多个神经网络加速处理单元通过发送指令完成各神经网络加速处理单元的协调运行。

为实现多处理单元的数据协同,地平线在2022年3月8日申请了一项名为“用于多处理单元的数据协同处理方法及装置”的发明专利(申请号:202210227643.4),申请人为北京地平线机器人技术研发有限公司。

根据该专利目前公开的相关资料,让我们一起来看看这项技术方案吧。

image

如上图,为该专利中公开的用于多处理单元数据协同处理方法的系统示意图。该系统架构包括有:第一处理单元101,第二处理单元102、主处理单元103和共享内存104。其中,这些处理单元可以集成在一个芯片中,也可以设置到不同的芯片或电路板中。这些芯片或电路板之间可以建立数据通信的链路。

第一处理单元和第二处理单元用于进行神经网络的计算。通常第一处理单元和第二处理单元可以协同地运行同一神经网络的不同部分,以对同一帧数据进行处理。第一处理单元和第二处理单元两两之间可以建立通信连接,以向其他处理单元发送提示本次运算结束的第一信号和表示其他处理单元本次运算结束的第二信号。

主处理单元可以对第一处理单元和第二处理单元的运算过程进行管理。例如,向第一处理单元和第二处理单元发送各种指令(例如启动神经网络运算的指令、指示结束运算的指令等),以及接收其发送的通知。

image
如上图,为用于多处理单元的数据协同处理方法的流程示意图。首先,通过多处理单元中的第一处理单元对预设的神经网络中的目标子网络对应的第一组数据进行运算,得到运算结果数据。在执行该步骤之前,会由第一处理单元和第二处理单元执行该数据系统处理方法所需的指令,并预先存入共享内存中。

其次,生成用于向多处理单元包括的第二处理单元发送提示本次运算结束的第一信号。第一信号为各种形式的信号,例如高低电平信号,数字信号等。第一处理单元可以通过与第二处理单元之间的连线直接发送第一信号,也可以通过其他器件间接发送第一信号。

接着,检测第二处理单元中的每个生成的表示每个第二处理单元对目标子网络对应的第二组数据运算结束的第二信号。当某个第二处理单元单元结束对第二组数据的运算时,向第一处理单元发送第二信号。当第一处理单元接收到所有第二处理单元发送的第二信号时,确定当前针对目标子网络的运算结束。

最后,基于目标子网络在神经网络中的位置,生成用于指示第一处理单元进一步针对神经网络的操作的指令。

image

最后,如上图,为该专利中公开的用于多处理单元的数据协同处理装置的结构示意图。该装置包括有:运算模块601、第一生成模块602、检测模块603以及第二生成模块604。其中,运算模块可以通过对目标子网络对应的第一组数据进行运算,以得到运算结果数据;检测模块用于检测每个第二处理单元对目标子网络对应的第二组数据运算结束的信号。

以上就是地平线提出的用于多处理单元的数据协同处理方法及装置,该方案实现了在多个处理单元执行神经网络的运算任务期间,自动对各个运算阶段进行协同,从而提高了神经网络运算的效率。

推荐阅读
关注数
12686
内容数
1029
从专利出发,浅析一切关于柔性屏、折叠屏、10倍光学变焦技术等有趣的前沿技术
目录
极术微信服务号
关注极术微信号
实时接收点赞提醒和评论通知
安谋科技学堂公众号
关注安谋科技学堂
实时获取安谋科技及 Arm 教学资源
安谋科技招聘公众号
关注安谋科技招聘
实时获取安谋科技中国职位信息