爱集微APP · 4月7日

【专利解密】百度助力AI芯片技术变革

【嘉勤点评】百度的AI芯片专利,通过与各指令来源弱耦合,实现了多指令来源共享SFU,并减少了指令来源调用SFU进行复杂计算时的数据通路,降低了AI芯片的面积开销和功耗开销

集微网消息,百度AI芯片部门昆仑近日完成一轮融资,知情人士透露,昆仑估值约为20亿美元。目前,昆仑芯片主要被百度用于智能电动汽车和云计算。百度将在AI芯片相关领域持续发力。

人工智能算法中存在着很多复杂计算。现在的AI处理器多通过单指令的方式调用专用的复杂计算单元来实现复杂计算。由于这些复杂计算单元占用的逻辑面积相对较大,在多核AI处理器中,如果每个处理器核都独享这些复杂计算单元,则会占用很大的芯片面积,实现代价太大;而且在实际应用场景中,这些复杂计算指令的使用频率也不是特别高,每个处理器核独享时,对这些复杂计算单元的利用率也不高。

为此,百度于2020年6月30日申请了一项名为“复杂计算装置、方法、人工智能芯片和电子设备”的发明专利(申请号: 202010612288.3),申请人为北京百度网讯科技有限公司。

image

图1 AI芯片结构示意图

图1为本发明提出的AI芯片结构示意图。该AI芯片中多个指令来源100均与复杂计算装置200连接,指令来源100可为AI处理器核。其中,复杂计算装置200包括输入接口210、多个计算部件220以及输出接口230。输入接口210可以连接于多个AI处理器核100与多个计算部件220之间,输出接口可以连接于多个计算部件220与多个AI处理器核100之间。

多个计算部件220构成特殊功能单元,每个计算部件220具有独立的运算能力,可以实现某种类型的复杂计算。计算部件220包括以下至少一项:专用集成电路、芯片和现场可编程门阵列。

AI处理器核100可以在接收到待执行指令的情况下,对待执行指令进行译码,并将译码后的数据拼接成复杂计算指令。AI处理器核100可以向复杂计算装置200的输入接口210发出指令请求,输入接口210再从每个AI处理器核100中获取复杂计算指令,并根据各复杂计算指令中的计算类型将其分别仲裁给对应的计算部件220。

计算部件220从接收到的复杂计算指令中获取源操作数以进行复杂计算,并生成计算结果指令反馈给输出接口230。计算结果指令中包括指令来源标识、计算结果以及写回地址等。其中,计算结果即为该计算部件220对源操作数进行复杂计算的计算结果,指令来源标识和写回地址来自于该计算部件220接收到的复杂计算指令中的数据。

输出接口230从各计算部件220中接收计算结果指令,并根据其中的指令来源标识将各计算结果指令中的计算结果和写回地址分别仲裁给对应的指令来源,如AI处理器核100。AI处理器核100根据写回地址将计算结果写入内部寄存器中。

简而言之,百度的AI芯片专利,通过与各指令来源弱耦合,实现了多指令来源共享SFU,并减少了指令来源调用SFU进行复杂计算时的数据通路,降低了AI芯片的面积开销和功耗开销。

百度是全球领先的AI公司,在AI算力、算法、开放平台、开发者生态等方面建立了领先优势,进入强劲增长的快车道。在云、AI、互联网融合发展的大趋势下,百度布局多引擎增长新格局,积蓄起支撑未来发展的强大势能。

关于嘉勤

深圳市嘉勤知识产权代理有限公司由曾在华为等世界500强企业工作多年的知识产权专家、律师、专利代理人组成,熟悉中欧美知识产权法律理论和实务,在全球知识产权申请、布局、诉讼、许可谈判、交易、运营、标准专利协同创造、专利池建设、展会知识产权、跨境电商知识产权、知识产权海关保护等方面拥有丰富的经验。

(校对/holly)

1 阅读 74
推荐阅读
0 条评论
关注数
1121
内容数
384
从专利出发,浅析一切关于柔性屏、折叠屏、10倍光学变焦技术等有趣的前沿技术
目录
极术微信服务号
关注极术微信号
实时接收点赞提醒和评论通知
Arm中国学堂公众号
关注Arm中国学堂
实时获取免费 Arm 教学资源信息
Arm中国招聘公众号
关注Arm中国招聘
实时获取 Arm 中国职位信息