麦斯科技 · 2022年08月16日 · 四川

来自Nota AI的AI技术演讲:设计神经模型的硬件感知方法

屏幕截图 2022-08-16 224830.png

视频链接:https://youtu.be/qTEqrH_ry3w

准备好参加我们的另一场Arm AI虚拟技术讲座!每两周,我们都会讨论和探索人工智能领域的一些最新趋势、技术和最佳实践,邀请来自人工智能生态系统的合作伙伴以及来自Arm的演讲者参加。

00:00开始
00:27 Nota简介
02:58 问题陈述
04:47 Arm虚拟硬件
06:10 Ethos-U65
09:10 神经网络块
13:16 Netspresso
24:00 问答

由于现代人工智能芯片组具有不同的高效操作策略,大多数神经网络模型可能无法充分优化这些设备的延迟和内存占用。

在本次演讲中,我们将介绍如何在新推出的微型NPU Ethos-U65上有效部署流行的神经模型。为此,我们首先检查各种操作形式(例如卷积类型和滤波器大小),并确定适当的操作以提高精度和延迟权衡。

基于这项研究,我们仔细重新设计了众所周知的卷积块(例如,反转残差块和幽灵方块),并使用这些块替换给定模型中计算效率低下的块。我们证明,通过我们的方法获得的模型变量可以显著减少推理时间和内存预算,而不会对Ethos-U65造成明显的性能下降。

本讲座是每两周一次的AI虚拟技术讲座系列的一部分:https://www.youtube.com/playlist?list=PLKjl7IFAwc4QajBFR1CauNEMYEkrKGQ_9

如果您喜欢这段视频,请订阅我们的频道,这样您就可以直接将更多类似的内容发送到您的订阅源中!
https://twitter.com/ArmSoftwareDev

推荐阅读
关注数
5767
内容数
525
定期发布Arm相关软件信息,微信公众号 ArmSWDevs,欢迎关注~
目录
极术微信服务号
关注极术微信号
实时接收点赞提醒和评论通知
安谋科技学堂公众号
关注安谋科技学堂
实时获取安谋科技及 Arm 教学资源
安谋科技招聘公众号
关注安谋科技招聘
实时获取安谋科技中国职位信息