视频链接:https://youtu.be/qTEqrH_ry3w
准备好参加我们的另一场Arm AI虚拟技术讲座!每两周,我们都会讨论和探索人工智能领域的一些最新趋势、技术和最佳实践,邀请来自人工智能生态系统的合作伙伴以及来自Arm的演讲者参加。
00:00开始
00:27 Nota简介
02:58 问题陈述
04:47 Arm虚拟硬件
06:10 Ethos-U65
09:10 神经网络块
13:16 Netspresso
24:00 问答
由于现代人工智能芯片组具有不同的高效操作策略,大多数神经网络模型可能无法充分优化这些设备的延迟和内存占用。
在本次演讲中,我们将介绍如何在新推出的微型NPU Ethos-U65上有效部署流行的神经模型。为此,我们首先检查各种操作形式(例如卷积类型和滤波器大小),并确定适当的操作以提高精度和延迟权衡。
基于这项研究,我们仔细重新设计了众所周知的卷积块(例如,反转残差块和幽灵方块),并使用这些块替换给定模型中计算效率低下的块。我们证明,通过我们的方法获得的模型变量可以显著减少推理时间和内存预算,而不会对Ethos-U65造成明显的性能下降。
本讲座是每两周一次的AI虚拟技术讲座系列的一部分:https://www.youtube.com/playlist?list=PLKjl7IFAwc4QajBFR1CauNEMYEkrKGQ_9
如果您喜欢这段视频,请订阅我们的频道,这样您就可以直接将更多类似的内容发送到您的订阅源中!
https://twitter.com/ArmSoftwareDev