来自Nota AI的AI技术演讲：设计神经模型的硬件感知方法

屏幕截图 2022-08-16 224830.png

准备好参加我们的另一场Arm AI虚拟技术讲座！每两周，我们都会讨论和探索人工智能领域的一些最新趋势、技术和最佳实践，邀请来自人工智能生态系统的合作伙伴以及来自Arm的演讲者参加。

00:00开始
00:27 Nota简介
02:58 问题陈述
04:47 Arm虚拟硬件
06:10 Ethos-U65
09:10 神经网络块
13:16 Netspresso
24:00 问答

由于现代人工智能芯片组具有不同的高效操作策略，大多数神经网络模型可能无法充分优化这些设备的延迟和内存占用。

在本次演讲中，我们将介绍如何在新推出的微型NPU Ethos-U65上有效部署流行的神经模型。为此，我们首先检查各种操作形式（例如卷积类型和滤波器大小），并确定适当的操作以提高精度和延迟权衡。

基于这项研究，我们仔细重新设计了众所周知的卷积块（例如，反转残差块和幽灵方块），并使用这些块替换给定模型中计算效率低下的块。我们证明，通过我们的方法获得的模型变量可以显著减少推理时间和内存预算，而不会对Ethos-U65造成明显的性能下降。

如果您喜欢这段视频，请订阅我们的频道，这样您就可以直接将更多类似的内容发送到您的订阅源中！
https://twitter.com/ArmSoftwareDev