在这篇博客中,我介绍了Armv8.4-A点积指令,这些指令可用于Cortex-A75、Cortex-A55和Neoverse N1以上的Arm内核。我介绍了这些指令的三个用例:卷积、平均和取绝对差异之和(SAD)。然后,我展示了我们如何使用这些指令来提高VP9的libvpx(https://chromium.googlesource... )实现的性能。读完这篇博客后,我希望你能了解DOT指令所能实现的一系列使用情况,然后能够将它们应用到你自己的数字信号处理代码中。
作者:James Greenhalgh
阅读直达链接:
https://community.arm.com/developer/tools-software/tools/b/tools-software-ides-blog/posts/dot-neoverse-n1-accelerating-dsp-functions-with-the-dot-instructions
欢迎大家点赞留言,更多Arm技术文章动态请关注极术社区Arm技术专栏