NEON架构包含对整数和浮点数据类型都有效的操作。
GCC有一个强大的自动矢量化单元,可以检测何时适合使用矢量引擎来优化代码并提高性能。然而,编译器可能不会在你期望的时候对代码进行矢量化。这其中有各种原因:
阅读直达链接:https://developer.arm.com/documentation/den0018/a/Compiling-NEON-Instructions/GCC-command-line-options/Vectorizing-floating-point-operations?lang=en
欢迎大家点赞留言,更多Arm技术文章动态请关注极术社区Arm技术专栏