极术小姐姐 · 2021年12月23日

浮点运算的矢量化

NEON架构包含对整数和浮点数据类型都有效的操作。

GCC有一个强大的自动矢量化单元,可以检测何时适合使用矢量引擎来优化代码并提高性能。然而,编译器可能不会在你期望的时候对代码进行矢量化。这其中有各种原因:

阅读直达链接:https://developer.arm.com/documentation/den0018/a/Compiling-NEON-Instructions/GCC-command-line-options/Vectorizing-floating-point-operations?lang=en
欢迎大家点赞留言,更多Arm技术文章动态请关注极术社区Arm技术专栏
推荐阅读
关注数
23565
内容数
1018
Arm相关的技术博客,提供最新Arm技术干货,欢迎关注
目录
极术微信服务号
关注极术微信号
实时接收点赞提醒和评论通知
安谋科技学堂公众号
关注安谋科技学堂
实时获取安谋科技及 Arm 教学资源
安谋科技招聘公众号
关注安谋科技招聘
实时获取安谋科技中国职位信息