近年来,整个行业的ISA供应商一直在推出越来越有表现力的SIMD指令集,包括更好地支持自动矢量化的功能。例如,Arm可扩展矢量扩展(SVE)[1]提供了预测、丰富的水平操作集、矢量分区以及聚集和分散内存访问。这扩大了可以被矢量化的程序的范围。然而,由编译器进行的内存别名分析的局限性和不经常出现的内存依赖仍然会不必要地限制矢量化,导致次优的性能。
阅读直达链接:https://community.arm.com/arm-research/b/articles/posts/speculative-vectorization-with-selective-replay-sve
作者:Giacomo Gabrielli
欢迎大家点赞留言,更多Arm技术文章动态请关注极术社区Arm技术专栏