如果您还没有接触过 Arm ® KleidiAI,它是一个开创性的软件库,旨在提升人工智能(AI)在 Arm CPU 上的性能。在这篇博文中有一个概述,其中包括一个指向本指南的链接,该指南提供了在 Linux 环境中运行一些 Arm KleidiAI 矩阵乘法(matmul)微内核的分步说明。这篇指南非常棒,而且超级简单易学,但我想看看如何让 Arm KleidiAI 内核在裸机环境中运行。我还想尝试使用一些 C/C++ 编译器,看看哪种编译器生成的代码更快。
本博文概述了让一些 Arm KleidiAI 微内核在裸机环境中运行的过程,以及在不同优化级别下对不同编译器执行一些基本基准测试的过程。博文使用了 Arm® Development Studio 的组件,包括固定虚拟平台(FVP),当然还有 Arm® Embedded 编译器(AC6)的许可证。博客末尾还提供了一些关于审查编译器已经(或尚未)利用的优化的信息。
作者:Paul Black
文章来源:https://community.arm.com/arm-community-blogs/b/tools-software-ides-blog/posts/kleidiai-matmul-kernels-bare-metal-arm-environment
欢迎大家点赞留言,更多 Arm 技术文章动态请关注极术社区 Arm 技术专栏欢迎添加极术小姐姐微信(id:aijishu20)加入技术交流群,请备注研究方向。