极术小姐姐 · 4月18日

在裸机 Arm 环境中运行 KleidiAI MatMul 内核

image.png

如果您还没有接触过 Arm ® KleidiAI,它是一个开创性的软件库,旨在提升人工智能(AI)在 Arm CPU 上的性能。在这篇博文中有一个概述,其中包括一个指向本指南的链接,该指南提供了在 Linux 环境中运行一些 Arm KleidiAI 矩阵乘法(matmul)微内核的分步说明。这篇指南非常棒,而且超级简单易学,但我想看看如何让 Arm KleidiAI 内核在裸机环境中运行。我还想尝试使用一些 C/C++ 编译器,看看哪种编译器生成的代码更快。

本博文概述了让一些 Arm KleidiAI 微内核在裸机环境中运行的过程,以及在不同优化级别下对不同编译器执行一些基本基准测试的过程。博文使用了 Arm® Development Studio 的组件,包括固定虚拟平台(FVP),当然还有 Arm® Embedded 编译器(AC6)的许可证。博客末尾还提供了一些关于审查编译器已经(或尚未)利用的优化的信息。

作者:Paul Black
文章来源:https://community.arm.com/arm-community-blogs/b/tools-software-ides-blog/posts/kleidiai-matmul-kernels-bare-metal-arm-environment

欢迎大家点赞留言,更多 Arm 技术文章动态请关注极术社区 Arm 技术专栏欢迎添加极术小姐姐微信(id:aijishu20)加入技术交流群,请备注研究方向。

推荐阅读
关注数
23702
内容数
1089
Arm相关的技术博客,提供最新Arm技术干货,欢迎关注
目录
极术微信服务号
关注极术微信号
实时接收点赞提醒和评论通知
安谋科技学堂公众号
关注安谋科技学堂
实时获取安谋科技及 Arm 教学资源
安谋科技招聘公众号
关注安谋科技招聘
实时获取安谋科技中国职位信息