极术小姐姐 · 2021年05月17日

在Arm PL中引入交错批处理的线性代数函数

ARM1996_5F00_Blog_5F00_Image_5F00_Options_5F00_V4.jpg_2D00_.jpg_2D00_900x506x2.jpg

在高性能计算中,对大批小矩阵执行线性代数运算是常见的用例。然而在BLAS和LAPACK接口的设计中,即两项用于执行基本和高级的线性函数计算的标准中,这样的做法并不理想。

作者:Chris Armstrong
阅读直达链接:https://community.arm.com/developer/tools-software/tools/b/tools-software-ides-blog/posts/new-interleave-batched-linear-algebra-functions-in-arm-pl

欢迎大家点赞留言,更多Arm技术文章动态请关注极术社区Arm技术专栏

推荐阅读
关注数
23519
内容数
973
Arm相关的技术博客,提供最新Arm技术干货,欢迎关注
目录
极术微信服务号
关注极术微信号
实时接收点赞提醒和评论通知
安谋科技学堂公众号
关注安谋科技学堂
实时获取安谋科技及 Arm 教学资源
安谋科技招聘公众号
关注安谋科技招聘
实时获取安谋科技中国职位信息