深度学习中的大多数操作涉及大量数据,但只涉及简单的控制逻辑。作为并行处理器,GPU非常适合此类任务。由于具有数百个算术逻辑单元(ALU),当前的高端移动GPU可以提供可观的吞吐量。实际上,GPU的设计只有一个目的——并行数据处理。它最初被用于3D图形,后来用于更通用的并行计算。
作者:Roberto Lopez Mendez
阅读直达链接:https://community.arm.com/developer/ip-products/processors/b/ml-ip-blog/posts/making-the-most-of-arm-nn-for-gpu-inference欢迎大家点赞留言,更多Arm技术文章动态请关注极术社区Arm技术专栏。