极术小姐姐 · 2022年08月31日 · 北京市

采用Arm V1的AWS Graviton3在深度学习推理工作负载方面比x86快1.8倍以上

采用Arm Neoverse V1的AWS Graviton3在深度学习推理工作负载方面比x86快1.8倍以上

image.png

机器学习(ML)是云和边缘基础设施中增长最快的部分之一。在ML中,深度学习推理的增长速度预计会更快。

在这篇博客中,我们比较了三种亚马逊网络服务(AWS)EC2云实例类型在运行两种常见的FP32 ML模型时的ML推理性能。我们将在未来的博客中介绍量化推理(INT8)的性能。

作者:Ashok Bhat
阅读直达:https://community.arm.com/arm-community-blogs/b/infrastructure-solutions-blog/posts/machine-learning-inference-on-aws-graviton3
欢迎大家点赞留言,更多Arm技术文章动态请关注极术社区Arm技术专栏欢迎添加极术小姐姐微信(id:aijishu20)加入技术交流群,请备注研究方向。
推荐阅读
关注数
23565
内容数
1018
Arm相关的技术博客,提供最新Arm技术干货,欢迎关注
目录
极术微信服务号
关注极术微信号
实时接收点赞提醒和评论通知
安谋科技学堂公众号
关注安谋科技学堂
实时获取安谋科技及 Arm 教学资源
安谋科技招聘公众号
关注安谋科技招聘
实时获取安谋科技中国职位信息