极术小姐姐 · 2022年12月20日 · 北京市

Yitian710上的深度学习推理性能

image.png
近年来,深度学习已经在工业的各个领域广泛实施,如视觉、自然语言处理和推荐系统。深度学习模型参数数量的指数级上升和对复杂模型的新业务需求要求云计算厂商降低算力成本,提高计算效率。这一条件在深度学习推理中尤为明显,成为我们优化的重点。在这种影响下,阿里云发布了新的Arm服务器芯片--倚天710,采用5纳米工艺。倚天710基于Arm Neoverse,支持最新的Armv9指令集。该指令集包括Int8 MatMul、BFloat16(BF16)等扩展指令,使其在高性能计算方面具有性能优势。

作者:Honglin Zhu
阅读直达:https://community.arm.com/arm-community-blogs/b/infrastructure-solutions-blog/posts/deep-learning-yitian-710
欢迎大家点赞留言,更多Arm技术文章动态请关注极术社区Arm技术专栏欢迎添加极术小姐姐微信(id:aijishu20)加入技术交流群,请备注研究方向。
推荐阅读
关注数
23583
内容数
1033
Arm相关的技术博客,提供最新Arm技术干货,欢迎关注
目录
极术微信服务号
关注极术微信号
实时接收点赞提醒和评论通知
安谋科技学堂公众号
关注安谋科技学堂
实时获取安谋科技及 Arm 教学资源
安谋科技招聘公众号
关注安谋科技招聘
实时获取安谋科技中国职位信息