近年来,深度学习已经在工业的各个领域广泛实施,如视觉、自然语言处理和推荐系统。深度学习模型参数数量的指数级上升和对复杂模型的新业务需求要求云计算厂商降低算力成本,提高计算效率。这一条件在深度学习推理中尤为明显,成为我们优化的重点。在这种影响下,阿里云发布了新的Arm服务器芯片--倚天710,采用5纳米工艺。倚天710基于Arm Neoverse,支持最新的Armv9指令集。该指令集包括Int8 MatMul、BFloat16(BF16)等扩展指令,使其在高性能计算方面具有性能优势。
作者:Honglin Zhu
阅读直达:https://community.arm.com/arm-community-blogs/b/infrastructure-solutions-blog/posts/deep-learning-yitian-710
欢迎大家点赞留言,更多Arm技术文章动态请关注极术社区Arm技术专栏欢迎添加极术小姐姐微信(id:aijishu20)加入技术交流群,请备注研究方向。