本期直播为极术社区2025年推出的此芯AI PC开发套件瑞莎“星睿O6”系列第四场公开课。本期我们邀请了安谋科技资深技术专家给大家分享Arm KleidiAI在端侧大模型部署的推理加速技术,及演示实际案例效果。
第一期:瑞莎计算机技术专家张云天全面介绍星睿O6”AI PC开发套件的硬件及操作系统
第二期:安谋科技NPU技术专家给大家分享利用“周易”NPU工具链在“星睿O6”上快速部署AI应用及适配优化AI算法的开发经验
第三期:此芯科技的两位技术专家将分别围绕图形应用及AI领域,实战演示基于“星睿O6”的经典应用部署
随着DeepSeek等大模型引爆端侧AI应用浪潮,AI手机、AI PC、机器人、智能汽车、AIoT等终端设备对AI推理加速的需求激增。Arm® KleidiAI作为面向AI框架开发者的计算内核,可有效加速各类模型在终端平台的落地。它支持Neon™、SVE2和SME2等关键Arm架构功能,深度集成MNN、Llama.cpp、PyTorch、Tensorflow、MediaPipe等热门AI框架,助力开发者在端侧高效部署主流大模型。
本期极术公开课,安谋科技的技术专家将深入分享大模型在端侧部署所面临的挑战与机遇,深度解析KleidiAI的原理及提升大模型性能的创新技术,同时结合实际案例演示KleidiAI在自然语言处理、语音识别、多模态等应用中的加速效果,以及在“星睿O6”上的推理框架集成实践,与开发者共同探讨KleidiAI在端侧AI部署中的更多应用。
1.大模型在端侧部署面临的挑战与机遇
2.KleidiAI介绍及加速原理剖析
3.KleidiAI应用案例及效果演示
4.KleidiAI在“星睿O6”上的推理框架集成实践
郑欣昊,安谋科技高级软件工程师
郑欣昊先生在GPU性能调优等方面积累了丰富的经验,他深度参与KleidiAI项目,主要负责MNN集成等工作,确保了KleidiAI在MNN中稳定运行并实现性能的显著提升。郑欣昊先生拥有哈尔滨工业大学电子信息科学与技术硕士学位。
扫码加入活动群,与讲师嘉宾即时互动交流。