活动回顾 | Meet AI Compiler 第5期技术沙龙圆满结束 - 极术社区

本次活动，我们有幸邀请到了来自上海交通大学、中国科学院计算技术研究所、微软亚洲研究院、北京智源人工智能研究院的多位 AI 编译器专家，他们不仅带来了最新的研究成果，更结合丰富的应用实践，为在场的数百位参与者提供了一场深入浅出的技术分享。

在这里插入图片描述

尽管活动当天的天气十分闷热，但参与者们的热情丝毫未减，现场讨论氛围十分活跃，激发了大家对 AI 编译器技术更深层次的思考。HyperAI超神经作为一个开放、包容的社区，非常开心能将大家聚集在一起，并提供一个高质量的学术交流平台，为 AI 编译器技术的发展助力。

在这里插入图片描述

欢迎更多的小伙伴们加入我们的 AI Compiler Family，与我们一同探索 AI 编译器技术的无限可能！

在这里插入图片描述

活动内容回顾

以下是活动内容简介以及现场的视频回顾。

在这里插入图片描述

分享主题： MLCEngine: A Universal LLM Deployment Engine

内容简介： 本次分享将介绍 MLCEngine，一个能够在不同平台上 Universally Deployment 的 LLM 引擎。MLCEngine 既在服务器上具备 high-throughput, low-latency 的 LLM serving 能力，同时又支持在各种本地环境下无缝部署当今高质量的大语言模型。

分享视频：
https://www.bilibili.com/vide...

在这里插入图片描述

分享主题： ElasticRoom: Multi-Tenant DNN Inference Engine via Co-design with Resource-constrained Compilation and Strong Priority Scheduling

内容简介： 运行时软件中的 GPU 资源划分机制已广泛应用于作业调度程序和多租户计算系统，以提高资源利用率和吞吐量。然而，现有的 GPU 资源划分机制在面临批量异构 DNN 推理请求的时候无法同时提高 GPU 资源利用率并确保实时请求的低延时。我们提出了一种创新的多租户 DNN 推理引擎 ElasticRoom，它基于 TVM 构建了资源约束编译并通过优先级调度同时实现高 GPU 利用率和实时请求的低延迟。

分享视频：

https://www.bilibili.com/vide...
https://www.bilibili.com/vide...
在这里插入图片描述

分享主题： 基于 Triton 的大模型算子库 FlagGems 创新实践

内容简介： 基于 OpenAI 的 Triton 语言，我们开发了高性能的通用算子库 FlagGems，为 PyTorch 框架下的大模型提供推理与训练加速。针对 Triton 的编程特点，我们应用了运行时优化和自动代码生成两项技术创新，拓展了算子的表达能力，提高了算子的性能表现。

分享视频：
https://www.bilibili.com/vide...

在这里插入图片描述

2024 AI Compiler · 敬请期待

2024 Meet AI Compiler 第 6 期技术沙龙预计在年底于上海举办，诚挚邀请各位企业及社区伙伴们以各种形式参与共创，无论是推荐讲师还是赞助场地、茶歇，我们都非常欢迎的。

让我们携手创造国内最活跃的 AI 编译器社区！最后分享一张现场的大合影❤️

在这里插入图片描述

主办方及合作伙伴

在这里插入图片描述

HyperAI超神经是国内领先的人工智能及高性能计算社区， 旨在通过提供数据集加速下载、在线教程演示、论文深度解读、顶会日历集成等多种基础设施，助力中国的数据科学与⼈⼯智能⾏业的开发者、爱好者学习、理解、实践，与社区⼀起构建⼈⼯智能的未来。目前超神经官网已经上线数千个经典及优质公开数据集和教程，并运营国内最活跃的 AI 编译器社区。

访问官网： https://hyper.ai/

在这里插入图片描述

OpenBayes贝式计算是国内领先的高性能计算服务提供商，通过为新一代异构芯片嫁接经典软件生态及机器学习模型，进而为工业企业及高校科研提供更加快速、易用的数据科学计算产品，其产品已被数十家大型工业场景或头部科研院所所采用。

访问官网： https://openbayes.com/

在这里插入图片描述

MLC.AI 社区成立于 2022 年 6 月，并由 Apache TVM 主要发明者、机器学习领域著名的青年学者陈天奇，带领团队上线了 MLC 线上课程，系统介绍了机器学习编译的关键元素以及核心概念。

2022 年 11 月，在 MLC.AI 社区志愿者的共同努力下，首个完整的 TVM 中文文档上线，并成功托管至 HyperAI超神经官网，进一步为对机器学习编译感兴趣的国内开发者，提供了接触并学习一门新技术的基础设置——文档。

MLC 线上课程： https://mlc.ai/

TVM 中文文档： https://tvm.hyper.ai/

在这里插入图片描述

中国科学院计算技术研究所（简称计算所）创建于 1956 年，是中国第一个专门从事计算机科学技术综合性研究的学术机构。 计算所研制成功了我国第一台通用数字电子计算机，并形成了我国高性能计算机的研发基地，我国首枚通用 CPU 芯片也诞生在这里。

计算所是我国计算机事业的摇篮。伴随着计算所的发展，先后为国家培养了几百名我国最早的计算技术专业人员，在这里工作或学习过的院士有二十余位。随着学科与技术发展，从计算所陆续分离出西安微电子所、计算中心、软件所、网络中心、微电子所和信工所等多个研究机构，孵化了联想、曙光、龙芯、寒武纪等高技术企业。

在这里插入图片描述

中国计算机学会高性能计算专业委员会（Technical Committee of HPC ,China Computer Federation 缩写 CCF TCHPC），于 2005 年经中国计算机学会批准成立，作为中国计算机学会下属专业委员会，是高性能计算学术研究、组织高性能计算领域学术会议、产学应用服务的权威性机构。

本着「打造学术平台、促进产业交流、推进应用落地、平衡软硬件生态、服务行业发展、沟通产学研用」原则使命，致力于推进中国高性能计算领域的研究与发展，构建高性能计算学术、产业合作交流平台，对支撑科技发展创新，促进社会进步，增强我国综合国力和国际竞争力有着不可替代的重要作用和意义。

获取 PPT： 关注微信公众号「HyperAI超神经」，后台回复关键字「AI 编译器北京」，获取嘉宾完整 PPT。

活动回顾 | Meet AI Compiler 第5期技术沙龙圆满结束

推荐阅读

超神经HyperAI

目录