超神经HyperAI · 7月12日

活动回顾 | Meet AI Compiler 第5期技术沙龙圆满结束

本次活动,我们有幸邀请到了来自上海交通大学、中国科学院计算技术研究所、微软亚洲研究院、北京智源人工智能研究院的多位 AI 编译器专家,他们不仅带来了最新的研究成果,更结合丰富的应用实践,为在场的数百位参与者提供了一场深入浅出的技术分享。

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

尽管活动当天的天气十分闷热,但参与者们的热情丝毫未减,现场讨论氛围十分活跃,激发了大家对 AI 编译器技术更深层次的思考。HyperAI超神经作为一个开放、包容的社区,非常开心能将大家聚集在一起,并提供一个高质量的学术交流平台,为 AI 编译器技术的发展助力。

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

欢迎更多的小伙伴们加入我们的 AI Compiler Family,与我们一同探索 AI 编译器技术的无限可能!

在这里插入图片描述

活动内容回顾

以下是活动内容简介以及现场的视频回顾。

在这里插入图片描述

分享主题: MLCEngine: A Universal LLM Deployment Engine

内容简介: 本次分享将介绍 MLCEngine,一个能够在不同平台上 Universally Deployment 的 LLM 引擎。MLCEngine 既在服务器上具备 high-throughput, low-latency 的 LLM serving 能力,同时又支持在各种本地环境下无缝部署当今高质量的大语言模型。

分享视频:
https://www.bilibili.com/vide...

在这里插入图片描述

分享主题: ElasticRoom: Multi-Tenant DNN Inference Engine via Co-design with Resource-constrained Compilation and Strong Priority Scheduling

内容简介: 运行时软件中的 GPU 资源划分机制已广泛应用于作业调度程序和多租户计算系统,以提高资源利用率和吞吐量。然而,现有的 GPU 资源划分机制在面临批量异构 DNN 推理请求的时候无法同时提高 GPU 资源利用率并确保实时请求的低延时。我们提出了一种创新的多租户 DNN 推理引擎 ElasticRoom,它基于 TVM 构建了资源约束编译并通过优先级调度同时实现高 GPU 利用率和实时请求的低延迟。

分享视频:

https://www.bilibili.com/vide...
https://www.bilibili.com/vide...
在这里插入图片描述

分享主题: 基于 Triton 的大模型算子库 FlagGems 创新实践

内容简介: 基于 OpenAI 的 Triton 语言,我们开发了高性能的通用算子库 FlagGems,为 PyTorch 框架下的大模型提供推理与训练加速。针对 Triton 的编程特点,我们应用了运行时优化和自动代码生成两项技术创新,拓展了算子的表达能力,提高了算子的性能表现。

分享视频:
https://www.bilibili.com/vide...

在这里插入图片描述

2024 AI Compiler · 敬请期待

2024 Meet AI Compiler 第 6 期技术沙龙预计在年底于上海举办,诚挚邀请各位企业及社区伙伴们以各种形式参与共创,无论是推荐讲师还是赞助场地、茶歇,我们都非常欢迎的。

让我们携手创造国内最活跃的 AI 编译器社区!最后分享一张现场的大合影❤️

在这里插入图片描述

在这里插入图片描述

主办方及合作伙伴

在这里插入图片描述

HyperAI超神经是国内领先的人工智能及高性能计算社区, 旨在通过提供数据集加速下载、在线教程演示、论文深度解读、顶会日历集成等多种基础设施,助力中国的数据科学与⼈⼯智能⾏业的开发者、爱好者学习、理解、实践,与社区⼀起构建⼈⼯智能的未来。目前超神经官网已经上线数千个经典及优质公开数据集和教程,并运营国内最活跃的 AI 编译器社区。

访问官网: https://hyper.ai/

在这里插入图片描述

OpenBayes贝式计算是国内领先的高性能计算服务提供商,通过为新一代异构芯片嫁接经典软件生态及机器学习模型,进而为工业企业及高校科研提供更加快速、易用的数据科学计算产品,其产品已被数十家大型工业场景或头部科研院所所采用。

访问官网: https://openbayes.com/

在这里插入图片描述

MLC.AI 社区成立于 2022 年 6 月,并由 Apache TVM 主要发明者、机器学习领域著名的青年学者陈天奇,带领团队上线了 MLC 线上课程,系统介绍了机器学习编译的关键元素以及核心概念。

2022 年 11 月,在 MLC.AI 社区志愿者的共同努力下,首个完整的 TVM 中文文档上线,并成功托管至 HyperAI超神经官网,进一步为对机器学习编译感兴趣的国内开发者,提供了接触并学习一门新技术的基础设置——文档。

MLC 线上课程: https://mlc.ai/

TVM 中文文档: https://tvm.hyper.ai/

在这里插入图片描述

中国科学院计算技术研究所(简称计算所)创建于 1956 年,是中国第一个专门从事计算机科学技术综合性研究的学术机构。 计算所研制成功了我国第一台通用数字电子计算机,并形成了我国高性能计算机的研发基地,我国首枚通用 CPU 芯片也诞生在这里。

计算所是我国计算机事业的摇篮。伴随着计算所的发展,先后为国家培养了几百名我国最早的计算技术专业人员,在这里工作或学习过的院士有二十余位。随着学科与技术发展,从计算所陆续分离出西安微电子所、计算中心、软件所、网络中心、微电子所和信工所等多个研究机构,孵化了联想、曙光、龙芯、寒武纪等高技术企业。

在这里插入图片描述

中国计算机学会高性能计算专业委员会(Technical Committee of HPC ,China Computer Federation 缩写 CCF TCHPC),于 2005 年经中国计算机学会批准成立,作为中国计算机学会下属专业委员会,是高性能计算学术研究、组织高性能计算领域学术会议、产学应用服务的权威性机构。

本着「打造学术平台、促进产业交流、推进应用落地、平衡软硬件生态、服务行业发展、沟通产学研用」原则使命,致力于推进中国高性能计算领域的研究与发展,构建高性能计算学术、产业合作交流平台,对支撑科技发展创新,促进社会进步,增强我国综合国力和国际竞争力有着不可替代的重要作用和意义。

获取 PPT: 关注微信公众号「HyperAI超神经」,后台回复关键字「AI 编译器北京」,获取嘉宾完整 PPT。

推荐阅读
关注数
694
文章数
367
目录
极术微信服务号
关注极术微信号
实时接收点赞提醒和评论通知
安谋科技学堂公众号
关注安谋科技学堂
实时获取安谋科技及 Arm 教学资源
安谋科技招聘公众号
关注安谋科技招聘
实时获取安谋科技中国职位信息