Datenlord · 3 天前 · 新泽西州

DatenLord 前沿技术分享 No.41

达坦科技始终致力于打造高性能AI+Cloud基础设施平台,积极推动AI应用的落地。达坦科技通过软硬件深度融合的方式,提供AI推理引擎和高性能网络,为AI应用提供弹性、便利、经济的基础设施服务,以此满足不同行业客户对AI+Cloud的需求。在本周的前沿技术分享中,我们邀请到了中国科学院大学在读学生许佳凯,来为大家分享从 Triton Kernel 到 AMDGCN:深入线程行为解析

01、演讲题目

从 Triton Kernel 到 AMDGCN:深入线程行为解析

02、演讲时间

2025年11月2日周日上午10:30

03、演讲人

许佳凯

中国科学院大学在读学生

04、引言

在高性能计算中,Triton 提供了便捷的 GPU 编程抽象,但其底层执行机制往往不为人所熟知。通过分析 .triton/cache 生成的中间表示,我们可以逐层追踪 kernel 的执行。本报告旨在为揭示每个线程在 GPU 上的实际计算行为及内存操作提供一些思路。

05、内容简介

本报告从 Triton 编写的 kernel 入手,借助 .triton/cache 生成的 TTIR、TTGIR、LLIR 以及最终的 AMDGCN 汇编,逐步剖析每个线程的计算与内存访问过程。通过对比不同层次表示,我们能够理解 Triton 编译器如何将高层张量操作映射到底层 GPU 指令,从而为性能优化提供直观依据。

06、直播预约

欢迎您通过微信视频号达坦科技DatenLord预约直播,或者登陆腾讯会议观看直播:

会议号:182 478 993

达坦科技始终致力于打造高性能AI+Cloud基础设施平台,积极推动AI应用的落地。达坦科技通过软硬件深度融合的方式,提供AI推理引擎和高性能网络,为AI应用提供弹性、便利、经济的基础设施服务,以此满足不同行业客户对AI+Cloud的需求。

公众号:达坦科技DatenLord

DatenLord官网

https://datenlord.github.io/zh-cn/

知乎账号:

https://www.zhihu.com/org/da-tan-ke-ji

B站

https://space.bilibili.com/2017027518

邮箱:info@datenlord.com

如果您有兴趣加入达坦科技Rust前沿技术交流群、硬件敏捷开发和验证方法学讨论群或AI Infra交流群,请添加小助手微信:DatenLord_Tech

推荐阅读
关注数
7
文章数
33
目录
极术微信服务号
关注极术微信号
实时接收点赞提醒和评论通知
安谋科技学堂公众号
关注安谋科技学堂
实时获取安谋科技及 Arm 教学资源
安谋科技招聘公众号
关注安谋科技招聘
实时获取安谋科技中国职位信息