达坦科技始终致力于打造高性能AI+Cloud基础设施平台,积极推动AI应用的落地。达坦科技通过软硬件深度融合的方式,提供AI推理引擎和高性能网络,为AI应用提供弹性、便利、经济的基础设施服务,以此满足不同行业客户对AI+Cloud的需求。在本周的前沿技术分享中,我们邀请到了中国科学院大学在读学生许佳凯,来为大家分享从 Triton Kernel 到 AMDGCN:深入线程行为解析。
01、演讲题目
从 Triton Kernel 到 AMDGCN:深入线程行为解析
02、演讲时间
2025年11月2日周日上午10:30
03、演讲人
许佳凯
中国科学院大学在读学生
04、引言
在高性能计算中,Triton 提供了便捷的 GPU 编程抽象,但其底层执行机制往往不为人所熟知。通过分析 .triton/cache 生成的中间表示,我们可以逐层追踪 kernel 的执行。本报告旨在为揭示每个线程在 GPU 上的实际计算行为及内存操作提供一些思路。
05、内容简介
本报告从 Triton 编写的 kernel 入手,借助 .triton/cache 生成的 TTIR、TTGIR、LLIR 以及最终的 AMDGCN 汇编,逐步剖析每个线程的计算与内存访问过程。通过对比不同层次表示,我们能够理解 Triton 编译器如何将高层张量操作映射到底层 GPU 指令,从而为性能优化提供直观依据。
06、直播预约
欢迎您通过微信视频号达坦科技DatenLord预约直播,或者登陆腾讯会议观看直播:
会议号:182 478 993

达坦科技始终致力于打造高性能AI+Cloud基础设施平台,积极推动AI应用的落地。达坦科技通过软硬件深度融合的方式,提供AI推理引擎和高性能网络,为AI应用提供弹性、便利、经济的基础设施服务,以此满足不同行业客户对AI+Cloud的需求。
公众号:达坦科技DatenLord
DatenLord官网:
https://datenlord.github.io/zh-cn/
知乎账号:
https://www.zhihu.com/org/da-tan-ke-ji
B站:
https://space.bilibili.com/2017027518
如果您有兴趣加入达坦科技Rust前沿技术交流群、硬件敏捷开发和验证方法学讨论群或AI Infra交流群,请添加小助手微信:DatenLord_Tech