DatenLord 前沿技术分享 No.41

达坦科技始终致力于打造高性能AI+Cloud基础设施平台，积极推动AI应用的落地。达坦科技通过软硬件深度融合的方式，提供AI推理引擎和高性能网络，为AI应用提供弹性、便利、经济的基础设施服务，以此满足不同行业客户对AI+Cloud的需求。在本周的前沿技术分享中，我们邀请到了中国科学院大学在读学生许佳凯，来为大家分享从 Triton Kernel 到 AMDGCN：深入线程行为解析。

01、演讲题目

从 Triton Kernel 到 AMDGCN：深入线程行为解析

02、演讲时间

2025年11月2日周日上午10:30

03、演讲人

许佳凯

中国科学院大学在读学生

04、引言

在高性能计算中，Triton 提供了便捷的 GPU 编程抽象，但其底层执行机制往往不为人所熟知。通过分析 .triton/cache 生成的中间表示，我们可以逐层追踪 kernel 的执行。本报告旨在为揭示每个线程在 GPU 上的实际计算行为及内存操作提供一些思路。

05、内容简介

本报告从 Triton 编写的 kernel 入手，借助 .triton/cache 生成的 TTIR、TTGIR、LLIR 以及最终的 AMDGCN 汇编，逐步剖析每个线程的计算与内存访问过程。通过对比不同层次表示，我们能够理解 Triton 编译器如何将高层张量操作映射到底层 GPU 指令，从而为性能优化提供直观依据。

06、直播预约

欢迎您通过微信视频号达坦科技DatenLord预约直播，或者登陆腾讯会议观看直播：

会议号：182 478 993