arXiv上面看到的综述“The Deep Learning Compiler: A Comprehensive Survey([链接])”,2020年2月上传第一版,4月已经是第三版。
围绕GPU硬件上的低精度算子开展了一系列优化工作,以充分发掘NV新硬件提供的以TensorCore为代表的专用硬件加速单元的计算效率。
由于 LLVM IR Opcode 的表达能力有限,为了将额外的信息传递给优化器和代码生成器,LLVM 通常有三个解决方法,分别是 Attribute、Metada...
MLIR(Multi-Level Intermediate Representaion,多级中间表示)是一种用来构建可重用和可扩展编译的新方法。MLIR的设计初衷是为了解决...
IR (Intermediate Representation):LLVM提供的一套编译器系统的中间语言,与具体的语言、指令集、类型系统无关,其中每条指令都是静态...