TorchInductor
-
TorchInductor引入CuteDSL后端:GPU推理性能提升1.78倍,自动调优技术革新GEMM计算
关键词:TorchInductor、CuteDSL、GEMM、GPU 推理、自动调优 “在抽象-性能权衡的赛道上,每一种优秀的领域特定语言(DSL)都占据着独特位置。” PyTorch 的 TorchInductor 此前已支持 Triton、CUTLASS(C++)和 cuBLAS 三大自动调优后端。CuteDSL 的加入,不仅填补了由 Python 编写…