GPU Kernel优化
-
用Lean4自动搜索GPU Kernel:Attention加速4倍,算子融合黑科技揭秘
Lean4-TileLang 张量程序超级优化器:用形式化推理自动搜索 GPU Kernel,实现 Attention 4.08x 加速 项目概览 核心项目:Lean4-TileLang 张量程序超级优化器(开发中) 项目地址:https://leloykun.github.io/ponder/lean4-tilelang/ 内容规模:5000 字,阅读约 …
Lean4-TileLang 张量程序超级优化器:用形式化推理自动搜索 GPU Kernel,实现 Attention 4.08x 加速 项目概览 核心项目:Lean4-TileLang 张量程序超级优化器(开发中) 项目地址:https://leloykun.github.io/ponder/lean4-tilelang/ 内容规模:5000 字,阅读约 …