张量程序

  • Prism:符号化超优化突破LLM推理瓶颈,性能提升1.7倍

    “人类直觉本质上不足以捕捉代数变换、数据布局和硬件特定调度决策之间的组合交互。” 这句话来自 Prism 论文,精准揭示了在过去十年中,ML 系统优化领域始终无法跨越的核心瓶颈。 从 TensorFlow 到 TVM,从 cuDNN 到 FlashAttention,我们一直依赖专家手工编写的规则和内核来推动 AI 模型性能的飞跃。然而,这种范式正逐渐触及天…

    大模型推理 9小时前
    2000