SonicMoE
-
普林斯顿伯克利联手打造SonicMoE:在Blackwell GPU上实现峰值吞吐量,性能超越DeepSeek DeepGEMM
提到“索尼克”,无论是游戏中的蓝色刺猬还是高速移动的概念,人们的第一反应往往是“快”。而“快”同样是当前众多AI模型与应用优化的核心追求。 近日,由普林斯顿大学Tri Dao(FlashAttention的第一作者)与加州大学伯克利分校Ion Stoica共同领导的联合研究团队,也推出了一款名为SonicMoE的“超快”系统。 据官方介绍,SonicMoE能…