专家协作

大模型工程

告别短视路由！RMS-MoE用记忆检索让MoE专家协作效率倍增

随着大模型参数规模持续膨胀，Mixture-of-Experts（MoE）已成为平衡模型容量与计算成本的关键架构。然而，在真实世界的 Web 级系统中，MoE 的路由机制存在一个常被忽略的缺陷：它本质上是“无记忆”的。在搜索、问答、对话等高并发场景中，大量输入并非彼此孤立，而是存在显著的语义重复与结构相似性。传统的 MoE 路由器每次仅基于当前输入独立决策…

3天前
118000