长时记忆

  • 突破记忆瓶颈!MSA架构实现100M Token长时记忆,开启大模型终身记忆新纪元

    人的智能由推理能力与长期记忆能力构成。近年来,大模型的推理能力快速发展,但其长期记忆能力始终受限于上下文长度,难以突破。历史上,多种技术路线都试图解决这一问题,但均未能同时满足扩展性(Scality)、精度(Precision)与效率(Efficiency)的要求,形成了一个“不可能三角”。近期,论文《MSA: Memory Sparse Attention…

    2026年3月19日
    80300
  • 谷歌DeepMind联合伯克利推出LoGeR:突破性长时记忆架构,让3D重建跨越数千帧

    记忆机制是大型模型处理复杂任务的核心能力之一。在对话、自动化工作流等场景中,模型需要依赖记忆来维持长期上下文。这一需求在3D重建领域同样关键,尤其是在处理大范围场景或长序列视频时,跨帧信息的持续传递与整合至关重要。 然而,现有的前馈式3D重建模型通常受限于较短的上下文窗口,难以有效建模长序列中的依赖关系。尽管近期出现的几何基础模型(如DUSt3R、MonST…

    2026年3月15日
    35600