重构AI记忆范式:GAM框架如何以动态搜索替代静态压缩,突破智能体长期记忆瓶颈

在人工智能尤其是大模型驱动的智能体系统中,记忆机制一直是制约其长期任务执行与复杂推理能力的关键瓶颈。传统AI记忆系统普遍采用“压缩-摘要”模式,即将冗长的思维链、工具调用记录等历史轨迹压缩为简短的文本摘要以节省存储空间。这种做法的致命缺陷在于:信息保真度严重受损。如同将一本百科全书强行压缩成一张便利贴,当智能体后续需要回溯具体决策细节、工具参数或中间推理步骤时,关键信息往往已被丢弃,导致其无法准确回答需要细节支撑的问题,甚至出现“幻觉”或逻辑断裂。

近日,北京人工智能研究院发表的论文《General Agentic Memory Via Deep Research》提出了全新的GAM(通用智能体记忆)框架,其核心理念颠覆了传统认知:记忆的本质不是静态的数据存储,而是动态的搜索过程。预计算的记忆内容本质上是为了支持高效、精准的搜索而存在。该框架采用“即时编译”(JIT)策略,仅在需要回忆时才动态激活搜索过程,从而在保留完整原始信息的前提下,实现高效、高保真的记忆检索。

**框架架构与双组件设计**

GAM框架包含两个核心协同工作的模块:记忆器(Memorizer)与研究员(Researcher)。

记忆器负责对智能体的历史交互轨迹(包括对话、工具调用、环境反馈等)进行预处理。具体而言,它将长序列按2048个token为单位切分成独立的“页面”,为每个页面生成一个约50词的轻量级“微型备忘录”,同时完整保留原始页面内容。这一过程借鉴了BGE(Bidirectional Encoder Representations from Generators)地标检索的思想,为每个页面添加具有语义代表性的上下文标题,确保后续检索时能维持语义一致性。所有页面及其备忘录被存入可搜索的存储库中,形成记忆的基础设施。

研究员模块则是记忆检索的执行引擎。当智能体需要回忆信息时(例如基于当前任务或用户查询),研究员被激活,并执行一个“规划-搜索-反思”的三步循环:首先规划搜索策略(确定检索重点与方式),随后利用多种检索工具并行搜索记忆库,最后对检索结果进行反思评估,决定是否需进一步深入搜索或调整策略。默认配置下,研究员最多进行3轮反思,每轮检索5个最相关页面,且可根据任务复杂度动态调整轮次与数量。

重构AI记忆范式:GAM框架如何以动态搜索替代静态压缩,突破智能体长期记忆瓶颈

研究员配备了三种互补的检索工具:向量搜索(处理语义相似性查询)、BM25(基于关键词的精确匹配)、以及ID访问(直接通过页面标识符定位)。实验表明,单一工具效果有限,但组合使用时性能显著提升,体现了“工具组合效应”。例如,在基准测试中,BM25单独使用F1分数为48.64%,向量搜索为32.31%,ID访问为28.96%,而三者结合后达到最佳性能。

**性能表现与关键发现**

在多项标准测试中,GAM框架展现出显著优势。在文档问答任务中,其准确率比单纯使用长上下文提示的方法高出37%,比基础检索增强生成(RAG)方法高出28%。具体数据进一步印证了其有效性:

– 在LoCoMo对话记忆测试中,单跳任务F1分数从48.62%提升至57.75%,多跳推理任务从35.27%跃升至42.29%。

– 在HotpotQA多跳问答任务中,面对448K token的长文档,GAM的F1分数达到59.81%,而传统方法普遍低于50%。

– 在RULER长文本理解任务的多跳追踪场景中,GAM准确率高达93.2%,而传统RAG方法因信息丢失严重,性能接近0%。

重构AI记忆范式:GAM框架如何以动态搜索替代静态压缩,突破智能体长期记忆瓶颈

研究还揭示了一个关键现象:“上下文腐化”。即使使用支持128K上下文窗口的长文本模型,当面临大量无关或干扰信息时,模型性能仍会急剧下降。这表明,单纯扩展上下文窗口并非解决长程记忆问题的根本方案,而GAM的动态检索机制能有效过滤噪声,精准定位相关信息。

另一个有趣发现是模型规模对组件的影响差异。实验显示,当使用0.5B参数模型时,记忆器(负责相对简单的信息提取与摘要)仍能保持48.83的F1分数,而研究员(负责复杂的迭代规划与推理)性能则大幅下降至9.08。这凸显了迭代推理任务对模型能力的更高要求。

**效率与性能的权衡**

GAM框架在效率方面进行了明确权衡。由于其采用即时检索而非预载全文,响应时间相比传统方法有所增加。测试显示,处理1000页历史记录的平均响应时间为1.2秒,具体到不同规模文档:56K文档在线响应需12.43秒,224K文档需16.65秒,448K文档需18.49秒。这比传统方法慢10-50倍。

然而,这种时间成本换来了准确率的质的飞跃:从传统方法的20-30%提升至50-60%。在多数注重准确性与可靠性的应用场景(如医疗咨询、法律分析、复杂决策支持)中,这种权衡显然是值得的。研究团队还验证了“测试时计算缩放”的可行性,即通过增加反思轮数或检索页面数,性能可进一步提升,这是固定流程的传统方法无法实现的。

重构AI记忆范式:GAM框架如何以动态搜索替代静态压缩,突破智能体长期记忆瓶颈

**范式转变与行业影响**

GAM框架的核心贡献在于重新定义了AI记忆的本质。传统方法将记忆视为数据压缩问题,追求存储效率;而GAM将其重构为动态搜索问题,追求检索精度与上下文适应性。这类似于人类的记忆过程:我们并非存储完整百科全书,而是存储索引与关键线索,在需要时通过联想与搜索重建细节。

这种范式转变带来三大优势:

1. **高保真度**:完整保留原始信息,避免压缩导致的信息损失。

2. **强适应性**:根据实时查询动态重建上下文,而非提供固定摘要。

3. **可优化性**:整个搜索过程可端到端地通过强化学习进行优化,持续提升检索策略。

重构AI记忆范式:GAM框架如何以动态搜索替代静态压缩,突破智能体长期记忆瓶颈

此外,GAM的即时检索机制为AI工作流的可解释性与调试提供了新思路。有研究者指出,“决策路径比最终状态更重要”,GAM通过保留完整历史并支持回溯,使得智能体的决策过程变得透明、可审计。当然,也有观点认为这本质上是将人类档案管理的成熟方法(动态编目、按需调阅)迁移至AI系统,但其在复杂、高维数据中的实现仍具创新性。

论文作者表示,当前系统效率已达到实用水平,为智能体的长期任务部署、持续学习与复杂协作奠定了基础。未来方向可能包括进一步优化检索算法、降低延迟,以及探索在更大规模模型上的应用。

论文链接:https://arxiv.org/abs/2511.18423


关注“鲸栖”小程序,掌握最新AI资讯

本文来自网络搜集,不代表鲸林向海立场,如有侵权,联系删除。转载请注明出处:http://www.itsolotime.com/archives/6076

(0)
上一篇 2025年11月27日 下午12:19
下一篇 2025年11月27日 下午12:30

相关推荐

  • 模型融合新范式:SoCE方法如何通过类别专家加权实现大语言模型性能突破

    在大语言模型(LLM)快速发展的今天,模型训练对算力和时间的依赖已成为制约技术迭代的关键瓶颈。传统的训练方法需要庞大的计算资源和精细的流程设计,而模型融合(Model Souping)作为一种轻量化的替代方案,通过权重平均融合多个同架构模型,在降低成本的同时实现能力互补。然而,传统的均匀平均方法往往忽视了不同任务类别间的性能差异,导致融合效果受限。近期,Me…

    2025年11月21日
    9300
  • 跨模态知识解耦与对齐:北京大学团队突破终身行人重识别技术瓶颈

    终身行人重识别技术旨在通过持续学习不断涌现的新增行人数据,在保持对已知数据识别能力的同时,吸收新增的鉴别性信息。这一技术在公共安防监控、智慧社区管理、运动行为分析等实际场景中具有重要的研究价值和应用前景。随着监控系统全天候运行,白天采集的可见光图像和夜晚采集的红外图像数据不断积累,终身行人重识别方法需要持续学习特定模态中的新知识(例如仅适用于红外模态的热辐射…

    2025年12月6日
    7400
  • 硅谷容貌革命:科技从业者医美潮背后的年龄焦虑与行业变革

    在科技创新的前沿阵地硅谷,一场静默的容貌革命正在悄然兴起。加州整形外科医生的最新数据显示,过去五年间,来自科技行业的男性求美者数量激增五倍,其中大厂中年程序员成为主力军。这一现象不仅揭示了科技从业者日益加剧的年龄焦虑,更折射出全球科技行业在AI时代下面临的结构性挑战。 深入分析这一趋势,首先需要关注医美项目的具体变化。根据硅谷整形外科医生本·塔莱博士的观察,…

    2025年11月7日
    7100
  • 奥特曼自曝:不想当上市公司CEO,豪赌1.4万亿算力押注AGI未来

    近日,OpenAI CEO山姆·奥特曼做客《Big Technology Podcast》节目,分享了诸多犀利观点。 访谈中,奥特曼曝出不少引人注目的言论。例如,他明确表示:“对于担任一家上市公司的CEO,我一点都不感到兴奋。”此言一出,迅速被外媒捕捉并广泛报道。 本次访谈直面了许多尖锐问题:OpenAI的收入将如何匹配其1.4万亿美元的算力投入承诺?公司的…

    2025年12月20日
    15900
  • 硅谷AI幻象:当“人肉智能”成为独角兽的隐秘燃料

    在硅谷光鲜的科技叙事背后,一场关于真实与虚构的生存博弈正在AI领域悄然上演。Fireflies.ai联合创始人Sam Udotong的领英自白,揭开了这个行业最荒诞却又最真实的秘密:他们估值超10亿美元的AI产品,最初竟是由两位创始人亲自扮演的“人肉智能”。这个故事不仅是个创业轶事,更是整个AI产业在狂热发展期的一个缩影——当技术尚未成熟时,人类如何成为算法…

    2025年11月30日
    9200

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注