Cog-RAG：让RAG在检索前先思考，用双超图架构模拟人类认知过程

Retrieval-Augmented Generation（RAG）已成为帮助大型语言模型保持信息“有根有据”的标准方法。其基本流程广为人知：将文档切分为片段，进行向量化嵌入，执行向量检索，最后将最匹配的前K个结果输入给大模型生成答案。

然而，这条标准流水线存在一些固有的局限性。

为什么多数 RAG 系统仍像支离破碎的记忆

图 1：图、超图与 Cog-RAG（主题增强型 RAG）的知识建模对比。[来源]。

只匹配局部，缺乏全局理解

传统 RAG 将文档视为扁平的片段列表。检索器独立地为每个片段与查询进行匹配打分，完全不了解各个片段之间的内在关联。

这导致检索结果往往是一组东拼西凑的段落，它们之间可能松散相关，却缺乏连贯的结构与整体的“大图景”。

基于图的 RAG：本质仍是两两相连

近期如 GraphRAG、LightRAG 等方法试图通过从文档构建知识图谱来改进这一问题。

它们抽取实体与关系，将文本转化为可查询的图结构。这确实增加了一些结构性——可以建模“哪些事物彼此相关”，但多数系统仍受限于简单的成对连接。如果一个主题涉及多个实体的协同作用，这种细微的复杂性会被抹平。

超图增加了复杂度，却仍错过“大主题”

以 Hyper-RAG 为代表的超图方法更进一步，允许一条边连接多个实体，有助于捕捉复杂的高阶关系。然而，这类方法通常局限在实体层面的表示，难以建模跨文档片段的全局主题组织。

它们未能刻画主题如何在不同片段间演进，或信息如何在共享的叙事/话题下汇聚。

Cog-RAG：以主题对齐的双超图 RAG

人类在解决问题时，不会在一堆零散的笔记中胡乱翻找。我们通常会先确定主要的主题或问题框架，再深入到具体的事实或例子中。

Cog-RAG 受这种自上而下认知过程的启发：它先从整篇文档中检索出相关的主题，再下钻到细粒度的实体级细节，将检索过程组织在“大图景”之上，而非仅仅依赖局部文本的重叠匹配。

Cog-RAG 基于两个关键理念：
* 用两种互补的超图来索引知识。
* 用两阶段的流程进行检索，模拟人类思考：先把握大局，再深究细节。

图 2：Cog-RAG 的整体框架。[来源]。

完整架构如图 2 所示，这是一条从文档索引到最终答案生成的完整流程。

具体而言，Cog-RAG 由两大部分组成：双超图索引与类认知的两阶段检索流程：
* 双超图索引：通过主题超图建模全局的跨片段主题结构，通过实体超图建模本地的片段内细粒度实体网络，以此组织文档知识。
* 两阶段检索：
1. 第一阶段：主题感知的超图检索。找出与查询相关的主题及关键实体，构建全局语义支架。
2. 第二阶段：主题对齐的实体超图检索。沿着已识别的主题，在实体超图中进行扩展，纳入细粒度实体与高阶关系。

进一步拆解：双超图与两阶段检索

双超图索引

Cog-RAG 使用两种不同的超图来建立对文档的理解，各自捕捉不同层级的语义结构：
* 主题超图 捕捉跨文档片段的关系。每条超边代表一个由语言模型自动归纳出的主题或叙事脉络。这些主题充当全局语义锚点，帮助检索过程保持聚焦和一致，降低答案跑题的风险。
* 实体超图 则作用于单个片段内部。其超边表示多个实体之间的高阶关系，如事件、因果链或高频共现的实体组合。该图提供细粒度细节，并支持高阶语义推理，填补宏观主题之下的具体语境空隙。

图 3：实体超图的可视化示例。[来源]。

构建方式：
1. 通过滑动窗口将文档切分为相互重叠的片段。对每个片段，使用大语言模型提取其主题摘要和关键实体，用于构建主题超图。
2. 在每个片段内部，抽取实体及其成对（低阶）与群体级（高阶）关系，组成实体超图。

存储方式：
将主题与实体两种超图存入超图数据库。检索时，结合向量相似性搜索（例如在主题超边或实体节点上）与结构化的超图扩散算法。

受认知启发的两阶段检索

Cog-RAG 的检索分为两步，松散地模拟人类的信息处理方式：先把握更广泛的主题，再补齐具体细节。
* 第一阶段：主题驱动检索。系统接收用户查询，并提取主题级关键词。利用这些关键词在主题超图中匹配主题超边，并向邻近节点扩展，构建一个聚焦的子图以捕捉相关主题。据此生成一个粗粒度的、具备主题意识的答案草稿，记为 A_theme。
* 第二阶段：细节召回。将 A_theme 与从原始查询中提取的实体级关键词结合。基于此在实体超图中导航，检索最相关的实体，再沿高阶边进行扩展以挖掘更深层的关联，得到一个更丰富的实体子图。最后，将初始的主题答案 A_theme 与这些实体细节整合，生成最终答案 A。

其他关键设计：
* 全自动关键词提取：系统使用大语言模型将查询自动拆解为主题级与实体级关键词，无需手工规则。
* 内置主题-实体对齐：通过提示词引导模型以 A_theme 为上下文来选择“最相关且互补”的实体，确保局部细节与全局主题保持一致。

评测

图 4：在五个数据集上的六项评估指标平均胜率。比较对象为基线模型与 Cog-RAG。六项指标分别为：全面性、赋能性、相关性、一致性、清晰度和逻辑性。[来源]。

在图 4 所示的 Mix 数据集基于选择的评测结果中，相较于 NaiveRAG，Cog-RAG 的总体胜率达到 84.5%。在与最强基线 Hyper-RAG 的成对比较中，Cog-RAG 的总体胜率为 53.2%，而 Hyper-RAG 为 46.8%，Cog-RAG 领先 6.4 个百分点。

跨不同 LLMs 的稳健性：无论使用 GPT-4o-mini、Qwen-Plus、GLM-4-Air、DeepSeek-V3，还是 LLaMA-3.3–70B，Cog-RAG 在多维度的基于分数评估上均取得显著提升。

在知识密集的医疗领域增益最强：在 Neurology 数据集上，较 Hyper-RAG 提升 21.0%；在 Pathology 上，优势更高，达到 26.4%。

思考

从设计视角看，由主题超图、实体超图与两阶段检索组成的架构，作为企业知识库或内部语料的高层索引层很有价值，尤其适合结构化且相对稳定的数据集。

但在典型的在线场景下，很难为不断更新的日志、FAQ 或工单等来源运行如此“重量级”的图构建流程。该索引流水线难以随内容快速变化而顺畅扩展。

一个潜在担忧是，双超图的几乎每一步都依赖 LLM——从结构抽取到打分分配。Cog-RAG 并未充分讨论在大规模、真实语料中这对成本、一致性或版本漂移意味着什么。

更值得继续探索的是，是否能把这种“先主题、后细节”的认知路径蒸馏到更轻量的索引结构中，或许部分借助嵌入向量做近似。真正的挑战在于找到折中点：既保留足够的结构以保持可解释性，又足够高效和灵活，能支撑在线、持续增长的数据，而不只是优雅的离线流水线。

参考：Cog-RAG: Cognitive-Inspired Dual-Hypergraph with Theme Alignment Retrieval-Augmented Generation.

关注“鲸栖”小程序，掌握最新AI资讯

本文来自网络搜集，不代表鲸林向海立场，如有侵权，联系删除。转载请注明出处：https://www.itsolotime.com/archives/22348

Cog-RAG：让RAG在检索前先思考，用双超图架构模拟人类认知过程

为什么多数 RAG 系统仍像支离破碎的记忆

只匹配局部，缺乏全局理解

基于图的 RAG：本质仍是两两相连

超图增加了复杂度，却仍错过“大主题”

Cog-RAG：以主题对齐的双超图 RAG

进一步拆解：双超图与两阶段检索

双超图索引

受认知启发的两阶段检索

评测

思考

相关推荐

Ollama Launch 实测：一键启动 Claude Code、Codex 与 OpenCode，告别繁琐配置

17岁高中生实现Ilya预言！Kimi团队“旋转”注意力机制，训练效率提升25%，马斯克都来围观

构建智能数据库对话助手：基于RAG的Text-to-SQL聊天机器人实战

突破GUI像素瓶颈！面向端侧Agent语义世界建模 MobileWorldBench！1.4M 数据样本驱动 7.4%性能跃升！

Agent Infra：驾驭不确定性，开启智能体工程化落地新纪元