Retrieval-Augmented Generation(RAG)已成为帮助大型语言模型保持信息“有根有据”的标准方法。其基本流程广为人知:将文档切分为片段,进行向量化嵌入,执行向量检索,最后将最匹配的前K个结果输入给大模型生成答案。
然而,这条标准流水线存在一些固有的局限性。
为什么多数 RAG 系统仍像支离破碎的记忆

图 1:图、超图与 Cog-RAG(主题增强型 RAG)的知识建模对比。[来源]。
只匹配局部,缺乏全局理解
传统 RAG 将文档视为扁平的片段列表。检索器独立地为每个片段与查询进行匹配打分,完全不了解各个片段之间的内在关联。
这导致检索结果往往是一组东拼西凑的段落,它们之间可能松散相关,却缺乏连贯的结构与整体的“大图景”。
基于图的 RAG:本质仍是两两相连
近期如 GraphRAG、LightRAG 等方法试图通过从文档构建知识图谱来改进这一问题。
它们抽取实体与关系,将文本转化为可查询的图结构。这确实增加了一些结构性——可以建模“哪些事物彼此相关”,但多数系统仍受限于简单的成对连接。如果一个主题涉及多个实体的协同作用,这种细微的复杂性会被抹平。
超图增加了复杂度,却仍错过“大主题”
以 Hyper-RAG 为代表的超图方法更进一步,允许一条边连接多个实体,有助于捕捉复杂的高阶关系。然而,这类方法通常局限在实体层面的表示,难以建模跨文档片段的全局主题组织。
它们未能刻画主题如何在不同片段间演进,或信息如何在共享的叙事/话题下汇聚。
Cog-RAG:以主题对齐的双超图 RAG
人类在解决问题时,不会在一堆零散的笔记中胡乱翻找。我们通常会先确定主要的主题或问题框架,再深入到具体的事实或例子中。
Cog-RAG 受这种自上而下认知过程的启发:它先从整篇文档中检索出相关的主题,再下钻到细粒度的实体级细节,将检索过程组织在“大图景”之上,而非仅仅依赖局部文本的重叠匹配。
Cog-RAG 基于两个关键理念:
* 用两种互补的超图来索引知识。
* 用两阶段的流程进行检索,模拟人类思考:先把握大局,再深究细节。

图 2:Cog-RAG 的整体框架。[来源]。
完整架构如图 2 所示,这是一条从文档索引到最终答案生成的完整流程。
具体而言,Cog-RAG 由两大部分组成:双超图索引与类认知的两阶段检索流程:
* 双超图索引:通过主题超图建模全局的跨片段主题结构,通过实体超图建模本地的片段内细粒度实体网络,以此组织文档知识。
* 两阶段检索:
1. 第一阶段:主题感知的超图检索。找出与查询相关的主题及关键实体,构建全局语义支架。
2. 第二阶段:主题对齐的实体超图检索。沿着已识别的主题,在实体超图中进行扩展,纳入细粒度实体与高阶关系。
进一步拆解:双超图与两阶段检索
双超图索引
Cog-RAG 使用两种不同的超图来建立对文档的理解,各自捕捉不同层级的语义结构:
* 主题超图 捕捉跨文档片段的关系。每条超边代表一个由语言模型自动归纳出的主题或叙事脉络。这些主题充当全局语义锚点,帮助检索过程保持聚焦和一致,降低答案跑题的风险。
* 实体超图 则作用于单个片段内部。其超边表示多个实体之间的高阶关系,如事件、因果链或高频共现的实体组合。该图提供细粒度细节,并支持高阶语义推理,填补宏观主题之下的具体语境空隙。

图 3:实体超图的可视化示例。[来源]。
构建方式:
1. 通过滑动窗口将文档切分为相互重叠的片段。对每个片段,使用大语言模型提取其主题摘要和关键实体,用于构建主题超图。
2. 在每个片段内部,抽取实体及其成对(低阶)与群体级(高阶)关系,组成实体超图。
存储方式:
将主题与实体两种超图存入超图数据库。检索时,结合向量相似性搜索(例如在主题超边或实体节点上)与结构化的超图扩散算法。
受认知启发的两阶段检索
Cog-RAG 的检索分为两步,松散地模拟人类的信息处理方式:先把握更广泛的主题,再补齐具体细节。
* 第一阶段:主题驱动检索。系统接收用户查询,并提取主题级关键词。利用这些关键词在主题超图中匹配主题超边,并向邻近节点扩展,构建一个聚焦的子图以捕捉相关主题。据此生成一个粗粒度的、具备主题意识的答案草稿,记为 A_theme。
* 第二阶段:细节召回。将 A_theme 与从原始查询中提取的实体级关键词结合。基于此在实体超图中导航,检索最相关的实体,再沿高阶边进行扩展以挖掘更深层的关联,得到一个更丰富的实体子图。最后,将初始的主题答案 A_theme 与这些实体细节整合,生成最终答案 A。
其他关键设计:
* 全自动关键词提取:系统使用大语言模型将查询自动拆解为主题级与实体级关键词,无需手工规则。
* 内置主题-实体对齐:通过提示词引导模型以 A_theme 为上下文来选择“最相关且互补”的实体,确保局部细节与全局主题保持一致。
评测

图 4:在五个数据集上的六项评估指标平均胜率。比较对象为基线模型与 Cog-RAG。六项指标分别为:全面性、赋能性、相关性、一致性、清晰度和逻辑性。[来源]。
在图 4 所示的 Mix 数据集基于选择的评测结果中,相较于 NaiveRAG,Cog-RAG 的总体胜率达到 84.5%。在与最强基线 Hyper-RAG 的成对比较中,Cog-RAG 的总体胜率为 53.2%,而 Hyper-RAG 为 46.8%,Cog-RAG 领先 6.4 个百分点。
跨不同 LLMs 的稳健性:无论使用 GPT-4o-mini、Qwen-Plus、GLM-4-Air、DeepSeek-V3,还是 LLaMA-3.3–70B,Cog-RAG 在多维度的基于分数评估上均取得显著提升。
在知识密集的医疗领域增益最强:在 Neurology 数据集上,较 Hyper-RAG 提升 21.0%;在 Pathology 上,优势更高,达到 26.4%。
思考
从设计视角看,由主题超图、实体超图与两阶段检索组成的架构,作为企业知识库或内部语料的高层索引层很有价值,尤其适合结构化且相对稳定的数据集。
但在典型的在线场景下,很难为不断更新的日志、FAQ 或工单等来源运行如此“重量级”的图构建流程。该索引流水线难以随内容快速变化而顺畅扩展。
一个潜在担忧是,双超图的几乎每一步都依赖 LLM——从结构抽取到打分分配。Cog-RAG 并未充分讨论在大规模、真实语料中这对成本、一致性或版本漂移意味着什么。
更值得继续探索的是,是否能把这种“先主题、后细节”的认知路径蒸馏到更轻量的索引结构中,或许部分借助嵌入向量做近似。真正的挑战在于找到折中点:既保留足够的结构以保持可解释性,又足够高效和灵活,能支撑在线、持续增长的数据,而不只是优雅的离线流水线。
参考:Cog-RAG: Cognitive-Inspired Dual-Hypergraph with Theme Alignment Retrieval-Augmented Generation.
关注“鲸栖”小程序,掌握最新AI资讯
本文来自网络搜集,不代表鲸林向海立场,如有侵权,联系删除。转载请注明出处:https://www.itsolotime.com/archives/22348
