检索增强生成_鲸林向海

超越基础RAG：构建面向学术论文的智能检索系统实战

在AI工程实践中，你很快会意识到：并不存在一张可以完全照搬的“通用蓝图”。对于检索增强生成（RAG）中的基础检索（“R”），标准流程包括文档分块、查询语义搜索、结果重排等。这套流程已广为人知。但随着系统深入应用，一个问题会浮现：如果一个系统对一篇文档的理解仅限于几个零散的文本块，我们如何能称其为“智能”？那么，如何确保系统获得足够的信息，从而做出“聪明…

2026年1月19日

57000

大模型工程

深度研究智能体：从信息搜索到自主科研的演进之路

近年来，大模型的应用正从对话与创意写作，走向更加开放、复杂的研究型问题。尽管以检索增强生成（RAG）为代表的方法缓解了知识获取瓶颈，但其静态的“一次检索 + 一次生成”范式，难以支撑多步推理与长期研究流程，由此催生了深度研究（Deep Research, DR）这一新方向。然而，随着相关工作的快速涌现，DR的概念也在迅速膨胀并趋于碎片化：不同工作在系统实现…

2026年1月1日

95000

大模型工程

跨越模态边界：构建真正理解图像、表格与文本的多模态RAG系统

构建多模态 RAG 系统的终极指南三个月前，我们新开发的 AI 应用在诸多看似简单的问题上频频“翻车”。问题根源并非 AI 不够智能或数据不足，而是因为答案蕴含在一张图片里，而当时的系统仅能处理文本。这一时刻迫使我直面一个在构建 RAG 系统时长期回避的核心问题：我们花费数年时间教 AI “阅读”文字，却忽略了人类同样通过图像、表格、公式和流程图来“表达…

2025年12月16日

81000

大模型工程

揭秘RAG排序层：LambdaMART如何成为检索增强生成成败的关键

那层几乎无人提及、却决定你AI应用成败的排序层。 Google、Netflix、具备联网搜索功能的ChatGPT，它们有何共通之处？都依赖一个排序算法来决定你首先看到什么。它不决定“有什么”，而是决定你“看见什么”。当我们的团队调试RAG流水线，探究为何它对某些查询返回一堆无关内容时，“排序学习”问题一次次浮现。算法本身不难找到，但几乎没有人在构建AI应用…

2025年12月9日

95000

AI产业动态

重构AI记忆范式：GAM框架如何以动态搜索替代静态压缩，突破智能体长期记忆瓶颈

在人工智能尤其是大模型驱动的智能体系统中，记忆机制一直是制约其长期任务执行与复杂推理能力的关键瓶颈。传统AI记忆系统普遍采用“压缩-摘要”模式，即将冗长的思维链、工具调用记录等历史轨迹压缩为简短的文本摘要以节省存储空间。这种做法的致命缺陷在于：信息保真度严重受损。如同将一本百科全书强行压缩成一张便利贴，当智能体后续需要回溯具体决策细节、工具参数或中间推理步骤…

2025年11月27日

85000

大模型评测

RAG系统评测全攻略：五大核心指标与三种方法深度解析

在构建RAG系统时，如何科学地评测系统效果是每个开发者都会面临的挑战。一个优秀的RAG系统不仅要能检索到相关信息，还要能准确理解用户意图并生成可靠的答案。本文将带你深入了解RAG系统的评测体系，从核心指标到实战落地，帮助你建立起完整的评测方法论。一、为什么需要科学的评测体系？ RAG系统本质上包含三个核心环节：理解用户问题、检索相关文档、生成最终答案。每个…

2025年10月28日

76000

大模型工程

9张图速览大模型核心技术：从Transformer到AI Agent的全面解析

在 AI 工程领域，RAG（检索增强生成）、LLM（大语言模型）和 AI Agent（智能体）是当前最核心的技术方向。本文通过 9 张可视化图表，系统性地解析其核心概念、技术差异与应用场景，旨在帮助读者快速把握技术脉络。 1. Transformer 与混合专家 (Mixture of Experts) 混合专家（MoE）是一种改进Transformer模…

2025年5月8日

81000