RAG - 鲸林向海

谷歌发布首个原生多模态嵌入模型Gemini Embedding 2，统一文本、图像、视频、音频、文档嵌入空间

谷歌宣布推出全新的多模态嵌入模型 Gemini Embedding 2，这是首个基于 Gemini 架构构建的原生多模态嵌入模型。目前，该模型已经通过 Gemini API 和 Vertex AI 向开发者提供公开预览。统一的多模态嵌入空间与此前仅支持文本向量化的嵌入模型不同，Gemini Embedding 2 可以将文本、图像、视频、音频以及文档等多…

2026年3月11日

144000

大模型工程

面向AI Agents的7个免费Web Search API：实时、RAG就绪与快速集成指南

探索面向智能体（AI Agent）的主流 Web Search API，它们提供实时、高准确度的搜索结果，具备 RAG 就绪、低延迟与可扩展性。本文包含 Python 快速上手示例与免费套餐信息，便于无缝集成。 AI 智能体的有效性，取决于其获取新鲜、可靠信息的能力。许多智能体在幕后会调用 Web 搜索工具来获取最新上下文，以确保输出始终相关。然而，并非所有…

2026年2月27日

1.0K000

大模型工程

Cog-RAG：让RAG在检索前先思考，用双超图架构模拟人类认知过程

Retrieval-Augmented Generation（RAG）已成为帮助大型语言模型保持信息“有根有据”的标准方法。其基本流程广为人知：将文档切分为片段，进行向量化嵌入，执行向量检索，最后将最匹配的前K个结果输入给大模型生成答案。然而，这条标准流水线存在一些固有的局限性。为什么多数 RAG 系统仍像支离破碎的记忆图 1：图、超图与 Cog-RA…

2026年2月23日

172000

AI产业动态

跨越工程鸿沟：软件工程方法论指导下的企业级AI Agent构建实战

AI Agent 正在成为大模型发展的重要方向，也逐渐成为企业数字化转型中具备实用价值的突破口。与单一的大模型对话不同，Agent 不仅能够理解指令，还可以围绕目标进行任务规划、工具调用和流程执行，从而完成更复杂的业务闭环。然而，从“知道 Agent 是什么”到“在企业环境中稳定运行并产生价值”，中间仍然存在一道明显的工程鸿沟。万变不离其宗，AI Agen…

2026年2月9日

125000

AI产业动态

2024年1月GitHub热门开源项目盘点：从AI金融分析到无向量RAG，这些工具正在重塑开发效率

01 AI 金融分析 Agent：Dexter Dexter 是一款专注于金融研究的 AI 智能体。它能够像初级分析师一样工作，当你提出一个复杂的金融问题（例如分析某公司季度利润率变动的原因）时，它可以自主拆解任务并执行数据检索。该智能体接入了实时市场数据源，能够查阅财报、损益表等关键财务文件，并内置了一套自我检查机制。当发现数据存在疑问时，它会进行反思并…

2026年2月2日

834000

AI产业动态

清华开源！GitHub 4600星RAG神器UltraRAG 3.0发布：告别黑盒开发，推理逻辑全透明

这个名为 UltraRAG 的开源项目，已在 GitHub 上获得了超过 4600 个 Star。它由清华大学 THUNLP 实验室、东北大学 NEUIR 实验室、OpenBMB、面壁智能与 AI9Stars 等机构联合发布，是首个基于 MCP 的轻量级 RAG 开发框架。其核心在于：通过 YAML 配置逻辑，利用 MCP 构建组件，并通过 UI 打通从“算…

2026年1月29日

300000

UltraRAG 3.0重磅发布：可视化白盒框架，让RAG开发从数月缩短至一周

“验证算法原型只需一周，构建可用系统却耗时数月。” 这句看似调侃的“吐槽”，却是每一位算法工程师不得不面对的真实困境。今天，清华大学 THUNLP 实验室、东北大学 NEUIR 实验室、OpenBMB 、面壁智能与 AI9Stars 联合发布 UltraRAG 3.0。针对上述痛点，为科研工作者与开发者打造更懂开发者的技术框架，具备 3 大核心优势：从…

AI产业动态 2026年1月23日

234000

AI产业动态

构建可扩展、生产级的 Agentic RAG Pipeline：分层架构与六层核心设计详解

面向大型数据集、符合行业标准的 Agentic RAG Pipeline 需要基于清晰、可扩展的分层架构进行构建。我们将系统结构化，使得 Agent 能够并行地进行推理、获取上下文、使用工具以及与数据库交互。每一层都承担明确的职责，涵盖从数据摄取、模型服务到 Agent 协调的全过程。这种分层方法有助于系统实现可预测的扩展，同时为终端用户保持较低的响应延迟。…

2026年1月22日

303000

AI产业动态

DSPy 3与GEPA：革新RAG框架的自动推理与提示进化技术

近期，OpenAI 发布了 GPT-5.2 模型，引发了广泛关注。路透社报道称，OpenAI 在竞争压力下加速了研发进程。此次更新并非功能堆砌，而是聚焦于在智能、代码处理、长文本理解等核心能力上的显著提升，尤其擅长处理创建电子表格、制作演示文稿等复杂的多步骤任务。简而言之，GPT-5.2 是一次面向实用场景的“精修”，在可靠性、长上下文处理、工具执行和输出…

2026年1月20日

170000

AI产业动态

超越基础RAG：构建面向学术论文的智能检索系统实战

在AI工程实践中，你很快会意识到：并不存在一张可以完全照搬的“通用蓝图”。对于检索增强生成（RAG）中的基础检索（“R”），标准流程包括文档分块、查询语义搜索、结果重排等。这套流程已广为人知。但随着系统深入应用，一个问题会浮现：如果一个系统对一篇文档的理解仅限于几个零散的文本块，我们如何能称其为“智能”？那么，如何确保系统获得足够的信息，从而做出“聪明…

2026年1月19日

186000