首个基于 MCP 的 RAG 框架 UltraRAG:零代码构建多模态检索增强生成系统
UltraRAG 是一个基于 MCP 的开源检索增强生成框架,旨在让用户无需编写代码即可构建复杂的 RAG 系统。
RAG 系统通过让 AI 模型先检索相关信息再生成答案,从而显著提高回答的准确性。

UltraRAG 是由清华大学 THUNLP、东北大学 NEUIR、OpenBMB 等机构联合推出的开源项目,其核心设计极大地简化了复杂 RAG 系统的构建与测试流程。
开源项目简介

该项目的核心思路是将 RAG 的核心组件封装为标准化的独立 MCP Server,提供函数级的 Tool 接口以支持灵活调用。通过 MCP 客户端建立简洁的链路,用户只需编写 YAML 配置文件即可声明复杂逻辑,大幅降低了技术门槛。
最新的 2.1 版本围绕以下三大核心方向进行了全面升级:
① 原生多模态
统一框架支持文本与图像的检索与生成,新增的 VisRAG Pipeline 实现了从 PDF 到多模态问答的闭环。内置的多模态 Benchmark 覆盖视觉问答等任务,并提供统一的评估体系,方便研究者快速对比实验效果。
② 知识接入与语料构建自动化
支持 Word、电子书、网页存档等多种格式文档的自动解析与分块,无需编写复杂脚本即可构建统一格式的知识库。在 PDF 解析方面,集成了 MinerU 工具,能够高保真还原复杂版面与多栏结构,并支持将 PDF 按页转换为图像,保留视觉布局信息。
③ 统一工作流
通过 YAML 配置驱动检索、生成、评估全流程,支持多种引擎与可视化分析,有效提升了实验复现效率。
项目资源:
* 代码仓库:https://github.com/OpenBMB/UltraRAG
* 教程文档:https://ultrarag.openbmb.cn/
* 数据集:https://modelscope.cn/datasets/UltraRAG/UltraRAG_Benchmark
实际效果
以下是基于 UltraRAG 搭建的 RAG 系统的实际应用示例。
案例一:基于论文《Attention is All You Need》提问
问题:论文中的表 4 具体说了什么,请帮忙解释一下。
AI 能够直接解析表格内容并给出清晰的回答。
这得益于 2.0 版本后框架能统一处理文本和图像数据。上传的 PDF 文档不仅能读取文字,还能分析其中的图表和公式,实现真正的多模态检索与生成,避免了以往需要切换不同工具的麻烦。
案例二:基于麦肯锡报告《生成式人工智能的经济潜力》提问
问题:请基于报告内容,输出生成式 AI 最有潜力的企业职能有哪些?并请结合图表和正文说明它们在组织生产力中的影响。

如何使用
UltraRAG 支持两种部署方式。
第一种是使用 Conda 创建虚拟环境:
第二种是通过 Docker 部署:
部署完成后,即可基于 UltraRAG 运行一个完整的 RAG Pipeline,主要流程包括以下三个阶段:
1. 编写 Pipeline 配置文件
2. 编译 Pipeline 并调整参数
3. 运行 Pipeline
具体操作可参考详细的官方快速入门文档:https://ultrarag.openbmb.cn/pages/cn/getting_started/quick_start
整个过程无需编写代码,仅需配置一个 YAML 文件。项目还内置了 Case Study Viewer 界面,可对运行结果进行交互式浏览与分析。

关注“鲸栖”小程序,掌握最新AI资讯
本文来自网络搜集,不代表鲸林向海立场,如有侵权,联系删除。转载请注明出处:http://www.itsolotime.com/archives/15935
