清华联合开源!首个基于MCP的RAG框架UltraRAG:零代码构建多模态检索增强生成系统

首个基于 MCPRAG 框架 UltraRAG:零代码构建多模态检索增强生成系统

UltraRAG 是一个基于 MCP 的开源检索增强生成框架,旨在让用户无需编写代码即可构建复杂的 RAG 系统。

RAG 系统通过让 AI 模型先检索相关信息再生成答案,从而显著提高回答的准确性。

清华联合开源!首个基于MCP的RAG框架UltraRAG:零代码构建多模态检索增强生成系统

UltraRAG 是由清华大学 THUNLP、东北大学 NEUIR、OpenBMB 等机构联合推出的开源项目,其核心设计极大地简化了复杂 RAG 系统的构建与测试流程。

开源项目简介

清华联合开源!首个基于MCP的RAG框架UltraRAG:零代码构建多模态检索增强生成系统
该项目的核心思路是将 RAG 的核心组件封装为标准化的独立 MCP Server,提供函数级的 Tool 接口以支持灵活调用。通过 MCP 客户端建立简洁的链路,用户只需编写 YAML 配置文件即可声明复杂逻辑,大幅降低了技术门槛。
清华联合开源!首个基于MCP的RAG框架UltraRAG:零代码构建多模态检索增强生成系统

最新的 2.1 版本围绕以下三大核心方向进行了全面升级:

① 原生多模态
统一框架支持文本与图像的检索与生成,新增的 VisRAG Pipeline 实现了从 PDF 到多模态问答的闭环。内置的多模态 Benchmark 覆盖视觉问答等任务,并提供统一的评估体系,方便研究者快速对比实验效果。

② 知识接入与语料构建自动化
支持 Word、电子书、网页存档等多种格式文档的自动解析与分块,无需编写复杂脚本即可构建统一格式的知识库。在 PDF 解析方面,集成了 MinerU 工具,能够高保真还原复杂版面与多栏结构,并支持将 PDF 按页转换为图像,保留视觉布局信息。
清华联合开源!首个基于MCP的RAG框架UltraRAG:零代码构建多模态检索增强生成系统

③ 统一工作流
通过 YAML 配置驱动检索、生成、评估全流程,支持多种引擎与可视化分析,有效提升了实验复现效率。

项目资源:
* 代码仓库:https://github.com/OpenBMB/UltraRAG
* 教程文档:https://ultrarag.openbmb.cn/
* 数据集:https://modelscope.cn/datasets/UltraRAG/UltraRAG_Benchmark

实际效果

以下是基于 UltraRAG 搭建的 RAG 系统的实际应用示例。

案例一:基于论文《Attention is All You Need》提问
问题:论文中的表 4 具体说了什么,请帮忙解释一下。

AI 能够直接解析表格内容并给出清晰的回答。
清华联合开源!首个基于MCP的RAG框架UltraRAG:零代码构建多模态检索增强生成系统
这得益于 2.0 版本后框架能统一处理文本和图像数据。上传的 PDF 文档不仅能读取文字,还能分析其中的图表和公式,实现真正的多模态检索与生成,避免了以往需要切换不同工具的麻烦。

案例二:基于麦肯锡报告《生成式人工智能的经济潜力》提问
问题:请基于报告内容,输出生成式 AI 最有潜力的企业职能有哪些?并请结合图表和正文说明它们在组织生产力中的影响。

清华联合开源!首个基于MCP的RAG框架UltraRAG:零代码构建多模态检索增强生成系统

如何使用

UltraRAG 支持两种部署方式。

第一种是使用 Conda 创建虚拟环境:
清华联合开源!首个基于MCP的RAG框架UltraRAG:零代码构建多模态检索增强生成系统

第二种是通过 Docker 部署:
清华联合开源!首个基于MCP的RAG框架UltraRAG:零代码构建多模态检索增强生成系统

部署完成后,即可基于 UltraRAG 运行一个完整的 RAG Pipeline,主要流程包括以下三个阶段:
1. 编写 Pipeline 配置文件
2. 编译 Pipeline 并调整参数
3. 运行 Pipeline

具体操作可参考详细的官方快速入门文档:https://ultrarag.openbmb.cn/pages/cn/getting_started/quick_start

整个过程无需编写代码,仅需配置一个 YAML 文件。项目还内置了 Case Study Viewer 界面,可对运行结果进行交互式浏览与分析。
清华联合开源!首个基于MCP的RAG框架UltraRAG:零代码构建多模态检索增强生成系统
清华联合开源!首个基于MCP的RAG框架UltraRAG:零代码构建多模态检索增强生成系统


关注“鲸栖”小程序,掌握最新AI资讯

本文来自网络搜集,不代表鲸林向海立场,如有侵权,联系删除。转载请注明出处:https://www.itsolotime.com/archives/15935

(0)
上一篇 2025年11月19日 下午2:03
下一篇 2025年11月19日 下午6:20

相关推荐

  • AutoMV:首个开源全曲级MV生成Agent,实现音画同步与人物一致性

    AutoMV团队 投稿 量子位 | 公众号 QbitAI 现有的AI视频生成模型虽然在短片上效果惊人,但面对一首完整的歌曲时往往束手无策——画面不连贯、人物换脸、甚至完全不理会歌词含义。 近日,来自M-A-P、北京邮电大学、南京大学NJU-LINK实验室等机构的研究者们提出了AutoMV。 这是一个无需训练的多智能体(Multi-Agent)系统,它像一个专…

    2025年12月29日
    82400
  • 蚂蚁灵波开源LingBot-Map:突破流式3D重建瓶颈,实现万帧视频实时三维建模

    今年1月,蚂蚁灵波开源了包括高精度空间感知模型LingBot-Depth、具身大模型LingBot-VLA与LingBot-VA,以及世界模型LingBot-World在内的四款大模型。这些模型分别负责从图像中估算深度、对环境进行模拟理解,以及控制机器人的决策与动作,覆盖了感知、理解与行动环节。 然而,一个关键环节仍然缺失:如何将连续的感知数据实时构建成稳定…

    2026年4月16日
    1.0K00
  • 《生化危机》女主联手程序员打造AI记忆宫殿,本地开源拿下历史最高分96.6%

    项目背景:开源AI记忆系统MemPalace 在GitHub上,一个名为MemPalace的开源项目引起了广泛关注。该项目由知名女演员米拉·乔沃维奇(曾主演《生化危机》系列)与程序员好友及Claude团队共同打造,旨在构建一个高效的AI记忆系统。 经过数月的开发与打磨,该系统在长期记忆基准测试LongMemEval中取得了96.6%的优异成绩,据称是“公开可…

    2026年4月9日
    68900
  • MacBook本地跑284B大模型!Redis之父开源神器,KV缓存磁盘化颠覆传统

    01 让你的 MacBook 也能本地运行 DeepSeek V4 作为 Redis 的缔造者,antirez 在开源社区堪称传奇。 最近,他带来了一个新项目——ds4。上线仅仅 4 天,便收获了超过 7000 个 Star。 ds4 是一个专为 DeepSeek V4 Flash 打造的本地推理引擎,采用 C 语言编写,并针对 Apple Metal 进行…

    1天前
    10200
  • AI Hedge Fund:12位投资大师Agent军团开源,人人可用量化投资

    AI 对冲基金:开源 12 位投资大师智能体军团,量化投资触手可及 一个汇集了 12 位世界级投资大师智慧的开源项目,正在 GitHub 上引发关注。该项目名为 AI Hedge Fund,旨在将传奇投资人的哲学编码为智能体(Agent),为用户提供股票分析与交易策略参考。 该系统不仅能让这些“大师级”智能体实时分析市场,还内置了回测模块。用户可以先使用历史…

    2026年4月13日
    1.2K00