清华联合开源!首个基于MCP的RAG框架UltraRAG:零代码构建多模态检索增强生成系统

首个基于 MCPRAG 框架 UltraRAG:零代码构建多模态检索增强生成系统

UltraRAG 是一个基于 MCP 的开源检索增强生成框架,旨在让用户无需编写代码即可构建复杂的 RAG 系统。

RAG 系统通过让 AI 模型先检索相关信息再生成答案,从而显著提高回答的准确性。

清华联合开源!首个基于MCP的RAG框架UltraRAG:零代码构建多模态检索增强生成系统

UltraRAG 是由清华大学 THUNLP、东北大学 NEUIR、OpenBMB 等机构联合推出的开源项目,其核心设计极大地简化了复杂 RAG 系统的构建与测试流程。

开源项目简介

清华联合开源!首个基于MCP的RAG框架UltraRAG:零代码构建多模态检索增强生成系统
该项目的核心思路是将 RAG 的核心组件封装为标准化的独立 MCP Server,提供函数级的 Tool 接口以支持灵活调用。通过 MCP 客户端建立简洁的链路,用户只需编写 YAML 配置文件即可声明复杂逻辑,大幅降低了技术门槛。
清华联合开源!首个基于MCP的RAG框架UltraRAG:零代码构建多模态检索增强生成系统

最新的 2.1 版本围绕以下三大核心方向进行了全面升级:

① 原生多模态
统一框架支持文本与图像的检索与生成,新增的 VisRAG Pipeline 实现了从 PDF 到多模态问答的闭环。内置的多模态 Benchmark 覆盖视觉问答等任务,并提供统一的评估体系,方便研究者快速对比实验效果。

② 知识接入与语料构建自动化
支持 Word、电子书、网页存档等多种格式文档的自动解析与分块,无需编写复杂脚本即可构建统一格式的知识库。在 PDF 解析方面,集成了 MinerU 工具,能够高保真还原复杂版面与多栏结构,并支持将 PDF 按页转换为图像,保留视觉布局信息。
清华联合开源!首个基于MCP的RAG框架UltraRAG:零代码构建多模态检索增强生成系统

③ 统一工作流
通过 YAML 配置驱动检索、生成、评估全流程,支持多种引擎与可视化分析,有效提升了实验复现效率。

项目资源:
* 代码仓库:https://github.com/OpenBMB/UltraRAG
* 教程文档:https://ultrarag.openbmb.cn/
* 数据集:https://modelscope.cn/datasets/UltraRAG/UltraRAG_Benchmark

实际效果

以下是基于 UltraRAG 搭建的 RAG 系统的实际应用示例。

案例一:基于论文《Attention is All You Need》提问
问题:论文中的表 4 具体说了什么,请帮忙解释一下。

AI 能够直接解析表格内容并给出清晰的回答。
清华联合开源!首个基于MCP的RAG框架UltraRAG:零代码构建多模态检索增强生成系统
这得益于 2.0 版本后框架能统一处理文本和图像数据。上传的 PDF 文档不仅能读取文字,还能分析其中的图表和公式,实现真正的多模态检索与生成,避免了以往需要切换不同工具的麻烦。

案例二:基于麦肯锡报告《生成式人工智能的经济潜力》提问
问题:请基于报告内容,输出生成式 AI 最有潜力的企业职能有哪些?并请结合图表和正文说明它们在组织生产力中的影响。

清华联合开源!首个基于MCP的RAG框架UltraRAG:零代码构建多模态检索增强生成系统

如何使用

UltraRAG 支持两种部署方式。

第一种是使用 Conda 创建虚拟环境:
清华联合开源!首个基于MCP的RAG框架UltraRAG:零代码构建多模态检索增强生成系统

第二种是通过 Docker 部署:
清华联合开源!首个基于MCP的RAG框架UltraRAG:零代码构建多模态检索增强生成系统

部署完成后,即可基于 UltraRAG 运行一个完整的 RAG Pipeline,主要流程包括以下三个阶段:
1. 编写 Pipeline 配置文件
2. 编译 Pipeline 并调整参数
3. 运行 Pipeline

具体操作可参考详细的官方快速入门文档:https://ultrarag.openbmb.cn/pages/cn/getting_started/quick_start

整个过程无需编写代码,仅需配置一个 YAML 文件。项目还内置了 Case Study Viewer 界面,可对运行结果进行交互式浏览与分析。
清华联合开源!首个基于MCP的RAG框架UltraRAG:零代码构建多模态检索增强生成系统
清华联合开源!首个基于MCP的RAG框架UltraRAG:零代码构建多模态检索增强生成系统


关注“鲸栖”小程序,掌握最新AI资讯

本文来自网络搜集,不代表鲸林向海立场,如有侵权,联系删除。转载请注明出处:http://www.itsolotime.com/archives/15935

(0)
上一篇 2025年11月19日 下午2:03
下一篇 2025年11月19日 下午6:20

相关推荐

  • 五大前沿AI开源项目盘点:从多智能体协作到方言播客生成

    01 AI 大神的新开源项目:多智能体协作委员会 AI 领域知名开发者 Karpathy 近日开源了一个名为 llm-council 的多智能体协作演示项目。 其核心理念是:单个大语言模型(如 GPT-4)的答案可能存在局限或错误,那么集合多个模型的智慧是否能得出更优解?该项目构建了一个“委员会”机制,允许用户邀请不同的 AI 模型(例如 GPT-4、Cla…

    2025年12月6日
    18500
  • 清华开源AI课堂平台OpenMAIC:让AI学会“教人学习”,打造L4级自动驾驶式课堂体验

    最近,科技圈掀起了一股“养龙虾”的热潮。OpenClaw 的横空出世,引发了广泛关注。与此同时,清华大学的研究团队也开源了一只特别的“龙虾”。 这只“龙虾”的目标并非操控电脑或执行任务,而是致力于一项更具根本性的工作:让 AI 学会“教人学习”。它所构建的,是一种能够“讲、问、互动”的全新课堂形态。 设想一个场景:面对火爆的 OpenClaw,零基础用户想学…

    2天前
    1.3K00
  • NotebookLM开源替代方案全解析:三大GitHub明星项目打造本地化AI笔记助手

    NotebookLM 是谷歌推出的一款 AI 笔记助手。与普通 AI 不同,它严格限制在你上传的文档范围内进行回答,并能提供精准的原文引用。其标志性功能之一是播客生成,能将上传的复杂资料一键转换为逼真的双人英语对话播客,让学习过程更有趣,也支持通过“听”来消化信息。 本文将盘点 GitHub 上所有 NotebookLM 的开源替代方案,帮助你部署自己的本地…

    2025年12月19日
    30700
  • 谷歌开源Google Workspace CLI:专为AI Agent设计的命令行工具,打通Gmail、Drive、Calendar等全家桶API

    谷歌开源 Google Workspace CLI:专为 AI Agent 设计的命令行工具 随着类似 OpenClaw 的 AI 智能体加速普及,一个显著的趋势正在发生:用户主动打开特定软件的频率在降低,转而更多地通过自然语言向 AI 下达指令。 过去,处理邮件需要打开邮箱客户端,手动点击、逐封回复。未来,你或许只需在聊天窗口中对 AI 说一句“处理一下今…

    2026年3月11日
    13600
  • 3个GitHub开源神器:网页打包APP、私人时光机、极简番茄钟

    快速把网页打包成 APP 这个名为 PakePlus 的 GitHub 开源项目已获得 6.5K Star。它是一个能将常用网站(如 YouTube、小红书)或个人网页项目,快速打包成独立、小巧的桌面或移动端应用的工具。 它支持在 macOS、Windows、Linux 以及 Android 和 iOS 系统上安装使用。 PakePlus 体积小巧(小于 5…

    2025年11月13日
    23600