清华联合开源!首个基于MCP的RAG框架UltraRAG:零代码构建多模态检索增强生成系统

首个基于 MCPRAG 框架 UltraRAG:零代码构建多模态检索增强生成系统

UltraRAG 是一个基于 MCP 的开源检索增强生成框架,旨在让用户无需编写代码即可构建复杂的 RAG 系统。

RAG 系统通过让 AI 模型先检索相关信息再生成答案,从而显著提高回答的准确性。

清华联合开源!首个基于MCP的RAG框架UltraRAG:零代码构建多模态检索增强生成系统

UltraRAG 是由清华大学 THUNLP、东北大学 NEUIR、OpenBMB 等机构联合推出的开源项目,其核心设计极大地简化了复杂 RAG 系统的构建与测试流程。

开源项目简介

清华联合开源!首个基于MCP的RAG框架UltraRAG:零代码构建多模态检索增强生成系统
该项目的核心思路是将 RAG 的核心组件封装为标准化的独立 MCP Server,提供函数级的 Tool 接口以支持灵活调用。通过 MCP 客户端建立简洁的链路,用户只需编写 YAML 配置文件即可声明复杂逻辑,大幅降低了技术门槛。
清华联合开源!首个基于MCP的RAG框架UltraRAG:零代码构建多模态检索增强生成系统

最新的 2.1 版本围绕以下三大核心方向进行了全面升级:

① 原生多模态
统一框架支持文本与图像的检索与生成,新增的 VisRAG Pipeline 实现了从 PDF 到多模态问答的闭环。内置的多模态 Benchmark 覆盖视觉问答等任务,并提供统一的评估体系,方便研究者快速对比实验效果。

② 知识接入与语料构建自动化
支持 Word、电子书、网页存档等多种格式文档的自动解析与分块,无需编写复杂脚本即可构建统一格式的知识库。在 PDF 解析方面,集成了 MinerU 工具,能够高保真还原复杂版面与多栏结构,并支持将 PDF 按页转换为图像,保留视觉布局信息。
清华联合开源!首个基于MCP的RAG框架UltraRAG:零代码构建多模态检索增强生成系统

③ 统一工作流
通过 YAML 配置驱动检索、生成、评估全流程,支持多种引擎与可视化分析,有效提升了实验复现效率。

项目资源:
* 代码仓库:https://github.com/OpenBMB/UltraRAG
* 教程文档:https://ultrarag.openbmb.cn/
* 数据集:https://modelscope.cn/datasets/UltraRAG/UltraRAG_Benchmark

实际效果

以下是基于 UltraRAG 搭建的 RAG 系统的实际应用示例。

案例一:基于论文《Attention is All You Need》提问
问题:论文中的表 4 具体说了什么,请帮忙解释一下。

AI 能够直接解析表格内容并给出清晰的回答。
清华联合开源!首个基于MCP的RAG框架UltraRAG:零代码构建多模态检索增强生成系统
这得益于 2.0 版本后框架能统一处理文本和图像数据。上传的 PDF 文档不仅能读取文字,还能分析其中的图表和公式,实现真正的多模态检索与生成,避免了以往需要切换不同工具的麻烦。

案例二:基于麦肯锡报告《生成式人工智能的经济潜力》提问
问题:请基于报告内容,输出生成式 AI 最有潜力的企业职能有哪些?并请结合图表和正文说明它们在组织生产力中的影响。

清华联合开源!首个基于MCP的RAG框架UltraRAG:零代码构建多模态检索增强生成系统

如何使用

UltraRAG 支持两种部署方式。

第一种是使用 Conda 创建虚拟环境:
清华联合开源!首个基于MCP的RAG框架UltraRAG:零代码构建多模态检索增强生成系统

第二种是通过 Docker 部署:
清华联合开源!首个基于MCP的RAG框架UltraRAG:零代码构建多模态检索增强生成系统

部署完成后,即可基于 UltraRAG 运行一个完整的 RAG Pipeline,主要流程包括以下三个阶段:
1. 编写 Pipeline 配置文件
2. 编译 Pipeline 并调整参数
3. 运行 Pipeline

具体操作可参考详细的官方快速入门文档:https://ultrarag.openbmb.cn/pages/cn/getting_started/quick_start

整个过程无需编写代码,仅需配置一个 YAML 文件。项目还内置了 Case Study Viewer 界面,可对运行结果进行交互式浏览与分析。
清华联合开源!首个基于MCP的RAG框架UltraRAG:零代码构建多模态检索增强生成系统
清华联合开源!首个基于MCP的RAG框架UltraRAG:零代码构建多模态检索增强生成系统


关注“鲸栖”小程序,掌握最新AI资讯

本文来自网络搜集,不代表鲸林向海立场,如有侵权,联系删除。转载请注明出处:http://www.itsolotime.com/archives/15935

(0)
上一篇 2025年11月19日 下午2:03
下一篇 2025年11月19日 下午6:20

相关推荐

  • 三大前沿AI智能体开源项目深度解析:从工作流编排到交易决策与视频创作

    AI 智能体平台 Astron Agent 是科大讯飞开源的一款实用性较高的 AI 智能体平台。 与 Coze、n8n 等平台类似,Astron Agent 集成了 AI 工作流编排、模型管理、工具集成、RPA 自动化和团队协作功能,但整体设计更为轻量。 它继承了科大讯飞 Astron 平台的核心技术,不仅支持智能体开发的全流程,还创新性地集成了智能 RPA…

    2025年11月20日
    6800
  • 五大AI开源神器:从GLM-4.7编程突破到手机集群推理,重塑开发新范式

    智谱开源 GLM-4.7 智谱 GLM-4.7 正式发布并官宣即将开源。 在 LiveCodeBench 和 Code Arena 等多个权威榜单中,它取得了国产第一、开源第一的成绩。其综合编程能力已直逼甚至在某些维度超越了 Claude 4.5 Sonnet。 近期,智谱已向港交所递交招股书,冲击全球大模型第一股。这表明国产大模型在编程这一核心赛道上,已具…

    2025年12月24日
    17600
  • Skyvern:用大模型革新浏览器自动化,告别传统RPA的脆弱性

    逛 GitHub 的时候,发现一个叫 Skyvern 的开源项目登上了热榜。这是一个利用 AI 控制浏览器自动化工作流的项目,目前在 GitHub 上已斩获近 2 万的 Star。 01 开源项目简介 在传统的网页自动化 RPA 开发中,最让人头疼的莫过于页面结构的变化。如果你写过 Selenium 或 Puppeteer 脚本,一定经历过因为网站开发者修改…

    2025年12月5日
    6300
  • GitHub本周爆火:从Linux运行Windows应用到AI绘图管理,10个必看开源项目盘点

    01 在 Linux 上运行 Windows 应用 winapps 是一个拥有 12K Star 的开源项目,它能让你在 Linux 上运行 Windows 软件,并获得如同原生 Linux 应用般丝滑的体验。 该项目通过 KVM/QEMU 虚拟机,以无缝模式运行 Windows 应用程序。与 Wine 的指令翻译方式不同,winapps 在后台运行一个真实…

    2025年12月7日
    7800
  • 3个GitHub开源神器:网页打包APP、私人时光机、极简番茄钟

    快速把网页打包成 APP 这个名为 PakePlus 的 GitHub 开源项目已获得 6.5K Star。它是一个能将常用网站(如 YouTube、小红书)或个人网页项目,快速打包成独立、小巧的桌面或移动端应用的工具。 它支持在 macOS、Windows、Linux 以及 Android 和 iOS 系统上安装使用。 PakePlus 体积小巧(小于 5…

    2025年11月13日
    6500