开源框架
-
蚂蚁开源LingBot-World世界模型:挑战谷歌Genie 3,一张图生成10分钟稳定交互视频
蚂蚁开源世界模型,为机器人造“元宇宙训练场”。 智东西1月29日报道,蚂蚁灵波科技发布并开源了世界模型LingBot-World。该模型是一个专为交互式世界模型设计的开源框架。其核心LingBot-World-Base能够提供高保真、可控制且逻辑一致的模拟环境。 ▲LingBot-World开源页面(来源:Hugging Face) LingBot-Worl…
-
清华开源!GitHub 4600星RAG神器UltraRAG 3.0发布:告别黑盒开发,推理逻辑全透明
这个名为 UltraRAG 的开源项目,已在 GitHub 上获得了超过 4600 个 Star。它由清华大学 THUNLP 实验室、东北大学 NEUIR 实验室、OpenBMB、面壁智能与 AI9Stars 等机构联合发布,是首个基于 MCP 的轻量级 RAG 开发框架。其核心在于:通过 YAML 配置逻辑,利用 MCP 构建组件,并通过 UI 打通从“算…
-
MemGovern框架:让AI从GitHub历史经验中学习,Bug修复率提升至69.8%
MemGovern框架:让AI从GitHub历史经验中学习,Bug修复率提升至69.8% 当前,大语言模型驱动的代码智能体在自动化软件工程领域带来了变革,但它们普遍面临“封闭世界”的认知局限:现有的智能体往往试图从零开始修复Bug,或者仅依赖仓库内的局部上下文,而忽略了GitHub等平台上积累的浩瀚历史人类经验。 事实上,人类工程师在解决复杂问题时,往往会搜…
-
MobileRL:突破端侧GUI智能体训练瓶颈,AndroidWorld成功率超80%的强化学习新框架
关键词:MobileRL框架、端侧GUI智能体、强化学习、ADAGRPO算法、Android基准测试 MobileRL: Online Agentic Reinforcement Learning for Mobile GUI Agents https://arxiv.org/pdf/2509.18119 代码:https://github.com/THUD…
-
清华联手生数开源TurboDiffusion:单卡2秒生成视频,速度提升200倍
清华联手生数开源TurboDiffusion:单卡2秒生成视频,速度提升200倍 现在,生成一个视频可能比你刷视频还要快。 一个开源新框架,能让视频生成在保证质量的情况下,最高提速200多倍,并且仅需单张显卡即可实现。 以1.3B参数、480P分辨率的模型为例,在单张RTX 5090上生成一段5秒视频,原始方法需要约184秒。而采用新框架后,时间缩短至1.9…
-
Vision Agents:开源框架革新实时视频AI,构建多模态智能体的终极解决方案
如果你曾尝试构建一个能够“看见”、“听见”并即时“响应”的实时 AI 系统,就会知道其技术栈有多么复杂。 视频需要一个 SDK。 语音需要另一个。 目标检测需要另一个。 大语言模型(LLM)还需要一个。 之后,你仍需将所有组件集成起来,处理延迟问题,并设法让整个系统实时运行。 Vision Agents 改变了这一切。 这是一个开源框架,旨在帮助开发者构建能…
-
清华联合开源!首个基于MCP的RAG框架UltraRAG:零代码构建多模态检索增强生成系统
首个基于 MCP 的 RAG 框架 UltraRAG:零代码构建多模态检索增强生成系统 UltraRAG 是一个基于 MCP 的开源检索增强生成框架,旨在让用户无需编写代码即可构建复杂的 RAG 系统。 RAG 系统通过让 AI 模型先检索相关信息再生成答案,从而显著提高回答的准确性。 UltraRAG 是由清华大学 THUNLP、东北大学 NEUIR、Op…
-
从12次拒签到AI框架革命:Soumith Chintala与PyTorch的逆袭之路
在人工智能发展的历史长河中,框架工具往往成为技术演进的关键催化剂。2017年,一个名为PyTorch的开源框架悄然问世,它改变了深度学习研究的范式,重塑了AI开发的生态格局。而这一切的背后,是一位曾被世界反复拒绝的工程师——Soumith Chintala。 Soumith Chintala的起点并不耀眼。他出生于印度海德拉巴,就读于VIT Vellore这…