RAG

  • NVlabs FVRuleLearner:用算子推理树终结LLM写SystemVerilog断言的时序错误,形式验证正确率飙升

    利用大语言模型将自然语言描述转化为 SystemVerilog 断言(SVA),表面上是“代码生成”的一个应用分支,但其真正的挑战并非语法,而是语义。例如,一个“握手后必须响应”的需求,可能涉及时序蕴含、复位屏蔽、信号稳定性、延迟窗口以及位级抽象等多种微妙的逻辑选择。 研究论文揭示,在自然语言到 SVA(NL-to-SVA)任务中,超过 80% 的功能性错误…

    大模型工程 5天前
    9600
  • LLM知识管理新范式:从临时检索到复利增长的Wiki式构建

    近期,Andrej Karpathy分享了一种利用大语言模型管理个人知识库的新方法,其核心思路引发了广泛共鸣。他将这一理念整理成一份Gist文档,迅速获得了大量关注。 这一思路的兴起,与大模型自身能力的演进密切相关。长程Agent能力的提升,以及渐进式披露等实践方法的出现,使得许多过去难以被AI重塑的知识管理场景正逐步被解锁。 核心理念:从检索到构建 Kar…

    2026年4月7日
    77500
  • 谷歌发布首个原生多模态嵌入模型Gemini Embedding 2,统一文本、图像、视频、音频、文档嵌入空间

    谷歌宣布推出全新的多模态嵌入模型 Gemini Embedding 2,这是首个基于 Gemini 架构构建的原生多模态嵌入模型。目前,该模型已经通过 Gemini API 和 Vertex AI 向开发者提供公开预览。 统一的多模态嵌入空间 与此前仅支持文本向量化的嵌入模型不同,Gemini Embedding 2 可以将文本、图像、视频、音频以及文档等多…

    2026年3月11日
    48300
  • 面向AI Agents的7个免费Web Search API:实时、RAG就绪与快速集成指南

    探索面向智能体(AI Agent)的主流 Web Search API,它们提供实时、高准确度的搜索结果,具备 RAG 就绪、低延迟与可扩展性。本文包含 Python 快速上手示例与免费套餐信息,便于无缝集成。 AI 智能体的有效性,取决于其获取新鲜、可靠信息的能力。许多智能体在幕后会调用 Web 搜索工具来获取最新上下文,以确保输出始终相关。然而,并非所有…

    2026年2月27日
    2.8K00
  • Cog-RAG:让RAG在检索前先思考,用双超图架构模拟人类认知过程

    Retrieval-Augmented Generation(RAG)已成为帮助大型语言模型保持信息“有根有据”的标准方法。其基本流程广为人知:将文档切分为片段,进行向量化嵌入,执行向量检索,最后将最匹配的前K个结果输入给大模型生成答案。 然而,这条标准流水线存在一些固有的局限性。 为什么多数 RAG 系统仍像支离破碎的记忆 图 1:图、超图与 Cog-RA…

    2026年2月23日
    45600
  • 跨越工程鸿沟:软件工程方法论指导下的企业级AI Agent构建实战

    AI Agent 正在成为大模型发展的重要方向,也逐渐成为企业数字化转型中具备实用价值的突破口。与单一的大模型对话不同,Agent 不仅能够理解指令,还可以围绕目标进行任务规划、工具调用和流程执行,从而完成更复杂的业务闭环。然而,从“知道 Agent 是什么”到“在企业环境中稳定运行并产生价值”,中间仍然存在一道明显的工程鸿沟。 万变不离其宗,AI Agen…

    2026年2月9日
    35300
  • 2024年1月GitHub热门开源项目盘点:从AI金融分析到无向量RAG,这些工具正在重塑开发效率

    01 AI 金融分析 Agent:Dexter Dexter 是一款专注于金融研究的 AI 智能体。它能够像初级分析师一样工作,当你提出一个复杂的金融问题(例如分析某公司季度利润率变动的原因)时,它可以自主拆解任务并执行数据检索。 该智能体接入了实时市场数据源,能够查阅财报、损益表等关键财务文件,并内置了一套自我检查机制。当发现数据存在疑问时,它会进行反思并…

    2026年2月2日
    1.6K00
  • 清华开源!GitHub 4600星RAG神器UltraRAG 3.0发布:告别黑盒开发,推理逻辑全透明

    这个名为 UltraRAG 的开源项目,已在 GitHub 上获得了超过 4600 个 Star。它由清华大学 THUNLP 实验室、东北大学 NEUIR 实验室、OpenBMB、面壁智能与 AI9Stars 等机构联合发布,是首个基于 MCP 的轻量级 RAG 开发框架。其核心在于:通过 YAML 配置逻辑,利用 MCP 构建组件,并通过 UI 打通从“算…

    2026年1月29日
    54700
  • UltraRAG 3.0重磅发布:可视化白盒框架,让RAG开发从数月缩短至一周

    “验证算法原型只需一周,构建可用系统却耗时数月。” 这句看似调侃的“吐槽”,却是每一位算法工程师不得不面对的真实困境。 今天,清华大学 THUNLP 实验室、东北大学 NEUIR 实验室、OpenBMB 、面壁智能与 AI9Stars 联合发布 UltraRAG 3.0。 针对上述痛点,为科研工作者与开发者打造更懂开发者的技术框架,具备 3 大核心优势: 从…

    AI产业动态 2026年1月23日
    44300
  • 构建可扩展、生产级的 Agentic RAG Pipeline:分层架构与六层核心设计详解

    面向大型数据集、符合行业标准的 Agentic RAG Pipeline 需要基于清晰、可扩展的分层架构进行构建。我们将系统结构化,使得 Agent 能够并行地进行推理、获取上下文、使用工具以及与数据库交互。每一层都承担明确的职责,涵盖从数据摄取、模型服务到 Agent 协调的全过程。这种分层方法有助于系统实现可预测的扩展,同时为终端用户保持较低的响应延迟。…

    2026年1月22日
    91800