RAG
-
2024年1月GitHub热门开源项目盘点:从AI金融分析到无向量RAG,这些工具正在重塑开发效率
01 AI 金融分析 Agent:Dexter Dexter 是一款专注于金融研究的 AI 智能体。它能够像初级分析师一样工作,当你提出一个复杂的金融问题(例如分析某公司季度利润率变动的原因)时,它可以自主拆解任务并执行数据检索。 该智能体接入了实时市场数据源,能够查阅财报、损益表等关键财务文件,并内置了一套自我检查机制。当发现数据存在疑问时,它会进行反思并…
-
清华开源!GitHub 4600星RAG神器UltraRAG 3.0发布:告别黑盒开发,推理逻辑全透明
这个名为 UltraRAG 的开源项目,已在 GitHub 上获得了超过 4600 个 Star。它由清华大学 THUNLP 实验室、东北大学 NEUIR 实验室、OpenBMB、面壁智能与 AI9Stars 等机构联合发布,是首个基于 MCP 的轻量级 RAG 开发框架。其核心在于:通过 YAML 配置逻辑,利用 MCP 构建组件,并通过 UI 打通从“算…
-
UltraRAG 3.0重磅发布:可视化白盒框架,让RAG开发从数月缩短至一周
“验证算法原型只需一周,构建可用系统却耗时数月。” 这句看似调侃的“吐槽”,却是每一位算法工程师不得不面对的真实困境。 今天,清华大学 THUNLP 实验室、东北大学 NEUIR 实验室、OpenBMB 、面壁智能与 AI9Stars 联合发布 UltraRAG 3.0。 针对上述痛点,为科研工作者与开发者打造更懂开发者的技术框架,具备 3 大核心优势: 从…
-
构建可扩展、生产级的 Agentic RAG Pipeline:分层架构与六层核心设计详解
面向大型数据集、符合行业标准的 Agentic RAG Pipeline 需要基于清晰、可扩展的分层架构进行构建。我们将系统结构化,使得 Agent 能够并行地进行推理、获取上下文、使用工具以及与数据库交互。每一层都承担明确的职责,涵盖从数据摄取、模型服务到 Agent 协调的全过程。这种分层方法有助于系统实现可预测的扩展,同时为终端用户保持较低的响应延迟。…
-
DSPy 3与GEPA:革新RAG框架的自动推理与提示进化技术
近期,OpenAI 发布了 GPT-5.2 模型,引发了广泛关注。路透社报道称,OpenAI 在竞争压力下加速了研发进程。此次更新并非功能堆砌,而是聚焦于在智能、代码处理、长文本理解等核心能力上的显著提升,尤其擅长处理创建电子表格、制作演示文稿等复杂的多步骤任务。 简而言之,GPT-5.2 是一次面向实用场景的“精修”,在可靠性、长上下文处理、工具执行和输出…
-
超越基础RAG:构建面向学术论文的智能检索系统实战
在AI工程实践中,你很快会意识到:并不存在一张可以完全照搬的“通用蓝图”。 对于检索增强生成(RAG)中的基础检索(“R”),标准流程包括文档分块、查询语义搜索、结果重排等。这套流程已广为人知。 但随着系统深入应用,一个问题会浮现:如果一个系统对一篇文档的理解仅限于几个零散的文本块,我们如何能称其为“智能”? 那么,如何确保系统获得足够的信息,从而做出“聪明…
-
GraphRAG深度解析:融合Neo4j与LangChain,构建下一代知识增强型LLM系统
LLM 已从根本上改变了我们与数据交互、自动化推理以及构建智能系统的方式。然而,尽管其生成式能力令人印象深刻,LLM 天生并不理解关系、结构或长期的事实一致性。这一缺陷在我们尝试将 LLM 用于企业级知识系统、多跳推理或决策关键型应用时尤为明显。 这正是图数据库与 RAG 结合之处,二者共同为 AI 系统形成一种新的架构范式——将符号推理与神经生成相融合。 …
-
向量检索评估体系大洗牌:IceBerg基准揭示HNSW并非最优,多模态RAG远未标准化
将多模态数据纳入到RAG(检索增强生成)乃至Agent框架,是目前大语言模型(LLM)应用领域最受关注的方向之一。针对多模态数据最自然的召回方式,便是向量检索。 然而,我们正在依赖的这一整套“embedding → 向量检索 → 下游任务”的流程,其实存在一个未被正确认知到的陷阱。许多人认为向量检索方法已经标准化,遇到向量检索需求便不假思索地选择HNSW算法…
-
GPU上LLM推理性能瓶颈深度解析:从两阶段特性到MoE/RAG优化策略
关键词:LLM Inference 、GPU、 Two-Phase Heterogeneity 、Microarchitectural Analysis 、 System Scaling 、Emerging Paradigms 我们的研究从观测到预测系统性推进:识别性能现象、揭示硬件层面原因、验证系统行为、探索新范式。 我们的研究结果为理解 LLM 推理建立…
-
2025年AI技能全景图:从Prompt Engineering到AI Agent的九大核心能力解析
我们正从“与 AI 聊天”的时代迈向“用 AI 构建”的时代。 科技领域每隔几年就会经历一次范式转移,但当前人工智能领域的变革,其深度与广度远超过去十年间的任何一次。 一个清晰的现实是:到了 2025 年,掌握 AI 技能与不掌握 AI 技能的人,其能力差距将以指数级速度扩大。 这并非危言耸听,而是正在发生的趋势。从“与 AI 对话”到“用 AI 构建”,是…