RAG_鲸林向海

开源项目

2024年1月GitHub热门开源项目盘点：从AI金融分析到无向量RAG，这些工具正在重塑开发效率

01 AI 金融分析 Agent：Dexter Dexter 是一款专注于金融研究的 AI 智能体。它能够像初级分析师一样工作，当你提出一个复杂的金融问题（例如分析某公司季度利润率变动的原因）时，它可以自主拆解任务并执行数据检索。该智能体接入了实时市场数据源，能够查阅财报、损益表等关键财务文件，并内置了一套自我检查机制。当发现数据存在疑问时，它会进行反思并…

2天前

37000

开源项目

清华开源！GitHub 4600星RAG神器UltraRAG 3.0发布：告别黑盒开发，推理逻辑全透明

这个名为 UltraRAG 的开源项目，已在 GitHub 上获得了超过 4600 个 Star。它由清华大学 THUNLP 实验室、东北大学 NEUIR 实验室、OpenBMB、面壁智能与 AI9Stars 等机构联合发布，是首个基于 MCP 的轻量级 RAG 开发框架。其核心在于：通过 YAML 配置逻辑，利用 MCP 构建组件，并通过 UI 打通从“算…

6天前

38000

UltraRAG 3.0重磅发布：可视化白盒框架，让RAG开发从数月缩短至一周

“验证算法原型只需一周，构建可用系统却耗时数月。” 这句看似调侃的“吐槽”，却是每一位算法工程师不得不面对的真实困境。今天，清华大学 THUNLP 实验室、东北大学 NEUIR 实验室、OpenBMB 、面壁智能与 AI9Stars 联合发布 UltraRAG 3.0。针对上述痛点，为科研工作者与开发者打造更懂开发者的技术框架，具备 3 大核心优势：从…

大模型工程 2026年1月23日

59000

大模型工程

构建可扩展、生产级的 Agentic RAG Pipeline：分层架构与六层核心设计详解

面向大型数据集、符合行业标准的 Agentic RAG Pipeline 需要基于清晰、可扩展的分层架构进行构建。我们将系统结构化，使得 Agent 能够并行地进行推理、获取上下文、使用工具以及与数据库交互。每一层都承担明确的职责，涵盖从数据摄取、模型服务到 Agent 协调的全过程。这种分层方法有助于系统实现可预测的扩展，同时为终端用户保持较低的响应延迟。…

2026年1月22日

148000

大模型工程

DSPy 3与GEPA：革新RAG框架的自动推理与提示进化技术

近期，OpenAI 发布了 GPT-5.2 模型，引发了广泛关注。路透社报道称，OpenAI 在竞争压力下加速了研发进程。此次更新并非功能堆砌，而是聚焦于在智能、代码处理、长文本理解等核心能力上的显著提升，尤其擅长处理创建电子表格、制作演示文稿等复杂的多步骤任务。简而言之，GPT-5.2 是一次面向实用场景的“精修”，在可靠性、长上下文处理、工具执行和输出…

2026年1月20日

59000

大模型工程

超越基础RAG：构建面向学术论文的智能检索系统实战

在AI工程实践中，你很快会意识到：并不存在一张可以完全照搬的“通用蓝图”。对于检索增强生成（RAG）中的基础检索（“R”），标准流程包括文档分块、查询语义搜索、结果重排等。这套流程已广为人知。但随着系统深入应用，一个问题会浮现：如果一个系统对一篇文档的理解仅限于几个零散的文本块，我们如何能称其为“智能”？那么，如何确保系统获得足够的信息，从而做出“聪明…

2026年1月19日

60000

大模型工程

GraphRAG深度解析：融合Neo4j与LangChain，构建下一代知识增强型LLM系统

LLM 已从根本上改变了我们与数据交互、自动化推理以及构建智能系统的方式。然而，尽管其生成式能力令人印象深刻，LLM 天生并不理解关系、结构或长期的事实一致性。这一缺陷在我们尝试将 LLM 用于企业级知识系统、多跳推理或决策关键型应用时尤为明显。这正是图数据库与 RAG 结合之处，二者共同为 AI 系统形成一种新的架构范式——将符号推理与神经生成相融合。 …

2025年12月27日

87000

大模型评测

向量检索评估体系大洗牌：IceBerg基准揭示HNSW并非最优，多模态RAG远未标准化

将多模态数据纳入到RAG（检索增强生成）乃至Agent框架，是目前大语言模型（LLM）应用领域最受关注的方向之一。针对多模态数据最自然的召回方式，便是向量检索。然而，我们正在依赖的这一整套“embedding → 向量检索 → 下游任务”的流程，其实存在一个未被正确认知到的陷阱。许多人认为向量检索方法已经标准化，遇到向量检索需求便不假思索地选择HNSW算法…

2025年12月25日

103000

大模型推理

GPU上LLM推理性能瓶颈深度解析：从两阶段特性到MoE/RAG优化策略

关键词：LLM Inference 、GPU、 Two-Phase Heterogeneity 、Microarchitectural Analysis 、 System Scaling 、Emerging Paradigms 我们的研究从观测到预测系统性推进：识别性能现象、揭示硬件层面原因、验证系统行为、探索新范式。我们的研究结果为理解 LLM 推理建立…

2025年12月24日

89000

大模型工程

2025年AI技能全景图：从Prompt Engineering到AI Agent的九大核心能力解析

我们正从“与 AI 聊天”的时代迈向“用 AI 构建”的时代。科技领域每隔几年就会经历一次范式转移，但当前人工智能领域的变革，其深度与广度远超过去十年间的任何一次。一个清晰的现实是：到了 2025 年，掌握 AI 技能与不掌握 AI 技能的人，其能力差距将以指数级速度扩大。这并非危言耸听，而是正在发生的趋势。从“与 AI 对话”到“用 AI 构建”，是…

2025年12月10日

102000