RAG - 鲸林向海

GraphRAG深度解析：融合Neo4j与LangChain，构建下一代知识增强型LLM系统

LLM 已从根本上改变了我们与数据交互、自动化推理以及构建智能系统的方式。然而，尽管其生成式能力令人印象深刻，LLM 天生并不理解关系、结构或长期的事实一致性。这一缺陷在我们尝试将 LLM 用于企业级知识系统、多跳推理或决策关键型应用时尤为明显。这正是图数据库与 RAG 结合之处，二者共同为 AI 系统形成一种新的架构范式——将符号推理与神经生成相融合。 …

2025年12月27日

277000

大模型评测

向量检索评估体系大洗牌：IceBerg基准揭示HNSW并非最优，多模态RAG远未标准化

将多模态数据纳入到RAG（检索增强生成）乃至Agent框架，是目前大语言模型（LLM）应用领域最受关注的方向之一。针对多模态数据最自然的召回方式，便是向量检索。然而，我们正在依赖的这一整套“embedding → 向量检索 → 下游任务”的流程，其实存在一个未被正确认知到的陷阱。许多人认为向量检索方法已经标准化，遇到向量检索需求便不假思索地选择HNSW算法…

2025年12月25日

214000

大模型推理

GPU上LLM推理性能瓶颈深度解析：从两阶段特性到MoE/RAG优化策略

关键词：LLM Inference 、GPU、 Two-Phase Heterogeneity 、Microarchitectural Analysis 、 System Scaling 、Emerging Paradigms 我们的研究从观测到预测系统性推进：识别性能现象、揭示硬件层面原因、验证系统行为、探索新范式。我们的研究结果为理解 LLM 推理建立…

2025年12月24日

198000

大模型工程

2025年AI技能全景图：从Prompt Engineering到AI Agent的九大核心能力解析

我们正从“与 AI 聊天”的时代迈向“用 AI 构建”的时代。科技领域每隔几年就会经历一次范式转移，但当前人工智能领域的变革，其深度与广度远超过去十年间的任何一次。一个清晰的现实是：到了 2025 年，掌握 AI 技能与不掌握 AI 技能的人，其能力差距将以指数级速度扩大。这并非危言耸听，而是正在发生的趋势。从“与 AI 对话”到“用 AI 构建”，是…

2025年12月10日

289000

大模型工程

揭秘RAG排序层：LambdaMART如何成为检索增强生成成败的关键

那层几乎无人提及、却决定你AI应用成败的排序层。 Google、Netflix、具备联网搜索功能的ChatGPT，它们有何共通之处？都依赖一个排序算法来决定你首先看到什么。它不决定“有什么”，而是决定你“看见什么”。当我们的团队调试RAG流水线，探究为何它对某些查询返回一堆无关内容时，“排序学习”问题一次次浮现。算法本身不难找到，但几乎没有人在构建AI应用…

2025年12月9日

199000

大模型工程

Prompt与Context工程实战：解锁LLM高效沟通的核心技艺

如果你一直在关注《Master LLMs》系列，那么你已经走过了从建立直觉到理解机制，再到学习关键原则的旅程。现在，我们将转向动手实践，聚焦于构建AI应用时，如何与大型语言模型（LLM）进行高效沟通的核心技艺。许多人在使用LLM时并未意识到一个关键点：模型非常聪明，但也非常“按字面理解”。与LLM的沟通，并非像与人交谈那样简单。它既比想象中更直接，也比…

2025年11月29日

196000

大模型工程

构建真正会“思考”的AI：Agentic RAG全面指南

注：本文为技术内容，诸如 RAG、Agentic、Vector Database、SQL、Embedding、Cross-Encoder、LLM 等专业术语均保留英文原文，以保证准确性与可检索性。 🤔 问题：为何多数 AI 助手显得“笨拙” 设想你向一位财务分析师提问：“我们公司表现如何？” 一位初级分析师可能会匆忙给出几个数字。而一位资深专家则会先停下来，…

2025年11月28日

191000

大模型推理

Meta REFRAG革新RAG架构：30倍提速、16倍上下文、成本减半，彻底解决上下文垃圾问题

你是否遇到过这样的困扰：只想让大模型读取10段关键资料，它却被迫处理100段，导致token消耗激增，响应速度却异常缓慢？这一行业普遍痛点，如今被Meta提出的全新方案彻底解决。他们刚刚开源了一个名为 REFRAG 的革新性RAG架构。其核心思想极为直接：在信息输入大模型前，将无关的上下文极度压缩，仅保留并提供真正有用的部分。实测数据令人印象深刻：* …

2025年11月23日

199000

开源项目

清华联合开源！首个基于MCP的RAG框架UltraRAG：零代码构建多模态检索增强生成系统

首个基于 MCP 的 RAG 框架 UltraRAG：零代码构建多模态检索增强生成系统 UltraRAG 是一个基于 MCP 的开源检索增强生成框架，旨在让用户无需编写代码即可构建复杂的 RAG 系统。 RAG 系统通过让 AI 模型先检索相关信息再生成答案，从而显著提高回答的准确性。 UltraRAG 是由清华大学 THUNLP、东北大学 NEUIR、Op…

2025年11月19日

221000

AI产品库

Google File Search：零门槛RAG工具，让AI直接理解你的数据

如果你曾尝试自己搭建一套 RAG（检索增强生成）系统，大概深有体会：管理向量嵌入、配置向量数据库、进行文本切分，还要确保整个流程与模型顺畅协作且成本可控，过程相当繁琐。现在，Google 用一个新工具解决了这些麻烦。他们在 Gemini API 中悄然推出了全新的 File Search Tool，它能替你处理 RAG 流程中的所有繁重工作。你只需上传文…

2025年11月16日

222000