向量检索

  • Hypatia:开源AI记忆管理系统,融合知识图谱与向量检索,让AI拥有“长期记忆”

    关键词: AI 记忆管理、知识图谱、双引擎架构、JSON 查询表达式、向量检索 随着大语言模型(LLM)和 AI Agent 技术的飞速发展,让 AI 拥有类似人类的“长期记忆”成为了当前技术界亟待解决的关键难题。如何在海量的历史交互、文档和常识中,既能做到语义层面的模糊理解,又能实现精确的逻辑与文本匹配? 开源项目 Hypatia 是一个面向 AI 的记忆…

    2026年4月21日
    26100
  • 快手CroPS:跨视角正样本引擎打破搜索信息茧房,AAAI 2026 Oral成果引领向量检索新范式

    短视频搜索是向量检索在工业界最核心的应用场景之一。然而,当前业界普遍采用的「自强化」训练范式过度依赖历史点击数据,导致系统陷入信息茧房,难以召回潜在相关的新鲜内容。 针对这一问题,快手搜索团队提出了一套全新的检索数据引擎 CroPS(Cross-Perspective Positive Samples)。该方法通过引入用户换 Query 数据、推荐流数据以及…

    2026年1月12日
    32700
  • 构建实时语音驱动RAG系统:从架构设计到生产部署的全栈指南

    多数团队都在谈论构建对话代理,但真正将其打磨到可用于生产环境却充满挑战。语音系统尤为严苛:延迟会立刻显现,检索失误会破坏信任,而语音、语言与响应之间的任何断层,都会让用户体验大打折扣。本文将带你构建一个“声音原生”的对话代理,实现端到端自然流畅的交互。你将了解语音如何在实时流程中依次经过转写、推理、检索与合成,以及各层如何协同工作以保持体验的连贯性。阅读本部…

    2025年12月30日
    42500
  • 向量检索评估体系大洗牌:IceBerg基准揭示HNSW并非最优,多模态RAG远未标准化

    将多模态数据纳入到RAG(检索增强生成)乃至Agent框架,是目前大语言模型(LLM)应用领域最受关注的方向之一。针对多模态数据最自然的召回方式,便是向量检索。 然而,我们正在依赖的这一整套“embedding → 向量检索 → 下游任务”的流程,其实存在一个未被正确认知到的陷阱。许多人认为向量检索方法已经标准化,遇到向量检索需求便不假思索地选择HNSW算法…

    2025年12月25日
    36300