多模态搜索
-
HyperEyes:并行多模态搜索新范式,打破串行困局,效率提升10倍
当前,开源多模态搜索智能体普遍受限于“裁剪-再搜索”的串行处理流程。当面对多个目标时,这种模式往往导致交互过程冗长,并容易陷入错误级联累积的困境。 为突破这一瓶颈,小红书研究团队推出了一款全新架构的模型——HyperEyes。该模型通过统一“定位”与“搜索”的动作空间、构建可学习的并行数据,以及引入双粒度效率感知强化学习,实现了一套全栈式设计,成功将多模态搜…
当前,开源多模态搜索智能体普遍受限于“裁剪-再搜索”的串行处理流程。当面对多个目标时,这种模式往往导致交互过程冗长,并容易陷入错误级联累积的困境。 为突破这一瓶颈,小红书研究团队推出了一款全新架构的模型——HyperEyes。该模型通过统一“定位”与“搜索”的动作空间、构建可学习的并行数据,以及引入双粒度效率感知强化学习,实现了一套全栈式设计,成功将多模态搜…