CVPR 2026
-
ReCALL框架破解大模型检索难题:AI国家队联合新加坡国立大学实现生成式模型无损变检索器,CVPR 2026收录
行业痛点:范式冲突导致大模型检索“能力退化” 多模态大模型(MLLM)在图文理解与逻辑推理方面展现出强大能力,将其应用于组合图像检索(CIR)任务,本应具有显著优势。然而,现实情况却相反:将生成式大模型强行改造为判别式检索器后,模型会出现严重的能力退化,甚至无法解决原本能够精准处理的问题。生成式与判别式之间的范式冲突,成为大模型向检索领域落地的核心障碍。 近…
-
首次证实RL能让3D模型学会推理,复杂文本描述下生成质量跃升!
首个系统性研究:强化学习如何让3D模型学会推理? 图像生成领域,强化学习(RL)已交出亮眼答卷。那么,在更具挑战性的3D生成领域,RL能否同样奏效?当GRPO等算法让大模型在数学、代码推理上实现质变时,一项开创性研究率先给出了答案——首个将强化学习系统性引入文本到3D自回归生成的工作 正式诞生,并已被CVPR 2026接收。该研究并非简单移植2D经验,而是针…
-
RL赋能3D生成新突破:首个系统性强化学习研究让3D模型学会复杂文本推理,生成质量大幅跃升
RL赋能3D生成新突破:首个系统性强化学习研究让3D模型学会复杂文本推理 图像生成领域,强化学习(RL)已取得显著成果。那么,3D生成呢? 当GRPO(Group Relative Policy Optimization)等技术推动大模型在数学、代码推理上实现质变时,一项开创性研究率先给出了答案——首个将强化学习系统性引入文本到3D自回归生成的研究正式诞生,…
