对比学习
-
ReVision突破:无需图文配对,几何对齐解锁多模态大模型预训练新范式
无需图文配对,几何对齐解锁多模态大模型预训练新范式 在多模态大模型(MLLM)的研发中,一个长期共识是:没有图文对(Image-Text Pairs),就没有多模态能力。为了训练模型理解图像,业界通常需要耗费巨资收集海量图片,并为每张图片生成高质量的文本描述。这种强监督的配对数据,一直被视为多模态训练的基石。 然而,来自港科大(广州)、新加坡国立大学等机构的…
-
快手CroPS:跨视角正样本引擎打破搜索信息茧房,AAAI 2026 Oral成果引领向量检索新范式
短视频搜索是向量检索在工业界最核心的应用场景之一。然而,当前业界普遍采用的「自强化」训练范式过度依赖历史点击数据,导致系统陷入信息茧房,难以召回潜在相关的新鲜内容。 针对这一问题,快手搜索团队提出了一套全新的检索数据引擎 CroPS(Cross-Perspective Positive Samples)。该方法通过引入用户换 Query 数据、推荐流数据以及…
-
突破AI人像生成瓶颈:复旦大学与阶跃星辰联合推出WithAnyone,实现身份一致性与场景多样性的完美平衡
在人工智能图像生成领域,个性化人像合成一直是技术攻关的难点。传统方法往往陷入“复制粘贴”的困境——生成结果高度依赖输入图像的表情、角度和姿态,缺乏自然的变化与多样性。近日,复旦大学与阶跃星辰的研究团队联合发布全新AI合照生成模型WithAnyone,通过创新的数据策略与训练框架,成功打破了这一技术瓶颈,实现了身份一致性(ID Consistency)与身份可…
