对比学习 - 鲸林向海

ReVision突破：无需图文配对，几何对齐解锁多模态大模型预训练新范式

无需图文配对，几何对齐解锁多模态大模型预训练新范式在多模态大模型（MLLM）的研发中，一个长期共识是：没有图文对（Image-Text Pairs），就没有多模态能力。为了训练模型理解图像，业界通常需要耗费巨资收集海量图片，并为每张图片生成高质量的文本描述。这种强监督的配对数据，一直被视为多模态训练的基石。然而，来自港科大（广州）、新加坡国立大学等机构的…

2026年3月3日

98000

AI产业动态

快手CroPS：跨视角正样本引擎打破搜索信息茧房，AAAI 2026 Oral成果引领向量检索新范式

短视频搜索是向量检索在工业界最核心的应用场景之一。然而，当前业界普遍采用的「自强化」训练范式过度依赖历史点击数据，导致系统陷入信息茧房，难以召回潜在相关的新鲜内容。针对这一问题，快手搜索团队提出了一套全新的检索数据引擎 CroPS（Cross-Perspective Positive Samples）。该方法通过引入用户换 Query 数据、推荐流数据以及…

2026年1月12日

146000

AI产业动态

突破AI人像生成瓶颈：复旦大学与阶跃星辰联合推出WithAnyone，实现身份一致性与场景多样性的完美平衡

在人工智能图像生成领域，个性化人像合成一直是技术攻关的难点。传统方法往往陷入“复制粘贴”的困境——生成结果高度依赖输入图像的表情、角度和姿态，缺乏自然的变化与多样性。近日，复旦大学与阶跃星辰的研究团队联合发布全新AI合照生成模型WithAnyone，通过创新的数据策略与训练框架，成功打破了这一技术瓶颈，实现了身份一致性（ID Consistency）与身份可…

2025年11月16日

282000