
在当今数字时代,推荐系统已成为连接用户与内容的核心枢纽。传统推荐算法主要聚焦于“内容层”的理解——通过分析用户的点击、停留、互动等行为数据,推断其对特定视频、话题或商品的偏好。这种基于统计关联的方法虽然在一定程度上能够捕捉用户的兴趣点,但其本质仍停留在“知其然”的层面:系统知道用户喜欢什么内容,却难以理解“用户是谁”这一根本问题。快手消费策略算法团队敏锐地洞察到这一局限性,联合快手基础大模型与应用部及武汉大学,提出了TagCF框架,旨在推动推荐系统从“内容推荐”向“角色认知”的范式转变。该研究成果已被NeurIPS 2025接收,相关代码与实验框架已全面开源,为学术界与工业界提供了一套以“理解驱动”为核心的推荐系统方法论。

**用户角色建模:推荐系统的缺失维度**
传统推荐系统通常基于协同过滤、矩阵分解或深度学习模型,学习内容之间的隐式关联。然而,这种关联背后往往隐藏着“用户角色”这一关键混杂因素。例如,在音乐推荐场景中,“耳机-交响乐手-小提琴”的关联并非源于内容本身的直接联系,而是由“交响乐手”这一用户角色所驱动;在电商领域,“啤酒-新晋奶爸-尿布”的经典案例同样印证了用户角色在行为逻辑中的核心作用。相比基于ID的隐式建模,引入用户角色视角使推荐系统能够更清晰地理解用户的社会属性、个性特征与长期需求,从而迈向显式、可解释的推荐演进。

从建模角度看,当系统需要构建话题-话题关联时,可将其视为话题-角色-话题关联的简化图。这意味着引入用户角色不仅增强了模型的表达能力,还提供了更通用的协同行为建模框架。这种框架不仅能捕捉统计方法难以识别的弱交互(如跨领域兴趣迁移),还能逻辑性地突破用户的信息茧房——通过理解用户的多元角色,系统可推荐超出其历史行为模式的内容,促进探索与发现。实验表明,基于用户角色的建模在统计意义上显著优于传统话题建模,不仅具备更稳定的表征空间,还能带来更显著的推荐效果提升。
**TagCF框架:三层模块驱动逻辑化推荐**
TagCF框架的核心在于构建“内容理解-逻辑推理-系统增强”的三层架构,将大模型能力系统性地融入推荐流程。

**第一层:基于MLLM的视频内容理解中台**。系统每日处理海量新增视频,利用多模态大模型(如M3)提取视频的视觉、文本与音频嵌入,并通过精心设计的提示词引导模型理解视频语义,自动生成物品标签(item tag)与用户标签(user tag)。这些标签不仅涵盖传统话题分类,还深入捕捉内容背后的用户角色暗示(如“职场新人必备”“亲子互动指南”),形成动态更新的标签库。

**第二层:基于LLM的行为逻辑图探索中台**。在获得标签集合后,系统构建标签-标签逻辑图,包括“用户到物品”(U2I)与“物品到用户”(I2U)两类推理路径。通过特定提示词(如“喜欢古典音乐的用户可能对哪些文化内容感兴趣?”),系统调用语言模型(如QWen2.5-7B)生成逻辑关联的目标标签,形成可解释的推理网络。这一步骤将离散的标签转化为结构化逻辑关系,为推荐决策提供因果支撑。

**第三层:赋能下游推荐系统**。TagCF采用“LLM-for-rec”范式(而非替代性“LLM-as-rec”),将前两层产出的标签与逻辑图作为增强信号注入现有推荐模型。团队提出两种增强方案:TagCF-it(聚焦物品标签空间)与TagCF-ut(聚焦用户标签空间),支持基于标签的编码器增强、逻辑对齐训练增强及预估分数增强。实验证明,这些增强方案能显著提升点击率、停留时长等关键指标,同时保持系统的实时性与可扩展性。

**工程挑战与创新解决方案**
在实际落地中,TagCF面临多项工程挑战:无限制标签生成导致集合无序扩张、视频覆盖率呈长尾分布、生成结果缺乏评估标准等。为此,团队提出以下解决方案:
1. **构建弱重叠高频标签子集(Cover Set)**:通过自动化流程提取高频且通用的标签子集(规模约7k-20k),在30天内收敛,平衡覆盖率与稳定性。该子集在工业场景中展现出良好的泛化能力,为下游任务提供统一语义空间。
2. **模型蒸馏优化**:利用MLLM与LLM产出的标签数据训练轻量级蒸馏模型,实现对标签的精细排序与快速推理,减少对大模型的实时依赖。
3. **人工评估验证**:采用Good-Same-Bad策略,从准确性、完整性、合理性等维度进行人工评测,确保标签质量满足业务需求。

**未来展望与行业影响**
TagCF框架的突破性在于将推荐系统的核心从“内容匹配”升级为“角色认知”,通过逻辑化建模揭示用户行为背后的深层动机。其产出的标签-逻辑体系不仅适用于视频推荐,经验证也具备向电商、搜索等场景迁移的潜力。随着多模态大模型与推理能力的持续进化,这类“理解驱动”的推荐范式有望重塑个性化服务的底层逻辑,推动人工智能从感知智能向认知智能迈进。对于行业而言,TagCF的开源释放了重要信号:未来的竞争将不仅是算法效率的比拼,更是对用户理解深度与逻辑构建能力的较量。
— 图片补充 —








关注“鲸栖”小程序,掌握最新AI资讯
本文由鲸栖原创发布,未经许可,请勿转载。转载请注明出处:http://www.itsolotime.com/archives/6178
