从“内容理解”到“用户角色认知”：快手TagCF框架如何重塑推荐系统的逻辑范式

在当今数字时代，推荐系统已成为连接用户与内容的核心枢纽。传统推荐算法主要聚焦于“内容层”的理解——通过分析用户的点击、停留、互动等行为数据，推断其对特定视频、话题或商品的偏好。这种基于统计关联的方法虽然在一定程度上能够捕捉用户的兴趣点，但其本质仍停留在“知其然”的层面：系统知道用户喜欢什么内容，却难以理解“用户是谁”这一根本问题。快手消费策略算法团队敏锐地洞察到这一局限性，联合快手基础大模型与应用部及武汉大学，提出了TagCF框架，旨在推动推荐系统从“内容推荐”向“角色认知”的范式转变。该研究成果已被NeurIPS 2025接收，相关代码与实验框架已全面开源，为学术界与工业界提供了一套以“理解驱动”为核心的推荐系统方法论。

**用户角色建模：推荐系统的缺失维度**

传统推荐系统通常基于协同过滤、矩阵分解或深度学习模型，学习内容之间的隐式关联。然而，这种关联背后往往隐藏着“用户角色”这一关键混杂因素。例如，在音乐推荐场景中，“耳机-交响乐手-小提琴”的关联并非源于内容本身的直接联系，而是由“交响乐手”这一用户角色所驱动；在电商领域，“啤酒-新晋奶爸-尿布”的经典案例同样印证了用户角色在行为逻辑中的核心作用。相比基于ID的隐式建模，引入用户角色视角使推荐系统能够更清晰地理解用户的社会属性、个性特征与长期需求，从而迈向显式、可解释的推荐演进。

从建模角度看，当系统需要构建话题-话题关联时，可将其视为话题-角色-话题关联的简化图。这意味着引入用户角色不仅增强了模型的表达能力，还提供了更通用的协同行为建模框架。这种框架不仅能捕捉统计方法难以识别的弱交互（如跨领域兴趣迁移），还能逻辑性地突破用户的信息茧房——通过理解用户的多元角色，系统可推荐超出其历史行为模式的内容，促进探索与发现。实验表明，基于用户角色的建模在统计意义上显著优于传统话题建模，不仅具备更稳定的表征空间，还能带来更显著的推荐效果提升。

**TagCF框架：三层模块驱动逻辑化推荐**

TagCF框架的核心在于构建“内容理解-逻辑推理-系统增强”的三层架构，将大模型能力系统性地融入推荐流程。

**第一层：基于MLLM的视频内容理解中台**。系统每日处理海量新增视频，利用多模态大模型（如M3）提取视频的视觉、文本与音频嵌入，并通过精心设计的提示词引导模型理解视频语义，自动生成物品标签（item tag）与用户标签（user tag）。这些标签不仅涵盖传统话题分类，还深入捕捉内容背后的用户角色暗示（如“职场新人必备”“亲子互动指南”），形成动态更新的标签库。

**第二层：基于LLM的行为逻辑图探索中台**。在获得标签集合后，系统构建标签-标签逻辑图，包括“用户到物品”（U2I）与“物品到用户”（I2U）两类推理路径。通过特定提示词（如“喜欢古典音乐的用户可能对哪些文化内容感兴趣？”），系统调用语言模型（如QWen2.5-7B）生成逻辑关联的目标标签，形成可解释的推理网络。这一步骤将离散的标签转化为结构化逻辑关系，为推荐决策提供因果支撑。

**第三层：赋能下游推荐系统**。TagCF采用“LLM-for-rec”范式（而非替代性“LLM-as-rec”），将前两层产出的标签与逻辑图作为增强信号注入现有推荐模型。团队提出两种增强方案：TagCF-it（聚焦物品标签空间）与TagCF-ut（聚焦用户标签空间），支持基于标签的编码器增强、逻辑对齐训练增强及预估分数增强。实验证明，这些增强方案能显著提升点击率、停留时长等关键指标，同时保持系统的实时性与可扩展性。

**工程挑战与创新解决方案**

在实际落地中，TagCF面临多项工程挑战：无限制标签生成导致集合无序扩张、视频覆盖率呈长尾分布、生成结果缺乏评估标准等。为此，团队提出以下解决方案：

1. **构建弱重叠高频标签子集（Cover Set）**：通过自动化流程提取高频且通用的标签子集（规模约7k-20k），在30天内收敛，平衡覆盖率与稳定性。该子集在工业场景中展现出良好的泛化能力，为下游任务提供统一语义空间。

2. **模型蒸馏优化**：利用MLLM与LLM产出的标签数据训练轻量级蒸馏模型，实现对标签的精细排序与快速推理，减少对大模型的实时依赖。

3. **人工评估验证**：采用Good-Same-Bad策略，从准确性、完整性、合理性等维度进行人工评测，确保标签质量满足业务需求。

**未来展望与行业影响**

TagCF框架的突破性在于将推荐系统的核心从“内容匹配”升级为“角色认知”，通过逻辑化建模揭示用户行为背后的深层动机。其产出的标签-逻辑体系不仅适用于视频推荐，经验证也具备向电商、搜索等场景迁移的潜力。随着多模态大模型与推理能力的持续进化，这类“理解驱动”的推荐范式有望重塑个性化服务的底层逻辑，推动人工智能从感知智能向认知智能迈进。对于行业而言，TagCF的开源释放了重要信号：未来的竞争将不仅是算法效率的比拼，更是对用户理解深度与逻辑构建能力的较量。

— 图片补充 —