TCDiff++：突破群体舞蹈生成瓶颈，端到端模型实现虚拟群舞新高度

2025年11月27日上午11:50 • AI产业动态 • 阅读 2

在元宇宙与数字人技术快速发展的今天，群体舞蹈生成已成为虚拟演唱会、数字人集体表演等场景的核心需求。然而，现有技术在多人生成、动作协调和长序列稳定性方面面临严峻挑战。近期，由南京理工大学、清华大学和南京大学联合研发的端到端模型TCDiff++，通过创新性的架构设计，成功突破了这些技术壁垒，为高质量、长时序的群体舞蹈自动生成提供了完整解决方案。

TCDiff++：突破群体舞蹈生成瓶颈，端到端模型实现虚拟群舞新高度

当前群体舞蹈生成技术主要面临三大核心难题：多舞者碰撞、动作僵硬与长序列崩坏。在常见的群舞数据中，超过80%的动作具有高度相似性，而每个舞者的动作数据维度高达100多，位置坐标却仅有3维。这种数据不平衡导致模型难以区分不同舞者身份，经常出现舞者混淆和相互碰撞的问题。

更严重的是，现有模型在协调全身动作与脚下轨迹方面存在明显缺陷，导致典型的「脚部滑动」现象——舞者上身动作标准，双脚却像在冰面滑行，严重破坏了视觉真实感。当编舞时间延长至数分钟时，现有技术更是面临崩溃风险，动作突变、卡顿和不连贯问题频发，难以满足实际表演需求。

TCDiff++：突破群体舞蹈生成瓶颈，端到端模型实现虚拟群舞新高度

针对这些挑战，研究团队在AAAI 2025发表的TCDiff模型基础上进行了全面升级。TCDiff首次提出「轨迹可控」的生成思路，通过分离轨迹预测与动作生成的两阶段框架，有效防止了舞者碰撞。然而，这种设计也导致了动作与位移衔接生硬，长序列生成时容易出现抖动和性能下降。

TCDiff++的核心创新在于其端到端的生成流程和专门设计的模块化架构。模型采用两阶段生成机制：首先，团体舞蹈解码器根据输入音乐生成整体协调、避免碰撞的初始舞蹈动作；随后，步法适配器聚焦于脚部轨迹优化，对初始动作进行局部精修，生成扎实的脚步动作，彻底消除「脚底打滑」现象。

TCDiff++：突破群体舞蹈生成瓶颈，端到端模型实现虚拟群舞新高度

在多舞者防碰撞系统方面，TCDiff++引入了三项关键技术：舞者定位嵌入为每位舞者编码其在队伍中的相对位置，维持整体队形；融合投影模块将舞者特征映射到更高维空间，强化模型对不同舞者动作的辨识能力；全局距离约束通过一致性损失函数合理控制舞者间距，确保生成队形既舒展又安全。

TCDiff++：突破群体舞蹈生成瓶颈，端到端模型实现虚拟群舞新高度

在精准步态控制上，模型在生成初始动作时引入交换模式，将音乐特征与舞者间特定的空间交换模式共同作为条件，从源头引导合理步法生成。步法适配器则利用脚跟、脚趾触地状态和身体根骨骼速度信息，针对性修正下半身运动，最后与富有表现力的上半身动作自然融合。

TCDiff++：突破群体舞蹈生成瓶颈，端到端模型实现虚拟群舞新高度

针对长序列生成难题，TCDiff++提出了长序列扩散采样策略。模型采用分段生成、后半段重叠的自回归方式，在生成新片段时利用已生成片段的后半部分作为确定性条件，有效维持角色位置与动作的连贯性，避免突变和崩坏。

TCDiff++：突破群体舞蹈生成瓶颈，端到端模型实现虚拟群舞新高度

实验结果表明，TCDiff++在个体动作质量和群体协调效果两方面均有显著提升。对比现有模型，EDGE在群舞场景中因难以区分舞者而导致频繁碰撞；GCD过度关注互动却忽略位置建模；CoDancers虽减轻了混淆却牺牲了队形协调性；TCDiff则因两阶段分离导致动作与位置不匹配。

TCDiff++：突破群体舞蹈生成瓶颈，端到端模型实现虚拟群舞新高度

TCDiff++凭借其端到端架构与模块协同设计，在所有团体舞蹈指标上持续领先。模型生成的群舞在较长音乐片段上能够保持高度同步、富有表现力且整体和谐，为虚拟演唱会、数字人集体演出等场景提供了可靠的AIGC解决方案。

TCDiff++：突破群体舞蹈生成瓶颈，端到端模型实现虚拟群舞新高度

从技术演进的角度看，TCDiff++代表了群体舞蹈生成领域的重要突破。它不仅解决了当前技术的核心痛点，更为未来更复杂、更大型的虚拟表演场景奠定了基础。随着元宇宙生态的不断完善，这类基础模型的价值将日益凸显。

TCDiff++：突破群体舞蹈生成瓶颈，端到端模型实现虚拟群舞新高度

值得注意的是，TCDiff++作为该领域首批基础模型之一，已从AAAI 2025的开源成果TCDiff升级而来，并被IJCV 2025正式接收。其开源代码提供了自动化渲染流程，对Blender软件初学者友好，有望推动相关技术的快速普及和应用创新。

TCDiff++：突破群体舞蹈生成瓶颈，端到端模型实现虚拟群舞新高度

展望未来，群体舞蹈生成技术仍有多方面需要完善。如何进一步提升动作的细节表现力，如何适应更复杂的音乐节奏变化，如何实现更大规模的群体协调，都是值得深入探索的方向。TCDiff++的成功经验为这些问题的解决提供了宝贵参考。

TCDiff++：突破群体舞蹈生成瓶颈，端到端模型实现虚拟群舞新高度

在产业应用层面，这项技术不仅限于娱乐表演领域。在教育培训、康复治疗、体育训练等场景中，高质量的群体动作生成同样具有重要价值。随着技术的不断成熟，我们有望看到更多跨领域的创新应用涌现。

TCDiff++：突破群体舞蹈生成瓶颈，端到端模型实现虚拟群舞新高度

总体而言，TCDiff++的研发标志着群体舞蹈生成技术迈入了新的发展阶段。通过解决多舞者碰撞、动作僵硬和长序列稳定性等核心难题，该模型为虚拟世界的集体表演提供了可靠的技术支撑，展现了人工智能在创造性内容生成方面的巨大潜力。

TCDiff++：突破群体舞蹈生成瓶颈，端到端模型实现虚拟群舞新高度

— 图片补充 —

TCDiff++：突破群体舞蹈生成瓶颈，端到端模型实现虚拟群舞新高度

TCDiff++：突破群体舞蹈生成瓶颈，端到端模型实现虚拟群舞新高度

TCDiff++：突破群体舞蹈生成瓶颈，端到端模型实现虚拟群舞新高度

TCDiff++：突破群体舞蹈生成瓶颈，端到端模型实现虚拟群舞新高度

TCDiff++：突破群体舞蹈生成瓶颈，端到端模型实现虚拟群舞新高度

TCDiff++：突破群体舞蹈生成瓶颈，端到端模型实现虚拟群舞新高度

TCDiff++：突破群体舞蹈生成瓶颈，端到端模型实现虚拟群舞新高度

TCDiff++：突破群体舞蹈生成瓶颈，端到端模型实现虚拟群舞新高度

关注“鲸栖”小程序，掌握最新AI资讯

本文由鲸栖原创发布，未经许可，请勿转载。转载请注明出处：http://www.itsolotime.com/archives/10799

扩散模型群体舞蹈生成虚拟表演

赞 (0)

0 0

ROOT优化器：华为诺亚方舟实验室如何为十亿级大模型训练构建稳健的矩阵感知引擎

上一篇 2025年11月27日上午11:48

操作系统级AI融合：夸克浏览器全面集成千问助手，开启PC生产力新纪元

下一篇 2025年11月27日上午11:50

AI产业动态

Heretic工具深度解析：突破语言模型安全限制的技术革命与伦理挑战

在人工智能快速发展的今天，语言模型的安全对齐机制已成为行业标准配置。然而，这种旨在防止生成有害内容的安全机制，在实际应用中却引发了新的争议。许多开发者发现，当前主流商业模型如GPT-5等，在涉及特定话题时表现出过度保守的倾向，频繁触发安全拒绝机制，这在研究、创作等正当场景中造成了显著障碍。从小说创作需要描述必要的情节冲突，到网络安全研究需要分析潜在漏洞；从…

2025年11月17日
6000
AI产业动态

VLA强化学习新范式：从星动纪元iRe-VLA到π*0.6的迭代式突破

在具身智能领域，视觉-语言-动作（VLA）模型正成为连接大语言模型与物理世界的关键桥梁。近期，Physical Intelligence发布的π*0.6论文与清华大学星动纪元团队的iRe-VLA研究，共同揭示了VLA模型通过在线强化学习实现自我改进的技术路径，标志着该领域从单纯模仿学习向自主探索的范式转变。 VLA模型的核心挑战在于如何将预训练的视觉-语言大…

2025年12月12日
4000
AI产业动态

2025人工智能年度评选深度解析：五大奖项如何定义行业标杆与未来趋势

随着人工智能技术从实验室走向规模化应用，行业亟需权威的评估体系来识别真正的创新力量与商业价值。2025人工智能年度评选的设立，正是对这一需求的系统性回应。本次评选从企业、产品、人物三大维度设立五类奖项，不仅是对过去一年成果的总结，更是对未来发展方向的指引。从企业维度看，评选分为“领航企业”与“潜力创业公司”两类，这反映了行业成熟度与创新活力的双重关注。领航…

2025年11月17日
4000
AI产业动态

开源模型首夺国际物理奥赛金牌！上海AI Lab打造235B参数模型超越GPT-5与Grok-4

上海AI Lab研发的开源模型P1-235B-A22B在国际物理奥林匹克竞赛（IPhO）中首次达到金牌分数线，并在涵盖全球13项顶级赛事的HiPhO基准测试中以12金1银的成绩与谷歌Gemini-2.5-Pro并列第一，超越GPT-5与Grok-4。该成果依托多阶段强化学习训练与协同进化多智能体系统PhysicsMinions，标志着开源模型在复杂物理推理能力上实现重要突破。

2025年10月25日
197000
AI产业动态

GPT-5.2 vs Gemini 3 Pro：年度AI对决的深度技术剖析与产业格局演变

在人工智能领域竞争白热化的2025年，OpenAI与谷歌之间的技术对决达到了前所未有的激烈程度。GPT-5.2作为OpenAI年度重磅产品，在发布48小时内即面临来自各方的严格审视，而谷歌Gemini 3 Pro则凭借卓越表现重新定义了行业标杆。这场对决不仅关乎单一产品的成败，更折射出两大科技巨头在技术路线、研发策略和市场布局上的根本差异。 Epoch AI…

5天前
2000

发表回复