奖励设计

大模型工程

强化学习赋能3D生成：首个文本到3D的RL范式攻克几何与物理合理性难题

强化学习赋能3D生成：首个文本到3D的RL范式攻克几何与物理合理性难题在大语言模型和文生图领域，强化学习（RL）已成为提升模型思维链与生成质量的关键方法。但当我们将目光转向更为复杂的文本到3D生成时，这套方法还会管用吗？近期，一项由西北工业大学、北京大学、香港中文大学、上海人工智能实验室、香港科技大学合作开展的研究系统性探索了这一重要问题。论文链接： …

2025年12月20日
198000