自进化强化学习

AI产业动态

VisPlay：突破视觉语言模型的数据困境，开启自进化强化学习新纪元

在Vision-Language Model（VLM）领域，提升复杂推理能力长期面临严峻挑战。传统方法主要依赖大规模人工标注数据或启发式奖励机制，这不仅带来高昂的经济成本和时间成本，更关键的是难以实现规模化扩展。随着模型参数量的指数级增长，人工标注的速度已远远跟不上模型演化的需求，形成了制约VLM发展的“数据困境”。最新研究成果VisPlay首次提出了一种…

2025年12月1日
191000