在自动驾驶技术发展的关键转折点,行业正经历一场深刻的范式迁移。端到端架构虽曾统一技术栈并释放Scaling Law潜力,但随着数据瓶颈日益凸显,单纯依赖模仿学习已难以突破人类司机能力上限。ICCV 2025的最新动向显示,头部企业正形成共识:强化学习与云端生成式世界模型将成为下一代自动驾驶系统的核心基座。

特斯拉与理想汽车在顶会现场的实践分享,揭示了这一转型的技术逻辑。理想汽车VLA模型负责人詹锟在具身智能研讨会上提出,自动驾驶已进入“下半场”,必须从数据闭环迈向训练闭环。数据闭环虽完成了采集、训练、评估、部署的循环,却无法有效覆盖边缘场景;而训练闭环通过环境生成与反馈迭代,使模型能持续优化以实现预设目标。

理想构建的全球首个世界模型与强化学习闭环量产架构,包含三大核心能力:区域级仿真评估、合成数据生成、强化学习世界引擎。区域级仿真采用重建与生成结合的策略——重建确保操作对象完美还原与稳定性,生成则提供动态变化信息与更强泛化能力。相关成果如Street Gaussians算法(ECCV 2024)与Hierarchy UGP模型(ICCV 2025),实现了大规模动态场景的SOTA重建。


合成数据能力通过场景编辑、迁移与全场景生成三层应用,解决了数据分布不均衡问题。传统采集数据多集中于简单场景(晴天、普通道路),而合成数据补充了极端案例与复杂场景,使模型评估更全面、性能更稳健。

强化学习世界引擎作为最具挑战的环节,涉及世界模型、3D资产、仿真智能体、奖励模型与性能优化五大要素。其中仿真智能体的建模——特别是他车交互行为——被詹锟视为“比实现单车L4更难”的难题。理想通过目标函数与奖励函数约束多智能体行为,并调整权重以增加样本多样性,突破了传统自博弈方法的局限。


技术迁移的背后是理想的商业化闭环支撑:2023-2024年研发投入连续超百亿元,2025年上半年达53亿元。这不仅驱动了辅助驾驶算法演进,还夯实了底层基础——整车操作系统理想星环OS于2024年首次上车,实现了软硬件解耦,为训练闭环提供了基础设施保障。

从数据闭环到训练闭环的范式迁移,标志着自动驾驶从“学习人类经验”转向“创造超越人类的驾驶智能”。世界模型作为物理AI的竞速引擎,正推动行业向L4级自动驾驶迈进。未来,随着生成式仿真占比提升与强化学习规模化应用,自动驾驶系统的安全边界与场景泛化能力将实现质的飞跃。

这一转型不仅是技术路径的升级,更是整个产业思维的重构:当数据红利见顶,通过仿真环境创造“无限数据”并实现自主进化,将成为破解长尾难题、实现全场景覆盖的关键。理想汽车的实践表明,训练闭环已从理论构想走向工程落地,为行业提供了可参考的技术范式与商业化路径。
— 图片补充 —





关注“鲸栖”小程序,掌握最新AI资讯
本文由鲸栖原创发布,未经许可,请勿转载。转载请注明出处:http://www.itsolotime.com/archives/7871
