从数据闭环到训练闭环:理想汽车世界模型如何重塑自动驾驶AI范式

近期,人工智能领域关于范式转变的讨论日益激烈。强化学习之父Rich Sutton在《体验时代》中指出,AI正从依赖人类标注数据转向体验式学习的新阶段。OpenAI前研究员姚顺雨更明确表示AI已进入“下半场”,强调需要为现实世界任务开发新的评估体系,并寻求超越人类模仿、依赖智能体自我改进的可扩展数据源。在这一宏观背景下,自动驾驶作为AI技术落地的前沿阵地,其范式演进尤为引人注目。

在刚刚落幕的全球计算机视觉顶会ICCV 2025上,理想汽车自动驾驶高级算法专家詹锟发表了题为《世界模型:让我们从数据闭环走向训练闭环》的主题演讲,系统阐述了理想汽车在自动驾驶技术路线上的系统性思考。

从数据闭环到训练闭环:理想汽车世界模型如何重塑自动驾驶AI范式

理想汽车当前的核心辅助驾驶技术LiAuto AD Max,以视觉语言行动模型(VLA)为架构基础,实现了从规则算法到端到端方案的进化。去年,理想率先提出双系统方案——结合端到端模型和视觉语言模型,这一路线已成为行业主流。通过直接输入传感器信号并输出驾驶轨迹,系统能够全量学习人类驾驶行为,使辅助驾驶能力实现显著突破。自端到端方案上线以来,理想在人类接管里程指标上取得了持续进步。

从数据闭环到训练闭环:理想汽车世界模型如何重塑自动驾驶AI范式

然而,当训练数据规模扩展到1000万Clips后,理想团队发现单纯增加数据量的边际效应开始显现,技术提升再次遇到瓶颈。这一现象揭示了自动驾驶AI训练的根本性挑战:许多关键场景的数据天然稀疏,自然采集难以覆盖所有Corner Case,而这些罕见场景恰恰是系统安全性和可靠性的关键测试点。

从数据闭环到训练闭环:理想汽车世界模型如何重塑自动驾驶AI范式

面对这一挑战,理想提出了从“数据闭环”向“训练闭环”的范式转变。传统的数据闭环侧重于数据采集和模型迭代,而训练闭环则构建了一个更完整的系统:不仅包含数据采集,更重要的是建立能够根据训练目标、通过环境生成和反馈进行持续迭代的智能训练环境。这种转变的核心在于,系统的优化目标从“收集更多数据”转变为“达成训练目标”。

从数据闭环到训练闭环:理想汽车世界模型如何重塑自动驾驶AI范式

具体而言,理想的训练闭环架构包含两个核心组件:车端的VLA模型和云端的世界模型训练环境。车端模型具备先验知识和基础驾驶能力,而云端环境则融合了真实世界数据、合成数据以及模型探索生成的数据。通过强化学习体系(包括RLHF、RLVR、RLAIF等范式),系统能够实现持续迭代优化。

这一基于世界模型的庞大系统需要多项关键技术支撑:首先是环境构建能力,包括场景重建、多传感器渲染和多模态生成;其次是智能体构建,涉及交通参与者的行为建模;第三是反馈构建,需要建立全面的评价体系;最后是场景推演能力,确保系统能够处理多样化的驾驶情境。

从数据闭环到训练闭环:理想汽车世界模型如何重塑自动驾驶AI范式

在环境重建方面,理想团队自2023年起持续探索3D高斯泼溅在自动驾驶场景重建中的应用。近期,团队进一步探索了重建与生成相结合的路线,新一代AI系统既保持了重建的稳定性,又具备了生成的泛化能力。随着VGGT等先进三维前馈网络的发展,理想正在研发下一代更依赖生成技术的世界模型渲染系统。

从数据闭环到训练闭环:理想汽车世界模型如何重塑自动驾驶AI范式

今年被ICCV收录的论文《Hierarchy UGP: Hierarchy Unified Gaussian Primitive for Large-Scale Dynamic Scene Reconstruction》体现了理想在该方向的前沿探索。该研究提出了一种由根层、子场景层和图元层组成的层次结构,使用四维空间中定义的高斯图元作为统一表示。这种设计显著提升了模型容量,能够有效建模大规模动态场景。

在仿真系统构建的同时,合成数据的大规模应用成为另一关键技术突破。理想已经能够通过提示词直接生成完整的视频序列和点云数据,这种能力特别适用于处理新法规要求、新地区环境等数据稀缺场景。

从数据闭环到训练闭环:理想汽车世界模型如何重塑自动驾驶AI范式

世界模型的合成数据能力使训练数据配比更加合理,显著提升了辅助驾驶系统在实际道路上的稳定性和泛化能力。正如AI先驱们所预见,在新架构下,训练闭环的效率成为技术迭代的关键驱动力。

从数据闭环到训练闭环:理想汽车世界模型如何重塑自动驾驶AI范式

当现实世界数据接近“耗尽”时,合成数据能力的增强和数据分布配比的优化,为LiAD辅助驾驶能力的持续提升提供了新的动力。新的VLA方案推动了数据缩放定律在自动驾驶场景下的持续延伸:数据规模越大,辅助驾驶能力越强。

自2021年以来,理想汽车自动驾驶团队在学术研究上成果丰硕,累计有32篇论文被顶级会议收录,研究方向从最初的感知BEV端到端任务,逐步扩展到视觉语言模型、视觉语言行动模型和世界模型等前沿领域。本届ICCV大会上,理想团队共有五篇论文入选,展现了在自动驾驶AI范式演进中的持续探索和创新能力。

— 图片补充 —

从数据闭环到训练闭环:理想汽车世界模型如何重塑自动驾驶AI范式

从数据闭环到训练闭环:理想汽车世界模型如何重塑自动驾驶AI范式

从数据闭环到训练闭环:理想汽车世界模型如何重塑自动驾驶AI范式

从数据闭环到训练闭环:理想汽车世界模型如何重塑自动驾驶AI范式

从数据闭环到训练闭环:理想汽车世界模型如何重塑自动驾驶AI范式


关注“鲸栖”小程序,掌握最新AI资讯

本文由鲸栖原创发布,未经许可,请勿转载。转载请注明出处:http://www.itsolotime.com/archives/8588

(0)
上一篇 2025年10月31日 上午11:45
下一篇 2025年10月31日 上午11:51

相关推荐

  • LimiX:结构化数据处理的通用革命,开启工业AI新纪元

    在科幻作家刘慈欣的《超新星纪元》中,一个关于盐和味精供应量的场景深刻揭示了现代工业社会运转的本质——它建立在海量精确数据的处理之上。从生产计划到机器监控,再到电力调度,结构化数据如同社会的神经网络,支撑着工业化便利的每一个环节。这些以固定行列格式组织、关系预先定义的数据,构成了现代社会高效运转的基石。 然而,在人工智能浪潮席卷全球的今天,处理这些最基础的结构…

    2025年11月21日
    200
  • SGLang Model Gateway 0.2:一体化AI原生编排解决方案的突破性实践

    在AI模型部署与推理的复杂生态中,尽管市场上涌现了众多GPU内核优化、推理引擎加速项目以及从传统云原生演进而来的AI网关工具,但真正实现一体化、原生AI编排的解决方案却长期处于空白状态。实际生产环境中,开发者往往需要自行整合多个组件,形成效率低下、维护困难的“缝合怪”系统。Oracle与SGLang团队敏锐地捕捉到这一痛点,近期推出了生产就绪的SGLang …

    2025年10月25日
    100
  • 2025人工智能年度榜单深度解析:从评选标准看AI产业演进趋势

    随着2025年人工智能年度榜单申报进入倒计时阶段,这一已持续八年的行业盛事再次成为科技界关注的焦点。八年间,人工智能技术从实验室走向产业化,从概念验证到规模化应用,榜单的演变轨迹恰恰映射了整个产业的成长脉络。本次评选从企业、产品、人物三大维度设立五类奖项,不仅是对过去一年成就的总结,更是对未来发展趋势的预判。 从企业维度来看,榜单设置了“领航企业”和“潜力创…

    2025年11月15日
    200
  • MiMo-Embodied:全球首个跨具身基座模型的技术突破与产业影响

    在人工智能技术快速演进的当下,具身智能与自动驾驶作为两大前沿领域,长期面临着知识迁移与能力统一的挑战。传统视觉语言模型(VLMs)往往局限于单一场景——要么专注于室内机器人操作,要么聚焦于户外驾驶任务,这种割裂状态严重制约了智能体在动态物理世界中的综合交互能力。近日,小米汽车陈龙团队开源了全球首个打通自动驾驶与具身操作场景的跨具身(X-Embodied)基座…

    2025年11月25日
    400
  • IGGT:统一Transformer突破3D感知瓶颈,实现几何重建与实例理解的首次融合

    在人工智能领域,让机器像人类一样自然地理解三维世界的几何结构与语义内容,一直是极具挑战性的前沿课题。传统方法通常将3D重建(底层几何)与空间理解(高层语义)割裂处理,这种分离不仅导致错误在流程中累积,更严重限制了模型在复杂、动态场景中的泛化能力。近年来,一些新方法尝试将3D模型与特定的视觉语言模型(VLM)进行绑定,但这本质上是一种妥协:模型被限制在预设的语…

    2025年10月31日
    200

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注