华为战略投资极佳视界:世界模型如何重塑自动驾驶与具身智能的数据范式

近日,华为哈勃与华控基金联合完成对物理AI公司极佳视界的亿元级A1轮投资,这是该公司两个月内连续完成的第三轮融资。这一动作不仅标志着华为在自动驾驶和具身智能领域的战略深化,更揭示了世界模型作为下一代AI基础设施的核心价值。

华为战略投资极佳视界:世界模型如何重塑自动驾驶与具身智能的数据范式

极佳视界成立于2023年,是国内首家以“世界模型”为核心定位的纯血物理AI公司。在短短两年内,该公司已构建覆盖自动驾驶世界模型、具身基础模型及世界模型平台的全栈软硬件产品体系。其创始人兼CEO黄冠(清华大学自动化系AI方向博士)在2024年公开演讲中明确指出:所有通用智能都在走向端到端大模型,而世界模型正是未来具身智能最重要的高质量数据来源。这一观点直指当前AI发展的核心瓶颈——高质量数据的稀缺性与成本问题。

华为战略投资极佳视界:世界模型如何重塑自动驾驶与具身智能的数据范式

华为战略投资极佳视界:世界模型如何重塑自动驾驶与具身智能的数据范式

从技术路径来看,极佳视界的核心突破体现在其自动驾驶世界模型DriveDreamer系列。作为全球首个真实世界驱动的自动驾驶世界模型,DriveDreamer通过物理引擎与神经渲染技术,实现了对复杂交通场景的高保真模拟。2024年,该模型升级至4D版本,联合中国科学院自动化研究所、理想汽车等机构,首次利用世界模型实现对4D驾驶场景重建效果的增强。这不仅是技术层面的创新,更意味着自动驾驶开发范式从“数据采集-标注-训练”的传统流程,转向“世界模型生成-仿真验证-闭环迭代”的高效模式。官方数据显示,基于DriveDreamer的解决方案已服务数十家客户,并与多家头部主机厂达成定点合作。

华为战略投资极佳视界:世界模型如何重塑自动驾驶与具身智能的数据范式

华为战略投资极佳视界:世界模型如何重塑自动驾驶与具身智能的数据范式

团队构成进一步强化了极佳视界的技术壁垒。联合创始人兼首席科学家朱政(清华大学自动化系博士后)的代表作SiamRPN系列是深度学习时代最具影响力的目标跟踪算法,其提出的BEVDet已被多家车企采用为3D感知标准方案。另一位联合创始人孙韶言曾任阿里云总监及地平线数据闭环产品线总经理,合伙人毛继明则曾任百度Apollo仿真技术负责人。这种“学术前沿+产业落地”的复合背景,使公司既能保持技术领先性,又能精准对接行业需求。

华为战略投资极佳视界:世界模型如何重塑自动驾驶与具身智能的数据范式

华为此次投资绝非偶然,而是其技术战略的必然延伸。华为智能汽车解决方案BU CEO靳玉志曾明确表示:“我们不会走向VLA(视觉-语言-动作)路径,更看重WA(世界-动作)模型。”这种技术选择背后是对自动驾驶本质的深刻理解:VLA模型需将视觉信息转换为语言再决策,存在信息损耗与延迟;而WA模型通过世界模型直接理解物理状态并输出控制信号,更符合实时性要求。华为提出的WEWA架构(云端世界引擎+车端世界行为模型)正是这一理念的实践,极佳视界的技术恰好能补全其世界引擎的数据生成与仿真能力。

华为战略投资极佳视界:世界模型如何重塑自动驾驶与具身智能的数据范式

从更宏观的布局看,华为在世界模型领域的投入已形成矩阵效应。除自动驾驶外,其与上海交通大学、华中科技大学联合推出的WorldGrow模型,可单卡30分钟生成272㎡的高质量室内场景;此前对具身智能公司千寻智能的投资,则补全了空间智能的感知层。这些动作共同指向一个清晰趋势:华为正在构建以世界模型为基座、覆盖感知-仿真-决策的全栈智能系统。

华为战略投资极佳视界:世界模型如何重塑自动驾驶与具身智能的数据范式

产业影响层面,世界模型的崛起可能引发三重变革:其一,降低AI数据成本,传统自动驾驶数据采集标注成本高达每公里数百元,而世界模型可无限生成标注数据;其二,加速算法迭代,仿真环境允许进行极端场景测试(如事故规避),大幅缩短开发周期;其三,推动具身智能普及,机器人可通过世界模型预训练物理交互能力,减少真实环境试错。

华为战略投资极佳视界:世界模型如何重塑自动驾驶与具身智能的数据范式

然而挑战依然存在:世界模型的物理真实性仍需提升,特别是在光线反射、材质变形等细节;多智能体交互的复杂性尚未完全解决;从仿真到实车的“仿真到现实”差距仍需算法补偿。极佳视界与华为的合作,正是通过产业需求反哺技术演进的重要尝试。

展望未来,随着世界模型精度的持续提升与算力成本的下降,2025-2027年或将迎来规模化应用拐点。届时,自动驾驶开发效率有望提升3-5倍,具身智能训练成本降低60%以上。华为此次投资不仅是资本布局,更是为这场即将到来的范式革命提前落子。


关注“鲸栖”小程序,掌握最新AI资讯

本文来自网络搜集,不代表鲸林向海立场,如有侵权,联系删除。转载请注明出处:http://www.itsolotime.com/archives/7599

(0)
上一篇 2025年11月12日 上午11:41
下一篇 2025年11月12日 下午12:30

相关推荐

  • PyTorch之父Soumith Chintala离职Meta:一个时代的结束与开源AI工具的新征程

    近日,PyTorch创始人兼Meta长期工程师Soumith Chintala宣布将于11月17日正式离职,结束他在Meta长达11年的职业生涯。这一消息迅速在AI社区引发广泛关注,不仅因为Chintala是PyTorch这一全球主流AI框架的核心缔造者,更因其离职标志着开源AI工具发展史上的一个重要节点。本文将从技术影响、行业生态、个人动机及未来展望四个维…

    2025年11月7日
    7900
  • 摩尔线程LiteGS斩获SIGGRAPH Asia银奖:3D高斯溅射技术突破60秒高质量重建极限

    在近期于香港举办的SIGGRAPH Asia 2025国际图形学顶级学术会议上,摩尔线程凭借其自主研发的3D高斯溅射(3DGS)基础库LiteGS,在3DGS重建挑战赛中荣获银奖。这一成就不仅展示了摩尔线程在算法创新与软硬件协同优化方面的深厚实力,也标志着该公司在新一代图形渲染技术领域获得了学术界的高度认可。 3D高斯溅射作为2023年提出的革命性三维场景表…

    2025年12月17日
    16700
  • Cursor崛起之路:揭秘AI编程独角兽的非典型组织哲学与产品战略

    在AI编程工具竞争白热化的当下,Cursor以独特的姿态脱颖而出,其背后不仅是技术创新的胜利,更是一场关于组织文化、人才战略与产品哲学的深刻实验。这家成立不到两年即估值超百亿美元的公司,正通过一系列反常规的实践,重新定义着软件开发的生产力范式。 Cursor的人才招募机制彻底颠覆了传统硅谷公司的招聘逻辑。公司没有固定的职位描述(JD),而是将每位员工转化为“…

    2025年11月11日
    8300
  • VANS模型:从文本到视频的AI推理革命,开启“视频即答案”新纪元

    在人工智能技术日新月异的今天,我们正见证着AI从单纯的信息处理工具向具备深度感知与创造性输出能力的智能体演进。传统AI模型在面对用户查询时,往往局限于生成文本答案,这种交互方式在解释复杂动态过程或视觉化场景时显得力不从心。例如,当用户询问“如何打温莎结”时,文字描述难以精确传达手指的缠绕顺序和力度变化;而面对“电影主角下一秒会做什么”的开放式问题,静态的文字…

    2025年11月22日
    8100
  • 月之暗面Seer引擎:突破LLM强化学习训练瓶颈,实现同步RL效率革命性提升

    在大型语言模型(LLM)快速发展的当下,强化学习(RL)已成为推动模型能力跃迁的核心技术。然而,随着模型规模不断扩大和任务复杂度持续提升,传统RL训练系统在端到端迭代过程中暴露出的性能瓶颈日益凸显,尤其是在生成阶段(rollout phase),资源利用率低、长尾延迟严重等问题严重制约了训练效率的进一步提升。 针对这一行业痛点,月之暗面联合清华大学研究团队近…

    2025年11月27日
    9400

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注