华为战略投资极佳视界:世界模型如何重塑自动驾驶与具身智能的数据范式

近日,华为哈勃与华控基金联合完成对物理AI公司极佳视界的亿元级A1轮投资,这是该公司两个月内连续完成的第三轮融资。这一动作不仅标志着华为在自动驾驶和具身智能领域的战略深化,更揭示了世界模型作为下一代AI基础设施的核心价值。

华为战略投资极佳视界:世界模型如何重塑自动驾驶与具身智能的数据范式

极佳视界成立于2023年,是国内首家以“世界模型”为核心定位的纯血物理AI公司。在短短两年内,该公司已构建覆盖自动驾驶世界模型、具身基础模型及世界模型平台的全栈软硬件产品体系。其创始人兼CEO黄冠(清华大学自动化系AI方向博士)在2024年公开演讲中明确指出:所有通用智能都在走向端到端大模型,而世界模型正是未来具身智能最重要的高质量数据来源。这一观点直指当前AI发展的核心瓶颈——高质量数据的稀缺性与成本问题。

华为战略投资极佳视界:世界模型如何重塑自动驾驶与具身智能的数据范式

华为战略投资极佳视界:世界模型如何重塑自动驾驶与具身智能的数据范式

从技术路径来看,极佳视界的核心突破体现在其自动驾驶世界模型DriveDreamer系列。作为全球首个真实世界驱动的自动驾驶世界模型,DriveDreamer通过物理引擎与神经渲染技术,实现了对复杂交通场景的高保真模拟。2024年,该模型升级至4D版本,联合中国科学院自动化研究所、理想汽车等机构,首次利用世界模型实现对4D驾驶场景重建效果的增强。这不仅是技术层面的创新,更意味着自动驾驶开发范式从“数据采集-标注-训练”的传统流程,转向“世界模型生成-仿真验证-闭环迭代”的高效模式。官方数据显示,基于DriveDreamer的解决方案已服务数十家客户,并与多家头部主机厂达成定点合作。

华为战略投资极佳视界:世界模型如何重塑自动驾驶与具身智能的数据范式

华为战略投资极佳视界:世界模型如何重塑自动驾驶与具身智能的数据范式

团队构成进一步强化了极佳视界的技术壁垒。联合创始人兼首席科学家朱政(清华大学自动化系博士后)的代表作SiamRPN系列是深度学习时代最具影响力的目标跟踪算法,其提出的BEVDet已被多家车企采用为3D感知标准方案。另一位联合创始人孙韶言曾任阿里云总监及地平线数据闭环产品线总经理,合伙人毛继明则曾任百度Apollo仿真技术负责人。这种“学术前沿+产业落地”的复合背景,使公司既能保持技术领先性,又能精准对接行业需求。

华为战略投资极佳视界:世界模型如何重塑自动驾驶与具身智能的数据范式

华为此次投资绝非偶然,而是其技术战略的必然延伸。华为智能汽车解决方案BU CEO靳玉志曾明确表示:“我们不会走向VLA(视觉-语言-动作)路径,更看重WA(世界-动作)模型。”这种技术选择背后是对自动驾驶本质的深刻理解:VLA模型需将视觉信息转换为语言再决策,存在信息损耗与延迟;而WA模型通过世界模型直接理解物理状态并输出控制信号,更符合实时性要求。华为提出的WEWA架构(云端世界引擎+车端世界行为模型)正是这一理念的实践,极佳视界的技术恰好能补全其世界引擎的数据生成与仿真能力。

华为战略投资极佳视界:世界模型如何重塑自动驾驶与具身智能的数据范式

从更宏观的布局看,华为在世界模型领域的投入已形成矩阵效应。除自动驾驶外,其与上海交通大学、华中科技大学联合推出的WorldGrow模型,可单卡30分钟生成272㎡的高质量室内场景;此前对具身智能公司千寻智能的投资,则补全了空间智能的感知层。这些动作共同指向一个清晰趋势:华为正在构建以世界模型为基座、覆盖感知-仿真-决策的全栈智能系统。

华为战略投资极佳视界:世界模型如何重塑自动驾驶与具身智能的数据范式

产业影响层面,世界模型的崛起可能引发三重变革:其一,降低AI数据成本,传统自动驾驶数据采集标注成本高达每公里数百元,而世界模型可无限生成标注数据;其二,加速算法迭代,仿真环境允许进行极端场景测试(如事故规避),大幅缩短开发周期;其三,推动具身智能普及,机器人可通过世界模型预训练物理交互能力,减少真实环境试错。

华为战略投资极佳视界:世界模型如何重塑自动驾驶与具身智能的数据范式

然而挑战依然存在:世界模型的物理真实性仍需提升,特别是在光线反射、材质变形等细节;多智能体交互的复杂性尚未完全解决;从仿真到实车的“仿真到现实”差距仍需算法补偿。极佳视界与华为的合作,正是通过产业需求反哺技术演进的重要尝试。

展望未来,随着世界模型精度的持续提升与算力成本的下降,2025-2027年或将迎来规模化应用拐点。届时,自动驾驶开发效率有望提升3-5倍,具身智能训练成本降低60%以上。华为此次投资不仅是资本布局,更是为这场即将到来的范式革命提前落子。


关注“鲸栖”小程序,掌握最新AI资讯

本文来自网络搜集,不代表鲸林向海立场,如有侵权,联系删除。转载请注明出处:http://www.itsolotime.com/archives/7599

(0)
上一篇 2025年11月12日 上午11:41
下一篇 2025年11月12日 下午12:30

相关推荐

  • 掩码扩散语言模型:超越自回归范式,解锁推理与采样的新潜能

    在自然语言处理领域,自回归(AR)语言模型长期占据主导地位,其从左到右顺序生成token的方式已成为标准范式。然而,这种单向生成机制在推理效率、并行化能力和任务适应性方面存在固有局限。近年来,掩码扩散语言模型(MDLM)作为一种新兴架构,通过随机遮蔽序列位置并学习填充被掩码区域,为语言建模提供了全新的视角。本文将从技术原理、性能表现、创新应用三个维度,深入分…

    2025年10月30日
    18800
  • Game-TARS:从游戏玩家到通用计算机用户的革命性跨越——基于统一键盘鼠标动作空间的智能体范式

    在人工智能与游戏交互的交叉领域,一项突破性进展正在重新定义智能体的能力边界。字节跳动Seed团队最新发布的Game-TARS通用型游戏智能体,不仅实现了在《我的世界》、《神庙逃亡》、《星露谷》等多样化游戏环境中的卓越表现,更通过零样本迁移能力在未见过的3D网页游戏中展现惊人适应性。 这一成就的背后,是团队对智能体交互范式的根本性重构——从传统的函数调用模式转…

    2025年10月30日
    17000
  • 英伟达重磅开源Nemotron 3 Super:1200亿参数专为Agent打造,性能直逼Claude Opus 4.6

    全球市值领先的英伟达,正式进军OpenClaw领域。其最新发布的开源模型Nemotron 3 Super,专为大规模AI智能体打造。 该模型拥有1200亿参数,采用120亿激活参数,支持100万token的上下文长度。据称,其推理速度提升高达3倍,吞吐量提升达5倍。 Nemotron 3 Super采用了创新的Mamba-MoE混合架构,旨在解决多智能体协同…

    2026年3月12日
    18400
  • 强化学习赋能文本到3D生成:从算法突破到能力边界探索

    在人工智能生成内容领域,文本到3D生成技术正成为继大语言模型和文生图之后的下一个前沿阵地。这一技术旨在将自然语言描述转化为具有复杂几何结构、纹理细节和物理合理性的三维模型,其应用潜力覆盖数字孪生、游戏开发、工业设计、虚拟现实等多个关键领域。然而,与相对成熟的文本到2D图像生成相比,文本到3D生成面临着更为严峻的技术挑战:三维数据本身具有更高的维度复杂性、更强…

    2025年12月19日
    22900
  • Claude Skills实战指南:5大高效技能组合,打造你的AI自动化工作流

    一、Anthropic 官方 Skills(必装) 🔗 项目地址:https://github.com/anthropics/skills 这是Claude Skills的“官方基座”,也是我建议所有人第一个安装的Skills集合。 为什么一定要装?* 官方最佳实践:你能看到Anthropic官方是如何设计一个「可维护、可扩展、可组合」的Skill。* 覆盖…

    2026年1月29日
    41000

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注