近日,华为哈勃与华控基金联合完成对物理AI公司极佳视界的亿元级A1轮投资,这是该公司两个月内连续完成的第三轮融资。这一动作不仅标志着华为在自动驾驶和具身智能领域的战略深化,更揭示了世界模型作为下一代AI基础设施的核心价值。

极佳视界成立于2023年,是国内首家以“世界模型”为核心定位的纯血物理AI公司。在短短两年内,该公司已构建覆盖自动驾驶世界模型、具身基础模型及世界模型平台的全栈软硬件产品体系。其创始人兼CEO黄冠(清华大学自动化系AI方向博士)在2024年公开演讲中明确指出:所有通用智能都在走向端到端大模型,而世界模型正是未来具身智能最重要的高质量数据来源。这一观点直指当前AI发展的核心瓶颈——高质量数据的稀缺性与成本问题。


从技术路径来看,极佳视界的核心突破体现在其自动驾驶世界模型DriveDreamer系列。作为全球首个真实世界驱动的自动驾驶世界模型,DriveDreamer通过物理引擎与神经渲染技术,实现了对复杂交通场景的高保真模拟。2024年,该模型升级至4D版本,联合中国科学院自动化研究所、理想汽车等机构,首次利用世界模型实现对4D驾驶场景重建效果的增强。这不仅是技术层面的创新,更意味着自动驾驶开发范式从“数据采集-标注-训练”的传统流程,转向“世界模型生成-仿真验证-闭环迭代”的高效模式。官方数据显示,基于DriveDreamer的解决方案已服务数十家客户,并与多家头部主机厂达成定点合作。


团队构成进一步强化了极佳视界的技术壁垒。联合创始人兼首席科学家朱政(清华大学自动化系博士后)的代表作SiamRPN系列是深度学习时代最具影响力的目标跟踪算法,其提出的BEVDet已被多家车企采用为3D感知标准方案。另一位联合创始人孙韶言曾任阿里云总监及地平线数据闭环产品线总经理,合伙人毛继明则曾任百度Apollo仿真技术负责人。这种“学术前沿+产业落地”的复合背景,使公司既能保持技术领先性,又能精准对接行业需求。

华为此次投资绝非偶然,而是其技术战略的必然延伸。华为智能汽车解决方案BU CEO靳玉志曾明确表示:“我们不会走向VLA(视觉-语言-动作)路径,更看重WA(世界-动作)模型。”这种技术选择背后是对自动驾驶本质的深刻理解:VLA模型需将视觉信息转换为语言再决策,存在信息损耗与延迟;而WA模型通过世界模型直接理解物理状态并输出控制信号,更符合实时性要求。华为提出的WEWA架构(云端世界引擎+车端世界行为模型)正是这一理念的实践,极佳视界的技术恰好能补全其世界引擎的数据生成与仿真能力。

从更宏观的布局看,华为在世界模型领域的投入已形成矩阵效应。除自动驾驶外,其与上海交通大学、华中科技大学联合推出的WorldGrow模型,可单卡30分钟生成272㎡的高质量室内场景;此前对具身智能公司千寻智能的投资,则补全了空间智能的感知层。这些动作共同指向一个清晰趋势:华为正在构建以世界模型为基座、覆盖感知-仿真-决策的全栈智能系统。

产业影响层面,世界模型的崛起可能引发三重变革:其一,降低AI数据成本,传统自动驾驶数据采集标注成本高达每公里数百元,而世界模型可无限生成标注数据;其二,加速算法迭代,仿真环境允许进行极端场景测试(如事故规避),大幅缩短开发周期;其三,推动具身智能普及,机器人可通过世界模型预训练物理交互能力,减少真实环境试错。

然而挑战依然存在:世界模型的物理真实性仍需提升,特别是在光线反射、材质变形等细节;多智能体交互的复杂性尚未完全解决;从仿真到实车的“仿真到现实”差距仍需算法补偿。极佳视界与华为的合作,正是通过产业需求反哺技术演进的重要尝试。
展望未来,随着世界模型精度的持续提升与算力成本的下降,2025-2027年或将迎来规模化应用拐点。届时,自动驾驶开发效率有望提升3-5倍,具身智能训练成本降低60%以上。华为此次投资不仅是资本布局,更是为这场即将到来的范式革命提前落子。
关注“鲸栖”小程序,掌握最新AI资讯
本文由鲸栖原创发布,未经许可,请勿转载。转载请注明出处:http://www.itsolotime.com/archives/7599
