极佳视界GigaWorld-1登顶WorldArena全球榜首,具身智能领域迎来里程碑式突破

近日,极佳视界(GigaAI)在具身智能领域取得系列突破:其全栈自研的具身基础大模型 GigaBrain-0.1 在 RoboChallenge 评测中位列全球榜首;新一代原生范式 GigaBrain-0.5M 在复杂长时程真机任务中实现数小时零失误;首创的“世界-动作模型”GigaWorld-Policy 在推理速度与训练效率上实现数量级提升,任务成功率显著提高。

在这些突破的支撑下,极佳视界的 GigaWorld 系列具身世界模型迎来重要升级。其最新版本 GigaWorld-1 在世界模型领域的权威评测基准 WorldArena 中,综合表现超越多家国际顶尖科技公司与研究机构的模型,位列全球第一,并且是榜单中综合得分率先突破 60 分的具身世界模型。

极佳视界GigaWorld-1登顶WorldArena全球榜首,具身智能领域迎来里程碑式突破

在三大核心评估维度上,GigaWorld-1 展现出显著优势:
* 物理遵循:相比第二名模型,得分大幅提升 16%。
* 3D 准确度:取得接近满分的成绩。
* 视觉质量:同样处于领先地位。

这标志着 GigaWorld-1 在视觉真实性、几何精准度和物理准确性方面达到了新的水平。

极佳视界GigaWorld-1登顶WorldArena全球榜首,具身智能领域迎来里程碑式突破

在严苛评测中脱颖而出

WorldArena 评测基准由清华大学联合多所国内外高校及科研机构的专家共同构建。该基准包含 16 项细分核心指标和 3 大真实应用任务,旨在全面评估具身世界模型的感知、物理理解、空间认知及动作预测等综合能力。

凭借其学术严谨性,WorldArena 吸引了全球多家头部团队参与评测。极佳视界团队的 GigaWorld-1 在竞争中凭借技术实力获得榜首。

极佳视界GigaWorld-1登顶WorldArena全球榜首,具身智能领域迎来里程碑式突破

技术路径:显式动作建模与可微分物理引擎融合

GigaWorld-1 是一款为具身场景设计的动作控制世界模型。它在既有核心架构基础上,引入了显式的动作建模机制以保障视频生成的几何一致性,并创新性地融合可微分物理引擎,以精准模拟和遵循复杂的物理交互过程。

此外,该模型使用了大量高质量真实机器人操作视频数据进行训练,增强了其在开放场景下的泛化能力与动作遵循精度。

团队与技术背景

极佳视界核心团队在计算机视觉、自动驾驶、具身智能等领域拥有深厚积累。团队负责人曾任职于多家知名研究机构与企业,并多次在权威国际赛事中取得领先成绩。团队其他成员包括在相关领域拥有丰富研究经验与产业实践经验的专家。

公司技术路径聚焦于“世界模型”与“具身大脑”的协同发展,并在相关国际评测中均取得了领先成果。

世界模型平台 GigaWorld:物理世界的数字沙盒

GigaWorld 是一个世界模型平台,旨在模拟物理世界的运行规律,并生成高保真的合成数据。与传统的仿真器相比,它通过对世界进行几何一致、物理准确的建模,能够生成可控且多样化的具身交互数据,实现“数据放大”。基于此数据训练的视觉-语言-动作模型,在新纹理、新视角和新物体位置等泛化维度上,性能获得了显著提升。

该平台在效率上实现了数量级的提升。在具身智能领域,GigaWorld-0 是首个在高水平具身基模中验证世界模型核心价值的工作;在自动驾驶领域,其 DriveDreamer 系列也是最早将世界模型应用于物理世界感知与预测的开创性工作之一。

具身基础模型 GigaBrain:机器人的通用大脑

GigaBrain 是一个端到端的视觉-语言-动作基础模型。在全球一项大规模的真机评测比赛中,其开源版本 GigaBrain-0.1 取得了领先的成绩。

极佳视界GigaWorld-1登顶WorldArena全球榜首,具身智能领域迎来里程碑式突破

后续发布的 GigaBrain-0.5M* 模型,采用了基于世界模型的强化学习范式,通过迭代式闭环训练流程实现高效学习与自我进化。在面对折纸盒、制备咖啡、折叠衣物等多阶段、需精细感知与持续决策的复杂长时程任务时,该模型实现了接近百分之百的任务成功率,并能稳定复现成功的执行轨迹,展现了出色的策略鲁棒性。

极佳视界GigaWorld-1登顶WorldArena全球榜首,具身智能领域迎来里程碑式突破

全面开源与社区影响

GigaWorld-1 的核心代码与部分数据集已对外开源。该开源项目作为官方基线模型,为后续的国际学术挑战赛提供支持。

开源发布后,其在开源社区平台上的下载量迅速增长,显示出学术界与工业界对其的关注与认可。

  • 挑战赛官网:https://gigaai-research.github.io/GigaBrain-Challenge-2026/
  • 开源代码:https://github.com/open-gigaai/CVPR-2026-Workshop-WM-Track
  • 开源模型与数据:https://huggingface.co/collections/open-gigaai/cvpr-2026-worldmodel-track

极佳视界GigaWorld-1登顶WorldArena全球榜首,具身智能领域迎来里程碑式突破 极佳视界GigaWorld-1登顶WorldArena全球榜首,具身智能领域迎来里程碑式突破

技术演进与行业贡献

从模型架构到数据引擎,该系列工作持续推动着技术边界的拓展:

  • GigaWorld-0:首个验证了世界模型生成的数据能有效提升真实物理机器人性能的工作,其开源代码获得了广泛关注。
  • GigaWorld-1:在世界模型权威评测榜单 WorldArena 中综合得分领先,登顶榜首。
  • GigaWorld-Policy:作为世界-动作模型,在推理速度、训练效率和任务成功率上实现了显著提升,推动了由世界模型驱动的新范式发展。

从数据生成、闭环仿真到策略模型,这一系列迭代致力于为通用人工智能融入物理世界构建坚实的数据与架构基础。


关注“鲸栖”小程序,掌握最新AI资讯

本文来自网络搜集,不代表鲸林向海立场,如有侵权,联系删除。转载请注明出处:https://www.itsolotime.com/archives/27960

(0)
上一篇 1天前
下一篇 5小时前

相关推荐

  • 字节豆包Seed 2.0 Mini实测:轻量级AI模型如何实现成本效益与性能平衡?

    字节跳动近期正式发布了Seed 2.0系列,该系列针对大规模生产环境进行了系统性优化,旨在处理真实世界中的复杂任务。通过提供Pro、Lite、Mini及Code/Preview等全系列尺寸,该系列旨在为不同规模与复杂度的应用场景提供专业级支持。 本次评测的Doubao-Seed-2.0-mini是该系列的轻量级版本,面向低时延、高并发与成本敏感场景,强调快速…

    2026年2月25日
    1.1K00
  • 具身智能产业激辩实录:架构革命、数据路径与落地挑战的深度剖析

    2025年被业界普遍视为具身智能的爆发元年,这一领域正经历从概念验证到产业落地的关键转折。在北京鼎好大厦举行的智源具身2025 OpenDay现场,30余家顶尖具身智能企业的创始人、技术负责人齐聚一堂,围绕行业核心议题展开了长达四小时的深度辩论。这场汇聚产学研用各方的对话,不仅揭示了当前行业的技术分歧,更勾勒出未来发展的清晰路径。 在智源研究院院长王仲远的主…

    2025年11月21日
    22400
  • 硅谷AI圈中文现象深度解析:从人才流动到开源模型崛起的范式转移

    硅谷AI领域近期出现了一个引人注目的文化现象:中文正在成为顶尖AI圈层的通用语言。这一现象不仅体现在人才聚集层面,更延伸至模型开发与产业选择,反映出全球AI力量格局的深刻变化。本文将从人才结构、开源模型竞争力、产业迁移三个维度进行系统分析,揭示这一现象背后的技术逻辑与市场动因。 **一、人才结构的范式转移:中文成为AI精英的隐性门槛** 传统认知中,英语是科…

    2025年11月1日
    29500
  • LimiX:结构化数据处理的通用革命,开启工业AI新纪元

    在科幻作家刘慈欣的《超新星纪元》中,一个关于盐和味精供应量的场景深刻揭示了现代工业社会运转的本质——它建立在海量精确数据的处理之上。从生产计划到机器监控,再到电力调度,结构化数据如同社会的神经网络,支撑着工业化便利的每一个环节。这些以固定行列格式组织、关系预先定义的数据,构成了现代社会高效运转的基石。 然而,在人工智能浪潮席卷全球的今天,处理这些最基础的结构…

    2025年11月21日
    22400
  • 华为天才少年创业:全球首个虚实融合实时交互视频模型X1,让童年幻想“滚球兽”走进现实

    还记得童年的那个愿望吗? 随着《数码宝贝》进化曲的响起,屏幕前的你我或许都曾幻想过:要是那只从数码蛋中破壳而出的滚球兽,真的可以从电视屏幕那端跳出来,就好了。 彼时,我们只能将这种天马行空的「美梦」寄希望于「次元裂缝」的开启。再后来,增强现实(AR)技术曾一度带来了希望,但几经潮起潮落,结果仍停留在「预先制作的内容叠加」层面,数字角色无法真正感知环境。 而现…

    2026年2月9日
    17500