从虚拟生成到真实复刻:如视Argus 1.0如何用空间大模型重构物理世界

在人工智能领域,世界模型(World Model)近期成为炙手可热的研究方向,多个顶尖实验室相继展示出仅凭单张图片或简短文字描述即可生成交互式3D虚拟世界的惊人演示。这些成果无疑彰显了AI在内容生成方面的巨大潜力,引发行业广泛关注。然而,一个根本性问题随之浮现:这些由模型“想象”出的虚拟世界,其构成元素大多源于数据训练中的模式学习与合成,缺乏对真实物理空间的精确映射与度量。

如果我们不满足于创造虚构的数字场景,而是希望将现实世界——包括住宅、办公场所、工业设施乃至整个城市——完整、精确地转化为可交互、可计算的3D数字孪生体,这需要怎样的技术路径?这正是如视(Realsee)发布全球首个支持全景图输入的空间大模型Argus 1.0所要回答的核心命题。与主流虚拟生成路线不同,Argus 1.0代表了一条“真实复刻”的技术路径,其目标并非虚构世界,而是高精度还原真实空间。

从虚拟生成到真实复刻:如视Argus 1.0如何用空间大模型重构物理世界

Argus 1.0的技术突破在于,它能够以毫秒级速度,从单张或多张全景或普通图像中,同步推理出带有绝对尺度的相机位姿、深度图及点云数据。这一能力标志着从2D视觉信息到3D空间理解的重大跨越,为大规模空间数字化提供了高效桥梁。其背后,是如视自2017年以来围绕“空间智能”构建的深厚技术积累与战略布局。

任何强大模型的诞生都非空中楼阁,Argus 1.0的根基深植于如视独特的“数字空间-算法-行业应用”飞轮循环体系。这一体系的核心驱动力,是如视通过多年实践构建的全球最大真实空间数据库。截至2025年9月,该数据库已积累超过5300万套数字空间数据,覆盖面积突破44亿平方米。如视副总裁、首席科学家潘慈辉博士指出,这一海量、高质量的真实数据资产,是算法持续迭代的根本燃料。

从虚拟生成到真实复刻:如视Argus 1.0如何用空间大模型重构物理世界

数据规模构筑了护城河的宽度,而数据质量则决定了其深度。Argus 1.0的技术突破,很大程度上得益于如视坚持自研硬件与算法协同的技术路线,从而确保了数据“完备且一致”的高标准。通过自研的伽罗华(Galois)系列3D激光扫描仪(如P4型号可直出3亿像素超高清全景图,图像与点云平均匹配误差小于2像素),如视在数据采集源头实现了像素级精度的对齐。这种严格标定、高度一致的真实数据对,为模型学习准确深度与绝对尺度提供了可靠前提,也是其性能超越同类算法的关键养料。

从虚拟生成到真实复刻:如视Argus 1.0如何用空间大模型重构物理世界

在强大数据飞轮的支撑下,如视研发团队以应用为导向进行底层创新。公司年均研发投入超2亿元人民币,持续耕耘使其在学术与产品层面均获国际认可:研究成果多次入选ICCV、CVPR等顶级会议;硬件产品连续三年斩获德国红点设计大奖。这些积累最终汇聚于Argus 1.0的诞生。

从技术命名上即可窥见其演进脉络:如视早期单目深度估计算法命名为Cyclops(独眼巨人),象征从单一视角推测深度;而Argus(百眼巨人)则寓意模型实现了从“单视”到“多视全局一致性”的跨越。基于Transformer架构构建的Argus 1.0,通过近百万套真实高清空间数据训练,在兼容性、实时性与生成质量三大维度实现行业突破。

兼容性方面,Argus 1.0是业界首个且唯一支持全景图输入的深度推测大模型,同时广泛兼容单张/多张普通照片及AI生成图像,具备强大的多源适应能力。

从虚拟生成到真实复刻:如视Argus 1.0如何用空间大模型重构物理世界

这一特性直击VR内容生产痛点,潘慈辉博士表示,它能显著降低从全景图到VR的处理门槛,提升效率,使低成本、高效率的3D空间复刻成为可能。

实时性与一致性方面,Argus 1.0实现了毫秒级全局重建。相较于此前需分步处理深度推测与位姿拼接的流程,新模型可一步到位,同步输出带有绝对尺度的相机位姿、深度图及点云,极大提升了重建效率与全局一致性。

从虚拟生成到真实复刻:如视Argus 1.0如何用空间大模型重构物理世界

生成质量上,模型得益于高质量训练数据与Transformer架构的泛化能力,在处理玻璃、镜面等传统难题时表现稳健,输出结果在细节还原与尺度准确性上达到业界领先水平。

Argus 1.0的发布,不仅标志着如视在空间智能领域从数据积累到算法创新的闭环形成,更预示着一个新时代的开启:当AI从“想象虚拟”转向“复刻真实”,物理世界与数字世界的融合将进入高精度、高效率的新阶段。其应用前景广阔,从房产、家装、零售到智慧城市、工业运维,任何需要空间数字化与可视化的场景均可受益。随着技术迭代与生态拓展,空间大模型有望成为驱动产业数字化转型的核心引擎之一,重新定义我们感知、交互与改造现实世界的方式。

— 图片补充 —

从虚拟生成到真实复刻:如视Argus 1.0如何用空间大模型重构物理世界

从虚拟生成到真实复刻:如视Argus 1.0如何用空间大模型重构物理世界

从虚拟生成到真实复刻:如视Argus 1.0如何用空间大模型重构物理世界

从虚拟生成到真实复刻:如视Argus 1.0如何用空间大模型重构物理世界


关注“鲸栖”小程序,掌握最新AI资讯

本文来自网络搜集,不代表鲸林向海立场,如有侵权,联系删除。转载请注明出处:http://www.itsolotime.com/archives/7223

(0)
上一篇 2025年11月19日 上午11:50
下一篇 2025年11月19日 下午12:04

相关推荐

  • AI周报:阿里通义语音模型升级、腾讯开源2B小模型、Qwen3-VL多模态检索新突破

    1月5日 【闭源】 阿里通义发布语音合成模型 CosyVoice-v3-flash,新增24个音色以覆盖多元场景需求。新增音色包括:* 方言类:龙嘉怡、龙老铁* 出海营销类* 诗词朗诵类:龙飞* 语音助手类:龙小淳、龙小夏、YUMI* 社交陪伴类:龙橙、龙泽、龙哲、龙颜、龙星、龙天、龙婉、龙嫣、龙菲菲、龙浩* 有声书类:龙三叔、龙媛、龙悦、龙修、龙楠* 新闻…

    2026年1月12日
    4700
  • Video-As-Prompt:统一语义控制新范式,开启视频生成“克隆”时代

    在当前的AI视频生成领域,实现抽象语义的精确控制一直是个技术难题。无论是复刻Labubu特效、重现吉卜力风格,还是模仿希区柯克运镜,这些依赖高层次语义理解的创作任务,往往因缺乏统一的条件表征而难以实现。传统方法通常采用两种路径:一是针对每种语义单独训练LoRA模型,二是为特定语义类别设计专用架构。然而,前者面临语义条件无穷无尽、模型复杂度爆炸、泛化能力缺失的…

    2025年11月18日
    8400
  • 智谱冲刺全球大模型第一股:IPO募资43亿港元,GLM-4.7登顶开源与国产双榜

    Jay 发自 凹非寺 全球大模型第一股,进入最后冲刺阶段。 智谱AI正式启动公开招股,股票代码2513。公司预计将于2026年1月8日在香港交易所主板挂牌上市。 根据招股文件披露,本次IPO预计募集资金总额约43亿港元,上市后市值预计将超过511亿港元。 核心信息如下—— 股票名称: 智谱 股份代号: 2513 预募资总额:约43亿港元 IPO预估值:超51…

    2025年12月30日
    23400
  • 美国启动“创世纪计划”:AI与国家级科研体系的深度融合与战略意义

    近日,美国能源部联合OpenAI、谷歌、微软、英伟达等24家顶尖科技企业,正式启动了名为“创世纪计划”的国家级人工智能战略合作项目。这一计划被外界广泛称为“AI曼哈顿计划”,标志着美国政府与科技巨头在人工智能领域的合作进入全新阶段,旨在将最前沿的AI技术系统性地应用于国家实验室的科研体系,加速可控核聚变、量子计算、材料科学、气候模拟等关键领域的科学突破。 从…

    2025年12月19日
    22200
  • 从数据闭环到训练闭环:理想汽车世界模型如何重塑自动驾驶AI范式

    近期,人工智能领域关于范式转变的讨论日益激烈。强化学习之父Rich Sutton在《体验时代》中指出,AI正从依赖人类标注数据转向体验式学习的新阶段。OpenAI前研究员姚顺雨更明确表示AI已进入“下半场”,强调需要为现实世界任务开发新的评估体系,并寻求超越人类模仿、依赖智能体自我改进的可扩展数据源。在这一宏观背景下,自动驾驶作为AI技术落地的前沿阵地,其范…

    2025年10月31日
    7600

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注