LeCun领衔AI革命:世界模型挑战Next-token范式,构建真实世界智能体

自从图灵奖得主 Yann LeCun 离开 Meta 创立 AMI Labs(Advanced Machine Intelligence)以来,这家新公司便引发了业界的高度关注。本周,他们终于确认了核心方向:开发所谓的「世界模型(world models)」,以此构建能够理解现实世界的智能系统。

LeCun领衔AI革命:世界模型挑战Next-token范式,构建真实世界智能体

一直以来,LeCun 都对现有大语言模型的发展持怀疑态度,认为仅靠预测下一个 token 的生成式模型无法真正做到理解现实世界。他提出了世界模型这一不同路径,一种能够准确反映现实动态的新型人工智能架构。这类全新的智能系统,应同时具备四项关键能力:

  • 理解真实世界;
  • 拥有持久记忆;
  • 能够进行推理与规划;
  • 可控且安全。

这一愿景背后,直指当前大模型路线的一个核心局限。

现实世界的数据主要来自摄像头与各类传感器,其特征是连续、高维且充满噪声。过去几年中,基于自监督学习、以预测未来为目标的生成式模型,在语言领域取得巨大成功。然而,当这一路径被直接套用到真实世界的感知数据上时,却会遭遇根本性挑战,因为现实世界中,大量细节本身就是不可预测的。

AMI Labs 给出的答案是:不再执着于逐像素生成现实,而是构建世界模型,让模型学会对真实世界传感器数据进行抽象建模,过滤掉不可预测的噪声信息,并在更高层次的表征空间中进行预测与推理。

在此基础上,AMI Labs 进一步提出带动作条件的世界模型(action-conditioned world models)。这种模型能够预估智能体采取某个行动后可能带来的结果,并在安全约束之内规划行动序列,从而完成具体任务。这也意味着,其目标不只是理解世界,而是让 AI 能够在真实世界中可靠地行动。

因此,AMI Labs 的应用方向也高度聚焦在对可靠性、可控性和安全性要求极高的领域,包括工业流程控制、自动化系统、可穿戴设备、机器人与医疗健康等场景。

LeCun领衔AI革命:世界模型挑战Next-token范式,构建真实世界智能体

值得一提的是,在业界另一条技术路线中,LeCun 也开始发挥更广泛的影响力。近日,硅谷初创公司 Logical Intelligence 任命 Yann LeCun 为其技术研究委员会创始主席。

LeCun领衔AI革命:世界模型挑战Next-token范式,构建真实世界智能体

近日,该公司推出了一款名为 Kona 的能量-推理模型,并宣称其性能比 OpenAI 的 GPT-5 和谷歌的 Gemini 等大语言模型更准确,功耗也更低。Kona 走的技术路线也是不同于 next token 预测范式,而是一种基于能量的推理模型(EBRM),它通过根据约束条件进行评分来验证和优化解决方案,从而找到能量最低(最一致)的结果。

有意思的是,这一路线与 Yann LeCun 长期以来倡导的思路高度一致。LeCun 多次批评大语言模型依赖 next-token 预测的方式本质上是在猜答案,而真正的智能应建立在目标驱动与能量最小化的机制之上,让模型在约束与物理一致性的框架中寻找最优解。

无论是 Logical Intelligence 的能量推理模型,还是 AMI Labs 正在推进的世界模型,本质上都指向同一个方向:跳出语言生成范式,转向能够理解、预测并作用于真实世界的智能系统。而这背后,或许正是 LeCun 选择离开 Meta 的重要原因之一。

在他看来,如今整个 AI 行业几乎被大语言模型所占据。在硅谷,所有公司都在做同一件事,挖同一条战壕,彼此争夺工程师,却很少有人敢真正走一条不同的路,因为一旦偏离主流方向,就可能在竞争中落后。Meta 同样选择了全面押注大语言模型。这或许是一个合理的商业决策,但并不是 LeCun 所感兴趣的研究方向。

在他看来,如果一个系统无法提前预测自身行为可能带来的后果,就无法构建真正的智能体系统(agentic systems)。正如人类在现实世界中行动,是因为能够预见行为的结果,并据此进行规划与决策,这种能力,才是智能的基础。

顶尖科学家入局,「世界模型」赛道吸引 VC 争抢

构建连接 AI 与现实世界的基础模型,已经成为当下 AI 领域最令人兴奋的探索方向之一。无论是否已经拥有成熟产品,这一赛道都正在吸引顶尖科学家和资金雄厚的投资者持续加码。

比如由 AI 先驱李飞飞创立的 World Labs,在结束隐形融资阶段后不久便跻身「独角兽」行列,而在其推出首款产品 Marble——能够生成符合物理规律的 3D 世界后,更是估值飙升,成为资本新宠。据报道,目前该公司正在洽谈新一轮融资,估值达 50 亿美元。

毫无疑问,风投机构(VC)也同样渴望投资 LeCun,这也进一步佐证了前段时间传出的,关于 AMI Labs 可能正以 35 亿美元估值进行融资传言的可信度。据报道,正在与这家初创公司洽谈的风投机构包括 Cathay Innovation、Greycroft,以及 LeCun 担任顾问的 Hiro Capital。此外,其他潜在投资者还包括 20VC、Bpifrance、Daphni 和 HV Capital。

其实无论谁出资,投资者或许需要注意一个重要细节:正如 LeCun 所明确指出的,他是 AMI 的执行董事长,而非首席执行官(CEO)。实际上,这一职位是由 Alex LeBrun 担任,他此前是 Nabla 的联合创始人兼首席执行官,而 Nabla 是一家在巴黎和纽约均设有办事处的医疗 AI 初创公司。

LeCun领衔AI革命:世界模型挑战Next-token范式,构建真实世界智能体

Alex LeBrun 之所以从 Nabla 转任 AMI,源于 Nabla 去年 12 月宣布的一项合作项目。据悉,Nabla 致力于开发用于临床护理的 AI 助手,而 LeCun 一直是其顾问。因此,作为交换,Nabla 获得了对 AMI 世界模型的「优先访问权」,其董事会也支持 Alex LeBrun 从 CEO 转任首席 AI 科学家兼董事长,从而为他在 AMI 担任新职务铺平了道路。

作为 AMI Labs 的 CEO,LeBrun 身边有着许多熟悉面孔。此前,他创办的上一家公司 Wit.ai 被 Meta 收购后,他便在 LeCun 的领导下在 Meta 的 AI 研究实验室 FAIR 工作。此外,据传去年 12 月卸任 Meta 欧洲区副总裁一职的 Laurent Solly 也将加入 AMI Labs。

其实,AMI Labs 与 Meta 之间的人才重叠可能远不止于此。据 LeCun 透露,前雇主 Meta 很可能成为 AMI 的首个客户。不过,他也曾公开批评过 Meta 在 Mark Zuckerberg 领导下所做出的部分战略选择。甚至,从更广泛的角度来讲,在外界看来,AMI Labs 是对大语言模型 (LLM) 的一种逆向投资。

在 LeCun 看来,LLM 的局限性包括幻觉等问题,而这在医疗等领域是一个严重隐忧,LeBrun 对此也深有体会,他曾在接受媒体采访时提到,他接受这份工作的一个重要原因是希望将世界模型应用于医疗健康领域。「医疗健康是我的心血之作,我们也清楚目前哪些问题我们无法解决,我们希望 AI 的这一新兴分支能够帮助我们在医疗健康领域超越目前的局限。」

不过,这家初创公司也将目光投向了其他高风险的应用领域。正如官网所宣称的那样:「AMI Labs 将致力于推进 AI 研究,并开发那些对可靠性、可控性和安全性要求极高的应用,特别是在工业过程控制、自动化、可穿戴设备、机器人技术、医疗健康以及更多领域。」

该初创公司计划将其技术授权给行业合作伙伴以用于实际应用,但同时也表示,计划「通过公开出版物和开源项目,与全球学术研究界」共同构建 AI 的未来。

LeCun 表示,他计划保留在纽约大学(NYU)的教授职位,他目前在那里每年教授一门课程,并指导博士生和博士后研究员。

这意味着这位出生于法国的研究人员将继续常驻纽约,但他也透露,AMI Labs「将成为一家总部位于巴黎的全球性公司」。


关注“鲸栖”小程序,掌握最新AI资讯

本文来自网络搜集,不代表鲸林向海立场,如有侵权,联系删除。转载请注明出处:http://www.itsolotime.com/archives/18856

(0)
上一篇 2026年1月24日 上午11:54
下一篇 2026年1月24日 下午12:38

相关推荐

  • 多模型路由时代:从OpenRouter《State of AI》报告看AI使用格局与Agent化趋势

    一、报告背景:OpenRouter 在整个 AI 版图中的位置 1.1 OpenRouter 是谁?这份报告在看什么? OpenRouter 本质上是一个 多模型路由层(Model Router / Gateway) : 对上 :开发者、应用只需要对接一个 API; 对下 :OpenRouter 接入了 300+ 模型、60+ 提供方 ,覆盖了主流闭源(Op…

    2025年12月12日
    19100
  • PartCrafter:结构化3D生成革命,从单图到可编辑部件级网格的端到端突破

    在计算机图形学与人工智能生成内容(AIGC)的交叉领域,从单张二维图像直接生成高质量三维模型一直是学术界和工业界共同追求的目标。然而,传统3D生成模型普遍存在一个根本性局限:它们将三维物体视为不可分割的“黑箱”整体进行处理,生成的模型虽然外观逼真,但内部结构完全融合,用户无法对个别部件(如椅子的腿、汽车的轮子、桌子的抽屉)进行独立编辑、移动、旋转或替换。这种…

    2025年11月27日
    16200
  • 国产AI实现空间智能突破:SenseNova-SI超越国际顶尖模型,揭示AI技术范式变革

    空间智能领域迎来里程碑:SenseNova-SI实现全面超越 在空间智能这一前沿研究领域,一项重要进展近日引发行业关注。商汤科技发布的开源模型SenseNova-SI,在多项关键能力评估中超越了李飞飞团队研发的Cambrian-S模型,标志着国产AI技术在该领域取得突破性进展。 从空间感知能力的综合评估数据来看,SenseNova-SI在多个维度上的表现均优…

    2025年12月19日
    17500
  • AI重塑跨境电商:1688“遨虾”如何用智能体重构B2B供应链三环节

    在AI技术从概念验证迈向产业落地的关键阶段,B2B领域正成为价值创造的前沿阵地。作为中国最大的B2B供应链平台,阿里巴巴旗下1688近期推出的跨境电商AI智能体“遨虾”(alphashop.cn),标志着AI正从辅助工具升级为核心生产力引擎。本文将从技术架构、产业影响和商业逻辑三个维度,深入分析这一变革如何重构跨境电商的选品、采购、上架全流程。 **一、技术…

    2025年12月7日
    33200
  • FGN技术革命:谷歌DeepMind WeatherNext 2如何重塑小时级气象预报新范式

    气象预报领域正迎来一场由人工智能驱动的深刻变革。谷歌DeepMind最新发布的WeatherNext 2系统,不仅将预报精度提升至小时级别,更通过创新的功能生成网络(FGN)技术,实现了对天气演变的多情景概率预测,标志着传统数值预报方法向智能化、实时化方向迈出了关键一步。 传统气象预报主要依赖基于物理方程组的数值天气预报模型,这些模型需要在超级计算机上运行数…

    2025年11月18日
    16300