世界建模 - 鲸林向海

英伟达专家预言：世界建模将取代词预测，开启AI预训练新纪元

henry 发自凹非寺量子位 | 公众号 QbitAI 继“下一个词预测”之后，世界建模将成为新的预训练范式。这是英伟达机器人主管Jim Fan 给出的最新判断。他认为，2026年将成为大世界模型（Large World Models）真正为机器人领域以及更广义的多模态AI奠定基础的第一年。谢赛宁随即转发表示赞同：“事后看来显而易见”。在这篇长文…

2026年2月5日

79000

AI产业动态

AI范式革命：从预测下一个词到预测下一个物理状态

又一位大佬准备对现有 AI 技术范式开刀了。今天凌晨，英伟达高级研究科学家、机器人团队负责人 Jim Fan（范麟熙）发布文章《第二代预训练范式》，引发了机器学习社区的讨论。 Jim Fan 指出，目前以大语言模型（LLM）为代表的 AI 模型主要基于「对下一词的预测」，这第一代范式虽然取得了巨大成功，但在将其应用于物理世界时，出现了明显的「水土不服」。 …

2026年2月4日

94000

AI产业动态

Emu3.5：原生多模态世界模型的突破与全场景应用解析

Emu3.5是由北京智源研究院最新发布的大规模多模态世界模型，其核心创新在于原生支持视觉与语言的联合状态预测。该模型采用统一的下一token预测目标进行端到端预训练，训练数据规模超过10万亿token，主要来源于互联网视频的连续帧及其转录文本，这为模型理解动态视觉序列与语言描述的关联性奠定了坚实基础。模型架构设计上，Emu3.5天然接受交错的视觉-语言输入…

2025年11月1日

190000

AI产业动态

悟界・Emu3.5：原生多模态世界大模型开启AI第三条Scaling范式

在人工智能技术快速演进的今天，多模态大模型正成为推动AI向通用人工智能迈进的关键力量。当业界仍在围绕自回归与扩散模型的技术路线展开激烈讨论时，北京智源人工智能研究院（BAAI）最新发布的悟界・Emu3.5模型，以其创新的“多模态世界大模型”定位，为这场技术辩论提供了全新的视角和答案。 Emu3.5不仅仅是一次常规的模型迭代，它被定义为“多模态世界大模型”（M…

2025年10月30日

188000