世界模型 - 鲸林向海

世界模型五大门派争霸：杨立昆VS李飞飞，谁将定义AI未来？

春节后，图灵奖得主杨立昆的新公司 AMI 宣布完成 10.3 亿美元种子轮融资，创下欧洲 AI 公司融资纪录。此前不久，李飞飞创办的 World Labs 也宣布获得 10 亿美元融资。本周早些时候，极佳视界获得数十亿元融资，估值超百亿。昨日，阿里巴巴发布了世界模型「快乐生蚝」（HappyOyster）。今日，群核科技在港交所敲钟上市。这些公司共同…

2026年4月17日

423000

AI产业动态

阿里发布全球首个主动式实时交互世界模型HappyOyster，开启沉浸式AI创作新纪元

近期，世界模型领域成果频出。成立刚满一个月的阿里巴巴ATH（Alibaba Token Hub）事业群，正式发布了其首个主动式实时交互世界模型产品——HappyOyster（快乐生蚝）。据官方介绍，HappyOyster基于原生多模态架构，是一款支持多模态输入与音视频联合生成的流式生成世界模型。其核心功能围绕四个维度展开：漫游（Wander）、导演（Dir…

2026年4月17日

663000

AI产业动态

空间智能第一股上市暴涨171%！群核科技成AI下半场领跑者，李飞飞、英伟达、腾讯阿里竞相押注

空间智能第一股上市暴涨171%，群核科技成AI下半场领跑者 “空间智能第一股”正式登陆资本市场。今日，群核科技（股票代码：00068.HK）在港交所挂牌上市，开盘报20.70港元，较发行价大幅上涨171.65%。公司董事长黄晓煌在上市仪式上表示： 15年前，群核科技以GPU上云为起点，秉持着‘让每一个空间，都成为可计算的世界’的愿景发展至今。未来，我们…

2026年4月17日

317000

AI产业动态

智在无界发布全球首个20万小时人类视频训练的世界模型Being-H0.7，六大评测全球第一

“人类视频，是机器人理解并与物理世界交互的最关键路径。” 这一如今渐成行业共识的观点，其最早的提出者是一家国内具身智能初创公司——智在无界（BeingBeyond）。在过去半年中，该公司在“海量人类视频训练”领域实现了两个重要里程碑：相继发布了全球首个基于1000小时与1万小时人类视频预训练的具身模型Being-H0与H0.5，率先开辟了“大规模人类视频驱…

2026年4月14日

613000

AI产业动态

极佳视界GigaWorld-1登顶WorldArena全球榜首，具身智能领域迎来里程碑式突破

近日，极佳视界（GigaAI）在具身智能领域取得系列突破：其全栈自研的具身基础大模型 GigaBrain-0.1 在 RoboChallenge 评测中位列全球榜首；新一代原生范式 GigaBrain-0.5M 在复杂长时程真机任务中实现数小时零失误；首创的“世界-动作模型”GigaWorld-Policy 在推理速度与训练效率上实现数量级提升，任务成功率显…

2026年3月31日

586000

大模型工程

Meta与NYU联手攻克AI规划难题：时间直道化让世界模型更接近现实

在人工智能的发展历程中，有一位科学家几乎贯穿了整个深度学习时代——他就是Yann LeCun。许多人最初接触神经网络，往往是通过他在上世纪提出的手写数字识别系统LeNet。这一早期的卷积神经网络模型不仅成功应用于银行支票识别，也为后来席卷全球的深度学习浪潮奠定了重要基础。与如今大量研究者将目光投向生成式AI不同，LeCun近年来一直在强调另一条更长期的研…

2026年3月29日

248000

AI产业动态

特斯拉前高管创业首秀：DiT4DiT模型让机器人看视频学动作，人形机器人首次落地世界模型

特斯拉前高管创业首秀：DiT4DiT模型让机器人看视频学动作，人形机器人首次落地世界模型离开特斯拉“擎天柱”团队创业一年多后，杨硕首次公开其研究成果。作为Mondo Robotics（妙动科技）的联合创始人兼CTO，杨硕及其团队在过去一年里潜心研究一个核心课题：如何利用视频数据训练机器人，使其能够以更少的数据学习，实现高水平、可泛化的动作控制，从而解决现…

2026年3月25日

410000

AI产业动态

RISE突破VLA瓶颈：组合式世界模型让机器人在想象空间完成强化学习，任务成功率提升超45%

在具身智能的发展中，视觉-语言-动作模型已成为通用操作任务的核心框架。然而，面对长程规划、柔性物体操作、精细双臂协同及动态交互等复杂场景时，VLA模型仍面临两大根本性挑战：模仿学习在推理过程中产生的长序列误差累积问题；真机强化学习成本高昂，难以规模化部署。针对这些挑战，香港大学李弘扬老师带领的OpenDriveLab团队近期提出了RISE方法。其核心思…

2026年3月17日

466000

大模型训练

超越语言建模：Meta与纽约大学探索统一多模态预训练，让AI直接理解现实世界

基础模型的能力爆发，源于海量文本的预训练。然而，文本只是人类对现实世界的一种抽象表达，是信息的有损压缩。借用柏拉图的“洞穴寓言”：语言模型擅长描述墙壁上的影子，却从未见过投射影子的实体。它们精于捕捉符号，却难以理解物理世界中高保真的规律、结构与因果。除了这一哲学局限，还存在一个现实瓶颈：高质量文本数据有限，且正逐渐枯竭。相比之下，视觉世界提供了近乎无限的…

2026年3月8日

265000

开源项目

中国团队突破空间智能核心技术：InSpatio-WorldFM开源实时3D世界模型，开启AI物理交互新纪元

AI领域最前沿的方向“世界模型”，正在经历一场深刻变革。互联网上，虚拟智能体在数字世界中灵活穿梭；现实中，具身机器人却仍受困于试验场，难以应对复杂的物理空间。这道横跨虚拟与现实的鸿沟，其核心在于智能体对空间智能感知的缺失。 2024年，空间智能这一关键赛道被正式点燃，成为全球科技竞争的焦点。其中，构建一个拥有永久一致性的3D场景，让智能体不仅能“看见”空间…

2026年3月6日

1.1K000