世界模型

  • 世界模型五大门派争霸:杨立昆VS李飞飞,谁将定义AI未来?

    春节后,图灵奖得主杨立昆的新公司 AMI 宣布完成 10.3 亿美元种子轮融资,创下欧洲 AI 公司融资纪录。 此前不久,李飞飞创办的 World Labs 也宣布获得 10 亿美元融资。 本周早些时候,极佳视界获得数十亿元融资,估值超百亿。 昨日,阿里巴巴发布了世界模型「快乐生蚝」(HappyOyster)。 今日,群核科技在港交所敲钟上市。 这些公司共同…

    2026年4月17日
    42300
  • 阿里发布全球首个主动式实时交互世界模型HappyOyster,开启沉浸式AI创作新纪元

    近期,世界模型领域成果频出。成立刚满一个月的阿里巴巴ATH(Alibaba Token Hub)事业群,正式发布了其首个主动式实时交互世界模型产品——HappyOyster(快乐生蚝)。 据官方介绍,HappyOyster基于原生多模态架构,是一款支持多模态输入与音视频联合生成的流式生成世界模型。其核心功能围绕四个维度展开:漫游(Wander)、导演(Dir…

    2026年4月17日
    66300
  • 空间智能第一股上市暴涨171%!群核科技成AI下半场领跑者,李飞飞、英伟达、腾讯阿里竞相押注

    空间智能第一股上市暴涨171%,群核科技成AI下半场领跑者 “空间智能第一股”正式登陆资本市场。 今日,群核科技(股票代码:00068.HK)在港交所挂牌上市,开盘报20.70港元,较发行价大幅上涨171.65%。 公司董事长黄晓煌在上市仪式上表示: 15年前,群核科技以GPU上云为起点,秉持着‘让每一个空间,都成为可计算的世界’的愿景发展至今。 未来,我们…

    2026年4月17日
    31700
  • 智在无界发布全球首个20万小时人类视频训练的世界模型Being-H0.7,六大评测全球第一

    “人类视频,是机器人理解并与物理世界交互的最关键路径。” 这一如今渐成行业共识的观点,其最早的提出者是一家国内具身智能初创公司——智在无界(BeingBeyond)。 在过去半年中,该公司在“海量人类视频训练”领域实现了两个重要里程碑:相继发布了全球首个基于1000小时与1万小时人类视频预训练的具身模型Being-H0与H0.5,率先开辟了“大规模人类视频驱…

    2026年4月14日
    61300
  • 极佳视界GigaWorld-1登顶WorldArena全球榜首,具身智能领域迎来里程碑式突破

    近日,极佳视界(GigaAI)在具身智能领域取得系列突破:其全栈自研的具身基础大模型 GigaBrain-0.1 在 RoboChallenge 评测中位列全球榜首;新一代原生范式 GigaBrain-0.5M 在复杂长时程真机任务中实现数小时零失误;首创的“世界-动作模型”GigaWorld-Policy 在推理速度与训练效率上实现数量级提升,任务成功率显…

    2026年3月31日
    58600
  • Meta与NYU联手攻克AI规划难题:时间直道化让世界模型更接近现实

    在人工智能的发展历程中,有一位科学家几乎贯穿了整个深度学习时代——他就是Yann LeCun。 许多人最初接触神经网络,往往是通过他在上世纪提出的手写数字识别系统LeNet。这一早期的卷积神经网络模型不仅成功应用于银行支票识别,也为后来席卷全球的深度学习浪潮奠定了重要基础。 与如今大量研究者将目光投向生成式AI不同,LeCun近年来一直在强调另一条更长期的研…

    2026年3月29日
    24800
  • 特斯拉前高管创业首秀:DiT4DiT模型让机器人看视频学动作,人形机器人首次落地世界模型

    特斯拉前高管创业首秀:DiT4DiT模型让机器人看视频学动作,人形机器人首次落地世界模型 离开特斯拉“擎天柱”团队创业一年多后,杨硕首次公开其研究成果。 作为Mondo Robotics(妙动科技)的联合创始人兼CTO,杨硕及其团队在过去一年里潜心研究一个核心课题:如何利用视频数据训练机器人,使其能够以更少的数据学习,实现高水平、可泛化的动作控制,从而解决现…

    2026年3月25日
    41000
  • RISE突破VLA瓶颈:组合式世界模型让机器人在想象空间完成强化学习,任务成功率提升超45%

    在具身智能的发展中,视觉-语言-动作模型已成为通用操作任务的核心框架。然而,面对长程规划、柔性物体操作、精细双臂协同及动态交互等复杂场景时,VLA模型仍面临两大根本性挑战: 模仿学习在推理过程中产生的长序列误差累积问题; 真机强化学习成本高昂,难以规模化部署。 针对这些挑战,香港大学李弘扬老师带领的OpenDriveLab团队近期提出了RISE方法。其核心思…

    2026年3月17日
    46600
  • 超越语言建模:Meta与纽约大学探索统一多模态预训练,让AI直接理解现实世界

    基础模型的能力爆发,源于海量文本的预训练。然而,文本只是人类对现实世界的一种抽象表达,是信息的有损压缩。 借用柏拉图的“洞穴寓言”:语言模型擅长描述墙壁上的影子,却从未见过投射影子的实体。它们精于捕捉符号,却难以理解物理世界中高保真的规律、结构与因果。 除了这一哲学局限,还存在一个现实瓶颈:高质量文本数据有限,且正逐渐枯竭。相比之下,视觉世界提供了近乎无限的…

    2026年3月8日
    26500
  • 中国团队突破空间智能核心技术:InSpatio-WorldFM开源实时3D世界模型,开启AI物理交互新纪元

    AI领域最前沿的方向“世界模型”,正在经历一场深刻变革。 互联网上,虚拟智能体在数字世界中灵活穿梭;现实中,具身机器人却仍受困于试验场,难以应对复杂的物理空间。这道横跨虚拟与现实的鸿沟,其核心在于智能体对空间智能感知的缺失。 2024年,空间智能这一关键赛道被正式点燃,成为全球科技竞争的焦点。其中,构建一个拥有永久一致性的3D场景,让智能体不仅能“看见”空间…

    2026年3月6日
    1.1K00