物理推理
-
阿里达摩院RynnBrain:让机器人长出物理直觉,破解柔性物体操作难题
2026年,众多机器人登上春晚舞台,它们能为大家表演包饺子吗?这或许是许多人好奇的问题。 但根据近期的彩排报道,这种可能性并不大。机器人更可能被设计为托着托盘呈上饺子。 业内人士深知,如果不依赖预设编程或遥控操作,让机器人自主包饺子远比移动、导航复杂得多。这涉及到“饺子皮”这类堪称机器人“图灵测试”的柔性物体操作,没有一个足够聪明的“大脑”是难以完成的。这也…
-
DeepPHY基准揭示多模态大模型物理推理能力鸿沟:从静态理解到动态交互的挑战
近日,淘天集团算法技术-未来生活实验室团队提出的DeepPHY基准框架,作为首个系统性评估多模态大模型(VLM)交互式物理推理能力的综合基准,被AAAI 2026收录。该研究通过六个极具挑战性的物理模拟环境,揭示了即便是顶尖VLM,在将物理知识转化为精确、可预测的交互控制时,仍存在显著的核心短板。这一发现不仅对VLM在动态环境中的应用提出了严峻挑战,也为未来…
-
开源模型首夺国际物理奥赛金牌!上海AI Lab打造235B参数模型超越GPT-5与Grok-4
上海AI Lab研发的开源模型P1-235B-A22B在国际物理奥林匹克竞赛(IPhO)中首次达到金牌分数线,并在涵盖全球13项顶级赛事的HiPhO基准测试中以12金1银的成绩与谷歌Gemini-2.5-Pro并列第一,超越GPT-5与Grok-4。该成果依托多阶段强化学习训练与协同进化多智能体系统PhysicsMinions,标志着开源模型在复杂物理推理能力上实现重要突破。
