物理推理 - 鲸林向海

阿里达摩院RynnBrain：让机器人长出物理直觉，破解柔性物体操作难题

2026年，众多机器人登上春晚舞台，它们能为大家表演包饺子吗？这或许是许多人好奇的问题。但根据近期的彩排报道，这种可能性并不大。机器人更可能被设计为托着托盘呈上饺子。业内人士深知，如果不依赖预设编程或遥控操作，让机器人自主包饺子远比移动、导航复杂得多。这涉及到“饺子皮”这类堪称机器人“图灵测试”的柔性物体操作，没有一个足够聪明的“大脑”是难以完成的。这也…

2026年2月10日

159000

AI产业动态

DeepPHY基准揭示多模态大模型物理推理能力鸿沟：从静态理解到动态交互的挑战

近日，淘天集团算法技术-未来生活实验室团队提出的DeepPHY基准框架，作为首个系统性评估多模态大模型（VLM）交互式物理推理能力的综合基准，被AAAI 2026收录。该研究通过六个极具挑战性的物理模拟环境，揭示了即便是顶尖VLM，在将物理知识转化为精确、可预测的交互控制时，仍存在显著的核心短板。这一发现不仅对VLM在动态环境中的应用提出了严峻挑战，也为未来…

2025年11月16日

177000

AI产业动态

开源模型首夺国际物理奥赛金牌！上海AI Lab打造235B参数模型超越GPT-5与Grok-4

上海AI Lab研发的开源模型P1-235B-A22B在国际物理奥林匹克竞赛（IPhO）中首次达到金牌分数线，并在涵盖全球13项顶级赛事的HiPhO基准测试中以12金1银的成绩与谷歌Gemini-2.5-Pro并列第一，超越GPT-5与Grok-4。该成果依托多阶段强化学习训练与协同进化多智能体系统PhysicsMinions，标志着开源模型在复杂物理推理能力上实现重要突破。

2025年10月25日

408000