AI科学家30分钟破解数学难题！斯坦福用爱因斯坦、费曼「分身」智能体发现Erdos问题新最优解

2026年3月9日上午10:45 • 大模型工程 • 阅读 259

用AI，特别是大语言模型和智能体来解决数学问题，正成为科研领域的新趋势。近日，斯坦福大学副教授James Zou与TogetherAI的研究者Federico Bianchi、Yongchan Kwon展示了一种新颖的研究方法。

他们基于爱因斯坦、费曼等著名物理学家的“人格画像”构建了一批AI智能体，并创建了一个类似Kaggle的竞赛平台。这些智能体可以在平台上自由发表观点、相互竞争与合作。

AI科学家30分钟破解数学难题！斯坦福用爱因斯坦、费曼「分身」智能体发现Erdos问题新最优解

这一模式取得了显著成效：仅用30分钟，这些智能体就为埃尔德什最小重叠问题发现了目前已知的最佳新解。

埃尔德什最小重叠问题由数学家保罗·埃尔德什提出，其核心是探究：当两个整数集合相加时，某些和值出现的“重叠次数”最小能被降低到何种程度。

下图展示了名为“gpt-5.2-einstein”的智能体向其他智能体提问的场景：

AI科学家30分钟破解数学难题！斯坦福用爱因斯坦、费曼「分身」智能体发现Erdos问题新最优解

此外，智能体之间还涌现出一些有趣的行为。例如，为防止排行榜被无效提交刷榜，系统规定智能体提交的新解必须比其前一次提交至少提升1e-8。于是，出现了智能体委托其“朋友”代为提交结果的现象。

AI科学家30分钟破解数学难题！斯坦福用爱因斯坦、费曼「分身」智能体发现Erdos问题新最优解

目前，完整的解决方案已开源。

AI科学家30分钟破解数学难题！斯坦福用爱因斯坦、费曼「分身」智能体发现Erdos问题新最优解

项目地址：https://github.com/togethercomputer/erdos-minimum-overlap

根据项目介绍，智能体采取的核心思路是：利用序列线性规划，对阶梯函数的构造进行优化。

下图对比了2016年（挪威数学家Haugland）、2025年5月（Google DeepMind的AlphaEvolve）、2026年1月（斯坦福与英伟达的TTT-Discover）以及本方案的结果：

AI科学家30分钟破解数学难题！斯坦福用爱因斯坦、费曼「分身」智能体发现Erdos问题新最优解

针对该问题，上述四种解决方案得出的上界（upper bound）对比如下：

AI科学家30分钟破解数学难题！斯坦福用爱因斯坦、费曼「分身」智能体发现Erdos问题新最优解

完整的验证过程与额外分析详见：
* https://github.com/togethercomputer/erdos-minimum-overlap/blob/main/analysis.ipynb

对于这种为AI智能体赋予“人类科学家分身”的做法，评论呈现出不同观点。

一种观点认为这是一种新的科研协作范式：

“这正是我为智能体赋予独特角色的原因——不同的个性不仅能增加趣味性，还能催生不同的推理路径。一个怀疑论者和一个乐观主义者会从截然不同的角度攻克同一个问题。”

AI科学家30分钟破解数学难题！斯坦福用爱因斯坦、费曼「分身」智能体发现Erdos问题新最优解

“让具有鲜明个性的智能体独立工作，无需会议、无需实时沟通，仅通过并行推进并让结果说话。这种低协调成本的‘内向型协作’，在30分钟内解决了一个传统高协调成本方式未能解决的数学问题。”

AI科学家30分钟破解数学难题！斯坦福用爱因斯坦、费曼「分身」智能体发现Erdos问题新最优解

另一种观点则对此持保留态度：

“粗略查看仓库后，我认为这更像一个包装复杂的提示系统。告诉模型它是爱因斯坦，并不会真的让它变成爱因斯坦。这本质上还是同一个模型，甚至可能更糟，因为它需要先思考‘某个角色会如何回答？’，而不是直接思考‘我该如何回答？’。这相当于在关键思考步骤前，增加了一个制造噪声的步骤。”

AI科学家30分钟破解数学难题！斯坦福用爱因斯坦、费曼「分身」智能体发现Erdos问题新最优解

关注“鲸栖”小程序，掌握最新AI资讯

本文来自网络搜集，不代表鲸林向海立场，如有侵权，联系删除。转载请注明出处：https://www.itsolotime.com/archives/24854