近日,数学界迎来里程碑式突破——由菲尔兹奖得主陶哲轩领衔的多国数学家团队,在人工智能工具的辅助下,仅用48小时便完全解决了困扰学界长达50年的Erdős #1026组合数学难题。这一突破不仅标志着数学研究范式的深刻变革,更揭示了“人机协同”在攻克复杂科学问题中的巨大潜力。

Erdős #1026问题源于1975年,其核心在于探索实数序列中单调子序列权重的下界。问题可转化为博弈论模型:假设Alice将N枚硬币分为n堆,Bob需选择单调递增或递减的堆序列并取走其中硬币。c(n)定义为无论Alice如何分配,Bob能保证获得的最小硬币比例。该问题长期停滞,直至AI工具的介入才迎来转机。

解题过程呈现多阶段人机协作特征。数学家Boris Alexeev率先使用Harmonic开发的数学AI模型“亚里士多德”,在证明助手Lean中自动构造并证明了关键不等式,将原问题转化为计算几何中的矩形填充问题。一小时内,数学家Koishi Chan基于经典Erdős–Szekeres定理给出替代证明,验证了AI推导的正确性。

陶哲轩随后介入,利用AlphaEvolve生成总和为10^6的实数序列,通过优化搜索获取c(n)的上界近似值。运行一小时后,AI输出结构清晰的潜在极值解序列:

数值分析显示分数值趋近简单有理数。陶哲轩借助John Cook的专用工具将序列重整为:

这催生了c(n)的明确猜想公式。Alexeev进一步给出简洁表述:c(n)=1/⌈√n⌉,并构造出匹配该上界的最劣序列配置:

该构造基于Erdős–Szekeres定理,通过精心设计数字排列与分块策略,限制长单调序列的权重积累能力,体现了组合数学的巧妙性。

可视化工具强化了理解。用ChatGPT Pro生成的1/c(n)函数图像显示,其本质是对平方根函数的分段线性逼近:

关键突破来自跨问题关联。数学家Lawrence Wu将Erdős #106的正方形填充问题引入分析,定义f(n)为n个小正方形放入大正方形时的最小边长比例。对于n=10,AI生成的方形打包示意图为:

通过AI论文检索,Wu团队定位到Baek、Koizumi和Ueoro于2023年发表的论文,该研究恰好证明了猜想公式,从而补全最终证明环节。陶哲轩将全部分析输入ChatGPT,生成连贯的完整证明文档:
此次突破凸显AI在数学研究中的多维价值:1)计算探索:AlphaEvolve等工具能高效搜索解空间,发现人类难以直观捕捉的极值结构;2)证明辅助:Lean等验证系统确保推导严谨性,避免隐性错误;3)知识关联:AI文献检索打破学科壁垒,识别跨领域理论联系;4)可视化呈现:生成图像使抽象关系具象化,加速直觉形成。

陶哲轩坦言,传统方法下数学家需数周乃至数月完成的工作,在人机协作模式下被压缩至两天。这并非孤立案例——近期他还借助Gemini 2.5 Deep Think在十分钟内补全Erdős #367的证明,并利用GPT-5进行半自动化文献检索,发现部分Erdős问题早已在过往研究中被间接解决。


Erdős问题库收录了匈牙利数学家Paul Erdős提出的上千道未解难题,多数已沉寂数十年。随着AI技术渗透,解题进程明显加速。Harmonic的数学AI近期独立证明了Erdős #124,耗时仅6小时;Erdős问题网站现已正式允许AI辅助解题,要求公开声明使用并确保内容准确性。



这场“48小时攻克50年难题”的案例,昭示着数学研究正进入“人类直觉+机器计算”的双引擎时代。AI并非替代数学家,而是成为拓展认知边界的“超级显微镜”,能处理海量组合可能性、识别隐藏模式、验证复杂推导。未来,随着多模态AI与符号推理技术的融合,人机协作有望在数论、几何、拓扑等更多领域催生突破,重新定义科学发现的速率与疆界。
— 图片补充 —







关注“鲸栖”小程序,掌握最新AI资讯
本文由鲸栖原创发布,未经许可,请勿转载。转载请注明出处:http://www.itsolotime.com/archives/4939
