Claude独立攻克图论猜想,算法祖师爷高德纳震惊:AI首次被正式记录在数学研究论文中

近日,Claude独立攻克了一项图论猜想,其成果被正式记录于一篇数学研究论文中。这一事件引发了算法领域泰斗、《计算机程序设计艺术》作者高德纳(Donald Knuth)的深度关注与思考,标志着生成式AI在自动推理与创造性问题求解方面达到了新的里程碑。

高德纳在斯坦福大学官网亲自发布了一篇题为《Claude’s Cycles》的原始论文,开篇即以“Shock! Shock!”表达了他的震撼。

论文地址: https://www-cs-faculty.stanford.edu/~knuth/papers/claude-cycles.pdf

高德纳是计算机科学领域的标志性人物,他是图灵奖得主,著有被誉为“算法圣经”的《计算机程序设计艺术》(TAOCP),也是排版系统TeX的发明者。

Claude独立攻克图论猜想,算法祖师爷高德纳震惊:AI首次被正式记录在数学研究论文中

《计算机程序设计艺术》是高德纳毕生的事业,旨在系统性地整理和夯实计算机算法的数学与历史基础。一位深耕算法领域五十余载的学者开始严肃审视AI的数学能力,这本身即是一个强烈的信号:AI正在触及人类最核心的智力疆域。

难倒算法祖师爷的问题,被Claude Opus 4.6攻克

在论文中,高德纳叙述道:“我昨天得知,一个我花费数周时间研究的未解问题,刚刚被Claude Opus 4.6——Anthropic公司于三周前发布的混合推理模型——解决了!”

他进一步表示:“看来我迟早得重新审视自己对‘生成式AI’的看法了。得知自己的猜想不仅有一个漂亮的解法,同时还能见证自动推理与创造性问题求解方面的这一戏剧性进步,真是令人欣喜不已。”

事件的起因源于高德纳为其持续撰写的《计算机程序设计艺术》系列新章节准备的一道题目。该题涉及有向图中的哈密顿循环,他与朋友们证明了其特殊情形,但在试图推广至一般情况时遇到了阻碍。

最终,Claude Opus 4.6为这个问题找到了一个优雅的构造性解法。随后,高德纳本人为此构造提供了严格的数学证明。这篇论文也因此成为一个标志:生成式AI的贡献首次被正式、严谨地记录在一项数学研究之中。

难题:三维环面图中的三环分解

这道题是一个看似简单实则复杂的图论问题。

设想一个三维的环面网格空间,即一个 m × m × m 的立方体,其中每个顶点由坐标 (i, j, k) 表示(每个坐标取值范围为0到m-1)。因此,图中共有 个顶点。

从每个顶点出发,允许沿三个坐标轴正方向移动(i+1, j+1, k+1),当坐标值达到m时则循环回0。这样,每个顶点都有三条出边,整个图共有 3m³ 条有向边。

Claude独立攻克图论猜想,算法祖师爷高德纳震惊:AI首次被正式记录在数学研究论文中

问题的目标是:找到三个哈密顿循环(即访问每个顶点恰好一次并回到起点的回路),使得这三条回路恰好覆盖图中所有的边,且每条边仅属于其中一个循环。高德纳原计划将这个问题及其(当时未知的)解法写入他的著作。

该问题的难点在于其巨大的搜索空间。每个顶点需在三出边中选择其一以构成回路,因此可能的组合数高达 3^(m³),暴力搜索几乎不可行,必须找到一种规律性的构造方法。

此前,高德纳已解决了m=3的情况,其合作者Filip Stappers通过计算实验找到了4 ≤ m ≤ 16的解,这强烈暗示了通用解的存在性。

Claude独立攻克图论猜想,算法祖师爷高德纳震惊:AI首次被正式记录在数学研究论文中

那么,能否找到一个适用于所有(或一类)m的通用公式?

研究过程:Claude的31次探索

Filip将问题交给了Claude Opus 4.6,并要求其严格记录每次程序运行的探索进展。有趣的是,Claude的求解过程并非一蹴而就,而是经历了31次系统性的尝试,其模式类似于人类研究者的工作流程。

Claude独立攻克图论猜想,算法祖师爷高德纳震惊:AI首次被正式记录在数学研究论文中

  1. 初步尝试:首先尝试使用简单的线性函数来决定每个顶点的移动方向,但很快发现此路不通。
  2. 暴力搜索:转向深度优先搜索(DFS),但因状态空间爆炸而效率低下。
  3. 降维分析:转而分析二维类似问题,发现了“蛇形路径”的构造,并试图将其推广至三维。
  4. 持续试错:在随后的十几次探索中,Claude不断尝试各种路径构造与分解方法,但均未获得通用解。

Claude独立攻克图论猜想,算法祖师爷高德纳震惊:AI首次被正式记录在数学研究论文中

关键突破:纤维分解(Fiber Decomposition)

在第15次探索中,Claude提出了一个核心概念:纤维分解

Claude独立攻克图论猜想,算法祖师爷高德纳震惊:AI首次被正式记录在数学研究论文中

它观察到,如果定义 s = (i + j + k) mod m,那么所有的有向边都会将顶点从s层移动到(s+1) mod m层。这意味着整个三维图可以按照s值“切片”,每一层(固定s)的顶点构成一个二维网格结构。这一洞见极大地简化了问题。

此后,Claude尝试了随机搜索、模拟退火和回溯搜索,虽然能为特定m找到解,但仍未提炼出通用规则。它由此得出结论:需要寻找一个纯数学的构造规则。

最终成功:第31次探索找到构造规则

在第31次探索中,Claude最终提出了一套简洁的规则。规则的核心依然是基于 s = (i + j + k) mod m

Claude独立攻克图论猜想,算法祖师爷高德纳震惊:AI首次被正式记录在数学研究论文中

具体规则根据s的值、i和j的奇偶性或取值,来决定在哪个坐标方向上进行“跃迁”(bump)。例如:
* 当 s = 0 时,移动方向由 j 的值决定。
* 当 0 < s < m-1 时,移动方向由 i 的值决定。
* 当 s = m-1 时,则应用另一套规则。

Claude独立攻克图论猜想,算法祖师爷高德纳震惊:AI首次被正式记录在数学研究论文中

Claude通过编程验证,对于m=3, 5, 7, 9, 11等奇数,由此规则生成的路径均能成功分解为三个哈密顿循环。

Claude独立攻克图论猜想,算法祖师爷高德纳震惊:AI首次被正式记录在数学研究论文中

当然,Claude提供的是构造方法。高德纳随后完成了严格的数学证明,证实该构造确实能生成覆盖所有顶点的回路,并且三条回路互不重叠地覆盖了所有边。

此外,高德纳的进一步研究表明,Claude发现的只是众多可能解中的一个。实际上存在760种满足类似结构的分解方法。同时,该构造目前仅适用于m为奇数的情况。对于偶数m,问题仍未完全解决(例如m=2已被证明无解)。

意义:超越解题的研究范式探索

此事件最深远的意义,或许不在于解决了一个具体的猜想,而在于AI解决问题所展现出的研究范式

在整个过程中,Claude并非进行盲目的猜测,而是系统地进行了问题重述、编程实验、模式识别与规律提炼。这一过程与人类数学研究者的工作方式高度相似。

数十年来,数学证明一直被视为AI难以涉足的圣殿。而这篇论文表明,AI已开始能够参与实质性的数学探索。未来,一种新的研究协作模式可能成为常态:人类提出关键问题与方向,AI进行探索与发现潜在结构,人类最终完成严格证明与理论升华

《Claude‘s Cycles》这篇论文,或许将被视为这一新时代的起点。

高德纳撰写《计算机程序设计艺术》已逾半个世纪,这套巨著记录了人类算法思想的演进历程。如今,AI的贡献被正式写入这位算法宗师的论文之中。这,可能仅仅是一个开端。

高德纳:不止于计算机科学教父

高德纳(Donald Ervin Knuth),1938年1月10日出生于美国密尔沃基,是享誉世界的计算机科学家、斯坦福大学名誉教授。

Claude独立攻克图论猜想,算法祖师爷高德纳震惊:AI首次被正式记录在数学研究论文中

他被公认为算法分析领域的奠基人,是现代计算机科学的先驱之一,在多个理论计算机科学分支做出了基石性的贡献。因其在算法分析和程序设计语言设计方面的开创性工作,他于1974年荣获图灵奖(计算机科学领域的最高荣誉),时年36岁,至今仍是该奖项最年轻的获奖者之一。

Claude独立攻克图论猜想,算法祖师爷高德纳震惊:AI首次被正式记录在数学研究论文中

颁奖词特别提到了他的系列巨著《计算机程序设计艺术》(The Art of Computer Programming, TAOCP)对计算机编程艺术的杰出贡献。1999年,该书被《美国科学家》期刊评为20世纪最佳12部学术专著之一,与爱因斯坦的“相对论”等重要著作并列。

Claude独立攻克图论猜想,算法祖师爷高德纳震惊:AI首次被正式记录在数学研究论文中

该丛书第一卷于1968年出版,至1976年时销量已超过一百万册。比尔·盖茨曾评价道:“如果你自认为是一个优秀的程序员,就去读《计算机程序设计艺术》吧。如果你读完了,请务必把简历发给我。”

为了追求更完美的书籍印刷效果,高德纳于1977年决定开发一套排版系统。历时八年,他推出了TeX系统,该系统现已成为全球学术界,尤其是数学、物理等需要处理复杂公式的领域,排版的不二之选。

Claude独立攻克图论猜想,算法祖师爷高德纳震惊:AI首次被正式记录在数学研究论文中

截至2025年,TAOCP已出版第1、2、3、4A和4B卷,未来预计还将出版更多卷册。其中,第1至5卷旨在阐述顺序计算机程序设计的核心内容,而第6卷和第7卷则专注于更专门但仍至关重要的主题。

值得一提的是,他的中文名“高德纳”是1977年访华前,由好友姚期智(清华姚班创始人)的夫人姚储枫所起。

高德纳为人风趣幽默。例如,他设立了“找错奖励”:任何在其著作中发现错误的人,都能获得2.56美元,因为“256美分刚好是十六进制的一美元”。

Claude独立攻克图论猜想,算法祖师爷高德纳震惊:AI首次被正式记录在数学研究论文中

Claude独立攻克图论猜想,算法祖师爷高德纳震惊:AI首次被正式记录在数学研究论文中

文学编程的先声

对高德纳而言,编程不仅是技术和科学,更是一门艺术。

Claude独立攻克图论猜想,算法祖师爷高德纳震惊:AI首次被正式记录在数学研究论文中

他认为,日常生活如同编程,如果你热爱一件事,就能将美感融入其中。开发TeX系统的经历,让他提出了“文学编程”的概念。这种范式不同于传统按计算机逻辑顺序编写程序的方式,而是允许程序员按照其思维的内在逻辑和流程来组织代码。

Claude独立攻克图论猜想,算法祖师爷高德纳震惊:AI首次被正式记录在数学研究论文中

高德纳曾表示:“文学编程确实是由TeX项目派生出来的最重要的东西。”他后来回忆道:“它不仅让我前所未有地更快编写和维护可靠性更高的程序,而且成为我自20世纪80年代以来的最大快乐之源……没有文学编程,我的整个事业规划就会轰然倒塌。它是你更上一层楼的必要工具。”

Claude独立攻克图论猜想,算法祖师爷高德纳震惊:AI首次被正式记录在数学研究论文中

从神童到计算机科学巨匠

高德纳自幼便展现出非凡的才智。8岁时,他为了参加一项用指定字母拼写单词的比赛,假装胃痛在家待了两周,凭借一部大词典列出了4500个单词,远超裁判掌握的2000个,最终为班级赢得冠军,自己也获得奖励。

Claude独立攻克图论猜想,算法祖师爷高德纳震惊:AI首次被正式记录在数学研究论文中

他在凯斯理工学院攻读数学时表现极为出色,毕业时被同时授予学士和硕士学位。1963年,他获得加州理工学院数学博士学位,随后留校任教。1968年,他加入斯坦福大学,历任教授及冠名教授,直至1993年荣休,成为“计算机程序设计艺术”荣休教授。

Claude独立攻克图论猜想,算法祖师爷高德纳震惊:AI首次被正式记录在数学研究论文中

据统计,高德纳一生荣获超过100项荣誉。

Claude独立攻克图论猜想,算法祖师爷高德纳震惊:AI首次被正式记录在数学研究论文中

参考资料:
https://www-cs-faculty.stanford.edu/~knuth/papers/claude-cycles.pdf
https://valeman.substack.com/p/donald-knuths-30-year-problem-solved

Claude独立攻克图论猜想,算法祖师爷高德纳震惊:AI首次被正式记录在数学研究论文中

Claude独立攻克图论猜想,算法祖师爷高德纳震惊:AI首次被正式记录在数学研究论文中


关注“鲸栖”小程序,掌握最新AI资讯

本文来自网络搜集,不代表鲸林向海立场,如有侵权,联系删除。转载请注明出处:https://www.itsolotime.com/archives/24171

(0)
上一篇 9小时前
下一篇 9小时前

相关推荐

  • PaddleOCR-VL:文档理解新突破,复杂表格公式一键精准解析

    传统 OCR 工具在处理包含复杂表格、数学公式或多栏排版的文档时,往往输出杂乱,需要大量人工整理。近期,百度开源的 PaddleOCR-VL-0.9B 模型在文档理解任务上展现出了显著突破。 尽管其参数量仅为 9 亿,但该模型在全球权威评测基准 OmniDocBench v1.5 上取得了 92.6 的综合得分,位列榜首。在推理速度上,相比同类模型 Mine…

    2025年11月5日
    14300
  • LENS:首个基于强化推理的分割大模型,突破传统SFT能力天花板

    文本提示图像分割(Text-prompted image segmentation)是实现精细化视觉理解的关键技术,在人机交互、具身智能及机器人等前沿领域具有重要的战略意义。该技术使机器能够根据自然语言指令,在复杂的视觉场景中定位并分割出任意目标。 然而,当前主流的技术路径,如基于监督式微调(Supervised Fine-Tuning, SFT)的方法,正…

    2025年12月29日
    15500
  • DeepSeek R1爆更86页论文:开源模型如何用强化学习实现推理能力突破

    R1论文暴涨至86页!DeepSeek向世界证明:开源不仅能追平闭源,还能教闭源做事! 全网震撼!两天前,DeepSeek悄无声息地将R1的论文从原来的22页大幅更新至86页。这篇全新的论文证明,仅通过强化学习就能显著提升AI的推理能力。DeepSeek似乎在憋大招,甚至有网友推测,这种纯强化学习方法或许会出现在未来的R2版本中。 此次更新,将原始论文升级为…

    2026年1月8日
    17000
  • DeepSeek联手清北发布DualPath框架:用闲置网卡打破Agent推理瓶颈,性能提升近2倍

    DeepSeek 联合北大清华发布 DualPath 框架:利用闲置网卡突破 Agent 推理 I/O 瓶颈,性能提升近 2 倍 当业界广泛关注 DeepSeek 的 GitHub 仓库,期待其下一代模型发布时,DeepSeek 与北京大学、清华大学的研究团队在 arXiv 上悄然发布了一篇论文,提出了一个全新的智能体推理框架:DualPath。 该框架的核…

    5天前
    5800
  • RAG延迟削减97%!REFRAG技术揭秘:压缩、感知、扩展三阶段实现效率飞跃

    传统RAG为何低效:冗余与延迟的根源 传统检索增强生成(RAG)流水线通常将检索到的多个文本片段直接拼接,作为上下文输入给大语言模型。然而,这些片段之间往往缺乏紧密的语义关联,导致模型在处理时需要为大量无关内容计算注意力权重。这不仅浪费了宝贵的计算资源,更关键的是,模型将大量时间耗费在了跨片段(cross-chunk)的、近乎无效的注意力计算上,效率低下。 …

    2025年11月26日
    15600