中国AI突破300年数学难题:强化学习系统PackingStar刷新高维亲吻数多项世界纪录

闻乐 发自 凹非寺

量子位 | 公众号 QbitAI

数学上有一个经典难题,名为亲吻数问题(Kissing Number Problem)。它困扰了人类三百余年,而最近,一项来自中国AI的研究,为这一领域带来了突破性进展。

这个问题探讨的是:在n维空间中,一个单位球体的周围,最多能有多少个同样大小的球体与它恰好相切(即“亲吻”),且彼此互不重叠。

中国AI突破300年数学难题:强化学习系统PackingStar刷新高维亲吻数多项世界纪录

亲吻数问题又称牛顿数问题,是希尔伯特第十八问题(球体堆积)的局部形式,其底层逻辑与通信技术中的“比特拥挤”问题相通。

它的历史可追溯至1694年牛顿与格雷戈里的一场著名争论:在三维空间中,一个球周围究竟能放置12个还是13个同等大小的球?牛顿坚持12个,而格雷戈里则认为可能是13个。这场争论持续了258年,直到1953年,数学家们才最终严格证明了牛顿是正确的。

即便是2022年获得菲尔兹奖的数学家玛丽娜·维亚佐夫斯卡,其获奖成果——解决8维和24维空间的最密球体堆积问题——也与亲吻数问题紧密相关。

中国AI突破300年数学难题:强化学习系统PackingStar刷新高维亲吻数多项世界纪录

然而,当维度继续升高,人类的几何直觉便完全失效。在过去近50年里,亲吻数的构造仅有7次实质性进展,且每次方法迥异,难以在相邻维度间迁移复用。

如今,这一僵局被打破了。

来自上海科学智能研究院(上智院)北京大学复旦大学的联合研究团队,开发出一套名为PackingStar强化学习系统,一举刷新了25至31维连续7个维度的亲吻数世界纪录。

同时,该系统还在其他多个维度以及广义亲吻数问题上创造了新的纪录,并发现了大量前所未有的新构型 (这些纪录曾长期保持稳定,二三十年都未被撼动)

中国AI突破300年数学难题:强化学习系统PackingStar刷新高维亲吻数多项世界纪录

这种系统性的突破在该问题三百多年的历史中极为罕见。成果公布后,离散几何领域的权威学者、麻省理工学院的Henry Cohn教授(曾与维亚佐夫斯卡合作研究24维问题)给予了高度评价,并将这些新纪录收录于其维护的权威榜单中。

中国AI突破300年数学难题:强化学习系统PackingStar刷新高维亲吻数多项世界纪录

PackingStar将高维几何难题转化为了AI擅长的多智能体博弈。AI与数学的这次深度结合,何尝不是另一种意义上的高维“亲吻”?

AI与数学的这场“深度亲吻”

首先来看PackingStar在这一世纪难题上取得的亮眼成绩:

  • 一次性打破25至31维连续7个维度的亲吻数纪录;
  • 在13维发现了优于自1971年以来所有已知的有理结构,并在14维等多个维度找到了超过6000个新构型;
  • 刷新了长期未变的广义亲吻数纪录:将“两球亲吻数”在14维、17维的纪录分别提升至252和578;将“三球亲吻数”在12维、20维、21维的纪录分别提升至81、405和567。(“两球亲吻数”指同时与两个相切单位球都外切的单位球最大数目,“三球亲吻数”类推)

中国AI突破300年数学难题:强化学习系统PackingStar刷新高维亲吻数多项世界纪录

项目发起人马成栋最初是在一门信息论课程中了解到这个问题。他本身深耕强化学习领域,2022年AlphaTensor的出现让他坚信AI能为数学难题带来突破。亲吻数问题形式简洁、目标明确、评价标准清晰,这种与AI的高度契合促使他决心深入探索。

中国AI突破300年数学难题:强化学习系统PackingStar刷新高维亲吻数多项世界纪录

PackingStar团队的科研青年们
从左至右依次为:刘明灏、李鹏宇、马成栋、陶兆巍、陈浩钧、毛子皓

这个困扰人类300年的难题,其瓶颈显而易见:维度升高后,球体的可能排列方式呈指数级爆炸,人类有限的几何直觉在高维空间中完全失灵。

因此,团队决定转换思路,让AI自主在高维空间中探索球体相切的可能结构。他们完成了一项关键的问题转化:不再直接处理球体在坐标空间中的位置,而是将所有操作转移到余弦矩阵上进行。该矩阵中的每个元素对应两个球心连线与原点连线的夹角余弦值,这套表示法天然适配GPU的大规模并行计算。

中国AI突破300年数学难题:强化学习系统PackingStar刷新高维亲吻数多项世界纪录

然而,新的挑战随之而来。在矩阵填充过程中,总会出现一些破坏整体结构的“坏球”。于是,团队进行了第二次关键的思路转变——引入一个负责“删球”的智能体。

中国AI突破300年数学难题:强化学习系统PackingStar刷新高维亲吻数多项世界纪录

最终,高维球体堆积问题被转化为余弦矩阵上两个智能体间的博弈游戏:
* 填充智能体:像AlphaGo落子一样,寻找可能的球体排列组合。
* 修剪智能体:进行几何分析,剔除次优的排列。

团队进一步从高维复杂结构中提取出精炼的几何表征,以完成对结构的解构。两个智能体通过 「填充—修剪—解构出“碎片”—再填充」 的协同机制,大幅降低了高维探索的难度。

中国AI突破300年数学难题:强化学习系统PackingStar刷新高维亲吻数多项世界纪录

接下来便是突破频现的时刻,PackingStar接连打破了多个维度的纪录。尤为出人意料的是,长期以来数学家对该问题的认知和构造框架都停留在对称型构造上,但PackingStar发现的诸多破纪录结构,均为明显反直觉的“非对称”构型,打破了这一长期认知。

马成栋感慨道:

在这种很复杂的高维空间里,人的很多“直觉”是不靠谱的,AI的一些有效发现甚至是完全反人类直觉的。这也是AI相比人强太多的地方。

例如,在12维“三球亲吻数”中发现的81球新纪录结构,虽然整体不具备明显的对称性,但每个球体的相邻球数量却完全一致,这暗示背后可能隐藏着对称性更高的构造。最终,团队成功找到了一个对称群阶数高达311040的81球结构。

更神奇的是,20维的405球、21维的567球新纪录,都可以通过这个12维结构组合衍生出来。

中国AI突破300年数学难题:强化学习系统PackingStar刷新高维亲吻数多项世界纪录

这些成果令Henry Cohn教授感到“无法想象”。他最初被团队的方法论所震撼,后续深入分析后更惊喜地发现,这些由AI发现的结构,能够将球面码、数论、群论等多个看似分散的数学领域连接起来,具备极高的数学价值。

这场AI与数学的深度“亲吻”背后,离不开上智院 「AI—科学—工程」 三位一体的支撑体系。

工程力:将数学探索放大为规模化发现

如果说算法是灵魂,那么工程力就是加速器。

当前,全球AI行业正经历一个微妙转折,竞争焦点从单纯比拼模型参数,转向对基础设施(AI Infra)能力的建设。在国外,DeepMind在AlphaFold、AlphaTensor等科学项目中,高度依赖自研的XLA编译与算子级优化,以支撑超长周期的AI训练。在国内,阿里云、国家超算中心等也日益重视AI for Science场景下的算子优化、任务调度与长期运行稳定性,旨在为前沿基础科研提供不间断的计算底座。

高维数学探索本身极度依赖耗时久、成功率低、资源消耗高的计算过程,对系统稳定性和效率提出了极限要求。正因如此,AI Infra逐渐成为解决此类复杂问题的决定性因素之一。

在PackingStar项目中,由上智院联合复旦大学和无限光年共同建设的星河启智科学智能开放平台,便扮演了“定海神针”的角色。面对传统数学优化算子在万亿次博弈场景下性能迅速见顶的瓶颈,星河启智的工程团队着手自研底层CUDA算子

中国AI突破300年数学难题:强化学习系统PackingStar刷新高维亲吻数多项世界纪录

新算子直接在GPU上进行计算,并将结果原位存储,从而省去了大量重复的数据读写和搬运时间,使得核心计算链路的端到端吞吐效率提升了数倍。

除了速度,团队还开发了自动Checkpointing系统,这是一个高鲁棒的自动容错机制,专门应对千卡级GPU长周期任务。它支持定时滚动存档、故障自动回溯恢复,确保了数据零丢失、任务断点可续传。如此一来,大规模运行中的效率与稳定性两大难题均得到解决。

通过工程的确定性来对冲科学发现的不确定性,使得原本高不可攀的数学难题变得系统化、可规模化探索。上智院的这波工程实践,走在了全球科学智能基础设施与前沿数学计算领域的前列。有了以科学家需求为中心的开放基础设施,青年科学家们无需再为算力稳定性分心,可以更专注于激发灵感与探索。

AI for Science进入2.0时代:赋能青年科学家

当然,如果仅仅认为PackingStar的意义在于刷新了几个维度的纪录,那就低估了它的价值。

它有力地证明了:那些超越人类直觉的复杂数学问题,并非不可探索,只是需要引入一个新的“伙伴”共同攻坚——那就是AI 中国AI突破300年数学难题:强化学习系统PackingStar刷新高维亲吻数多项世界纪录

中国AI突破300年数学难题:强化学习系统PackingStar刷新高维亲吻数多项世界纪录

聊到AI for Science,AlphaFold是绕不开的里程碑,它将蛋白质折叠预测从“十年实验”推进到“几分钟出结果”。

然而,从方法论上看,AlphaFold或许只能代表AI4S的1.0阶段。

其底层逻辑是以技术为中心:首先需要海量的已知数据和标准答案,然后由AI专家在人类设定的框架内,凭借强大的算力实现效率突破。本质上,科学家是在为AI提供支持。

但亲吻数问题则截然不同。它没有现成的数据集,没有标准答案,甚至学术界对“什么样的结构才算优秀”也尚无定论,堪称一个“三无”难题。

PackingStar所做的,正是将这套玩法彻底颠覆。

它不依赖人类预先提供答案,而是将AI直接置于没有任何先验知识的“真空地带”,从无到有地探索新结果,从而启发科学家后续的研究。这正是AI for Science 2.0阶段的特征之一。

中国AI突破300年数学难题:强化学习系统PackingStar刷新高维亲吻数多项世界纪录

纵观全球AI for Math领域,近年来重大成果频出。DeepMind的AlphaGeometry解决了奥数几何难题,AlphaProof在国际数学奥林匹克竞赛中斩获银牌。

但这些研究大多在回答一个问题:AI能否在人类已知答案的问题上,实现更高效的求解?

PackingStar则直面一个更具挑战性的命题——

当人类尚未明确问题边界时,AI能否自己开辟道路?

亲吻数与广义亲吻数问题正是这样一个典型。PackingStar首次运用系统性的方法,发掘出一系列人类未曾设想的“非对称”高维构型。这类发现并非偶然,而是在多个维度上持续产出的成果,这在AI for Math领域具有开创性意义。

  • 方法首创:零数据、零先验,首次利用多智能体强化学习系统性发掘非对称构型,打破了人类对对称结构的路径依赖。
  • 成果硬核:在多维度实现体系化的纪录刷新,是该领域三百年来首次系统性突破。

更重要的是,这些新构型具有明确的几何意义,能够启发进一步的数学研究,并留下了可复用的范式,其价值远超此前AlphaEvolve在11维问题上的单点性能提升。

中国AI突破300年数学难题:强化学习系统PackingStar刷新高维亲吻数多项世界纪录

这背后,反映了一个关键转变:AI已不再局限于替代人类进行计算,而是开始参与科学探索本身。

在这种新的合作范式下,AI如同科学家的“钢铁侠战衣”,更是全程在线的智能助手“贾维斯”。

  • AI在远超人类直觉的高维空间中学习如何求解;
  • 人类则对AI产生的结果进行解读,从中提炼出新的数学规律。

在这个闭环中,人机协作的成熟度显著提升。团队中数学专业出身的陶兆巍对此深有体会,他在与AI的反复“较劲”中不断打磨思路,PackingStar也随之变得越来越“聪明”。

在这场“人”与“机”的深度协作中,AI并非意在替代科学家,而是让更多有想法、有灵感的年轻研究者,得以站上数学未知领域的前沿。

One More Thing

值得一提的是,PackingStar这个名字取得颇为巧妙。

它不仅指代所研究的球体堆积(Packing)问题,还蕴含着团队的两重浪漫构想:

  • 高维几何结构如同数学宇宙中的星系,PackingStar则是带领团队成员探索、抵达遥远结构的飞船与望远镜;
  • 团队中的每位成员都是一颗星星,而AI正帮助这些年轻的科学家们,更高效地闯荡这片广袤的数学宇宙。这体现了人机协作、共同探索的别样浪漫。

中国AI突破300年数学难题:强化学习系统PackingStar刷新高维亲吻数多项世界纪录

但这群“星星”并非只会埋头苦干。如果你走进上海人工智能实验室(上智院),会发现门口有一个极具格调的吧台——一个普通的工作区,被陶兆巍及相关团队改造成为“学术酒吧”。

中国AI突破300年数学难题:强化学习系统PackingStar刷新高维亲吻数多项世界纪录

无论你是数学家、生物学家还是AI研究员,都可以在此小酌一杯,畅谈交流,让不同学科“离散的智慧”在此碰撞融合。

据调酒师(即陶兆巍)介绍,“酒水”已从最初的一两款无酒精鸡尾酒,发展出“马天尼”、“少年游”、“问宙星河”等多种风味。

中国AI突破300年数学难题:强化学习系统PackingStar刷新高维亲吻数多项世界纪录

最令人称奇的是,这家学术酒吧“开业”不久,PackingStar便迎来了突破性进展。这不禁让人想在这块“风水宝地”也来上一杯,沾沾喜气。

  • 科研纪录短片《Packing Star》
  • 亲吻数纪录榜单:
    • [1]https://cohn.mit.edu/kissing-numbers
    • [2]https://spherical-codes.org/

关注“鲸栖”小程序,掌握最新AI资讯

本文来自网络搜集,不代表鲸林向海立场,如有侵权,联系删除。转载请注明出处:https://www.itsolotime.com/archives/21558

(0)
上一篇 14小时前
下一篇 13小时前

相关推荐

  • Python开发者必备:12个能解决大问题的小型库

    小工具,大作用。 Python 工具带:12 个能解决大问题的小型库 发现一打容易被忽视的 Python 库,它们安静地让开发更顺滑、更高效、更聪明——一次优雅的 import 就够。 如果你是有经验的 Python 开发者,你的工具箱里可能已经装满了 requests、pandas、flask 和 numpy 这样的“大腕”。但在这些明星库之下,还隐藏着一…

    2025年12月4日
    10800
  • 大模型语义向量化的信号处理原理:从信息论到Transformer的深度解析

    引言 本文将从信号处理的角度,解读大模型语义向量化背后的信息论原理,并从时间序列的视角分析 Transformer 架构及其与 Granger 因果性的关联。 我们首先提出一个核心观点:大模型的输入是 Token 的语义嵌入(即语义向量),这一过程本质上是将自然语言处理问题转换为信号处理问题。因此,向量化对于大模型至关重要,它与信号处理、信息论有着深刻的联系…

    2026年1月30日
    8500
  • 揭秘16层架构:如何构建成本优化、全链路可观测的生产级知识图谱系统Agentic GraphOS

    面向企业生产的、成本优化且全链路可观测的 GraphRAG 操作系统 Agentic GraphOS | 生产可用 · 多智能体 · 思维速度级扩展 本文将从零开始,完整介绍如何构建一套可投入生产的知识图谱系统——GraphOS。你将了解如何架构一个多智能体平台,智能地将查询路由到最具性价比的检索策略,在保持研究级准确率的同时实现 30–50% 的成本优化。…

    2026年1月8日
    9900
  • COMET框架:突破AI加速器性能瓶颈,显式建模集体通信与复合操作数据流

    关键词:复合操作数据流建模、集体通信操作、内存层级优化、机器学习加速器、性能建模与优化 在人工智能技术日新月异的今天,大语言模型、状态空间模型等复杂神经网络已成为推动技术发展的核心引擎。然而,这些模型所依赖的复合操作——即由多个基础操作(如矩阵乘法、归一化、逐元素变换)组合而成的结构化模块——正在对现有的硬件加速器数据流设计与性能优化提出严峻挑战。 传统的数…

    2026年1月26日
    7600
  • AI Agents工具构建指南:从规范定义到高效使用的核心策略

    AI Agent 是由一系列大语言模型(LLM)调用构成的程序。它们接收用户任务,并通过调用“工具”来高效解决问题。工具本质上是 Agent 可以调用的函数。然而,构建一个高效的 Agent 远不止于简单地将一组函数塞入其上下文。关键在于如何精心定义工具,以及如何向 Agent 清晰地传达这些工具的信息。 本文旨在阐述为 AI Agent 构建工具时应关注的…

    2025年11月24日
    11400