情人节最硬核“Kiss”:中国 AI 突破 300 年亲吻数难题,连刷多维度纪录
中国AI突破300年亲吻数难题!PackingStar系统刷新25-31维世界纪录,实现AI与数学的深度协作。探索高维球体堆积新发现,见证AI for Science 2.0时代突破。
情人节到了,那咱也来应应景,讲讲亲吻这件事 ——AI 的打开方式。
你或许知道,数学上有个正经问题叫做亲吻数(Kissing Number Problem),卡了人类 300 多年,但就在最近,被中国 AI 狠狠推了一把。
简单说,它研究的是:在 n 维空间中,一个球体周围,最多能有多少个和它大小相同的球体,刚好与它相切(kiss),不重叠的那种。

亲吻数又叫牛顿数,是希尔伯特第十八问题(球体堆积)的局部形式,和通信技术中的“比特拥挤”问题是同一套底层逻辑。
它源自于 1694 年,牛顿和格雷戈里两位大佬的争吵:
在三维空间里,一个球周围到底能放 12 个,还是 13 个同款球?牛顿坚持 12,格雷戈里不服,结果谁也没能当场辩过谁。
直到 1953 年,数学家用了 258 年时间才严格证明牛顿是对的。
就连 2022 年获得菲尔兹奖的玛丽娜 · 维亚佐夫斯卡,正是凭借解决 8 维和 24 维空间的最密球体堆积问题,摘得桂冠。

但再往高维走,人类的直觉就崩了。在过去近 50 年里,亲吻数构造仅有 7 次实质性进展,而且每一次的方法都完全不同,在临近维度上难以迁移与复用。
现在,僵局被打破了。
来自上海科学智能研究院(上智院)、北京大学、复旦大学的联合团队,提出了一套名为 PackingStar 的强化学习系统,一口气刷新了 25-31 连续 7 个维度的世界纪录。
同时在其他各个不同维度和广义亲吻数中也刷新了多个维度的世界纪录,并做出了各种各样的新发现(相关纪录曾经二三十年都难以撼动)。

这种系统性的贡献在该问题三百多年的历史中非常罕见,成果出来后,连离散几何大牛、麻省理工的 Henry Cohn 教授(和维亚佐夫斯卡一起搞 24 维的大佬)都给予了高度评价;
还把这些新纪录收录到他维护的权威榜单里。

PackingStar 把高维几何难题转化成了 AI 擅长的多智能体博弈,AI 和 Math,何尝不是另一种高维“kiss”呢?
AI&Math 的这场“Deep Kiss”先给大家甩一波 PackingStar 在这个世纪难题上亮眼的成绩单:
一次性打破 25-31 维连续 7 维纪录;
在 13 维发现优于 1971 年以来的所有有理结构,并在 14 维等多个维度找到超过 6000 多个新构型;
打破长期不变的广义亲吻数纪录,将“两球亲吻数”中 14 维、17 维纪录分别刷新至 252、578;将“三球亲吻数”中 12 维、20 维、21 维纪录分别刷新至 81、405、567。(两球亲吻数是指同时与两个相切单位球都外切的单位球的最大数目,三球亲吻数指同时与三个相切单位球都外切的单位球的最大数目)

项目发起人马成栋最开始是在一门信息论的课上了解到这个问题。
他本身深耕强化学习,2022 年 AlphaTensor 的出现让他坚信 AI 能为数学难题带来突破。
加上亲吻数问题形式简单、结果明确、评价标准清晰,这份和 AI 的契合让他决心深入探索。

但这个困扰人类 300 年的难题,卡壳之处也明明白白,维度一高,球体排列方式直接呈指数级暴涨,人类那点几何直觉在高维空间里完全失灵。
于是团队决定换个思路,让 AI 自主在高维空间中探索“球体亲吻”的可能结构。
他们首次完成了关键的问题转化,不硬磕坐标空间中的球体位置,而是将所有操作全部在余弦矩阵上完成,矩阵中的每个元素,对应两个球心连线与原点的夹角余弦,这套表示法天生就适配大规模 GPU 的并行计算。

但不久后,问题来了。矩阵填充的过程中,总会冒出一些很不对劲的球破坏整个结构。
于是团队又完成了一次关键的思路转变,再来一个删球的智能体。

最终将高维球体堆积问题转化成了余弦矩阵上的两个智能体间的游戏:
填充智能体像 AlphaGo 落子一样,寻找可能的排列组合;
修剪智能体进行几何分析、剔除次优排列。
团队进一步从高维复杂结构中提取出了精炼的几何表征来完成对结构的解构。
两个智能体通过「填充 — 修剪 — 解构出“碎片”— 再填充」的协同机制,大幅降低了高维探索难度。

接下来就是开挂时刻,关键突破一个接一个,接连打破多个维度的纪录。
而且长期以来,数学家对这个问题的认知和构造框架都是停留在对称型构造上的,但很出人意料,PackingStar 发现的诸多破纪录结构均为明显反人类直觉的“非对称”构型,打破了长期以来的这一认知。
马成栋感慨道:
在这种很复杂的高维空间里,人的很多“直觉”是不靠谱的,AI 的一些有效发现甚至是完全反人类直觉的。这也是 AI 相比人强太多的地方。
比如,12 维 81 球的三球亲吻数新纪录,虽然它不具备良好的整体对称性,但每个球体的相邻数量却完全一致,这暗示背后藏着一种对称性更高的 81 球构造。
最终,他们成功找到了一个对称群阶数高达 311040 的 81 球结构。
更神奇的是,20 维 405 球、21 维 567 球的新纪录,也都可以通过这个 12 维结构再次组合出来。

这些成果让 Henry Cohn 直呼“无法想象”。
他最初被团队的方法论震撼,后续深入分析后更惊喜地发现,这些 AI 构造的结构能连接球面码、数论、群论等多个分散领域,具备极高的数学价值。
这场 AI 和 Math 深度亲吻的背后,其实是上智院「AI— 科学 — 工程」三位一体的支撑。
工程力,把数学探索放大为规模化发现如果说算法是灵魂,那么工程力就是加速器。
当前全球 AI 行业正处于一个微妙的转折点,大家不再仅仅卷模型参数,而是转向基础设施(AI Infra)能力的竞争。
在国外,DeepMind 在 AlphaFold、AlphaTensor 等科学项目中,大量依赖自研的 XLA 编译与算子级优化,以支撑超长周期的 AI 训练;
国内这边,阿里云、国家超算中心等也开始重视 AI for Science 场景下的算子优化、任务调度与长期运行稳定性,为基础科研提供不中断的计算底座。
其实高维数学探索这事儿,非常依赖于耗时久、成功率低、资源消耗高的计算过程,对系统稳定性和效率提出了极高要求。
也正因为这样,AI Infra 逐渐成为了解决复杂问题的决定性因素之一。
在 PackingStar 这个项目里,上智院联合复旦大学和无限光年建设的星河启智科学智能开放平台,就扮演了这种定海神针的角色。
传统的数学优化算子在面对万亿次博弈时,性能会迅速见顶。于是,星河启智的工程团队开始自研底层 CUDA 算子。

新算子直接在 GPU 上计算数据,并且原位存入,这样就省掉了大量重复读写和数据搬运的时间,使核心计算链路的端到端吞吐效率提升了数倍。
不光快,团队还开发了自动 Checkpointing 系统,这是一个高鲁棒自动容错机制,专门应对千卡级 GPU 长周期任务。
支持定时滚动存档、故障自动回溯恢复,确保数据零丢失、任务断点可续传。
这样一来,大规模运行的效率和稳定性这两大难题都解决了。
用工程的确定性对冲科学发现的不确定性,让原本高不可攀的数学难题变得系统可探索。上智院这波工程实践妥妥走在全球科学智能基础设施与前沿数学计算的前列。
有了以科学家为中心的开放基础设施,青年科学家不需要操心算力会不会挂,只需要专注于他们的灵感。
AI for Science 进入 2.0 时代,赋能青年科学家当然了,如果只觉得 PackingStar 牛在刷新了几个维度的纪录,那可真没 get 到它的意义!
它证明了:
那些人类直觉想不明白的数学题,并不是不可探索,只是需要加个新物种一起上 ——
没错,就是 AI。

聊到 AI for Science,AlphaFold 是绕不开的里程碑,它直接把蛋白质折叠从“十年实验”干到了“几分钟出结果”。
但说实话,从玩法上来看,AlphaFold 其实仅仅是 AI4S 的 1.0 阶段。
它的底层逻辑是以技术为中心,先得有海量已知数据和标准答案,再由 AI 专家在人类画好的圈里,靠算力暴力出奇迹,把事情办得更快。
本质上,科学家是在给 AI 打下手。
可亲吻数问题呢?几乎完全反过来。没有现成的数据集,没有标准答案,甚至学术界都吵不明白“啥样的结构才算好”,纯纯的三无难题。
而 PackingStar 干的事儿,相当于把玩法彻底颠倒了。
不指望人类先喂好答案,直接把 AI 扔到没任何先验逻辑的真空地带,从无到有的探索一些新的结果,从而启发科学家进一步的研究,这是 AI for Science 2.0 阶段的特质之一。

纵观全球 AI for Math 的发展,这几年大作频出。
DeepMind 的 AlphaGeometry 搞定了奥数几何,AlphaProof 拿到了 IMO 银牌。
但它们大多在回答 AI 能否在人类已经知道答案的问题上,实现更高效的求解?
PackingStar 直面的是一个更具挑战性的问题 ——
人类都没明确问题边界的时候,AI 能不能自己开路?
亲吻数与广义亲吻数问题,就是一个典型。
PackingStar 正是第一次用系统性的方法,挖出了一堆人类想都没想过的“非对称”高维构型,而且这类发现不是偶然,而是跨越多个维度的持续性产出。
这在 AI for Math 领域是开创性的成果。
方法首创,零数据、零先验,靠多智能体强化学习首次系统性发掘非对称构型,打破人类对对称结构的依赖;
成果硬核,多维度体系化破纪录,成该领域三百年来首次系统性突破。
而且新构型具有明确的几何意义、能启发进一步的数学研究,留下可复用范式,远超之前 AlphaEvolve 在 11 维上的那种单点提升。

这背后,其实是一个关键转变,AI 已不再局限于替代人类计算答案,而是开始参与科学本身的探索。
在这种新的合作范式下,AI 就像是科学家的钢铁侠战衣,更是全程在线的贾维斯。
AI 在远超人类直觉的空间去学习如何求解;
人类再回过头来,对 AI 得到的结果进行解读,提炼出新的数学规律。
在这个闭环里,人机协作的成熟度变高了。
团队里数学专业出身的陶兆巍对此深有体会,他三天两头和 AI 较劲,自己的思路越磨越犀利,PackingStar 也越跑越聪明。
在这场“人”和“机”的 Deep kiss 里,AI 做的并不是替代科学家,反而是能让更多有想法、有灵感的年轻研究者,获得站在数学未知前沿的机会。
One More Thing再说一嘴 PackingStar 这个名字,取得还怪好。
它不只是因为在做球体的堆积(Packing)问题,还藏着团队的另外两重浪漫。
高维几何结构就像数学宇宙里的星系,而 PackingStar 就是飞船和望远镜,带着团队成员们在漫天星河里探索、抵达那些遥远的结构;
团队里每个人都是一颗星星,AI 则帮着年轻科学家们,更高效地闯荡这片广袤的数学宇宙。有一种人机协作共同探索的别样浪漫。

不过这群星星可不只是“埋头苦干”。
如果你走进上智院,会发现门口有一个极具格调的吧台 ——
原本普通的工作区,被陶兆巍和相关团队改造成了“学术酒吧”。

不管你是数学家、生物学家还是 AI 研究员,都可以在这个小吧台来上一杯,谈天侃地、思想碰撞,把不同学科间“离散的智慧”凑到一块儿。
而且据调酒师(也就是陶兆巍)说,“酒水”已经从最开始的一两款无酒精鸡尾酒进化出了“马天尼”“少年游”“问宙星河”等各种风味(酒吧详情可移步至文末纪录片 [doge])。

最最最绝的是,这学术酒吧“开业”没多久,PackingStar 就迎来了突破性进展。搞得我都想在这块“风水宝地”来上一杯沾沾喜气了,有没有小伙伴想一起的~
亲吻数纪录榜单:
[1]https://cohn.mit.edu/kissing-numbers
[2]https://spherical-codes.org/

