菲尔兹奖得主0贡献!GPT-5.5 Pro两幼时跑出博士级证明
新智元报路
编纂:桃子
【新智元导读】全网震撼!菲尔兹奖得主把未解数学题抛给GPT-5.5 Pro,不到两幼时拿到博士论文级证明。整个过程中,他没给出任何数学思路。
今天,菲尔兹奖得主Timothy Gowers在幼我博客上发了一篇长文——
最近一次使用ChatGPT 5.5 Pro的履历
标题平平无奇,内容却让整个数学圈坐不住了。
文中,他亲手验证了一个令整个数学界不寒而栗的事实:
GPT-5.5 Pro,用了不到两个幼时,独立实现了一项博士论文级此外数学钻研。
而Gowers自己在整个过程中,数学贡献险些为0。
两个幼时,一章博士论文级成就。
全程2幼时,菲尔兹奖得主贡献为0
事件是这样的。
这几天,Timothy Gowers拿到了ChatGPT 5.5 Pro的测试权限,决定搞一次真刀真枪的测试。
他从数学家Melvyn Nathanson的一篇新论文中,挑出了几个关于加法数论中集中求和的未解问题。
这些问题的主题是:给定一个k个整数的集中A,它的h重求和集hA的可能大幼有哪些?
要实现特定大幼的求和集,集中的「直径」最幼能是几多?
Nathanson自己给出了一个指数级的上界:2^k - 1。
因而,Gowers把问题抛给了GPT-5.5 Pro。17分钟05秒后,AI给出了一个机关,直接把上界从指数级干到了二次方级。
而这,显然已经是最优的了。
更让人坐不住的,是Gowers在整个过程中表演的角色。
他没有给出任何数学思路,没有提供关键引理,更没有指出证明方向,
Gowers只是充任了一个「感情价值提供者」和「排版副手」,给出的提醒词极其单一——
对,这个设法不错,碰运气能不能成;
把这段推导写成尺度的LaTeX论文体式。
博客中,Gowers在反复强调:提醒词「不蕴含任何数学输入」。
AI走的每一步推理、每一个机关、每一处关键转折,都是它自己想出来的。
仅用了几个幼时,AI就实现了人类可能必要数月,甚至数年能力实现的工作。
换句话说,人类顶级数学家在这场所作中的智力贡献,约蹬宗0。
AI给出原创设法,震惊MIT博士生
若是故事到这里就实现了,那顶多算是「AI又解了一路数学题」。
但后面发生的事件,才真正让人细思极恐。
Gowers持续追问ChatGPT:那通常情况的h呢?这个问题的难度陡然上升。
由于当h=2的时辰,数学家们已齐全搞清了所有可能的求和集大幼。但对于通常的h,甚至不知路齐全的答案是什么。
此前,MIT博士生Isaac Rajagopal已经证了然一个指数级的上界。
Gowers因而让GPT去看看能不能改进拉Rajagopal的了局。
第一轮:GPT思虑了16分41秒,把上界从k的指数级改进到了k^(1/2+ε)的指数级。
这是对拉Rajagopal工作的「通例批改」。
第二轮:Gowers说,能不能再进一步,搞到多项式级?
GPT思虑了13分33秒,暗示「有戏」,但必要验证两个技术性命题。
Gowers让它自己验证,9分12秒后,GPT实现了验证,并在随后的31分40秒内写出了齐全的预印本论文。
论文地址:https://drive.google.com/file/d/1IkJBcWYz_3J_QGsESBmMa-jrEHAJDcJB/view
最终了局:N(h,k) ≤ O(k^{10h?})——从指数级,直接跃升到多项式级。
Rajagopal自己看完后,给出了一个让人五味杂陈的评价:
ChatGPT这个设法很原创、很奇妙。若是是我自己想出来的,我会极度高慢。
然而,我必要一两周能力实现的脑力风暴,GPT只用了不到一个幼时。
更重磅的是,Rajagopal具体分析了GPT的主题创新——
它使用了h?-耗散集(h?-dissociated sets)来节造h阶以下的关系。「这个思路,据我所知,齐满是原创的」。
不得不说,当一个MIT学生用「我会为这个设法感应高慢」来评价一个AI的数学证明时,某种范式转移已经悄然发生了。
顶级数学家忠告:;戳
菲尔兹奖得主Gowers没有停顿在「ChatGPT很严害」的层面,他直接把话题拉到了最敏感的问题:
博士生怎么办?
这才是这篇博客真正的重量级炸弹。
在组合数学领域,有大量论文会提出一系列新的组合参数,并附带一串未解问题。
这些问题通常不是出格难,它们的价值在于给初入科研的学生提供一个「能够攻克的指标」,让他们在解决一个「正式的盛开问题」中获得信念和成就感。
但此刻,这条路被AI截断了。Gowers的原话说得很直白:
从前,只有有人提出问题就够了。
但此刻,仅仅被提出是不够的,它还必须足够难,难到LLM解决不了。
2026年至今,已有15个Erd?s盛开问题被解决,其中11个明确标注了AI的贡献。
就在几周前,一个23岁、没有高档数学学位的年轻人Liam Price,用GPT-5.4 Pro在80分钟内解决了一个困扰数学家60年的Erd?s问题。
菲尔兹奖得主陶哲轩亲自验证了这个证明,并将其扩大为一个新理论的起点。
从前必要数年训练能力达到的钻研能力门槛,在被AI一夜之间碾平。
Gowers直言,「若是AI在数学领域以目前这个速度发展下去,那么我们将很快面对一场;。
对此,OpenAI钻研员Sebastien Bubeck深表赞成。
但也有人默默指出:这只是一次尝试,不能过度表推。Nathanson的问题固然是盛开问题,但难度不定代表数学前沿的天花板。
Gowers自己也认可,他「没有齐全答案」,只是在纪录自己的经历。
从前两年,类似的「AI攻克数学」叙事出现过好几次,仔细看城市发现具体前提限度不少。
但这一次,措辞的人是菲尔兹奖得主,他的判断尺度不必要额表背书。
AI数学加快度,已不成逆转
把功夫线拉长一点就会发现,AI在数学领域的进取曲线险些是垂直的。
2023年,GPT-4做不了大无数本科数学题;2024年,o1在数学较量中拿到了金牌水平;2025年,o3在前沿钻研中起头展示推理能力。
2026年5月,GPT-5.5 Pro独立实现了博士论文级此外证明。
三年,从本科到博士。
Gowers的尝试揭示了一个临界点:AI不只是工具了。至少在某些问题上,它已经是一个能独立产出原创了局的钻研者。
那些已经必要数年苦建能力叩开的大门,此刻只必要一个提醒框和两个幼时。
门槛没了。但门后面的世界,可能比我们设想的更大,也更陌生。
参考资料:
https://x.com/wtgowers/status/2052830948685676605?s=20
https://gowers.wordpress.com/2026/05/08/a-recent-experience-with-chatgpt-5-5-pro/
文章点评
未查问到任何数据!
颁发评论
◎迎接参加会商,请在这里颁发您的见解、互换您的概想。