88歲算法祖師爺驚呆,Claude聯手GPT攻破30年難題,14頁論文0修改

【導讀】 「哈密頓分解」難題,終於破解!88歲「算法祖師爺」高德納再更論文,Claude 4.6+GPT-5.4聯合破解了奇偶數情形。甚至,GPT-5.4直出一篇14頁論文,引爆全網。

88歲的老爺子,終於填平了自己當年挖下的坑!

三週前,「算法祖師爺」、圖靈獎最年輕的得主高德納被Claude震驚:一個懸了多年的算法難題,竟被Claude Opus 4.6解決了。

論文一開篇,他直呼「震驚、震驚」!

論文地址:https://cs.stanford.edu/~knuth/papers/claude-cycles.pdf

但進一步研究發現,實際上存在760種類似的分解方法,Claude只是找到了其中一個。

它只攻克了m為奇數的「堡壘」,對於m為偶數的情況,仍然沒有通用解

更新後的論文顯示,這一難題取得了巨大的進展!

GPT-5.4 Pro接棒Claude,對所有m≥8的偶數直出長達14頁的論文,並通過計算驗證了高達m=2000的情形。

不僅如此,GPT與Claude聯動後,通過多智能體工作流,為奇數和偶數m找到了更簡潔的構造方法。

還有人使用Lean語言,將Claude關於奇數情況的證明形式化。

至此,「哈密頓分解」難題徹底解決。

從Claude 4.6到GPT-5.4,再加上業界諸多大佬合力,終於把數十年的坑填上了。

論文的最後,老爺子感慨道——

我們的確生活在一個非常有趣的時代。願原力與你同在。

88歲算法祖師爺,挖了一個「大坑」

一直以來,在組合數學裡,哈密頓路徑(Hamiltonian Path)是一座易守難攻的要塞。

簡單來說,它要求在複雜的圖形網絡中,尋找一條不重複地經過每一個節點的閉合環路。

而「哈密頓分解問題」,則是要將一個圖完美地拆解為多個這樣的環路。這不僅是計算量的博弈,更是對數學構造能力的極限壓榨。

這個坑,是高德納親手挖下的。

在他撰寫計算機科學鉅著《計算機程序設計藝術》(TAOCP)的過程中,哈密頓分解始終是一個讓他掛念的「補丁」。

這個問題已經懸置了數十年,用術語描述如下:

此前,學術界始終無法給出覆蓋奇數與偶數情形的完整全解。

隨著節點增加,搜索空間呈指數級爆炸,人類的大腦在那種深度的黑暗面前,往往會感到生理性的無力。

過去三十年,無數天才試圖填坑,但大多折戟於那道「奇偶全解」的最後防線。

直到2026年的這個春天,高德納決定換一種武器。

偶數m,有解了?

上一次Claude Opus 4.6,在31次探索之後,終於提出了一套簡單的規則——

s = (i + j + k) mod m

其中依據s、i、j的情況,再去決定是否增加i、增加j、增加k,具體規則如下:

如果s=0,根據j的值決定移動方向。如果0<s <m−1,則根據i的值決定。如果s=m−1,再用另一種規則。

結果,Claude通過程序驗證了,當m=3,5,7,9,11,路徑全部成立。

可以看到,Claude只解決了m為奇數的情況,至於m為偶數的問題,還未得出真正的解。

直到3月3日,Filip Stappers給老爺子寫信說,「這事兒還有後續」。

Stappers讓Claude Opus 4.6再次針對m為偶數,算了大概4個小時,終於有些眉目,但沒有完整的解。

最終,Claude建立了一個類似於奇數情況的局部纖維構造,然後通過運行搜索來進行修補完善。

在最後的階段中,它把主要時間用在了「加快搜索」的速度上,而不是去尋找一個真正的構造方法。

它跑了許多程序,試圖用模擬「退火」或「回溯」算法來尋找解。

在Stappers建議下,讓Claude使用ORTools CP-SAT(谷歌開源工具包的一部分,帶有AddCircuit約束)求解,奇蹟發生了。

現在的程序,在短短几秒鐘內就能直接跑出結果!

緊接著在3月4日,來自新加坡好友Ho Boon Suan帶來了更震撼的消息。

他利用gpt-5.3-codex生成了一段代碼,成功實現了偶數m≥8的分解。

為了驗證可靠性,他測試了8到200之間所有的偶數m,以及400-2000之間的一些隨機偶數,結果都沒問題。

要知道,當m=2000時,那可是一個擁有80億個頂點的龐大圖結構!

若是純靠人力,來手算證明其正確性簡直是「天方夜譚」。

幾乎同一時間,來自Lean社區的Kim Morrison動作極其迅速。

他把之前關於Claude構造正確的證明形式化驗證,並於3月4日及時地發到了網上。

數學天才,扎堆研究

另一位名為「Exocija」的匿名研究者,找到了一種適用於奇數m的全新構造。

單從計算的角度來看,這極可能是目前最簡潔的方案,儘管它的證明也許不是最簡單的。

在C語言程序中,只需將特定的幾行替換為極其精簡的邏輯代碼,就能獲得有效的分解。

而且,幾乎每一步,都巧妙地利用了恆等置換「012」。

  • if (s == 0) d = (j == m - 1? "201" : "021");
  • else if (s == m - 1) d = (j == 0? "102" : "120");
  • else d = "012";

他是如何做到的?答案是:跨模型協作。

Exocija在GPT-5.4和Claude 4.6 Sonnet這兩個頂尖模型之間不斷來回粘貼文本,利用它們不同的思考維度相互啟發,最終成功拼湊出了完整的證明。

0修改,GPT-5.4直出14頁論文

關於偶數m的構造問題,真正的高潮還在後面。

既然gpt-5.3-codex生成的算法規律過於複雜,Ho Boon Suan決定給GPT-5.4 Pro下達一個終極指令:

你的任務是嚴格證明之前給出的算法,當m是≥ 8的偶數時,確實總是能產生三個長度均為m³的循環。

最好能深入說明一下這個算法為何有效,並探討是否有更簡單的構造方法。

誰曾想,GPT-5.4 Pro直接交出了一份令人驚歎的答卷——

一篇排版精美、邏輯嚴密、長達14頁的學術論文。

從「摘要」到「結論」,結構完整,起承轉合嚴絲合縫。

而且,它還採用了TeX標準,高德納本人就是TeX的發明者,AI似乎在用這一語言向他致敬。

最重要的是,論文通過了Lean形式化驗證工具的檢驗。

用Ho的原話來說,這完全是GPT-5.4 Pro獨立完成的壯舉,他連一個標點符號都不需要修改!

這意味著,它的邏輯鏈條在數學意義上是「絕對真理」。

AI「左右互搏」,Claude+GPT終成完美證明

這個故事的集大成者是Keston Aquino-Michaels。

不僅為奇數m的情形找到了另一種有效的分解,同時為偶數m的情形給出了一種優雅的分解,其簡潔程度遠超此前方法。

此外,他還發掘出了一篇高德納之前遺漏的相關參考文獻(即下圖最後參考文獻)。

預印本:https://arxiv.org/abs/2203.11017

最妙的是,他還細緻分析了這種聯合交互模式,對於未來如何應對並解決新問題具有潛在的重要意義。

  • 完整報告:https://github.com/no-way-labs/residue/blob/main/paper/completing_claudes_cycles.pdf
  • 開源項目:https://github.com/no-way-labs/residue
  • 簡單來說,Keston Aquino-Michaels並沒有簡單地向AI提問,而是構建了精妙的「協作工作流」

這更像是一場跨越碳基與硅基的協同演習,是Claude、GPT和人類的密切合作。

其中,兩個Agent獨立運行,使用相同的「Residue」提示詞。

兩個智能體使用的結構化探索提示詞

但各自發揮特長:

Agent O:5次探索解決奇數情況(符號證明)

Agent C:找到m=4,6,8,10,12的具體解(數據)

但兩個Agent沒有直接對話,通過Orchestrator中轉——數據、工具都經由指揮者(人類引導的Opus 4.6)傳遞。

Orchestrator需要判斷「何時傳、傳什麼、以什麼格式傳」,這不是兩個Agent自己能完成的。

比如,Agent O在偶數情況卡在m=10,無法推進;Orchestrator將Agent C的解傳遞給Agent O;Agent O收到後,立即識別出模式:m−2層「批量層」+2層「修復層」。

最終,那個困擾了人類幾十年的「奇偶情形全解」,在兩個AI智能體的瘋狂交鋒中,被徹底鑿穿。

人類圈定戰場,機器填補深淵

這次「填坑」,標誌著科學研究範式的徹底轉折。

科學家的身份變了。比如,高德納不再是那個在紙上計算每一行代碼的工匠,他定義了問題的邊界,設計了驗證的邏輯,然後指揮AI去填補那道試錯的黑洞。

研究的範式變了。人類只需定義邊界,而AI填補深淵。

數學家最珍貴的能力不再是算力,而是「提出問題的直覺」和「驗證答案的審美」

AI負責在無限的試錯中尋找路徑,而人類負責在終點確認這是否就是我們要找的真理。

下一個是誰?

當88歲的算法泰斗都開始用AI填坑,我們必須意識到:數學研究的工作方式正在發生不可逆的轉折。

這不僅僅是高德納的勝利,更是人類智力的一次「外掛式升級」。

在「機器左右互搏」的時代,連最嚴謹的數學殿堂都已經向AI敞開大門。

如果你還在糾結「AI是否會取代我」,那麼你可能已經錯過了成為下一個「智力架構師」的機會。

下一個被AI鑿穿的世紀難題,會是黎曼猜想,還是物理學的統一場論?

在這個「極其有趣的時代」,我們唯一的恐懼,應該是對這種進化速度的漠視。

參考資料: 

https://x.com/slow_developer/status/2038399555490791765 

https://x.com/mubeitech/status/2038388810157826467 

https://x.com/BoWang87/status/2037648937453232504 

本文來自微信公眾號“新智元”,編輯:KingHZ 桃子 ,36氪經授權發佈。

來源
免責聲明:以上內容僅為作者觀點,不代表Followin的任何立場,不構成與Followin相關的任何投資建議。
喜歡
收藏
評論