陶哲軒蓋章,GPT-5.2殺瘋了,我們終將淪為「硅基帕魯」

總統先生,數學界的第四座塔倒了!

昨晚,這張總統耳語的Meme圖,在美國學術圈引發了核爆級的討論。

Paul Erdos留下的第281號難題,被一個「門外漢」用AI暴力破解了。

人類最嚴肅的智力高地,淪為一張Meme圖的註腳。舊世界的規則,崩塌了。

第一現場:被GPT-5.2攻破的百年難題

這不僅是破解,更是「入侵」。

一個手持H100算力集群的「野蠻人」,一腳踹開了象牙塔的大門。

光看Neel Somani的履歷表,就足以讓傳統數學家感到信仰崩塌:

前Citadel量化研究員(以高頻交易著稱的華爾街巨頭);

前Eclipse創始人(Solana生態的高性能區塊鏈項目);

現役AI與區塊鏈交叉領域的探索者。

他來自Eclipse,混跡於加密貨幣與區塊鏈的叢林。在他的世界裡,算力即權力,共識即真理。

2026年1月,他帶著硅谷的算力崇拜,橫衝直撞地闖入了數學界——通過投資或協作的方式,推動了ErdosProblems.com平臺,把Paul Erdős留下的的數學懸賞,變成了一場公開的「獵殺遊戲」。

他的武器不是天才的大腦,而是GPT-5.2Pro。

Somani的邏輯簡單粗暴:既然數學證明可以被形式化,那它本質上和比特幣挖礦沒有任何區別。

只要顯卡夠多,只要AI試錯速度夠快,我就能通過窮舉撞開真理的大門。

結果呢?他賭贏了。

就在幾天前,作為這個收割月的重磅,GPT-5.2成功攻克了Erdős Problem#281。

Erdős Problem#281,源自1980年Erdős和Graham的工作,焦點是「覆蓋系統」的極限行為:

給定一個無限遞增的正整數序列n₁<n₂<⋯,如果對於任意選擇的剩餘類aᵢmodnᵢ,整個整數集都能被這些剩餘類「幾乎完全覆蓋」(即不被覆蓋的整數上密度為0),那麼是否必然存在一個有限前綴k,使得只用前k個剩餘類,就能把未覆蓋整數的密度壓到任意小的ε以下,且這種壓制對所有剩餘類選擇均勻成立?

這題卡了46年,牽扯到遍歷理論、profinite整數上的Haar測度等硬核工具。

Somani的GPT-5.2Pro用遍歷理論+點態遍歷定理+Dini定理給出了證明,陶哲軒評價這個思路與已知的Rogers/Davenport-Erdős證明相當不同。

X上的網友也將其譽為「第一臺真正達到博士級別的AI」。

這已經是2026年1月第三個被GPT-5.2Pro擊落的Erdős問題了。

從聖誕節到現在,ErdosProblems.com上已有15個問題從「open」轉為「solved」,其中11個明確標註AI參與。

陶哲軒甚至開了個wiki頁面,專門記錄「AI對Erdős問題的貢獻」。

https://github.com/teorth/erdosproblems/wiki/AI-contributions-to-Erd%C5%91s-problems?referrer=grok.com

數學界從「會不會來」直接跳到「來得有多快、會掃蕩多少」的恐慌階段。

Somani用行動告訴世界:不需要理解數學之美,只要電費管夠、GPU跑滿,就能收割數學界的「聖盃」。

但是,在這一片歡呼聲中,如果你去翻看Somani公佈的後臺數據,就能發現這場「勝利」的底色,其實是一片屍橫遍野的荒原。

數據庫屍橫遍野

Neel Somani贏了,但贏得非常難看。

登陸ErdosProblems.com,關掉「只顯示成功」的濾鏡,你會看到,後臺躺著成千上萬具「屍體」。

根據數據庫後臺的真實統計,GPT-5.2 Pro對這類問題的一次性通過率,只有可憐的1%到2%。

這意味著,為了那個登上頭條的完美證明,AI在後臺進行了成百上千次的胡言亂語。

它會捏造不存在的引理,陷入邏輯死循環,甚至把數學證明寫成一首打油詩。

如果只有一個GPT-5.2,這堆垃圾早就把數學界淹沒了。

所以,在這場遊戲中,真正的MVP根本不是GPT,而是一個被大眾忽略的冷酷工具——「Aristotle」。

Aristotle其實是Harmonic公司開發的專用工具,它把GPT輸出的自然語言(經常是胡說八道)自動翻譯並強制轉換成Lean形式語言,然後交給Lean內核做嚴格驗證。

相當於給AI配了一個「無限試錯+零容忍bug」的自動編譯+單元測試系統。

沒有它,GPT的1%到2%成功率根本無法浮出水面。

現在的AI解題流程越來越標準化。GPT瘋狂猜→Aristotle強制形式化+殺垃圾→Lean驗證通過→人類再讀。

一次,兩次,一萬次。直到那個概率極低的「倖存者」出現,Aristotle才會放行。

大眾以為的「神蹟」,其實是統計學必然。

陶哲軒在Mastodon上一針見血。他拒絕使用「Intelligence(智能)」,而是發明了一個新詞:「Artificial General Cleverness(人工通用小聰明)」。

注意這個詞:小聰明。

就像是一個從來不聽課、也沒看懂課本的差生,靠著瘋狂的作弊和試錯,硬生生蒙對了一道奧數題。

而這,正是NeelSomani想要的。對於「挖礦」的人來說,只要能挖出金子,誰在乎礦機懂不懂地質學?

最後的防線:人類只負責「提問」,不再負責「解答」

那麼,人類數學家要失業了嗎?

未必。但他們的工種,將發生一次徹底的變異。

在Neel Somani開啟的這個暴力版本里,數學研究不再是屬於藝術家的吟唱,而變成了屬於建築師的圖紙。

以前,數學家需要親自下礦井,一鎬一鎬地去挖掘真理。現在,GPT-5.2接過了鎬頭。

人類唯一剩下的特權,也是最後的防線,叫做「定義問題」。

你需要告訴那個瘋狂的AI礦工:去哪裡挖?挖什麼?以及最重要的——為什麼值得挖?

這聽起來像是升職了,從「礦工」變成了「包工頭」。但這背後藏著一個巨大的隱憂:我們正在失去對「為什麼」的掌控。

當GPT-5.2扔給你一個長達幾千行的Lean證明代碼時,Aristotle會告訴你「這是對的」,但你可能根本讀不懂中間發生了什麼。

表面上,人類從「礦工」升職成了「包工頭」。實際上,我們正在喪失對「為什麼」的解釋權。

數學曾是人類理解宇宙的語言,追求的是極致的優雅和簡潔。

而在AI的統治下,數學可能變成一堆雖然正確、但毫無美感的、亂七八糟的「邏輯堆砌物」。

這或許就是陶哲軒所說的「小聰明」的代價。我們用算力換來了效率,卻把理解這件事,外包給了機器。

當然,陶哲軒也反覆強調,這些被AI快速解決的Erdős問題多屬於「最低垂的果實」——可以用標準工具、只是之前沒人費心去組合的那一類。

真正最硬核的幾十個(比如需要全新思想或新對象的)目前AI還遠沒有觸及。

但問題在於:一旦算力×模型繼續指數上升,昨天的「最硬核」可能就是明天的「最低垂果實」。這不是結束,而是加速。

那張500美元的支票,已經被Neel Somani的算法兌現了。

這筆錢很少,但代價昂貴。它兌現了天才的祛魅,瓦解了數學最後的神聖感。

真理不再是上帝的耳語,它只是服務器裡風扇狂轉後,吐出的一行代碼。

從此,決定真理的不再是智商的高低,而是顯卡的多少。

醒醒吧,大航海時代結束,工業革命開始了。

當年蒸汽機讓肌肉貶值,電力讓距離貶值,今天的GPU集群正在讓「數學直覺的稀缺性」貶值。

下一個被收割的,可能不是Erdős題,而是某個價值5000萬美元的工業優化問題、或者卡了二十年的藥物分子設計關鍵引理。

數學的象牙塔倒了——就像那張總統耳語的Meme圖,下一個可能是你的行業。

參考資料:

https://the-decoder.com/gpt-5-2-pro-solves-another-erdos-problem-while-a-new-database-reveals-most-attempts-still-fail/

https://www.erdosproblems.com/forum/thread/281

https://x.com/neelsomani/status/2012695714187325745

https://mathstodon.xyz/@tao/115911902186528812

https://www.erdosproblems.com/forum/thread/281#post-3327

本文來自微信公眾號“新智元”,作者:新智元,編輯:傾傾,36氪經授權發佈。

來源
免責聲明:以上內容僅為作者觀點,不代表Followin的任何立場,不構成與Followin相關的任何投資建議。
喜歡
收藏
評論