陶哲軒蓋章，GPT-5.2殺瘋了，我們終將淪為「硅基帕魯」

36氪

01-26

總統先生，數學界的第四座塔倒了！

昨晚，這張總統耳語的Meme圖，在美國學術圈引發了核爆級的討論。

Paul Erdos留下的第281號難題，被一個「門外漢」用AI暴力破解了。

人類最嚴肅的智力高地，淪為一張Meme圖的註腳。舊世界的規則，崩塌了。

第一現場：被GPT-5.2攻破的百年難題

這不僅是破解，更是「入侵」。

一個手持H100算力集群的「野蠻人」，一腳踹開了象牙塔的大門。

光看Neel Somani的履歷表，就足以讓傳統數學家感到信仰崩塌：

前Citadel量化研究員（以高頻交易著稱的華爾街巨頭）；

前Eclipse創始人（Solana生態的高性能區塊鏈項目）；

現役AI與區塊鏈交叉領域的探索者。

他來自Eclipse，混跡於加密貨幣與區塊鏈的叢林。在他的世界裡，算力即權力，共識即真理。

2026年1月，他帶著硅谷的算力崇拜，橫衝直撞地闖入了數學界——通過投資或協作的方式，推動了ErdosProblems.com平臺，把Paul Erdős留下的的數學懸賞，變成了一場公開的「獵殺遊戲」。

他的武器不是天才的大腦，而是GPT-5.2Pro。

Somani的邏輯簡單粗暴：既然數學證明可以被形式化，那它本質上和比特幣挖礦沒有任何區別。

只要顯卡夠多，只要AI試錯速度夠快，我就能通過窮舉撞開真理的大門。

結果呢？他賭贏了。

就在幾天前，作為這個收割月的重磅，GPT-5.2成功攻克了Erdős Problem#281。

Erdős Problem#281，源自1980年Erdős和Graham的工作，焦點是「覆蓋系統」的極限行為：

給定一個無限遞增的正整數序列n₁<n₂<⋯，如果對於任意選擇的剩餘類aᵢmodnᵢ，整個整數集都能被這些剩餘類「幾乎完全覆蓋」（即不被覆蓋的整數上密度為0），那麼是否必然存在一個有限前綴k，使得只用前k個剩餘類，就能把未覆蓋整數的密度壓到任意小的ε以下，且這種壓制對所有剩餘類選擇均勻成立？

這題卡了46年，牽扯到遍歷理論、profinite整數上的Haar測度等硬核工具。

Somani的GPT-5.2Pro用遍歷理論+點態遍歷定理+Dini定理給出了證明，陶哲軒評價這個思路與已知的Rogers/Davenport-Erdős證明相當不同。

X上的網友也將其譽為「第一臺真正達到博士級別的AI」。

這已經是2026年1月第三個被GPT-5.2Pro擊落的Erdős問題了。

從聖誕節到現在，ErdosProblems.com上已有15個問題從「open」轉為「solved」，其中11個明確標註AI參與。

陶哲軒甚至開了個wiki頁面，專門記錄「AI對Erdős問題的貢獻」。

https://github.com/teorth/erdosproblems/wiki/AI-contributions-to-Erd%C5%91s-problems?referrer=grok.com

數學界從「會不會來」直接跳到「來得有多快、會掃蕩多少」的恐慌階段。

Somani用行動告訴世界：不需要理解數學之美，只要電費管夠、GPU跑滿，就能收割數學界的「聖盃」。

但是，在這一片歡呼聲中，如果你去翻看Somani公佈的後臺數據，就能發現這場「勝利」的底色，其實是一片屍橫遍野的荒原。

數據庫屍橫遍野

Neel Somani贏了，但贏得非常難看。

登陸ErdosProblems.com，關掉「只顯示成功」的濾鏡，你會看到，後臺躺著成千上萬具「屍體」。

根據數據庫後臺的真實統計，GPT-5.2 Pro對這類問題的一次性通過率，只有可憐的1%到2%。

這意味著，為了那個登上頭條的完美證明，AI在後臺進行了成百上千次的胡言亂語。

它會捏造不存在的引理，陷入邏輯死循環，甚至把數學證明寫成一首打油詩。

如果只有一個GPT-5.2，這堆垃圾早就把數學界淹沒了。

所以，在這場遊戲中，真正的MVP根本不是GPT，而是一個被大眾忽略的冷酷工具——「Aristotle」。

Aristotle其實是Harmonic公司開發的專用工具，它把GPT輸出的自然語言（經常是胡說八道）自動翻譯並強制轉換成Lean形式語言，然後交給Lean內核做嚴格驗證。

相當於給AI配了一個「無限試錯+零容忍bug」的自動編譯+單元測試系統。

沒有它，GPT的1%到2%成功率根本無法浮出水面。

現在的AI解題流程越來越標準化。GPT瘋狂猜→Aristotle強制形式化+殺垃圾→Lean驗證通過→人類再讀。

一次，兩次，一萬次。直到那個概率極低的「倖存者」出現，Aristotle才會放行。

大眾以為的「神蹟」，其實是統計學必然。

陶哲軒在Mastodon上一針見血。他拒絕使用「Intelligence（智能）」，而是發明了一個新詞：「Artificial General Cleverness（人工通用小聰明）」。

注意這個詞：小聰明。

就像是一個從來不聽課、也沒看懂課本的差生，靠著瘋狂的作弊和試錯，硬生生蒙對了一道奧數題。

而這，正是NeelSomani想要的。對於「挖礦」的人來說，只要能挖出金子，誰在乎礦機懂不懂地質學？

最後的防線：人類只負責「提問」，不再負責「解答」

那麼，人類數學家要失業了嗎？

未必。但他們的工種，將發生一次徹底的變異。

在Neel Somani開啟的這個暴力版本里，數學研究不再是屬於藝術家的吟唱，而變成了屬於建築師的圖紙。

以前，數學家需要親自下礦井，一鎬一鎬地去挖掘真理。現在，GPT-5.2接過了鎬頭。

人類唯一剩下的特權，也是最後的防線，叫做「定義問題」。

你需要告訴那個瘋狂的AI礦工：去哪裡挖？挖什麼？以及最重要的——為什麼值得挖？

這聽起來像是升職了，從「礦工」變成了「包工頭」。但這背後藏著一個巨大的隱憂：我們正在失去對「為什麼」的掌控。

當GPT-5.2扔給你一個長達幾千行的Lean證明代碼時，Aristotle會告訴你「這是對的」，但你可能根本讀不懂中間發生了什麼。

表面上，人類從「礦工」升職成了「包工頭」。實際上，我們正在喪失對「為什麼」的解釋權。

數學曾是人類理解宇宙的語言，追求的是極致的優雅和簡潔。

而在AI的統治下，數學可能變成一堆雖然正確、但毫無美感的、亂七八糟的「邏輯堆砌物」。

這或許就是陶哲軒所說的「小聰明」的代價。我們用算力換來了效率，卻把理解這件事，外包給了機器。

當然，陶哲軒也反覆強調，這些被AI快速解決的Erdős問題多屬於「最低垂的果實」——可以用標準工具、只是之前沒人費心去組合的那一類。

真正最硬核的幾十個（比如需要全新思想或新對象的）目前AI還遠沒有觸及。

但問題在於：一旦算力×模型繼續指數上升，昨天的「最硬核」可能就是明天的「最低垂果實」。這不是結束，而是加速。

那張500美元的支票，已經被Neel Somani的算法兌現了。

這筆錢很少，但代價昂貴。它兌現了天才的祛魅，瓦解了數學最後的神聖感。

真理不再是上帝的耳語，它只是服務器裡風扇狂轉後，吐出的一行代碼。

從此，決定真理的不再是智商的高低，而是顯卡的多少。

醒醒吧，大航海時代結束，工業革命開始了。

當年蒸汽機讓肌肉貶值，電力讓距離貶值，今天的GPU集群正在讓「數學直覺的稀缺性」貶值。

下一個被收割的，可能不是Erdős題，而是某個價值5000萬美元的工業優化問題、或者卡了二十年的藥物分子設計關鍵引理。

數學的象牙塔倒了——就像那張總統耳語的Meme圖，下一個可能是你的行業。

參考資料：

https://the-decoder.com/gpt-5-2-pro-solves-another-erdos-problem-while-a-new-database-reveals-most-attempts-still-fail/

https://www.erdosproblems.com/forum/thread/281

https://x.com/neelsomani/status/2012695714187325745

https://mathstodon.xyz/@tao/115911902186528812

https://www.erdosproblems.com/forum/thread/281#post-3327

本文來自微信公眾號“新智元”，作者：新智元，編輯：傾傾，36氪經授權發佈。