GPT-5正改寫科學發現的規則!一篇重磅論文揭秘,「量子版NP難題」竟被GPT-5在30分鐘之內攻克了,然而這要耗費人類1-2周的時間。照這種速度發展下去,AI離完成「諾獎級」突破真的不遠了。
幾天前,GPT-5成功通過「哥德爾測試」,破解了數學三大猜想。
意想不到的是,這一次,GPT-5又「攻陷」了量子領域的難題。
量子計算專家Scott Aaronson首次發表論文,證明其中一個老難題竟被GPT-5助攻破解了。
論文中,Scott一直在死磕量子計算中的一個核心問題——QMA複雜度類別,堪稱「量子版的NP問題」。
其中,關鍵在於證明過程中的誤差概率,能否被無限降低,特別是,能否實現完美完備性。
論文地址:https://arxiv.org/pdf/2509.21131
之前學界研究中已經把誤差壓到很低,但最新研究卻發現:「雙指數級誤差」是現有方法的理論極限,無法進一步突破。
在關鍵推導環節受阻後,作者開始向GPT-5尋求幫助。一開始,AI給出了錯誤的思路。
但在大約30分鐘交互後,它最終提出一個精妙的數學函數,精確分析出特徵值行為。
研究證明,這一構想成為了論文中最關鍵的突破。
在最新博文中,Scott驚歎地表示,「這思路要是哪個學生想出來的,我絕對會誇一句——真是絕了」!
這個難題預估需要1-2周人力才能完成
OpenAI科學家Sebastien、產品負責人Kevin再次激動轉發,並稱「一場重大變革開始了」。
量子版NP難題:QMA奇點
這篇於25日提交至arXiv的論文,主要研究了量子複雜性類「QMA中黑盒放大的侷限性」。
那麼,QMA是什麼?
QMA,即量子梅林-亞瑟(Quantum Merlin Arthur),可以看作是NP的典型量子版本。
它包含了一類決策問題:
如果答案是「是」,Merlin可以發送給Arthur一個量子見證態,能讓Arthur(在經過多項式時間的量子計算後)以至少2/3的概率接受;
而如果答案是「否」,無論Merlin發送什麼見證態,Arthur接受的概率都至多為1/3。
在這裡,如同複雜性理論中常見的那樣,常數2/3和1/3只是慣例,可以通過放大替換為,比如1-2⁻ⁿ和2⁻ⁿ。
在這個領域,一個長期懸而未決的問題是——
QMA是否等於QMA₁,其中QMA₁是QMA的一個子類,允許協議具有「完美完備性」?
2008年,Scott Aaronson通過實用分析方法,證明了存在一個「量子預言機」,使得QMA≠QMA₁。
這意味著,任何證明QMA=QMA₁的嘗試,都需要「量子非相對化技術」。
這倒並不是說這個障礙難以逾越,但至少說明了問題的複雜性。
突破:雙指數放大侷限
直到今年6月,Freek Witteveen和Stacey Jeffery發表了一篇重磅論文,證明了QMA協議可通過黑盒方式放大,讓完備性誤差達到了「雙指數級小」,即 1/exp(exp(n))。
論文地址:https://arxiv.org/pdf/2506.15551
他們採用了一種Scott從未想過的方法:將接受概率編碼到一個量子態的振幅中,而這些振幅以幾何級數遞減。
事實證明,QMA這位相識25年的「老朋友」,依然能帶來驚喜。
在8月的線上會議,Scott問道:
這個雙指數的完備性,是黑盒技術的極限嗎?能否進一步放大到三指數級小,即1/exp(exp(exp(n)))。
30分鐘攻克,GPT-5上大分
一週後,Scott聯手Freek寫出了完整證明,表明在黑盒技術下,雙指數級小的完備性誤差已是極限。
換句話說,他們將2008年的「QMA≠QMA₁」預言機分離結果量化,得到的「下界」(lower bound)恰好與6月論文的協議相匹配。
這項研究最引人注目的部分,或許並不是量子複雜性本身,而是AI在其中的角色。
如前所述,這是Scott Aaronson第一篇論文,其主要成果證明中的一個關鍵技術步驟來自AI。
具體來說,是GPT5-Thinking。
當時,作者面臨的一個問題是:分析一個N×N的厄米矩陣E(θ)(比如,N=2ⁿ),其每個元素都是一個關於實參數θ的poly(n)次三角多項式。
需要證明的是,當θ從0變化到1時E(θ)的最大特徵值,以證明λₘₐₓ(E(θ))不可能從一個接近0的值開始,然後長時間「停留」在接近1的狀態,例如接近 1/exp(exp(exp(n)))。
針對這一問題,如有1-2周的時間,Scott和合著者查閱文獻也可以解決。
但他選擇了GPT5-Thinking,5分鐘後,它給出了一個自信但明顯錯誤的答案。
Scott並沒有嘲笑AI,而是告訴它錯在哪裡。GPT5-Thinking在思考片刻後,再次嘗試給出了一個更好的方案。
就這樣,經過了幾次反覆迭代,如同研究生/同事交流一樣,GPT-5給出了以下函數:
它正確指出,這是一個關於θ的次數可控的有理函數,並且恰好編碼了最大特徵值 λₘₐₓ(E(θ))與1的接近程度的相關信息。
令人欣喜的是,這個方法奏效了,不用AI協助就能輕鬆完成驗證。
Scott認為,或許GPT5在訓練數據中,某個地方見過類似結構,但若是學生提出的方案,他會毫不猶豫地稱其為「巧妙」。
最後,他回憶道,一年前,自己曾用當時的GPT推理模型嘗試類似問題,結果遠不如人意。
現在,是2025年9月,我可以明確告訴你——
AI已經開始真正觸及那些我認為最具人類智慧特徵的核心工作:證明量子複雜性類之間的預言機分離。
雖然它現在還做不到獨立撰寫整篇研究論文,但如果你清楚自己在做什麼,它能幫你擺脫困境,這可以說是一個絕佳的應用場景。
誰知道,這種情況會持續多久?
Scott Aaronson調侃道,「想到這兒,不禁慶幸自己還有個鐵飯碗——終身教職」。
參考資料:
https://scottaaronson.blog/?p=9183
https://x.com/SebastienBubeck/status/1972368891239375078
https://x.com/kimmonismus/status/1972399015825203463
本文來自微信公眾號“新智元”,作者:新智元,編輯:桃子,36氪經授權發佈。