ChatGPT證明了六年難題,圖靈獎得主說:高興早了

avatar
36氪
06-08

學術圈最毒的評價之一是:

這項工作既有新意,又很好。

可惜的是,好的部分不新穎,新穎的部分不好。

但強化學習領域的奠基人之一、《強化學習》教科書的作者、圖靈獎獲得者Richard Sutton,把這個笑話對準了整個生成式AI。

他說:這個評價,適用於今天我們所熟悉的大部分AI。

AI:好的部分不新穎,新穎的部分不好

Sutton的核心論斷極其簡潔,簡潔到殘忍。

生成式AI本質上是監督學習。

監督學習的邏輯是:給模型看大量人類創造的樣本,讓它學會模仿。

模仿得越像,分數越高。

問題來了。

當模型嚴格按訓練數據生成內容時,輸出質量很高,因為它在復現人類已經驗證過的好東西。但這不新穎。它只是在用不同的排列組合,重新包裝人類已經知道的事。

當模型試圖偏離訓練數據、生成真正新穎的內容時,質量就崩了。因為它沒有任何內部機制來判斷「這個新東西到底好不好」。它只會生成,不會評估。

這就是那個結構性矛盾:

新穎性和質量,在純監督學習的框架下,是蹺蹺板的兩端。

你按下一頭,另一頭就翹起來。

不是工程問題。不是靠堆數據、擴大模型、加更多GPU就能解決的。

Sutton用了一個極其刺眼的類比:「幻覺」——大模型最被人詬病的毛病——本質上就是模型試圖「新穎」的副產品。

我們討厭幻覺,恰恰證明了一件事:我們其實根本不要新穎性。我們只要高質量的模仿。

「好的不新穎,新穎的不好。」

那個笑話裡審稿人的毒評,竟然精準描述了整個生成式AI的內在侷限。

真正的「發現」,需要三件套

Sutton從第一性原理出發,拆解了創造力的「三位一體公式」

真正的發現(Discovery)=變異(Variation)+評估(Evaluation)+選擇性保留(Retention)。

任何真正的創造力與發現,都需要三個步驟,缺一不可:

1. 變異(Variation)產生多樣化的可能性。可以是隨機的,可以是基於已有知識的,但必須有真正的不確定性——否則不叫探索,叫查表。

2. 評估(Evaluation)判斷哪些變異是有價值的。這需要一個明確的目標,或者一個能夠識別「好壞」的標準。

3. 選擇性保留(Selective Retention)把有價值的變異留下來,讓它影響未來的行動和學習。

這三個步驟,不是Sutton的發明。它是自然選擇的邏輯,是科學方法的邏輯,是人類學習的邏輯。

進化論:隨機基因突變(變異)→環境篩選(評估)→適者生存(選擇性保留)。

科學方法:提出假說(變異)→實驗驗證(評估)→發表論文(選擇性保留)。

人類學習:嘗試不同解法(變異)→檢驗對錯(評估)→記住有效的方法(選擇性保留)。

現在,生成式AI只完成了三位一體的第一步:幾乎沒有評估,更不要提選擇性保留了,

它就像一個會隨機射箭的弓箭手,但眼睛是蒙著的,射完之後既不看靶子,也不根據結果調整姿勢。

你叫它射一萬箭,偶爾會中靶,但它永遠不知道為什麼中了。

那麼,科學家還有沒有用?

到這裡你可能會有點焦慮:如果未來AI真的能自主完成"發現"的三位一體,科學家是不是就要失業了?

Sutton自己的回答是:不能被取代,但角色要徹底轉型。

他在演講中說,哪怕是能獨立證明數學定理的AI,目前仍然需要人類來告訴它:哪些問題是重要的。

這不是謙虛,而是真實的認知邊界。

數學家Shiqian Ma,萊斯大學(Rice University)優化領域學者,說:他用ChatGPT,證明了一個讓他研究了整整六年的算法收斂性問題。

摘要裡有一句話:

證明由ChatGPT 5.5生成,經作者驗證。

https://optimization-online.org/2026/05/convergence-of-bdrs-as-a-matrix-scaling-algorithm/

這個算法叫BDRS,全稱Bregman Douglas-Rachford Splitting,用於解決最優傳輸(Optimal Transport)問題。

論文標題:Bregman Douglas-Rachford Splitting Method

預印本地址:https://arxiv.org/abs/2509.08739

這是他和合著者們自己設計的東西,困擾了他六年的,是它的收斂性證明,就是說數學上最嚴格意義上的「它為什麼是對的」。

預印本平臺arXiv收到投稿後,至今仍在擱置。

他猜測原因:摘要裡有「ChatGPT」三個字,平臺不知道該如何處理這類論文。

但人類能被AI取代嗎?

他的回答是:不能。他直言:

我認為AI不能創造性地提出這種算法,並聲稱「這是一種用於最優傳輸的高效算法,現在讓我試著證明它的收斂性」。

沒有人類的引導,AI根本不知道該解決哪個問題。

這句話和Sutton精確對應:問題本身,必須由人類來定義。

他花了六年,才「提出正確問題」:

要提出哪些問題,實際上需要你對該主題有非常深入的理解。

就本例而言,我已在這個問題上鑽研了六年,因此我清楚地知道其中的難點所在。"

這六年不是浪費,是先決條件。

正是這六年,讓他知道這個證明卡在哪,之前所有路徑失敗的原因是什麼,ChatGPT給出的哪個方向值得繼續追、哪個是幻覺。

而且不是一次提示,是五個月。這是最容易被誤解的地方,他自己也誤解過:

從1月到5月,整整五個月,無數次對話,每一次提示都在逼近那個證明。

他總結得極其清醒:

研究的本質沒變,還是反覆試錯。變的是每一次試錯的速度——過去需要幾周驗證一個方向,現在幾分鐘就能知道這條路走不走得通。

但AI的貢獻不可磨滅:

然後,結尾直接封神:

回到我關於BDRS收斂性的論文,我相當確信證明是正確的。

但如果你發現任何錯誤,責任全由我承擔——請不要責怪ChatGPT,它才3.5歲。

這句話妙就妙在雙重性:這是真誠的責任聲明,也是一個精準的隱喻。

「3.5歲」描述了AI此刻真實的處境:能力驚人,但判斷未熟。

畢竟,人類從來沒有指望3.5歲的孩童能做什麼貢獻。

雖然你不能把證明的最終簽名權交給AI,但你也不能假裝AI沒做任何貢獻。

這也是為什麼,真正的科學發現不會消失在人類手中。

相反,它會更殘酷地篩選人類:誰能提出好問題,誰才配擁有強AI。

未來,科學家不借助AI,或許就像天文學家不用電腦一樣過時。

最後,我們一起回味Sutton頗具宣言性質的話:

如果我們希望充分發揮AI科學家的全部力量,就應該與他們共享目標,讓他們能夠創造、評估、發現,從而全面參與實現這些目標。

讓我們大膽一點!讓我們徹底實現創造力與發現的全自動化!

參考資料:

https://x.com/RichardSSutton/status/2061216087744946656

https://optimization-online.org/2026/05/convergence-of-bdrs-as-a-matrix-scaling-algorithm/

本文來自微信公眾號“新智元”,作者:ASI啟示錄,編輯:大衛,36氪經授權發佈。

來源
免責聲明:以上內容僅為作者觀點,不代表Followin的任何立場,不構成與Followin相關的任何投資建議。
喜歡
79
收藏
19
評論