ChatGPT證明了六年難題，圖靈獎得主說：高興早了

06-08

學術圈最毒的評價之一是：

這項工作既有新意，又很好。
可惜的是，好的部分不新穎，新穎的部分不好。

但強化學習領域的奠基人之一、《強化學習》教科書的作者、圖靈獎獲得者Richard Sutton，把這個笑話對準了整個生成式AI。

他說：這個評價，適用於今天我們所熟悉的大部分AI。

AI：好的部分不新穎，新穎的部分不好

Sutton的核心論斷極其簡潔，簡潔到殘忍。

生成式AI本質上是監督學習。

監督學習的邏輯是：給模型看大量人類創造的樣本，讓它學會模仿。

模仿得越像，分數越高。

問題來了。

當模型嚴格按訓練數據生成內容時，輸出質量很高，因為它在復現人類已經驗證過的好東西。但這不新穎。它只是在用不同的排列組合，重新包裝人類已經知道的事。

當模型試圖偏離訓練數據、生成真正新穎的內容時，質量就崩了。因為它沒有任何內部機制來判斷「這個新東西到底好不好」。它只會生成，不會評估。

這就是那個結構性矛盾：

新穎性和質量，在純監督學習的框架下，是蹺蹺板的兩端。
你按下一頭，另一頭就翹起來。

不是工程問題。不是靠堆數據、擴大模型、加更多GPU就能解決的。

Sutton用了一個極其刺眼的類比：「幻覺」——大模型最被人詬病的毛病——本質上就是模型試圖「新穎」的副產品。

我們討厭幻覺，恰恰證明了一件事：我們其實根本不要新穎性。我們只要高質量的模仿。

「好的不新穎，新穎的不好。」

那個笑話裡審稿人的毒評，竟然精準描述了整個生成式AI的內在侷限。

真正的「發現」，需要三件套

Sutton從第一性原理出發，拆解了創造力的「三位一體公式」：

真正的發現（Discovery）=變異（Variation）+評估（Evaluation）+選擇性保留（Retention）。

任何真正的創造力與發現，都需要三個步驟，缺一不可：

1. 變異（Variation）產生多樣化的可能性。可以是隨機的，可以是基於已有知識的，但必須有真正的不確定性——否則不叫探索，叫查表。
2. 評估（Evaluation）判斷哪些變異是有價值的。這需要一個明確的目標，或者一個能夠識別「好壞」的標準。
3. 選擇性保留（Selective Retention）把有價值的變異留下來，讓它影響未來的行動和學習。

這三個步驟，不是Sutton的發明。它是自然選擇的邏輯，是科學方法的邏輯，是人類學習的邏輯。

進化論：隨機基因突變（變異）→環境篩選（評估）→適者生存（選擇性保留）。
科學方法：提出假說（變異）→實驗驗證（評估）→發表論文（選擇性保留）。
人類學習：嘗試不同解法（變異）→檢驗對錯（評估）→記住有效的方法（選擇性保留）。

現在，生成式AI只完成了三位一體的第一步：幾乎沒有評估，更不要提選擇性保留了，

它就像一個會隨機射箭的弓箭手，但眼睛是蒙著的，射完之後既不看靶子，也不根據結果調整姿勢。

你叫它射一萬箭，偶爾會中靶，但它永遠不知道為什麼中了。

那麼，科學家還有沒有用？

到這裡你可能會有點焦慮：如果未來AI真的能自主完成"發現"的三位一體，科學家是不是就要失業了？

Sutton自己的回答是：不能被取代，但角色要徹底轉型。

他在演講中說，哪怕是能獨立證明數學定理的AI，目前仍然需要人類來告訴它：哪些問題是重要的。

這不是謙虛，而是真實的認知邊界。

數學家Shiqian Ma，萊斯大學（Rice University）優化領域學者，說：他用ChatGPT，證明了一個讓他研究了整整六年的算法收斂性問題。

摘要裡有一句話：

證明由ChatGPT 5.5生成，經作者驗證。

https://optimization-online.org/2026/05/convergence-of-bdrs-as-a-matrix-scaling-algorithm/

這個算法叫BDRS，全稱Bregman Douglas-Rachford Splitting，用於解決最優傳輸（Optimal Transport）問題。

論文標題：Bregman Douglas-Rachford Splitting Method

預印本地址：https://arxiv.org/abs/2509.08739

這是他和合著者們自己設計的東西，困擾了他六年的，是它的收斂性證明，就是說數學上最嚴格意義上的「它為什麼是對的」。

預印本平臺arXiv收到投稿後，至今仍在擱置。

他猜測原因：摘要裡有「ChatGPT」三個字，平臺不知道該如何處理這類論文。

但人類能被AI取代嗎？

他的回答是：不能。他直言：

我認為AI不能創造性地提出這種算法，並聲稱「這是一種用於最優傳輸的高效算法，現在讓我試著證明它的收斂性」。

沒有人類的引導，AI根本不知道該解決哪個問題。

這句話和Sutton精確對應：問題本身，必須由人類來定義。

他花了六年，才「提出正確問題」：

要提出哪些問題，實際上需要你對該主題有非常深入的理解。

就本例而言，我已在這個問題上鑽研了六年，因此我清楚地知道其中的難點所在。"

這六年不是浪費，是先決條件。

正是這六年，讓他知道這個證明卡在哪，之前所有路徑失敗的原因是什麼，ChatGPT給出的哪個方向值得繼續追、哪個是幻覺。

而且不是一次提示，是五個月。這是最容易被誤解的地方，他自己也誤解過：

從1月到5月，整整五個月，無數次對話，每一次提示都在逼近那個證明。

他總結得極其清醒：

研究的本質沒變，還是反覆試錯。變的是每一次試錯的速度——過去需要幾周驗證一個方向，現在幾分鐘就能知道這條路走不走得通。

但AI的貢獻不可磨滅：

然後，結尾直接封神：

回到我關於BDRS收斂性的論文，我相當確信證明是正確的。

但如果你發現任何錯誤，責任全由我承擔——請不要責怪ChatGPT，它才3.5歲。

這句話妙就妙在雙重性：這是真誠的責任聲明，也是一個精準的隱喻。

「3.5歲」描述了AI此刻真實的處境：能力驚人，但判斷未熟。

畢竟，人類從來沒有指望3.5歲的孩童能做什麼貢獻。

雖然你不能把證明的最終簽名權交給AI，但你也不能假裝AI沒做任何貢獻。

這也是為什麼，真正的科學發現不會消失在人類手中。

相反，它會更殘酷地篩選人類：誰能提出好問題，誰才配擁有強AI。

未來，科學家不借助AI，或許就像天文學家不用電腦一樣過時。

最後，我們一起回味Sutton頗具宣言性質的話：

如果我們希望充分發揮AI科學家的全部力量，就應該與他們共享目標，讓他們能夠創造、評估、發現，從而全面參與實現這些目標。

讓我們大膽一點！讓我們徹底實現創造力與發現的全自動化！

參考資料：

https://x.com/RichardSSutton/status/2061216087744946656

https://optimization-online.org/2026/05/convergence-of-bdrs-as-a-matrix-scaling-algorithm/

本文來自微信公眾號“新智元”，作者：ASI啟示錄，編輯：大衛，36氪經授權發佈。

相关赛道:

智能合約公鏈

來源

免責聲明：以上內容僅為作者觀點，不代表Followin的任何立場，不構成與Followin相關的任何投資建議。

喜歡

79

收藏

19

評論

分享

相關推薦

Bitcoin Sistemi

巨鯨拋售，主要交易所上市的競爭幣價格暴跌——跌幅超過70%

美國政府禁止外國人使用 Fable 5，Anthropic 發文駁斥

美國政府命令Anthropico公司撤回Claude Fable和Mythos人工智能模型