GPT-5破解世紀難題，竟是上網抄來的，哈薩比斯：太尷尬了

10-21

GPT-5一場鬧劇，讓OpenAI出大糗了！讓所有人都以為GPT-5破解了十道Erdos難題，沒想到竟是查文獻給出了答案。Hassabis點評，這太尷尬了。

OpenAI團隊狂吹了一波GPT-5，結果竟是鬧劇一場......

事情是這樣的。

幾天前，OpenAI科學家Sebastien Bubeck激動轉發，兩位研究員聯手GPT-5 Pro，僅用了一個週末，破解了10個「百年懸案」——

埃爾德什難題（Erdos problems）

緊接著，OpenAI科學副總裁Kevin Weil等人紛紛加入，大肆宣傳。

然而，真相很快浮出水面：

這十道難題，早就被學界解決，並非由GPT-5獨立解決，它只是通過檢索網絡文獻給出了答案。

消息一出，輿論譁然。就連谷歌DeepMind CEO Demis Hassabis也忍不住評價，「這也太尬了」。

還有，圖靈獎得主LeCun閃現X上嘲諷，「簡直就是，搬起石頭（GPT）砸自己的腳」。

GPT-5，一場鬧劇

這場鬧劇，可以說OpenAI團隊的自導自演。

研究人員Mark Sellke和Mehtaab Sawhney發文很明確，並沒有說GPT-5破解了難題。

他們原帖是，通過GPT-5數千條查詢後，找到了十個被列為Erdos問題的解。

當時的結果是，問題223、339、494、515、621、822、883、903、1043、1079都得到了解決，同時在另外 11 個問題上也取得了部分進展。

另一方面，這十道難題早已有了答案，只不過網站管理者並未更新。

傳送門：https://www.erdosproblems.com/

英國皇家學會研究院Thomas Bloom，網站erdosproblems.com運營者，卻對此並不知情。

網站上，「開放」狀態僅代表他個人並不瞭解該問題的解法，而不是表示該問題在科學界尚未被解決。

總言之，兩個誤會，湊在了一起，讓人們產生了「幻覺」——GPT-5攻克了埃爾德什難題。

一方面，難題並非未解決，只是網站維護者不清楚；另一方面，GPT-5僅通過搜索文獻完成，並非自己解決。

Sebastien Bubeck尷尬回覆道，GPT-5只是在文獻中找到了解決方案，僅此而已。

即便如此，已經非常高效了，因為我知道搜索文獻是有多麼地困難。

評論區的大佬們，正坐在前排吃瓜。

通過這場爭論，開發者Matt Mazur認真地表示，所有人必須謹慎地對待任何關於AI發現新科學/數學成果的說法」。

Hyperbolic創始人Yuchen Jin稱，「關於AI發現科學/數學的新發現，需要更多的同行評審」。

不過也有人認為，這對GPT-5來說並不尷尬，畢竟它在文獻檢索方面表現還是很出色的。

幾天前，陶哲軒也曾發文表示，我越來越覺得，眼下AI要在數學領域真正發揮作用，關鍵可能不在用最牛的模型去攻克最難的題目——

當然偶爾會有這種案例，特別是當人們砸了大量算力和專家精力進去的時候。

但更靠譜的路線，反而是用中等水平的AI工具，去幫我們搞定那些研究裡繞不開的瑣碎活、體力活。

無論何時，對AI原創發現保持審慎都是第一位的，但這並不妨礙AI輔助科研成為未來的必經之路。

https://x.com/SebastienBubeck/status/1979539604522127746

https://x.com/thomasfbloom/status/1979254235075059732

本文來自微信公眾號“新智元”，作者：桃子，36氪經授權發佈。

來源

免責聲明：以上內容僅為作者觀點，不代表Followin的任何立場，不構成與Followin相關的任何投資建議。

喜歡

評論