GPT-5破解世紀難題,竟是上網抄來的,哈薩比斯:太尷尬了

GPT-5一場鬧劇,讓OpenAI出大糗了!讓所有人都以為GPT-5破解了十道Erdos難題,沒想到竟是查文獻給出了答案。Hassabis點評,這太尷尬了。

OpenAI團隊狂吹了一波GPT-5,結果竟是鬧劇一場......

事情是這樣的。

幾天前,OpenAI科學家Sebastien Bubeck激動轉發,兩位研究員聯手GPT-5 Pro,僅用了一個週末,破解了10個「百年懸案」——

埃爾德什難題(Erdos problems)

緊接著,OpenAI科學副總裁Kevin Weil等人紛紛加入,大肆宣傳。

然而,真相很快浮出水面:

這十道難題,早就被學界解決,並非由GPT-5獨立解決,它只是通過檢索網絡文獻給出了答案。

消息一出,輿論譁然。就連谷歌DeepMind CEO Demis Hassabis也忍不住評價,「這也太尬了」。

還有,圖靈獎得主LeCun閃現X上嘲諷,「簡直就是,搬起石頭(GPT)砸自己的腳」。

GPT-5,一場鬧劇

這場鬧劇,可以說OpenAI團隊的自導自演。

研究人員Mark Sellke和Mehtaab Sawhney發文很明確,並沒有說GPT-5破解了難題。

他們原帖是,通過GPT-5數千條查詢後,找到了十個被列為Erdos問題的解。

當時的結果是,問題223、339、494、515、621、822、883、903、1043、1079都得到了解決,同時在另外 11 個問題上也取得了部分進展。

另一方面,這十道難題早已有了答案,只不過網站管理者並未更新。

傳送門:https://www.erdosproblems.com/

英國皇家學會研究院Thomas Bloom,網站erdosproblems.com運營者,卻對此並不知情。

網站上,「開放」狀態僅代表他個人並不瞭解該問題的解法,而不是表示該問題在科學界尚未被解決。

總言之,兩個誤會,湊在了一起,讓人們產生了「幻覺」——GPT-5攻克了埃爾德什難題。

一方面,難題並非未解決,只是網站維護者不清楚;另一方面,GPT-5僅通過搜索文獻完成,並非自己解決。

Sebastien Bubeck尷尬回覆道,GPT-5只是在文獻中找到了解決方案,僅此而已。

即便如此,已經非常高效了,因為我知道搜索文獻是有多麼地困難。

網友熱議,還需同行評審

評論區的大佬們,正坐在前排吃瓜。

通過這場爭論,開發者Matt Mazur認真地表示,所有人必須謹慎地對待任何關於AI發現新科學/數學成果的說法」。

Hyperbolic創始人Yuchen Jin稱,「關於AI發現科學/數學的新發現,需要更多的同行評審」。

不過也有人認為,這對GPT-5來說並不尷尬,畢竟它在文獻檢索方面表現還是很出色的。

幾天前,陶哲軒也曾發文表示,我越來越覺得,眼下AI要在數學領域真正發揮作用,關鍵可能不在用最牛的模型去攻克最難的題目——

當然偶爾會有這種案例,特別是當人們砸了大量算力和專家精力進去的時候。

但更靠譜的路線,反而是用中等水平的AI工具,去幫我們搞定那些研究裡繞不開的瑣碎活、體力活。

無論何時,對AI原創發現保持審慎都是第一位的,但這並不妨礙AI輔助科研成為未來的必經之路。

參考資料:

https://x.com/SebastienBubeck/status/1979539604522127746

https://x.com/thomasfbloom/status/1979254235075059732

本文來自微信公眾號“新智元”,作者:桃子 ,36氪經授權發佈。

來源
免責聲明:以上內容僅為作者觀點,不代表Followin的任何立場,不構成與Followin相關的任何投資建議。
喜歡
收藏
評論