GPT-5的新爆料又來了!GPT-5-Alpha已經由Cursor團隊內部測試,幾乎能一次性完成任何任務;Perplexity已在網站上完成GPT-5發佈的準備工作;微軟工程師也在緊鑼密鼓為GPT-5做準備,將很快在Copilot中發佈。GPT-5,它真的越來越近了。
每天一睜眼,都能感覺GPT-5更近了一點。
剛剛,又是一大波關於GPT-5的消息曝出。
首先,GPT-5-Alpha已經在由Cursor團隊內部測試。這個模型表現驚豔,幾乎能一次性完成任何任務。
比如下面這個「水族館遊戲」的挑戰,模型就順利完成了。
並且就在幾小時前,在macOS ChatGPT應用中,已經有人發現了GPT-5-Auto和GPT-5-Reasoning模型。
有眼尖的網友注意到了洩露信息中「reasoning」這個字眼,猜測道:這表明GPT-5很可能已經有了o系列模型。
同時,Perplexity已經在網站上完成了GPT-5發佈的準備工作。一旦GPT-5發佈,Perplexity Pro的用戶就能立刻使用了。
微軟已準備在AI套件中發佈GPT-5
同時,已經有人發現,微軟的Copilot Smart Mode,將由GPT-5提供支持。
有人猜測,GPT-5的路由器部分可能已經在逐步推出。
總之,微軟正準備在AI套件中發佈GPT-5,包括Copilot(消費者版)和 Microsoft 365 Copilot(企業/工作版),以及Azure(企業/API客戶)。
據悉,Windows 11的Copilot應用程序具有「智能」模式,可以根據查詢在GPT-5的推理/非推理模式之間切換。
甚至,Windows 11 Copilot的免費版,也將擁有基於GPT-5的「智能」模式,因此GPT-5並不會僅限於付費用戶使用。
微軟工程師,緊鑼密鼓為GPT-5做準備
同時,The Verge也剛剛發文表示,微軟正在準備推出GPT-5的全新Copilot智能模式。
據微軟內部人士透露,微軟正在消費者版和商業版的Microsoft 365 Copilot中測試GPT-5的智能模式,這就跟上面的爆料吻合了。
而且據說,在消費者版中,這個模式中的AI可以「根據任務進行深度或快速思考」,所以用戶無需選擇模型。
這也跟奧特曼此前透露的想法相一致。
奧特曼在二月表示,「我們和你們一樣討厭模型選擇器,希望迴歸神奇的統一智能。」
同時,GPT-5還將包含o3模型,而不是將其作為獨立版本發佈。
The Verge記者猜測,這種智能模式提前出現在Copilot中,是因為微軟工程師正在為GPT-5的發佈做準備。
總之,如果OpenAI對GPT-5的準備工作一切順利,那麼Copilot的智能模型將很快出現在大家面前。
以上,就是今天的新一波關於GPT-5蛛絲馬跡的爆料。
有網友感慨道:現在大模型的開發週期實在太快,營銷速度都趕不上發佈速度了。
OpenAI研究員:我再次相信AGI
GPT-5現在已經是山雨欲來風滿樓,就在這個時間點,OpenAI研究員Alexey Guzey發了一篇文章,題為《為什麼我再次相信 AGI》。
在這篇文章中,或許我們能窺見GPT-5的種種跡象。
以下為文章大意。
為什麼我現在又相信AGI了?
首先,我現在確信 ChatGPT 能夠理解它所讀的內容。其次,推理模型讓我相信ChatGPT 具有創造力。第三,ChatGPT能極其出色地總結文本,我認為這是衡量智能的一個可靠標準。
同時,我不相信「通用智能」,所以我認為AGI這個概念並沒有什麼意義。
最後,AI產品現在已經能為AGI研究提供資金,這意味著AI已經達到了自我改進循環的早期階段。
因此,許多關於「AGI」和「超級智能」的時間線討論,已經過時了。
ChatGPT能理解它所讀的內容
對我來說,AGI與理解有關。ChatGPT是真的理解了,還是隻是一個愚蠢地將輸入映射到輸出的中文房間?
我現在認為,它確實理解了。
真正讓我信服的是這一條推文。有人嘲笑OpenAI的o1模型沒有發現,他提出的邏輯謎題其實有個很簡單的解決方案。
第一看到這條推文,是在24年9月。
25年4月,我又看到了,於是試試o3模型是否也會犯同樣錯誤?
結果,o3的確也翻車了。
但我後來又想到,如果模型確實理解了這個謎題,只是沒有足夠關注它呢?於是我要求它更仔細地讀題,於是解決了問題。
o3 一旦仔細閱讀,就能毫無困難地解決一個從未遇到過的新謎題。
或者以這個來自GPT-3的greentext為例:
你能讀懂這個綠字文本,說ChatGPT是一個無意義的隨機鸚鵡嗎?我不能。
對我來說,這些例子非常有說服力地表明,ChatGPT是一個真正智能的實體,我們正在朝構建AGI的道路上穩步前進。
再比如,那個經典的「9.11和9.9哪個更大」的問題。
之前我們每次都會因此嘲笑AI,但最近我仔細思考了一下,認為這是一個上下文的問題,而不是智能的問題。
確實有很多情況下,9.11比 9.9大(書籍、學術論文、軟件版本)。如果沒有提供其他信息,ChatGPT認為9.11大於9.9,這並非不合理。
事實上,每當我嘲笑ChatGP 時,六個月後它都會反過來嘲諷我,這讓我越來越難以堅持,認為它是愚蠢的。
LLM具有創造力
或者說:LLMs + RL = 智能的第37步。
有人曾問過:我們該如何看待這樣一個事實:儘管這些模型幾乎記住了世界上所有已知的事實,但它們還沒有做出任何新的發現?
強化學習在LLMs上的應用,讓我相信這不是一個問題,因為每當強化學習生效時,它都會發現新穎且富有創意的解決方案。國際象棋。圍棋。數學。物理模擬。電子遊戲。莫不如是。
RL = 創造力。這就是範式。
尤其,當我讀到Karpathy關於第37步的推特文章時,一切都變得清晰了。
第37步,指的是一個通過RL的試錯過程訓練出來的人工智能,發現了即使是專家也感到新奇、驚訝且暗藏智慧的操作。
這是一種神奇的、略帶令人不安的湧現現象,只有通過大規模強化學習才能實現。你無法通過模仿專家做到這一點。
這是當AlphaGo在與李世石的第二局比賽中下出第37步時的情景,那是一個奇怪的棋步,人類下出它的概率僅為萬分之一,但事後看來,這一步卻充滿創意、極為精妙,最終導致了AI的勝利。
現在,隨著新一批「思考型」LLM(例如 OpenAI-o1、DeepSeek-R1、Gemini 2.0 Flash Thinking)的出現,我們開始在開放世界領域中看到類似的最初曙光。
這些模型在嘗試解決各種不同的數學/代碼等問題的過程中,發現了類似於人類內心獨白的策略,而這些策略很難(或不可能)直接編程到模型中。
我稱這些為「認知策略」——比如從不同角度解決問題、嘗試不同想法、尋找類比、回溯、重新審視等。
儘管聽起來很奇怪,但LLM有可能發現更好的思維方式、解決問題的方法、跨學科連接思想的方式,並且以一種我們事後看來會覺得驚訝、困惑,但又充滿創意和智慧的方式做到這一點。
正如英偉達的X. Dong所指出的:「經過強化學習訓練的模型在某些問題上取得了巨大進展,而基礎模型無論嘗試多少次都無法理解這些問題。」
幾十年前,Tyler Cowen看到AI在國際象棋上擊敗人類時,就認為AI也會在在其他直覺性的事情上擊敗我們。
壓縮就是智能,而ChatGPT的壓縮能力非常出色
當我想要弄清楚某人有多聰明時,我經常問他:某篇文章的主要觀點是什麼?
這個問題實際上要求的是將許多詞(一篇文章)壓縮成少數詞(一句話),同時丟棄所有不重要的內容。
如果這個人能做到這一點,我會認為ta很聰明。
因此,當我詢問ChatGPT同樣的問題時,它成功了,而我最聰明的朋友卻失敗了,我得出結論:它確實非常擅長壓縮,並且真的很聰明。
(這跟預測能力跟智能指標密切相關的觀點類似。我認為壓縮和預測是同一枚硬幣的兩面,因此ChatGPT在訓練過程中通過學習預測下一個單詞,順理成章地也學會了如何很好地壓縮文本。)
為什麼我認為AGI這個想法很愚蠢
因為我並不相信「通用智能」。AGI通常在某種意義上是參照人類定義的,而我認為我自己是一種極其狹窄的智能。
比如,我無法計算出3289乘以5721。事實上,我甚至無法計算328乘以572!我只能勉強計算32乘以57,而且20%的情況下會出錯。
我只能在大約10%的情況下搞清楚我女朋友為什麼生氣,但大多數時候,我在這方面和一個算盤差不多。
我是否具有通用智能?對我來說,答案顯然是否定的。
我可以學習如何做一些零散的事情。通過模仿他人或使用我的電腦,我可以學習做更多事情。但僅此而已。
人類文明和我們的技術進步,並不是由任何一種通用智能所推動的!而是因為我們能夠學習如何在這裡做一件事,在那裡做另一件事。
AGI是否真實存在並不重要
(有趣的是,我是從奧特曼最近的一篇博客中讀到了這個觀點。)
在過去的幾十年裡——直到幾年前——想得到AGI研究的資金支持,還需要依靠夢想和願景。
這就是為什麼AI行業曾經會經歷週期性的寒冬;這就是為什麼沒有一家AGI公司能夠存活超過幾年;這就是為什麼 AGI曾經是一個與「瘋狂邊緣」相關的貶義詞,正如 DeepMind 聯創所說。
今天,由AGI研究而創造的經濟價值首次足以支持進一步的AGI研究。每天有數億人使用ChatGPT,有數百萬人為 ChatGPT付費。
人工智能產品之所以為AGI研究買單,是因為它們對我們有用。
沒有人類,人工智能無法產生經濟價值,因為經濟價值的概念本身就關乎人類認為有價值的東西。因此,人工智能自我改進的能力完全依賴於它繼續對我們保持有用。
AI的進步比任何人預期的都要平穩,它的「有用性」更多地依賴於非智能的輔助結構,也超出了任何人的預期。
所以我認為,現在我們何時構建「AGI」或「超級智能」,真的已經不重要了。人工智能研究能夠自給自足 = 人工智能已經到來並將持續改進。
我經常思考過去那些真正改變世界的技術。
例如,印刷術在16至19世紀徹底重塑了世界,引發了基督教改革、百年戰爭、現代民族國家的形成,以及最終的科學和工業革命。那項技術本身並不包含任何智能。
但它改變了信息傳播的方式,極大地提升了思想的力量和識字的價值,並賦予我們追求目標時掌握的強大新能力。
人AI已經在讓我們個人和人類群體在影響世界的能力上得到了極大的提升。我們如何利用這種能力,取決於我們自己。
參考資料
https://x.com/testingcatalog/status/1950197904024436812
https://x.com/testingcatalog/status/1950534140974993578
https://x.com/WindowsLatest/status/1950641135602610466
https://www.theverge.com/notepad-microsoft-newsletter/715849/microsoft-copilot-smart-mode-testing-notepadhttps://x.com/alexeyguzey/status/1950632413870305637
本文來自微信公眾號“新智元”,作者:Aeneas,36氪經授權發佈。





