GPT-5這回是真的要來了。
現在,全網都在“偶遇”GPT-5。
不僅是ChatGPT上有蹤跡:
而且在MacOS應用的模型列表中也發現了GPT-5。
還有Cursor、微軟Copilot以及OpenAI API平臺上,也都被網友捉到已經悄悄接入/測試GPT-5。
這一大波洩露,大家對GPT-5的熱情和好奇再次被重新拉回高點,還是奧特曼會玩啊。
連向來懟天懟地的馬庫斯都說:不開玩笑,這一次GPT-5真的要來了。
從已經洩露的信息來看,GPT-5肯定更強大。
它將整合GPT系列和o系列,實現多模態和推理能力大一統、編程能力很強、百萬tokens上下文、支持MCP等。
最快下週就會發布!
據說微軟Copilot上的GPT-5將向所有人開放,不受訂閱限制。今年3月,奧特曼在採訪中還說了GPT-5將免費向用戶開放。
感覺GPT-5這一波,是要全面鋪開啊。
所以到底有多強?
兩款模型都編程能力突出
根據OpenAI內部人士透露,GPT-5實現推理能力(o系列)和多模態交互能力(4o以及GPT系列)的大一統,以後不用再手動切換模型。
模型包含多個版本:
GPT‑5 主模型(代號 “nectarine” 或 “o3‑alpha”)
GPT‑5 mini(代號 “lobster”)
GPT‑5 nano(代號 “starfish”)
模型的技術亮點可能包括:
輸入上下文窗口高達100萬tokens,輸出可達10萬tokens。
支持MCP(模型上下文協議)與並行工具調用。
動態處理短時與長時推理,集成 Code Interpreter 與其他工具。
性能更快、更可靠、更少幻覺、提升長期對話記憶與邏輯處理能力。
其中GPT-5(o3-alpha)被曝在高級編程方面表現出色,能達到接近人類程序員水平,“實現更快、更精準的軟件開發”。
它可以自動編寫高質量的遊戲原型,支持很多應用程序定製以及可以根據特定要求進一步細化。
以及在物理方面也表現出色,一些zero-shot的demo效果也很不錯。
Lobster (mini版本代號)有消息稱它是一個專用的編程模型。在精度和功能方面均優於Claude 4等模型,尤其是在一些複雜的編碼任務上。
Lobster可以通過極少的輸入快速生成結構完整、功能準確的代碼,非常適合處理凌亂的遺留代碼,可以自動優化代碼結構、清除冗餘,同時管理大型軟件項目中的依賴關係。
例如一名用戶讓Lobster和另一個模型同時創建交互式神經網絡動畫,Lobster一次性就生成了一個帶有彩色節點的解決方案,而另一個模型在代碼運行中出現錯誤。
另外Lobster據悉也集成了o3系列模型的高級推理能力,能在簡單任務中使用快速響應模式,在複雜任務中觸發深層推理模塊,更擅長邏輯推理以及解決數學問題。
支持文本、圖像、工具調用等多模態,具備類似Agent的多步驟組合執行能力,可以讓其同時完成解釋圖像、編寫代碼和使用工具等任務,而無需像GPT-4一次只能處理一類輸出。
Lobster將是編碼、推理、多模態理解的融合,將OpenAI之前彼此獨立的模型集合在一起,讓用戶直接擁有一個功能更強大的工作助手,輕鬆執行復雜的多步驟任務。
starfish(nano版本)則在前幾天悄悄出現在了大模型競技場上。
測試結果顯示,這個模型只能做靜態的小遊戲界面,無法啟動遊戲。
除了模型本身外,現在微軟和cursor也被曝將火速接入GPT-5。
微軟正試行新版Copilot的 “Smart 模式”(或稱 “magic mode”),能夠智能判斷何時調用GPT‑5的深度推理與多模態能力,以簡化用戶無需手動選擇模型的流程。這項功能顯示微軟極可能在GPT‑5發佈後第一時間集成該模型至Copilot及Microsoft 365生態中,Azure也在為集成GPT-5做準備。
同時也有人發現,cursor團隊正在內部測試GPT-5 Alpha版本(圖中被模糊掉的部分原來標了GPT-5-Alpha)。
但大家不容易被奧特曼忽悠了
從各方洩露信息來看,GPT-5確實如奧特曼所說,強得可怕。
不過,現在大家更冷靜、更理智、也更不容易被忽悠了。
有人就說,那又如何?GPT-5可能在剛剛發佈時表現很好,1周過去它就會開始變笨,像此前所有模型一樣。
也有人表示這可能是因為模型發佈後,出於安全考量會ban一部分能力,所以讓大家感覺這是炒作出來的幻象。
“潑冷水王”馬庫斯也發文表示,即便GPT-5真的更強大,但是他還是要給出7個悲觀預測:
儘管GPT-5在能力上會遠超GPT-4,但GPT-5仍然是難以控制的,會繼續犯一些難以預料的低級錯誤,甚至不會完全聽從指令操作。
GPT-5仍然難以處理一些複雜的物理、心理和數學推理任務。
幻覺依舊普遍,且誤導性更高,更容易生成看起來正確但實際內容錯誤的輸出。
自然語言輸出仍然無法可靠地鏈接到下游系統(如數據庫、虛擬助手等),自然語言指令難以準確映射到用戶意圖上。
GPT-5不會是像AGI一樣的通用人工智能,仍舊需要其它工具協助完成複雜場景任務。
系統仍將無法穩定地遵循有用無害的人類價值觀,在輸出回答時可能隱含部分偏見。
GPT-5只是基礎的規模擴展,未來AGI將朝向更結構化、具備顯性知識與規劃能力發展,與更廣泛的其它技術集成,而這些都是GPT系列所缺乏的。
社區裡也瀰漫著相似的觀點,畢竟已經被奧特曼溜了太多次,再不發佈,網友們都累了……
天天各種真假混雜的爆料,一些洩露的GPT-5基準測試都是fake news,網友表示,現在除了官方,誰都不可信。
當然也有不少網友認為,這些“不經意間的”洩漏,都是OpenAI在炒作。
總之,不管模型是不是真如宣傳所說的這麼好,都趕緊發佈吧!
參考鏈接:
[1]https://www.geeky-gadgets.com/openai-gpt-5-lobster-ai/
[2]https://garymarcus.substack.com/p/what-to-expect-when-youre-expecting-62e
[3]https://x.com/nicksomed/status/1950507062091485551[4]https://www.bgr.com/1926255/gpt-5-leaks-reveal-more-features-ahead-of-launch/?utm_source=chatgpt.com
本文來自微信公眾號“量子位”,作者:關注前沿科技,36氪經授權發佈。




