全網瘋傳GPT-5洩露，首次統一GPT和o系列，編程實測demo搶先曝光，下週發佈？

07-31

GPT-5這回是真的要來了。

現在，全網都在“偶遇”GPT-5。

不僅是ChatGPT上有蹤跡：

而且在MacOS應用的模型列表中也發現了GPT-5。

還有Cursor、微軟Copilot以及OpenAI API平臺上，也都被網友捉到已經悄悄接入/測試GPT-5。

這一大波洩露，大家對GPT-5的熱情和好奇再次被重新拉回高點，還是奧特曼會玩啊。

連向來懟天懟地的馬庫斯都說：不開玩笑，這一次GPT-5真的要來了。

從已經洩露的信息來看，GPT-5肯定更強大。

它將整合GPT系列和o系列，實現多模態和推理能力大一統、編程能力很強、百萬tokens上下文、支持MCP等。

最快下週就會發布！

據說微軟Copilot上的GPT-5將向所有人開放，不受訂閱限制。今年3月，奧特曼在採訪中還說了GPT-5將免費向用戶開放。

感覺GPT-5這一波，是要全面鋪開啊。

所以到底有多強？

兩款模型都編程能力突出

根據OpenAI內部人士透露，GPT-5實現推理能力（o系列）和多模態交互能力（4o以及GPT系列）的大一統，以後不用再手動切換模型。

模型包含多個版本：

GPT‑5 主模型（代號 “nectarine” 或 “o3‑alpha”）

GPT‑5 mini（代號 “lobster”）

GPT‑5 nano（代號 “starfish”）

模型的技術亮點可能包括：

輸入上下文窗口高達100萬tokens，輸出可達10萬tokens。

支持MCP（模型上下文協議）與並行工具調用。

動態處理短時與長時推理，集成 Code Interpreter 與其他工具。

性能更快、更可靠、更少幻覺、提升長期對話記憶與邏輯處理能力。

其中GPT-5（o3-alpha）被曝在高級編程方面表現出色，能達到接近人類程序員水平，“實現更快、更精準的軟件開發”。

它可以自動編寫高質量的遊戲原型，支持很多應用程序定製以及可以根據特定要求進一步細化。

以及在物理方面也表現出色，一些zero-shot的demo效果也很不錯。

Lobster （mini版本代號）有消息稱它是一個專用的編程模型。在精度和功能方面均優於Claude 4等模型，尤其是在一些複雜的編碼任務上。

Lobster可以通過極少的輸入快速生成結構完整、功能準確的代碼，非常適合處理凌亂的遺留代碼，可以自動優化代碼結構、清除冗餘，同時管理大型軟件項目中的依賴關係。

例如一名用戶讓Lobster和另一個模型同時創建交互式神經網絡動畫，Lobster一次性就生成了一個帶有彩色節點的解決方案，而另一個模型在代碼運行中出現錯誤。

另外Lobster據悉也集成了o3系列模型的高級推理能力，能在簡單任務中使用快速響應模式，在複雜任務中觸發深層推理模塊，更擅長邏輯推理以及解決數學問題。

支持文本、圖像、工具調用等多模態，具備類似Agent的多步驟組合執行能力，可以讓其同時完成解釋圖像、編寫代碼和使用工具等任務，而無需像GPT-4一次只能處理一類輸出。

Lobster將是編碼、推理、多模態理解的融合，將OpenAI之前彼此獨立的模型集合在一起，讓用戶直接擁有一個功能更強大的工作助手，輕鬆執行復雜的多步驟任務。

starfish（nano版本）則在前幾天悄悄出現在了大模型競技場上。

測試結果顯示，這個模型只能做靜態的小遊戲界面，無法啟動遊戲。

除了模型本身外，現在微軟和cursor也被曝將火速接入GPT-5。

微軟正試行新版Copilot的 “Smart 模式”（或稱 “magic mode”），能夠智能判斷何時調用GPT‑5的深度推理與多模態能力，以簡化用戶無需手動選擇模型的流程。這項功能顯示微軟極可能在GPT‑5發佈後第一時間集成該模型至Copilot及Microsoft 365生態中，Azure也在為集成GPT-5做準備。

同時也有人發現，cursor團隊正在內部測試GPT-5 Alpha版本（圖中被模糊掉的部分原來標了GPT-5-Alpha）。

但大家不容易被奧特曼忽悠了

從各方洩露信息來看，GPT-5確實如奧特曼所說，強得可怕。

不過，現在大家更冷靜、更理智、也更不容易被忽悠了。

有人就說，那又如何？GPT-5可能在剛剛發佈時表現很好，1周過去它就會開始變笨，像此前所有模型一樣。

也有人表示這可能是因為模型發佈後，出於安全考量會ban一部分能力，所以讓大家感覺這是炒作出來的幻象。

“潑冷水王”馬庫斯也發文表示，即便GPT-5真的更強大，但是他還是要給出7個悲觀預測：

儘管GPT-5在能力上會遠超GPT-4，但GPT-5仍然是難以控制的，會繼續犯一些難以預料的低級錯誤，甚至不會完全聽從指令操作。

GPT-5仍然難以處理一些複雜的物理、心理和數學推理任務。

幻覺依舊普遍，且誤導性更高，更容易生成看起來正確但實際內容錯誤的輸出。

自然語言輸出仍然無法可靠地鏈接到下游系統（如數據庫、虛擬助手等），自然語言指令難以準確映射到用戶意圖上。

GPT-5不會是像AGI一樣的通用人工智能，仍舊需要其它工具協助完成複雜場景任務。

系統仍將無法穩定地遵循有用無害的人類價值觀，在輸出回答時可能隱含部分偏見。

GPT-5只是基礎的規模擴展，未來AGI將朝向更結構化、具備顯性知識與規劃能力發展，與更廣泛的其它技術集成，而這些都是GPT系列所缺乏的。

社區裡也瀰漫著相似的觀點，畢竟已經被奧特曼溜了太多次，再不發佈，網友們都累了……

天天各種真假混雜的爆料，一些洩露的GPT-5基準測試都是fake news，網友表示，現在除了官方，誰都不可信。

當然也有不少網友認為，這些“不經意間的”洩漏，都是OpenAI在炒作。

總之，不管模型是不是真如宣傳所說的這麼好，都趕緊發佈吧！

參考鏈接：

[1]https://www.geeky-gadgets.com/openai-gpt-5-lobster-ai/

[2]https://garymarcus.substack.com/p/what-to-expect-when-youre-expecting-62e

[3]https://x.com/nicksomed/status/1950507062091485551[4]https://www.bgr.com/1926255/gpt-5-leaks-reveal-more-features-ahead-of-launch/?utm_source=chatgpt.com

本文來自微信公眾號“量子位”，作者：關注前沿科技，36氪經授權發佈。

來源

免責聲明：以上內容僅為作者觀點，不代表Followin的任何立場，不構成與Followin相關的任何投資建議。

喜歡

收藏

評論

分享

相關推薦

BeInCrypto Việt Nam

Pi Network聲稱擁有1800萬經過驗證的真實用戶。這是真的嗎？

幣圈人必須現在開始使用的 Agent Skills

鮑威爾留任概率飆至98%，特朗普的“解僱令”只是口嗨？