OpenAI剛剛更換了ChatGPT的引擎。從今天起, GPT-5.5 Instant將取代GPT-5.3 Instant,成為ChatGPT的默認模型,每天有數億用戶打開ChatGPT時都會使用這個模型。
這次更新並不張揚,沒有新模式,也沒有令人驚豔的演示。但“小幅改進”只是相對而言,因為這次升級將幻覺減少了一半以上。
OpenAI 的 GPT 系列模型分為多個級別。Instant 是日常使用的模型,速度快,適用於一般用途;Thinking 是速度較慢、分析能力更強的版本,適用於複雜問題;Pro 則是功能強大的版本,適用於高強度任務。
GPT-5.5 Instant 是 ChatGPT 用戶無論是否意識到,都會與之交互的最新版本。
OpenAI 表示,在醫學、法律和金融等高風險提示中,新模型產生的幻覺性陳述比 GPT-5.3 Instant 更少。幻覺性陳述一直是 ChatGPT 自誕生以來最頑固的缺陷。
OpenAI 還針對真實用戶之前標記出的事實錯誤對話進行了測試。結果顯示,不準確的說法減少了 37.3%。
在 HealthBench(一個測試人工智能對真實醫療問題回答的基準測試,評分範圍為 0 到 100)上,GPT-5.5 Instant 的得分為 51.4 分,比之前的 49.6 分有所提高。在 HealthBench Professional(臨床使用版本)上,它的得分從 32.9 分躍升至 38.4 分。
健康問題是人們向 ChatGPT 諮詢最多的問題之一,因此,正確回答這些問題不僅僅是一項基準測試。結果表明,GPT 5.5 Instant 的準確率提高了 38.4%。
GPT-5.5 Instant 還會更積極地從你過去的聊天記錄、保存的文件以及關聯的 Gmail 帳戶中提取信息,以使答案與你的個人情況相關。現在,當它這樣做時,會準確地顯示所使用的上下文,並允許你刪除或更正。“你始終掌控著自己記憶中的內容,”OpenAI 寫道。臨時聊天記錄仍然完全不包含在內。
兩週前, Decrypt報道了GPT-5.5 系列的發佈,當時的重點是智能體編碼和終端工作流程。GPT-5.5 Instant 則截然不同——它處理的是更“基礎”的任務,比如膳食計劃和郵件草稿,而不是自主的多步驟編碼流程。不過,別問我們 GPT-5.4 Instant 的情況。它可能正和從未存在過的 O2 模型一起靜靜地待在角落裡呢。
完整的 GPT-5.5 在 Terminal-Bench 2.0 測試中得分 82.7%,該測試用於衡量複雜命令行任務的性能。而 Instant 版本則是我們大多數人都能使用的版本,而且大多數用戶可能也都能滿足需求。
系統卡中有一條值得注意的腳註:GPT-5.5 Instant 是 OpenAI 首個被評為網絡安全和生物學領域“高能力”的 Instant 級模型——其能力之強,足以需要與之前僅用於更強大的 Thinking 版本相同的自動化安全防護措施。它並不能幫助你進行任何黑客攻擊,但 OpenAI 已經構建了相應的防護機制,以防有人試圖這樣做。
之前的默認版本 GPT-5.3 Instant 於 3 月發佈,承諾減少不必要的拒絕並提高準確率。GPT-5.5 Instant 延續了這一發展方向。喜歡舊版本的付費用戶還有三個月的時間可以使用 GPT-5.3 Instant,之後該版本將停止服務。Gmail 的增強個性化功能將首先面向網頁版 Plus 和 Pro 用戶推出,Free、Go、Business 和 Enterprise 用戶將在未來幾周內陸續體驗到此功能。



