OpenAI剛剛升級了ChatGPT的預設模型——以下是GPT-5.5 Instant的實際功能

Decrypt

本文為機器翻譯

展示原文

OpenAI剛剛更換了ChatGPT的引擎。從今天起， GPT-5.5 Instant將取代GPT-5.3 Instant，成為ChatGPT的默認模型，每天有數億用戶打開ChatGPT時都會使用這個模型。

這次更新並不張揚，沒有新模式，也沒有令人驚豔的演示。但“小幅改進”只是相對而言，因為這次升級將幻覺減少了一半以上。

OpenAI 的 GPT 系列模型分為多個級別。Instant 是日常使用的模型，速度快，適用於一般用途；Thinking 是速度較慢、分析能力更強的版本，適用於複雜問題；Pro 則是功能強大的版本，適用於高強度任務。

GPT-5.5 Instant 是 ChatGPT 用戶無論是否意識到，都會與之交互的最新版本。

OpenAI 表示，在醫學、法律和金融等高風險提示中，新模型產生的幻覺性陳述比 GPT-5.3 Instant 更少。幻覺性陳述一直是 ChatGPT 自誕生以來最頑固的缺陷。

OpenAI 還針對真實用戶之前標記出的事實錯誤對話進行了測試。結果顯示，不準確的說法減少了 37.3%。

在 HealthBench（一個測試人工智能對真實醫療問題回答的基準測試，評分範圍為 0 到 100）上，GPT-5.5 Instant 的得分為 51.4 分，比之前的 49.6 分有所提高。在 HealthBench Professional（臨床使用版本）上，它的得分從 32.9 分躍升至 38.4 分。

健康問題是人們向 ChatGPT 諮詢最多的問題之一，因此，正確回答這些問題不僅僅是一項基準測試。結果表明，GPT 5.5 Instant 的準確率提高了 38.4%。

GPT-5.5 Instant 還會更積極地從你過去的聊天記錄、保存的文件以及關聯的 Gmail 帳戶中提取信息，以使答案與你的個人情況相關。現在，當它這樣做時，會準確地顯示所使用的上下文，並允許你刪除或更正。“你始終掌控著自己記憶中的內容，”OpenAI 寫道。臨時聊天記錄仍然完全不包含在內。

兩週前， Decrypt報道了GPT-5.5 系列的發佈，當時的重點是智能體編碼和終端工作流程。GPT-5.5 Instant 則截然不同——它處理的是更“基礎”的任務，比如膳食計劃和郵件草稿，而不是自主的多步驟編碼流程。不過，別問我們 GPT-5.4 Instant 的情況。它可能正和從未存在過的 O2 模型一起靜靜地待在角落裡呢。

完整的 GPT-5.5 在 Terminal-Bench 2.0 測試中得分 82.7%，該測試用於衡量複雜命令行任務的性能。而 Instant 版本則是我們大多數人都能使用的版本，而且大多數用戶可能也都能滿足需求。

系統卡中有一條值得注意的腳註：GPT-5.5 Instant 是 OpenAI 首個被評為網絡安全和生物學領域“高能力”的 Instant 級模型——其能力之強，足以需要與之前僅用於更強大的 Thinking 版本相同的自動化安全防護措施。它並不能幫助你進行任何黑客攻擊，但 OpenAI 已經構建了相應的防護機制，以防有人試圖這樣做。

之前的默認版本 GPT-5.3 Instant 於 3 月發佈，承諾減少不必要的拒絕並提高準確率。GPT-5.5 Instant 延續了這一發展方向。喜歡舊版本的付費用戶還有三個月的時間可以使用 GPT-5.3 Instant，之後該版本將停止服務。Gmail 的增強個性化功能將首先面向網頁版 Plus 和 Pro 用戶推出，Free、Go、Business 和 Enterprise 用戶將在未來幾周內陸續體驗到此功能。

來源

免責聲明：以上內容僅為作者觀點，不代表Followin的任何立場，不構成與Followin相關的任何投資建議。

喜歡

評論