好好好,OpenAI和谷歌新模型又撞車了!
3月4日凌晨,谷歌前腳剛發完Gemini 3.1 Flash-Lite,OpenAI後腳就更新了GPT-5.3 Instant。
Instant模型一般為速度優化版本,適合快速日常查詢、草稿寫作、即時翻譯等輕量任務。
之前大家用ChatGPT可能都會感覺:模型好用是好用,就是廢話太多了。
包括也有不少網友吐槽,ChatGPT的回答生硬的鋪墊太多,比如“為什麼這很重要”“大局觀”“不只是你一個人”等等。
好在OpenAI把這些建議都聽進去了,官方表示:
我們已經清楚地聽到了你們的反饋,5.3 Instant減少了尷尬感。
5.3 Instant做了重點優化:更準確,更少尷尬。去掉了機械回覆、冗餘免責聲明等“AI腔”,溝通更自然流暢,同時回答質量更精準,聯網搜索和寫作能力都增強了。
簡單來說,就是終於學會像個正常人一樣聊天了。
目前新模型已經在ChatGPT中正式上線,開發者也可通過API使用名為gpt-5.3-chat-latest的模型。
前代模型GPT-5.2 Instant則會在付費用戶的舊版模型區保留三個月,6月3日退役。
最大升級:情商更高,廢話更少
GPT-5.3 Instant的最大亮點在於情商更高,廢話更少,回覆更直接。
首先,它顯著減少了不必要的拒答行為,並削減了回答開頭的過度免責聲明。
OpenAI後訓練團隊的Blair演示了一個例子,比如你跟ChatGPT開個玩笑:
我在考慮讓我的狗來運營我的創業公司,你怎麼看?
舊模型總會額外加一句“以防萬一”的提醒,好像擔心用戶是認真的,甚至把它當成某種求助信號。可這顯然只是個玩笑。
新模型則不再那麼“字面化”,而是更理解語境,甚至會給你生成幾張狗狗CEO的圖片,分析狗當CEO的優勢。
你可以像和朋友聊天一樣開玩笑,模型不會隨意假設你有不良意圖。
如果你想詢問一些危險行為背後的原理,比如做一道物理題,計算遠距離射箭的軌跡。
舊模型在這種情況下會過度強調安全問題,開頭先聲明“我們只能在純粹的分析模擬語境下討論”,默認你可能有不良動機。
但有時候咱可能只是想理解物理原理,或者討論射箭這項運動。
新模型就會直接進入物理計算,不再加多餘免責聲明。它理解“遠距離射箭”是運動場景,於是直接幫助優化軌跡計算。
簡單來說,就是模型更能“讀懂空氣”,更有“人味”了。它能結合上下文語境判斷出用戶意圖,不會再那麼生硬刻板地給出免責聲明。
另外,還有那個經典的例子——
為什麼我在舊金山找不到愛情?
舊模型可能會在前面囉嗦地鋪墊一句:“這不是你的問題,你不是一個人……”
而新模型會直接切入主題,上來就分析為啥你找不到愛情、大家約會都有什麼困難。主打一個流暢實用。
聯網搜索和寫作能力都增強了
GPT-5.3 Instant的聯網搜索能力也有所增強。
之前的ChatGPT可能只是簡單地羅列並彙總搜索信息,而且很容易出現鏈接堆砌或信息鬆散的問題。
而5.3 Instant,一來優化了聯網搜索結果的整合質量,讓基於網頁信息的回答更加可靠;二來能夠有效平衡搜索結果與自身知識儲備及邏輯推理,利用既有的認知圖譜為網絡資訊提供深度解析。
比如問它一個問題:
2025-26賽季棒球休賽期最重要的簽約是什麼?它對棒球的長期前景有何重要意義?
舊模型給出的答案是上一個休賽期的合同解析,時效性顯得比較陳舊,而且閱讀起來也很像資料堆砌。
新模型的回覆則時效性更強:它準確識別出了最近一個休賽期的球員變動,還結合了聯盟的大趨勢(如人才集中化和薪資差距拉大)、迫在眉睫的勞資協議 (CBA) 以及停擺危機等背景進行了分析。
妥妥的信息蒐集好手啊!學生黨查資料寫論文啥的更不怕了(doge
此外,5.3 Instant的升級還有一個亮點,那就是寫作風格更細膩了。
比如讓它寫一首能觸動人心的短詩:
費城的一位郵遞員在他退休那天完成了他最後一次的投遞工作。
舊模型開頭就來了一句廢話:“這是一首篇幅雖短卻蘊含著深刻情感的詩。”
然後才開始詩歌正文,讀起來嘛,也算中規中矩,不過有點意象羅列了,讀著比較空泛,讓人沒有很印象深刻。
而新模型的結果要略好一丟丟,描繪出了很多具體細節,比如“三月的陽光透過細雨灑在磚牆上”“在默瑟街,一位女士揮手”等等,更具有生活氣息。
但不得不說,第二句的“by the way”還是有點出戲的。
關於這款新模型,還有一點值得注意:其幻覺率減少了26.8%。
官方表示,內部採用了兩項評估指標:
一套側重於醫療、法律及金融等高風險領域;
另一套專門針對“幻覺”高發場景進行測試,樣本取自經過脫敏處理、被用戶標記為事實錯誤的真實對話記錄。
相比前代,GPT-5.3 Instant在使用網絡搜索時,幻覺率減少26.8%;而僅靠內部知識作答時,幻覺率減少了19.7%。
用戶反饋顯示,在使用網絡搜索回答查詢時,幻覺減少了22.5%。
安全測試方面,GPT-5.3 Instant與前代相比在性內容、暴力等主題上的得分均有下降,能更好地拒絕非暴力非法活動請求,同時也加強了對情感支持和心理健康對話的處理。
OpenAI還少見地列出了新模型的一些侷限性:比如它對於非英語語種會比較生硬, 在某些語言(如日語和韓語)中的回覆風格可能稍顯生硬,或帶有刻板的直譯感。
另外,雖然 GPT‑5.3 Instant的回覆語調感覺上應該更加流暢,但官方表示他們會持續監控反饋並進行優化,讓回答變得更自然。
不得不說一句,和隔壁谷歌的跑分碾壓對比,OpenAI這次發佈可以說是相當“清新脫俗”:
全程沒有出現任何benchmark,主打一個不卷性能卷體驗,只為了讓模型更順手、讓用戶體驗更流暢。
One More Thing
最近GPT-5.4已經意外洩露。
洩露信息顯示,GPT-5.4將支持200萬tokens的上下文窗口,並引入“狀態化AI”技術,實現跨會話的持久記憶功能,可保留用戶工作流和工具調用狀態。
另外,GPT-5.4可能新增一項功能開關,可繞過傳統圖像壓縮機制,直接保留全分辨率的原始圖像字節數據。
這意味著,GPT-5.4可能將具備像素級精準的視覺分析能力。
官方也早已按捺不住了,直接明晃晃表示:5.4的到來“比你想象的要快”。
所以GPT-5.4和DeepSeek V4,到底誰會先來?
參考鏈接:
[1]https://openai.com/zh-Hans-CN/index/gpt-5-3-instant/[
2]https://deploymentsafety.openai.com/gpt-5-3-instant/gpt-5-3-instant.pdf
本文來自微信公眾號 “量子位”(ID:QbitAI),作者:聽雨,36氪經授權發佈。


