Openai發佈了最新的GPT5.2版本
這個版本主要在通用智能,長上下文理解,智能體和視覺上有很大改進。
-該模型在製作電子表格、設計演示文稿、編寫代碼、識別圖像、理解長文本上下文、使用工具以及處理複雜的多步驟項目方面表現更佳。
-GPT‑5.2 在眾多基準測試中都刷新了行業水平,包括 GDPval。在該評測中,它在涵蓋 44 個職業的明確知識型工作任務上超越了行業專家。
-GPT‑5.2 Thinking 在 SWE-bench Pro 測試取得了 55.6% 的新成績。SWE-bench Pro 是一項嚴格評估真實軟件工程能力的基準測試。與只測試 Python 的 SWE-bench Verified 不同,SWE-bench Pro 涵蓋四種語言,旨在更具抗汙染性、更具挑戰性、更具多樣性,也更貼近真實工業場景
-GPT‑5.2 Thinking 在前端軟件工程方面也優於 GPT‑5.1 Thinking。早期測試者發現,它在前端開發以及複雜或非傳統的 UI 工作上表現更強(尤其是涉及 3D 元素的場景)
-GPT‑5.2 Thinking 在長上下文推理方面樹立了新的技術標杆
-在真實任務中,例如深度文檔分析(需要跨數十萬 Token 關聯信息),GPT‑5.2 Thinking 的準確性顯著高於 GPT‑5.1 Thinking
-GPT‑5.2 Thinking 是迄今最強大的視覺模型,在圖表推理和軟件界面理解方面將錯誤率大幅降低,約減少了一半
ChatGPT 中的 GPT‑5.2
-GPT‑5.2 Instant 是一款高效而強大的日常工作與學習“主力模型”,在信息查詢、操作指南、步驟講解、技術寫作以及翻譯方面都有顯著提升,並延續了 GPT‑5.1 Instant 更溫暖、更自然的對話風格。早期測試者特別指出,其解釋更清晰,能夠在一開始就呈現出關鍵信息。
-GPT‑5.2 Thinking 專為更深入的工作而打造,幫助用戶以更高的完成度處理複雜任務,擅長編碼、長文檔總結、回答上傳文件相關問題、逐步推導數學與邏輯問題,以及通過更清晰的結構和更有用的細節支持規劃與決策。
-GPT‑5.2 Pro 是應對高難度問題時最智能、最可靠的選擇,在需要高質量答案的場景中尤為適合。早期測試顯示,它的重大錯誤更少,在編程等複雜領域的表現也更為出色。