avatar
头雁
12-12

Openai發佈了最新的GPT5.2版本 這個版本主要在通用智能,長上下文理解,智能體和視覺上有很大改進。 -該模型在製作電子表格、設計演示文稿、編寫代碼、識別圖像、理解長文本上下文、使用工具以及處理複雜的多步驟項目方面表現更佳。 -GPT‑5.2 在眾多基準測試中都刷新了行業水平,包括 GDPval。在該評測中,它在涵蓋 44 個職業的明確知識型工作任務上超越了行業專家。 -GPT‑5.2 Thinking 在 SWE-bench Pro 測試取得了 55.6% 的新成績。SWE-bench Pro 是一項嚴格評估真實軟件工程能力的基準測試。與只測試 Python 的 SWE-bench Verified 不同,SWE-bench Pro 涵蓋四種語言,旨在更具抗汙染性、更具挑戰性、更具多樣性,也更貼近真實工業場景 -GPT‑5.2 Thinking 在前端軟件工程方面也優於 GPT‑5.1 Thinking。早期測試者發現,它在前端開發以及複雜或非傳統的 UI 工作上表現更強(尤其是涉及 3D 元素的場景) -GPT‑5.2 Thinking 在長上下文推理方面樹立了新的技術標杆 -在真實任務中,例如深度文檔分析(需要跨數十萬 Token 關聯信息),GPT‑5.2 Thinking 的準確性顯著高於 GPT‑5.1 Thinking -GPT‑5.2 Thinking 是迄今最強大的視覺模型,在圖表推理和軟件界面理解方面將錯誤率大幅降低,約減少了一半 ChatGPT 中的 GPT‑5.2 -GPT‑5.2 Instant 是一款高效而強大的日常工作與學習“主力模型”,在信息查詢、操作指南、步驟講解、技術寫作以及翻譯方面都有顯著提升,並延續了 GPT‑5.1 Instant 更溫暖、更自然的對話風格。早期測試者特別指出,其解釋更清晰,能夠在一開始就呈現出關鍵信息。 -GPT‑5.2 Thinking 專為更深入的工作而打造,幫助用戶以更高的完成度處理複雜任務,擅長編碼、長文檔總結、回答上傳文件相關問題、逐步推導數學與邏輯問題,以及通過更清晰的結構和更有用的細節支持規劃與決策。 -GPT‑5.2 Pro 是應對高難度問題時最智能、最可靠的選擇,在需要高質量答案的場景中尤為適合。早期測試顯示,它的重大錯誤更少,在編程等複雜領域的表現也更為出色。

OpenAI
@OpenAI
12-12
GPT-5.2 is now rolling out to everyone. https://openai.com/index/introducing-gpt-5-2/…
來自推特
免責聲明:以上內容僅為作者觀點,不代表Followin的任何立場,不構成與Followin相關的任何投資建議。
喜歡
收藏
評論