头雁的想法

12-12

Openai發佈了最新的GPT5.2版本這個版本主要在通用智能，長上下文理解，智能體和視覺上有很大改進。 -該模型在製作電子表格、設計演示文稿、編寫代碼、識別圖像、理解長文本上下文、使用工具以及處理複雜的多步驟項目方面表現更佳。 -GPT‑5.2 在眾多基準測試中都刷新了行業水平，包括 GDPval。在該評測中，它在涵蓋 44 個職業的明確知識型工作任務上超越了行業專家。 -GPT‑5.2 Thinking 在 SWE-bench Pro 測試取得了 55.6% 的新成績。SWE-bench Pro 是一項嚴格評估真實軟件工程能力的基準測試。與只測試 Python 的 SWE-bench Verified 不同，SWE-bench Pro 涵蓋四種語言，旨在更具抗汙染性、更具挑戰性、更具多樣性，也更貼近真實工業場景 -GPT‑5.2 Thinking 在前端軟件工程方面也優於 GPT‑5.1 Thinking。早期測試者發現，它在前端開發以及複雜或非傳統的 UI 工作上表現更強（尤其是涉及 3D 元素的場景） -GPT‑5.2 Thinking 在長上下文推理方面樹立了新的技術標杆 -在真實任務中，例如深度文檔分析（需要跨數十萬 Token 關聯信息），GPT‑5.2 Thinking 的準確性顯著高於 GPT‑5.1 Thinking -GPT‑5.2 Thinking 是迄今最強大的視覺模型，在圖表推理和軟件界面理解方面將錯誤率大幅降低，約減少了一半 ChatGPT 中的 GPT‑5.2 -GPT‑5.2 Instant 是一款高效而強大的日常工作與學習“主力模型”，在信息查詢、操作指南、步驟講解、技術寫作以及翻譯方面都有顯著提升，並延續了 GPT‑5.1 Instant 更溫暖、更自然的對話風格。早期測試者特別指出，其解釋更清晰，能夠在一開始就呈現出關鍵信息。 -GPT‑5.2 Thinking 專為更深入的工作而打造，幫助用戶以更高的完成度處理複雜任務，擅長編碼、長文檔總結、回答上傳文件相關問題、逐步推導數學與邏輯問題，以及通過更清晰的結構和更有用的細節支持規劃與決策。 -GPT‑5.2 Pro 是應對高難度問題時最智能、最可靠的選擇，在需要高質量答案的場景中尤為適合。早期測試顯示，它的重大錯誤更少，在編程等複雜領域的表現也更為出色。

OpenAI

@OpenAI

12-12

GPT-5.2 is now rolling out to everyone. https://openai.com/index/introducing-gpt-5-2/…

來自推特

免責聲明：以上內容僅為作者觀點，不代表Followin的任何立場，不構成與Followin相關的任何投資建議。

喜歡

評論