头雁的想法

12-12

Openai发布了最新的GPT5.2版本这个版本主要在通用智能，长上下文理解，智能体和视觉上有很大改进。 -该模型在制作电子表格、设计演示文稿、编写代码、识别图像、理解长文本上下文、使用工具以及处理复杂的多步骤项目方面表现更佳。 -GPT‑5.2 在众多基准测试中都刷新了行业水平，包括 GDPval。在该评测中，它在涵盖 44 个职业的明确知识型工作任务上超越了行业专家。 -GPT‑5.2 Thinking 在 SWE-bench Pro 测试取得了 55.6% 的新成绩。SWE-bench Pro 是一项严格评估真实软件工程能力的基准测试。与只测试 Python 的 SWE-bench Verified 不同，SWE-bench Pro 涵盖四种语言，旨在更具抗污染性、更具挑战性、更具多样性，也更贴近真实工业场景 -GPT‑5.2 Thinking 在前端软件工程方面也优于 GPT‑5.1 Thinking。早期测试者发现，它在前端开发以及复杂或非传统的 UI 工作上表现更强（尤其是涉及 3D 元素的场景） -GPT‑5.2 Thinking 在长上下文推理方面树立了新的技术标杆 -在真实任务中，例如深度文档分析（需要跨数十万 Token 关联信息），GPT‑5.2 Thinking 的准确性显著高于 GPT‑5.1 Thinking -GPT‑5.2 Thinking 是迄今最强大的视觉模型，在图表推理和软件界面理解方面将错误率大幅降低，约减少了一半 ChatGPT 中的 GPT‑5.2 -GPT‑5.2 Instant 是一款高效而强大的日常工作与学习“主力模型”，在信息查询、操作指南、步骤讲解、技术写作以及翻译方面都有显著提升，并延续了 GPT‑5.1 Instant 更温暖、更自然的对话风格。早期测试者特别指出，其解释更清晰，能够在一开始就呈现出关键信息。 -GPT‑5.2 Thinking 专为更深入的工作而打造，帮助用户以更高的完成度处理复杂任务，擅长编码、长文档总结、回答上传文件相关问题、逐步推导数学与逻辑问题，以及通过更清晰的结构和更有用的细节支持规划与决策。 -GPT‑5.2 Pro 是应对高难度问题时最智能、最可靠的选择，在需要高质量答案的场景中尤为适合。早期测试显示，它的重大错误更少，在编程等复杂领域的表现也更为出色。

OpenAI

@OpenAI

12-12

GPT-5.2 is now rolling out to everyone. https://openai.com/index/introducing-gpt-5-2/…

来自推特

免责声明：以上内容仅为作者观点，不代表Followin的任何立场，不构成与Followin相关的任何投资建议。

喜欢