OpenAI 推出了 GPT-5.4,这是一款专为专业工作负载设计的新型前沿模型,它将高阶推理、编码和基于代理的工作流程结合到一个系统中。
该模型正在 ChatGPT、API 和 Codex 中推广,同时也推出了效能更高的 GPT-5.4 Pro 版本,用于需要最大运算能力和准确性的复杂任务。
GPT-5.4 整合了 GPT-5.3 Codex 中引入的编码功能,同时提升了在各种工具、软体环境以及专业任务(例如电子表格、简报和文件创建)中的效能。该模型还可以在 ChatGPT 中预先规划其推理过程,使用户能够在过程中指导回应。
该版本引入了原生电脑使用功能,使人工智慧代理能够透过滑鼠、键盘和视觉输入与作业系统、网站和应用程式进行互动。开发人员可以使用该模型在各种软体环境中自动执行多步骤工作流程。
GPT-5.4 支援高达一百万个词元的上下文窗口,并引入了工具搜寻功能,使 AI 系统能够动态地定位和使用外部工具,而无需将所有工具定义载入记忆体。这不仅减少了词元的使用,也提高了复杂工作流程中的效能。
基准测试表明,GPT-5.4 在多项任务中均有所提升。在 GDPval 专业知识工作基准测试中,GPT-5.4 在 83% 的对比测试中达到或超过行业专家的水平,而 GPT-5.2 的比例约为 71%。此外,该模型在编码测试、网页浏览任务和电脑使用基准测试中也优于早期版本。
此模型的设计目标之一是提高效率。 OpenAI 表示,与 GPT-5.2 相比,GPT-5.4 解决许多推理任务所需的代币更少,从而提高了反应速度并降低了开发者的成本。
GPT-5.4 Thinking 现已对 ChatGPT Plus、Team 和 Pro 用户开放,而 GPT-5.4 Pro 则对 Pro 和 Enterprise 用户开放。开发者可以透过 API 存取这两个模型。





