OpenAI刚刚更换了ChatGPT的引擎。从今天起, GPT-5.5 Instant将取代GPT-5.3 Instant,成为ChatGPT的默认模型,每天有数亿用户打开ChatGPT时都会使用这个模型。
这次更新并不张扬,没有新模式,也没有令人惊艳的演示。但“小幅改进”只是相对而言,因为这次升级将幻觉减少了一半以上。
OpenAI 的 GPT 系列模型分为多个级别。Instant 是日常使用的模型,速度快,适用于一般用途;Thinking 是速度较慢、分析能力更强的版本,适用于复杂问题;Pro 则是功能强大的版本,适用于高强度任务。
GPT-5.5 Instant 是 ChatGPT 用户无论是否意识到,都会与之交互的最新版本。
OpenAI 表示,在医学、法律和金融等高风险提示中,新模型产生的幻觉性陈述比 GPT-5.3 Instant 更少。幻觉性陈述一直是 ChatGPT 自诞生以来最顽固的缺陷。
OpenAI 还针对真实用户之前标记出的事实错误对话进行了测试。结果显示,不准确的说法减少了 37.3%。
在 HealthBench(一个测试人工智能对真实医疗问题回答的基准测试,评分范围为 0 到 100)上,GPT-5.5 Instant 的得分为 51.4 分,比之前的 49.6 分有所提高。在 HealthBench Professional(临床使用版本)上,它的得分从 32.9 分跃升至 38.4 分。
健康问题是人们向 ChatGPT 咨询最多的问题之一,因此,正确回答这些问题不仅仅是一项基准测试。结果表明,GPT 5.5 Instant 的准确率提高了 38.4%。
GPT-5.5 Instant 还会更积极地从你过去的聊天记录、保存的文件以及关联的 Gmail 帐户中提取信息,以使答案与你的个人情况相关。现在,当它这样做时,会准确地显示所使用的上下文,并允许你删除或更正。“你始终掌控着自己记忆中的内容,”OpenAI 写道。临时聊天记录仍然完全不包含在内。
两周前, Decrypt报道了GPT-5.5 系列的发布,当时的重点是智能体编码和终端工作流程。GPT-5.5 Instant 则截然不同——它处理的是更“基础”的任务,比如膳食计划和邮件草稿,而不是自主的多步骤编码流程。不过,别问我们 GPT-5.4 Instant 的情况。它可能正和从未存在过的 O2 模型一起静静地待在角落里呢。
完整的 GPT-5.5 在 Terminal-Bench 2.0 测试中得分 82.7%,该测试用于衡量复杂命令行任务的性能。而 Instant 版本则是我们大多数人都能使用的版本,而且大多数用户可能也都能满足需求。
系统卡中有一条值得注意的脚注:GPT-5.5 Instant 是 OpenAI 首个被评为网络安全和生物学领域“高能力”的 Instant 级模型——其能力之强,足以需要与之前仅用于更强大的 Thinking 版本相同的自动化安全防护措施。它并不能帮助你进行任何黑客攻击,但 OpenAI 已经构建了相应的防护机制,以防有人试图这样做。
之前的默认版本 GPT-5.3 Instant 于 3 月发布,承诺减少不必要的拒绝并提高准确率。GPT-5.5 Instant 延续了这一发展方向。喜欢旧版本的付费用户还有三个月的时间可以使用 GPT-5.3 Instant,之后该版本将停止服务。Gmail 的增强个性化功能将首先面向网页版 Plus 和 Pro 用户推出,Free、Go、Business 和 Enterprise 用户将在未来几周内陆续体验到此功能。



