OpenAI刚刚升级了ChatGPT的预设模型——以下是GPT-5.5 Instant的实际功能

Decrypt

本文为机器翻译

展示原文

OpenAI刚刚更换了ChatGPT的引擎。从今天起， GPT-5.5 Instant将取代GPT-5.3 Instant，成为ChatGPT的默认模型，每天有数亿用户打开ChatGPT时都会使用这个模型。

这次更新并不张扬，没有新模式，也没有令人惊艳的演示。但“小幅改进”只是相对而言，因为这次升级将幻觉减少了一半以上。

OpenAI 的 GPT 系列模型分为多个级别。Instant 是日常使用的模型，速度快，适用于一般用途；Thinking 是速度较慢、分析能力更强的版本，适用于复杂问题；Pro 则是功能强大的版本，适用于高强度任务。

GPT-5.5 Instant 是 ChatGPT 用户无论是否意识到，都会与之交互的最新版本。

OpenAI 表示，在医学、法律和金融等高风险提示中，新模型产生的幻觉性陈述比 GPT-5.3 Instant 更少。幻觉性陈述一直是 ChatGPT 自诞生以来最顽固的缺陷。

OpenAI 还针对真实用户之前标记出的事实错误对话进行了测试。结果显示，不准确的说法减少了 37.3%。

在 HealthBench（一个测试人工智能对真实医疗问题回答的基准测试，评分范围为 0 到 100）上，GPT-5.5 Instant 的得分为 51.4 分，比之前的 49.6 分有所提高。在 HealthBench Professional（临床使用版本）上，它的得分从 32.9 分跃升至 38.4 分。

健康问题是人们向 ChatGPT 咨询最多的问题之一，因此，正确回答这些问题不仅仅是一项基准测试。结果表明，GPT 5.5 Instant 的准确率提高了 38.4%。

GPT-5.5 Instant 还会更积极地从你过去的聊天记录、保存的文件以及关联的 Gmail 帐户中提取信息，以使答案与你的个人情况相关。现在，当它这样做时，会准确地显示所使用的上下文，并允许你删除或更正。“你始终掌控着自己记忆中的内容，”OpenAI 写道。临时聊天记录仍然完全不包含在内。

两周前， Decrypt报道了GPT-5.5 系列的发布，当时的重点是智能体编码和终端工作流程。GPT-5.5 Instant 则截然不同——它处理的是更“基础”的任务，比如膳食计划和邮件草稿，而不是自主的多步骤编码流程。不过，别问我们 GPT-5.4 Instant 的情况。它可能正和从未存在过的 O2 模型一起静静地待在角落里呢。

完整的 GPT-5.5 在 Terminal-Bench 2.0 测试中得分 82.7%，该测试用于衡量复杂命令行任务的性能。而 Instant 版本则是我们大多数人都能使用的版本，而且大多数用户可能也都能满足需求。

系统卡中有一条值得注意的脚注：GPT-5.5 Instant 是 OpenAI 首个被评为网络安全和生物学领域“高能力”的 Instant 级模型——其能力之强，足以需要与之前仅用于更强大的 Thinking 版本相同的自动化安全防护措施。它并不能帮助你进行任何黑客攻击，但 OpenAI 已经构建了相应的防护机制，以防有人试图这样做。

之前的默认版本 GPT-5.3 Instant 于 3 月发布，承诺减少不必要的拒绝并提高准确率。GPT-5.5 Instant 延续了这一发展方向。喜欢旧版本的付费用户还有三个月的时间可以使用 GPT-5.3 Instant，之后该版本将停止服务。Gmail 的增强个性化功能将首先面向网页版 Plus 和 Pro 用户推出，Free、Go、Business 和 Enterprise 用户将在未来几周内陆续体验到此功能。

来源

免责声明：以上内容仅为作者观点，不代表Followin的任何立场，不构成与Followin相关的任何投资建议。

喜欢