【💃 今日人工智慧新闻! 💃】 ✔️ OpenAI 今天正式发布了 GPT-5.4!这次更新意义重大。 它支援原生计算机使用, 可以透过查看萤幕截图直接控制滑鼠和键盘,并将上下文视窗扩展到 100 万个词元。 (克劳德在看吗?) 此外,它在 OSWorld 基准测试中的表现超越了人类(72.4%),准确率达到 75%, 并且与上一版本相比,单一语句的错误率降低了 33%。 GPT-5.4 Thinking 和 Pro 版本正在陆续发布到 ChatGPT、 API 和 Codex。 @sama 也提到了 Codex Windows 应用程式的发布, 以及回复过程中改变方向的功能。 ✔️ @AnthropicAI 的动态有点不稳定。 Dario Amodei 已就美国国防部对其供应链风险的认定提起诉讼。 Anthropic 一直积极向美国国防部部署 Claude, 但它在自主武器和国内大规模监控方面划清了界限。 国防部对此提出异议,并将其认定为供应链风险。然而,Amodei 表示,这种做法“在法律上站不住脚”,并将诉诸法庭。 他们就泄漏的内部备忘录道歉, 承认自己「疏忽大意」。同时,有报告指出 OpenAI 已与美国国防部达成协议,将取代 Anthropic。 ✔️ Andrej Karpathy 在 nanochat 上 将 GPT-2 类模型在单一 8xH100 节点上的训练时间缩短至 2 小时。 一个月前,训练时间是 3 小时,但他表示,FP8 的实施以及迁移到 NVIDIA ClimbMix 资料集是关键因素。 这项实验同时运行了八个 AI 代理(四个 Claude 代理和四个 Codex 代理),以自动优化 nanochat。据报道,他们在短短 12 小时内透过 110 次修改降低了验证损失。他们自己也表示:「虽然现在还很混乱,但这才是方向。」 哇! ✔️ @perplexity_ai 也开始支援 GPT-5.4 和 针对 Pro 和 Max 订阅用户的 GPT-5.4 Thinking, 并为 Perplexity Computer 增加了语音模式,从而实现了语音控制的 AI 浏览器。 我个人认为,GPT 5.4 的原生电脑应用功能被整合到 通用前沿模型中意义重大。 Claude 是第一个引入电脑应用功能的模型, 但 OpenAI 将其整合到其旗舰模型中, 标志著智能体时代的开始。
本文为机器翻译
展示原文

Telegram
免责声明:以上内容仅为作者观点,不代表Followin的任何立场,不构成与Followin相关的任何投资建议。
喜欢
收藏
评论
分享





