本文為機器翻譯
展示原文

【💃 今日人工智慧新聞! 💃】 ✔️ OpenAI 今天正式發布了 GPT-5.4!這次更新意義重大。 它支援原生計算機使用, 可以透過查看螢幕截圖直接控制滑鼠和鍵盤,並將上下文視窗擴展到 100 萬個詞元。 (克勞德在看嗎?) 此外,它在 OSWorld 基準測試中的表現超越了人類(72.4%),準確率達到 75%, 並且與上一版本相比,單一語句的錯誤率降低了 33%。 GPT-5.4 Thinking 和 Pro 版本正在陸續發佈到 ChatGPT、 API 和 Codex。 @sama 也提到了 Codex Windows 應用程式的發布, 以及回覆過程中改變方向的功能。 ✔️ @AnthropicAI 的動態有點不穩定。 Dario Amodei 已就美國國防部對其供應鏈風險的認定提起訴訟。 Anthropic 一直積極向美國國防部部署 Claude, 但它在自主武器和國內大規模監控方面劃清了界限。 國防部對此提出異議,並將其認定為供應鏈風險。然而,Amodei 表示,這種做法“在法律上站不住腳”,並將訴諸法庭。 他們就洩漏的內部備忘錄道歉, 承認自己「疏忽大意」。同時,有報告指出 OpenAI 已與美國國防部達成協議,將取代 Anthropic。 ✔️ Andrej Karpathy 在 nanochat 上 將 GPT-2 類模型在單一 8xH100 節點上的訓練時間縮短至 2 小時。 一個月前,訓練時間是 3 小時,但他表示,FP8 的實施以及遷移到 NVIDIA ClimbMix 資料集是關鍵因素。 這項實驗同時運行了八個 AI 代理(四個 Claude 代理和四個 Codex 代理),以自動優化 nanochat。據報道,他們在短短 12 小時內透過 110 次修改降低了驗證損失。他們自己也表示:「雖然現在還很混亂,但這才是方向。」 哇! ✔️ @perplexity_ai 也開始支援 GPT-5.4 和 針對 Pro 和 Max 訂閱用戶的 GPT-5.4 Thinking, 並為 Perplexity Computer 增加了語音模式,從而實現了語音控制的 AI 瀏覽器。 我個人認為,GPT 5.4 的原生電腦應用功能被整合到 通用前沿模型中意義重大。 Claude 是第一個引入電腦應用功能的模型, 但 OpenAI 將其整合到其旗艦模型中, 標誌著智能體時代的開始。

Telegram
免責聲明:以上內容僅為作者觀點,不代表Followin的任何立場,不構成與Followin相關的任何投資建議。
喜歡
收藏
評論