Anthropic 正在籌備 Opus 4.7 和全棧 AI 工作室——同時還要應對更可怕的事情

本文為機器翻譯
展示原文

據 The Information 報道,Anthropic 即將發佈 Claude Opus 4.7 以及一款新的 AI 驅動設計工具,該工具允許用戶使用簡單的英語提示來構建網站、演示文稿和著陸頁——這一消息導致 Adob​​e、Wix 和 Figma 的股價在週一下跌。

據知情人士向The Information透露,這些產品最早可能在本週發佈。這款設計工具的目標用戶既包括開發者,也包括非技術用戶,這使其與Gamma和谷歌的Stitch等初創公司展開了激烈的競爭。

Anthropic公司沒有回應Decrypt的置評請求。

Opus 4.7 甚至還不是 Anthropic 最強大的型號。這個頭銜屬於 Claude Mythos——一款專注於網絡安全的強大產品,該公司正悄悄地將其交付給指定的幾家安全公司,而並未向公眾公開。

英國人工智能安全研究所(AI Security Institute) 近期對Mythos Preview進行了評估,發現它能夠自主執行復雜的網絡攻擊,其速度之快,其他任何模型都無法匹敵。Mythos Preview成為首個完成“The Last Ones”任務的人工智能系統。“The Last Ones”是一項包含32個步驟的企業網絡攻擊模擬任務,通常需要人類紅隊花費20個小時才能完成。Mythos Preview在十次嘗試中成功完成了三次,平均完成了32個步驟中的22個,而Opus 4.6的平均完成率為16。

這不僅僅關乎企業安全。衡量人工智能的實際能力已成為整個行業的一大難題。OpenAI 近期稱其領先的編碼基準測試“已被汙染”,但模型之間的比較仍然使用相同的測試。在另一項ARC-AGI-3 評估中, Gemini 的得分為 0.37%,GPT-5.4 的得分為 0.26%,而人類的得分為 100%。其結果是,基準測試結果既備受爭議,又被廣泛用作證據,因此在 Anthropic 發佈詳細的模型說明之前,我們很難對 Opus 4.7 的性能提升做出客觀評價。

Opus 和 Mythos 之間的關係比大多數人意識到的要密切得多。Anthropic 通過在 Opus 產品線的基礎上進行微調來構建其前沿模型——支撐公開 Claude 產品線的同一核心架構,經過壓力測試和強化後,最終應用於 Mythos。Opus 4.7 是最終融入網絡安全功能的基石。

此外,Anthropic 的努力方向也越來越偏向開發/企業應用場景。Claude 代碼洩露技能系統和MCP協議的發佈、對智能體 AI 的關注以及對代碼基準測試的重視,都更加印證了這一點。雖然 Anthropic 尚未正式宣佈,但這些洩露事件強化了其從 LLM 提供商向類似全棧“AI 工作室”模式的轉變,在這種模式下,Claude 不僅能夠生成文本,還能構建和部署完整的產品。

來源
免責聲明:以上內容僅為作者觀點,不代表Followin的任何立場,不構成與Followin相關的任何投資建議。
喜歡
收藏
評論