Anthropic 正在籌備 Opus 4.7 和全棧 AI 工作室——同時還要應對更可怕的事情

本文為機器翻譯

展示原文

據 The Information 報道，Anthropic 即將發佈 Claude Opus 4.7 以及一款新的 AI 驅動設計工具，該工具允許用戶使用簡單的英語提示來構建網站、演示文稿和著陸頁——這一消息導致 Adobe、Wix 和 Figma 的股價在週一下跌。

據知情人士向The Information透露，這些產品最早可能在本週發佈。這款設計工具的目標用戶既包括開發者，也包括非技術用戶，這使其與Gamma和谷歌的Stitch等初創公司展開了激烈的競爭。

Anthropic公司沒有回應Decrypt的置評請求。

Opus 4.7 甚至還不是 Anthropic 最強大的型號。這個頭銜屬於 Claude Mythos——一款專注於網絡安全的強大產品，該公司正悄悄地將其交付給指定的幾家安全公司，而並未向公眾公開。

英國人工智能安全研究所（AI Security Institute）近期對Mythos Preview進行了評估，發現它能夠自主執行復雜的網絡攻擊，其速度之快，其他任何模型都無法匹敵。Mythos Preview成為首個完成“The Last Ones”任務的人工智能系統。“The Last Ones”是一項包含32個步驟的企業網絡攻擊模擬任務，通常需要人類紅隊花費20個小時才能完成。Mythos Preview在十次嘗試中成功完成了三次，平均完成了32個步驟中的22個，而Opus 4.6的平均完成率為16。

這不僅僅關乎企業安全。衡量人工智能的實際能力已成為整個行業的一大難題。OpenAI 近期稱其領先的編碼基準測試“已被汙染”，但模型之間的比較仍然使用相同的測試。在另一項ARC-AGI-3 評估中， Gemini 的得分為 0.37%，GPT-5.4 的得分為 0.26%，而人類的得分為 100%。其結果是，基準測試結果既備受爭議，又被廣泛用作證據，因此在 Anthropic 發佈詳細的模型說明之前，我們很難對 Opus 4.7 的性能提升做出客觀評價。

Opus 和 Mythos 之間的關係比大多數人意識到的要密切得多。Anthropic 通過在 Opus 產品線的基礎上進行微調來構建其前沿模型——支撐公開 Claude 產品線的同一核心架構，經過壓力測試和強化後，最終應用於 Mythos。Opus 4.7 是最終融入網絡安全功能的基石。

此外，Anthropic 的努力方向也越來越偏向開發/企業應用場景。Claude 代碼洩露、技能系統和MCP協議的發佈、對智能體 AI 的關注以及對代碼基準測試的重視，都更加印證了這一點。雖然 Anthropic 尚未正式宣佈，但這些洩露事件強化了其從 LLM 提供商向類似全棧“AI 工作室”模式的轉變，在這種模式下，Claude 不僅能夠生成文本，還能構建和部署完整的產品。