Claude Mythos 解決了之前由人工智能專家完成的 73% 的網絡安全任務。

本文為機器翻譯

展示原文

根據英國人工智能安全研究所 (AISI) 的最新評估，Anthropic 的 Claude Mythos Preview 已成為第一個完全完成對企業網絡模擬攻擊的人工智能模型。

這些結果在模型於 2024 年 4 月 7 日上線後幾天就已公佈，表明人工智能在網絡安全方面的能力已經達到了全球安全團隊需要立即關注的水平。

Claude Mythos是什麼？

Anthropic公司於2024年4月7日發佈了Claude Mythos預覽模型，但尚未向公眾發佈。相反，開發團隊僅向網絡安全研究公司提供了有限的訪問權限，以便評估併為應對這款人工智能的先進功能做好準備。

“該模型在許多領域都展現出了卓越的性能，尤其是在計算機安全方面。為了解決這個問題，我們啟動了Glasswing項目，利用Mythos Preview來支持全球最關鍵軟件的安全，同時為科技行業提供必要的策略，以預測未來的網絡攻擊，” Anthropic公司宣佈。

請在 X 上關注我們，以便第一時間獲取最新消息。

這些進展不僅引起了科技行業的關注，也引起了政策制定者的關注。據路透社援引相關消息人士報道，美國財政部長斯科特·貝森特和美聯儲主席傑羅姆·鮑威爾與各大銀行的首席執行官舉行了緊急會議，警告稱這種人工智能模型可能存在網絡攻擊風險。

英國科學、創新和技術部下屬的人工智能安全研究所 (AISI) 對 Anthropic 的 Claude Mythos Preview 進行了網絡安全評估，以檢驗該模型的安全能力。

首先是“奪旗賽”（CTF）測試，系統需要檢測並挖礦漏洞來找到隱藏的“標誌”。Mythos 在專家級測試中取得了 73% 的成功率——這是 2025 年 4 月之前其他任何模型都未曾達到的水平。

克勞德·米索斯的網絡攻擊能力。來源： AISI

此外，AISI 還開發了一套名為“最後的倖存者”（The Last Ones，簡稱 TLO）的 32 步企業網絡攻擊模擬程序。安全專家大約需要 20 個小時才能完成。

Mythos Preview 在 10 次次中僅用 3 次就完成了整個模擬過程。平均而言，該 AI 執行了 32 個攻擊步驟中的 22 個。而排名第二的 Claude Opus 4.6 平均只完成了 16 個步驟。

研究團隊補充道：“Mythos Preview 在網絡測試環境中的成功表明，一旦獲得網絡訪問權限，該人工智能完全有能力自動攻擊小型、防護薄弱且易受攻擊的企業系統。然而，這些測試環境與實際情況仍存在諸多差異，這使得攻擊更容易發生。”

通過內部測試，Anthropic 的事件響應團隊還發現，當用戶發出明確請求時，Claude Mythos Preview 可以主動識別並挖礦所有主流操作系統和流行網絡瀏覽器上的零日漏洞。

“我們在此能夠披露的信息有限。我們發現的漏洞中超過99%尚未修復，因此透露細節風險極大，”開發團隊解釋道。

AISI點擊，各組織應優先實施基本的網絡安全措施，例如定期補丁更新、嚴格的訪問控制、上漲的安全配置和全面的日誌存儲。

訂閱我們的YouTube頻道，即可觀看專家和記者帶來的深度評估。

來源

免責聲明：以上內容僅為作者觀點，不代表Followin的任何立場，不構成與Followin相關的任何投資建議。

喜歡

評論