人類克勞德神話:是嚴重威脅還是被過度炒作?人工智能安全研究所對此發表了看法。

avatar
Decrypt
04-14
本文為機器翻譯
展示原文

英國人工智慧安全研究所對 Anthropic 的 Claude Mythos Preview 進行了評估,以檢驗其據稱強大的網路安全能力,結果發現該人工智慧模型能夠自主執行複雜的網路攻擊,且成功率前所未有。

Claude Mythos 的存在最早於三月下旬透過網站洩露曝光,Anthropic 公司證實,這款強大的下一代模型能夠發現並利用網路安全漏洞,其能力遠超任何現有的人工智慧模型。據稱,它已在當前的網頁瀏覽器和作業系統中發現了嚴重的漏洞。

Anthropic公司並未公開發布該模型,而是向數十家安全研究公司提供了有限的存取權限,以便他們可以測試該模型並為其高級功能做好準備。據報道,上周美國財政部長斯科特·貝森特和美聯儲主席傑羅姆·鮑威爾警告銀行高管, Claude Mythos模型構成了迫在眉睫的安全威脅。

人工智慧安全研究所週一發布的測試結果表明,Mythos Preview 的強大實力並非浪得虛名。評估結果顯示,Mythos Preview 在專家級奪旗任務中成功率高達 73%,而據該研究所稱,在 2025 年 4 月之前,沒有任何人工智慧模型能夠完成這些挑戰。

儘管這項技術可以用於發現和修復漏洞,而不僅僅是利用漏洞,但其威脅可能相當巨大且影響廣泛。對於加密基礎設施營運商而言,人工智慧能力的不斷提升代表了一種新的潛在安全威脅,因為人工智慧系統能夠獨立探測並利用網路漏洞。

人工智慧安全研究所表示,Mythos Preview 成為首個完成「最後的挑戰」(The Last Ones,簡稱 TLO)的人工智慧模型。 「最後的挑戰」是一項包含 32 個步驟的企業網路攻擊模擬,通常需要人類花費 20 個小時才能完成。該模型在 10 次嘗試中成功了 3 次,平均每次運行完成了 22 個步驟。

該模擬涵蓋了從初始偵察到全面網路接管的整個過程,模擬了現實世界中的企業入侵事件。表現次佳的模型 Claude Opus 4.6 平均僅需 16 步驟即可完成模擬。英國研究所指出,Mythos Preview 的效能會隨著運算資源的增加而持續提升,每次評估運行最多可使用 1 億個代幣。

在受控評估中,當明確指示並授予網路存取權限時,該模型展現出執行多階段攻擊和發現漏洞的能力,而無需人工指導。

這項進展標誌著人工智慧技術相比兩年前有了顯著提升,當時人工智慧模型甚至難以完成基本的網路安全任務。英國人工智慧安全研究所自2023年以來一直在追蹤這些能力的發展,並記錄了人工智慧從入門級任務到專家級自主攻擊的快速進步。

對於加密生態系統而言,智慧合約漏洞和交易所駭客攻擊每年已造成數十億美元的損失,而人工智慧驅動的攻擊可能會加劇現有風險。去中心化金融(DeFi )協定通常依賴複雜的互聯繫統,因此可能更容易受到自動化攻擊,這些攻擊能夠同時分析和攻擊多個途徑。

來源
免責聲明:以上內容僅為作者觀點,不代表Followin的任何立場,不構成與Followin相關的任何投資建議。
喜歡
68
收藏
18
評論