英国人工智慧安全研究所对 Anthropic 的 Claude Mythos Preview 进行了评估,以检验其据称强大的网路安全能力,结果发现该人工智慧模型能够自主执行复杂的网路攻击,且成功率前所未有。
Claude Mythos 的存在最早于三月下旬透过网站泄露曝光,Anthropic 公司证实,这款强大的下一代模型能够发现并利用网路安全漏洞,其能力远超任何现有的人工智慧模型。据称,它已在当前的网页浏览器和作业系统中发现了严重的漏洞。
Anthropic公司并未公开发布该模型,而是向数十家安全研究公司提供了有限的存取权限,以便他们可以测试该模型并为其高级功能做好准备。据报道,上周美国财政部长斯科特·贝森特和美联储主席杰罗姆·鲍威尔警告银行高管, Claude Mythos模型构成了迫在眉睫的安全威胁。
人工智慧安全研究所周一发布的测试结果表明,Mythos Preview 的强大实力并非浪得虚名。评估结果显示,Mythos Preview 在专家级夺旗任务中成功率高达 73%,而据该研究所称,在 2025 年 4 月之前,没有任何人工智慧模型能够完成这些挑战。
尽管这项技术可以用于发现和修复漏洞,而不仅仅是利用漏洞,但其威胁可能相当巨大且影响广泛。对于加密基础设施营运商而言,人工智慧能力的不断提升代表了一种新的潜在安全威胁,因为人工智慧系统能够独立探测并利用网路漏洞。
人工智慧安全研究所表示,Mythos Preview 成为首个完成「最后的挑战」(The Last Ones,简称 TLO)的人工智慧模型。 「最后的挑战」是一项包含 32 个步骤的企业网路攻击模拟,通常需要人类花费 20 个小时才能完成。该模型在 10 次尝试中成功了 3 次,平均每次运行完成了 22 个步骤。
该模拟涵盖了从初始侦察到全面网路接管的整个过程,模拟了现实世界中的企业入侵事件。表现次佳的模型 Claude Opus 4.6 平均仅需 16 步骤即可完成模拟。英国研究所指出,Mythos Preview 的效能会随著运算资源的增加而持续提升,每次评估运行最多可使用 1 亿个代币。
在受控评估中,当明确指示并授予网路存取权限时,该模型展现出执行多阶段攻击和发现漏洞的能力,而无需人工指导。
这项进展标志著人工智慧技术相比两年前有了显著提升,当时人工智慧模型甚至难以完成基本的网路安全任务。英国人工智慧安全研究所自2023年以来一直在追踪这些能力的发展,并记录了人工智慧从入门级任务到专家级自主攻击的快速进步。
对于加密生态系统而言,智慧合约漏洞和交易所骇客攻击每年已造成数十亿美元的损失,而人工智慧驱动的攻击可能会加剧现有风险。去中心化金融(DeFi )协定通常依赖复杂的互联系统,因此可能更容易受到自动化攻击,这些攻击能够同时分析和攻击多个途径。





