Claude Mythos 解决了之前由人工智能专家完成的 73% 的网络安全任务。

本文为机器翻译
展示原文

根据英国人工智能安全研究所 (AISI) 的最新评估,Anthropic 的 Claude Mythos Preview 已成为第一个完全完成对企业网络模拟攻击的人工智能模型。

这些结果在模型于 2024 年 4 月 7 日上线后几天就已公布,表明人工智能在网络安全方面的能力已经达到了全球安全团队需要立即关注的水平。

Claude Mythos是什么?

Anthropic公司于2024年4月7日发布了Claude Mythos预览模型,但尚未向公众发布。相反,开发团队仅向网络安全研究公司提供了有限的访问权限,以便评估并为应对这款人工智能的先进功能做好准备。

“该模型在许多领域都展现出了卓越的性能,尤其是在计算机安全方面。为了解决这个问题,我们启动了Glasswing项目,利用Mythos Preview来支持全球最关键软件的安全,同时为科技行业提供必要的策略,以预测未来的网络攻击,” Anthropic公司宣布。

请在 X 上关注我们,以便第一时间获取最新消息。

这些进展不仅引起了科技行业的关注,也引起了政策制定者的关注。 据路透社援引相关消息人士报道,美国财政部长斯科特·贝森特和美联储主席杰罗姆·鲍威尔与各大银行的首席执行官举行了紧急会议,警告称这种人工智能模型可能存在网络攻击风险

Claude Mythos预览版看起来怎么样?

英国科学、创新和技术部下属的人工智能安全研究所 (AISI) 对 Anthropic 的 Claude Mythos Preview 进行了网络安全评估,以检验该模型的安全能力

首先是“夺旗赛”(CTF)测试,系统需要检测并挖矿漏洞来找到隐藏的“标志”。Mythos 在专家级测试中取得了 73% 的成功率——这是 2025 年 4 月之前其他任何模型都未曾达到的水平。

克劳德·米索斯的网络攻击能力克劳德·米索斯的网络攻击能力。来源: AISI

此外,AISI 还开发了一套名为“最后的幸存者”(The Last Ones,简称 TLO)的 32 步企业网络攻击模拟程序。安全专家大约需要 20 个小时才能完成。

Mythos Preview 在 10 次次中仅用 3 次就完成了整个模拟过程。平均而言,该 AI 执行了 32 个攻击步骤中的 22 个。而排名第二的 Claude Opus 4.6 平均只完成了 16 个步骤。

研究团队补充道:“Mythos Preview 在网络测试环境中的成功表明,一旦获得网络访问权限,该人工智能完全有能力自动攻击小型、防护薄弱且易受攻击的企业系统。然而,这些测试环境与实际情况仍存在诸多差异,这使得攻击更容易发生。”

通过内部测试,Anthropic 的事件响应团队还发现,当用户发出明确请求时,Claude Mythos Preview 可以主动识别并挖矿所有主流操作系统和流行网络浏览器上的零日漏洞。

“我们在此能够披露的信息有限。我们发现的漏洞中超过99%尚未修复,因此透露细节风险极大,”开发团队解释道。

AISI点击,各组织应优先实施基本的网络安全措施,例如定期补丁更新、严格的访问控制、上涨的安全配置和全面的日志存储。

订阅我们的YouTube频道,即可观看专家和记者带来的深度评估。

来源
免责声明:以上内容仅为作者观点,不代表Followin的任何立场,不构成与Followin相关的任何投资建议。
喜欢
83
收藏
13
评论