Meta 透过新的 Llama 工具增强 AI 安全性

04-30

本文为机器翻译

展示原文

如果您正在使用 AI 进行构建，或者试图防御该技术不太好的一面，Meta 刚刚推出了新的Llama安全工具。

针对 Llama AI 模型的改进安全工具与 Meta 提供的全新资源一同推出，旨在帮助网络安全团队利用 AI 进行防御。这一切都是为了确保所有参与者都能更安全地开发和使用 AI。

使用 Llama 系列模型的开发人员现在可以使用一些升级版工具包。您可以直接从 Meta 自己的 Llama Protection 页面获取这些最新的 Llama Protection 工具，或者在众多开发人员聚集的地方找到它们：Hugging Face 和 GitHub。

首先是 Llama Guard 4。它可以被视为 Meta 可定制 AI 安全过滤器的升级版。最大的亮点是，它现在支持多模式，因此不仅可以理解并应用安全规则于文本，还可以理解并应用于图像。随着 AI 应用越来越注重视觉化，这一点至关重要。这个新版本也被嵌入到 Meta 全新的 Llama API 中，目前处于有限预览阶段。

然后是 LlamaFirewall。这是 Meta 的全新产品，旨在充当 AI 系统的安全控制中心。它有助于管理不同的安全模型协同工作，并与 Meta 的其他保护工具连接。它的作用是什么？识别并阻止那些让 AI 开发者夜不能寐的风险——例如旨在欺骗 AI 的巧妙“即时注入”攻击、潜在的恶意代码生成，以及 AI 插件的危险行为。

Meta 还对其 Llama Prompt Guard 进行了优化。主力型号 Prompt Guard 2 (86M) 现在能够更好地嗅探那些棘手的越狱尝试和快速注入。或许更有趣的是，Prompt Guard 2 22M 的推出。

Prompt Guard 2 22M 是一款体型更小、性能更强大的版本。Meta 估计，与更大的型号相比，它可以将延迟和计算成本降低高达 75%，同时又不会牺牲太多的检测能力。对于需要更快响应速度或预算紧张的用户来说，这是一个值得欢迎的补充。

但 Meta 的关注点不仅仅在于 AI 开发者，他们也关注着身处数字安全前线的网络防御者。他们听到了人们对更强大的 AI 工具的呼声，希望借此对抗网络攻击，并分享了一些旨在实现这一目标的更新。

CyberSec Eval 4 基准测试套件现已更新。这款开源工具包可帮助企业了解人工智能系统在安全任务中的表现。最新版本包含两个新工具：

CyberSOC Eval：该框架由网络安全专家 CrowdStrike 协助构建，专门衡量 AI 在真实安全运营中心 (SOC) 环境中的表现。它旨在更清晰地展现 AI 在威胁检测和响应方面的有效性。基准测试即将发布。
AutoPatchBench：该基准测试 Llama 和其他人工智能在坏人利用代码中的安全漏洞之前自动查找和修复漏洞的能力。

为了帮助有需要的人获得这类工具，Meta 启动了“Llama Defenders”计划。该计划旨在为合作伙伴公司和开发者提供一系列 AI 解决方案的特殊访问权限——其中一些是开源的，一些是早期试用版，还有一些可能是专有的——所有这些解决方案都针对不同的安全挑战。

作为其中的一部分，Meta 分享了他们内部使用的一款 AI 安全工具：自动敏感文档分类工具。它会自动为组织内部的文档贴上安全标签。目的是什么？为了防止敏感信息泄露，或者防止其被意外输入 AI 系统（例如 RAG 设置），从而导致信息泄露。

他们还在努力解决人工智能生成的虚假音频问题，这种音频在诈骗中被越来越多地使用。Llama 生成的音频检测器和 Llama 音频水印检测器正在与合作伙伴共享，帮助他们在潜在的网络钓鱼电话或欺诈企图中识别人工智能生成的声音。ZenDesk、加拿大贝尔和 AT&T 等公司已经准备整合这些技术。

最后，Meta 透露了一项对用户隐私可能产生巨大影响的技术：隐私处理。这是他们正在为 WhatsApp 开发的新技术。其理念是让人工智能做一些有用的事情，比如总结你的未读消息或帮助你起草回复，但 Meta 或 WhatsApp 无法读取这些消息的内容。

Meta 在安全方面相当开放，甚至公开了他们的威胁模型，并邀请安全研究人员在架构上线前对其进行漏洞检测。这表明他们深知必须妥善处理隐私问题。

总的来说，这是 Meta 发布的一系列广泛的人工智能安全公告。他们显然正努力加大力度，确保自身构建的人工智能安全，同时也为更广泛的科技社区提供更好的工具，帮助他们安全构建并有效防御。

另请参阅： 人工智能诈骗数量惊人增长：微软披露挫败的 40 亿美元欺诈案

想从行业领袖那里了解更多人工智能和大数据知识？欢迎关注在阿姆斯特丹、加利福尼亚和伦敦举办的人工智能与大数据博览会。这场综合性盛会将与其他领先活动同期举办，包括智能自动化大会、 BlockX 、数字化转型周以及网络安全与云计算博览会。

在此探索由 TechForge 主办的其他即将举行的企业技术活动和网络研讨会。

Meta 利用新的 Llama 工具增强 AI 安全性一文最先出现在AI News上。