本文为机器翻译
展示原文

ZeroLeaks 重大更新:首个不仅能发现提示漏洞,还能自动修复漏洞的 AI 红队平台。 隆重推出自动提示符号加强功能。 工作原理如下: 1. 您对系统提示字元执行安全扫描 2. ZeroLeaks 使用 250 多种对抗性技术对其进行攻击 3. 如果发现漏洞,它将生成 加强后的提示符,可直接部署 工作原理: 我们的多智能体系统(策略师 → 攻击者 → 评估者 → 修改器)能够精确识别哪些攻击向量成功攻击了您的提示符号。然后,一个专门的安全工程师代理程式会在保持产品原有行为的前提下,重写存在漏洞的部分。 您将获得: - 要新增的确切程式码行 - 新增位置(行号 + 上下文) - 无需猜测 两种使用方式: → 控制面板:线上查看带有插入锚点的新增内容。直接复制并贴上到您的系统提示字元中。 → GitHub PR:取得系统提示字元档案的可提交建议注释。一键应用修复,无需切换上下文。 这是 LLM 安全性中缺少的一环。每个工具都会告诉你哪里出了问题,但没有一个工具会告诉你如何准确修复,直到现在。

来自推特
免责声明:以上内容仅为作者观点,不代表Followin的任何立场,不构成与Followin相关的任何投资建议。
喜欢
收藏
评论