Turnittoglory的想法

02-16

本文为机器翻译

展示原文

ZeroLeaks 重大更新：首个不仅能发现提示漏洞，还能自动修复漏洞的 AI 红队平台。隆重推出自动提示符号加强功能。工作原理如下： 1. 您对系统提示字元执行安全扫描 2. ZeroLeaks 使用 250 多种对抗性技术对其进行攻击 3. 如果发现漏洞，它将生成加强后的提示符，可直接部署工作原理：我们的多智能体系统（策略师 → 攻击者 → 评估者 → 修改器）能够精确识别哪些攻击向量成功攻击了您的提示符号。然后，一个专门的安全工程师代理程式会在保持产品原有行为的前提下，重写存在漏洞的部分。您将获得： - 要新增的确切程式码行 - 新增位置（行号 + 上下文） - 无需猜测两种使用方式： → 控制面板：线上查看带有插入锚点的新增内容。直接复制并贴上到您的系统提示字元中。 → GitHub PR：取得系统提示字元档案的可提交建议注释。一键应用修复，无需切换上下文。这是 LLM 安全性中缺少的一环。每个工具都会告诉你哪里出了问题，但没有一个工具会告诉你如何准确修复，直到现在。