ZeroLeaks 重大更新:首个不仅能发现提示漏洞,还能自动修复漏洞的 AI 红队平台。
隆重推出自动提示符号加强功能。
工作原理如下:
1. 您对系统提示字元执行安全扫描
2. ZeroLeaks 使用 250 多种对抗性技术对其进行攻击
3. 如果发现漏洞,它将生成
加强后的提示符,可直接部署
工作原理:
我们的多智能体系统(策略师 → 攻击者 → 评估者 → 修改器)能够精确识别哪些攻击向量成功攻击了您的提示符号。然后,一个专门的安全工程师代理程式会在保持产品原有行为的前提下,重写存在漏洞的部分。
您将获得:
- 要新增的确切程式码行
- 新增位置(行号 + 上下文)
- 无需猜测
两种使用方式:
→ 控制面板:线上查看带有插入锚点的新增内容。直接复制并贴上到您的系统提示字元中。
→ GitHub PR:取得系统提示字元档案的可提交建议注释。一键应用修复,无需切换上下文。
这是 LLM 安全性中缺少的一环。每个工具都会告诉你哪里出了问题,但没有一个工具会告诉你如何准确修复,直到现在。