ZeroLeaks 重大更新:首個不僅能發現提示漏洞,還能自動修復漏洞的 AI 紅隊平台。
隆重推出自動提示符號加強功能。
工作原理如下:
1. 您對系統提示字元執行安全掃描
2. ZeroLeaks 使用 250 多種對抗性技術對其進行攻擊
3. 如果發現漏洞,它將生成
加強後的提示符,可直接部署
工作原理:
我們的多智能體系統(策略師 → 攻擊者 → 評估者 → 修改器)能夠精確識別哪些攻擊向量成功攻擊了您的提示符號。然後,一個專門的安全工程師代理程式會在保持產品原有行為的前提下,重寫存在漏洞的部分。
您將獲得:
- 要新增的確切程式碼行
- 新增位置(行號 + 上下文)
- 無需猜測
兩種使用方式:
→ 控制面板:線上查看帶有插入錨點的新增內容。直接複製並貼上到您的系統提示字元中。
→ GitHub PR:取得系統提示字元檔案的可提交建議註釋。一鍵應用修復,無需切換上下文。
這是 LLM 安全性中缺少的一環。每個工具都會告訴你哪裡出了問題,但沒有一個工具會告訴你如何準確修復,直到現在。