本文為機器翻譯
展示原文

ZeroLeaks 重大更新:首個不僅能發現提示漏洞,還能自動修復漏洞的 AI 紅隊平台。 隆重推出自動提示符號加強功能。 工作原理如下: 1. 您對系統提示字元執行安全掃描 2. ZeroLeaks 使用 250 多種對抗性技術對其進行攻擊 3. 如果發現漏洞,它將生成 加強後的提示符,可直接部署 工作原理: 我們的多智能體系統(策略師 → 攻擊者 → 評估者 → 修改器)能夠精確識別哪些攻擊向量成功攻擊了您的提示符號。然後,一個專門的安全工程師代理程式會在保持產品原有行為的前提下,重寫存在漏洞的部分。 您將獲得: - 要新增的確切程式碼行 - 新增位置(行號 + 上下文) - 無需猜測 兩種使用方式: → 控制面板:線上查看帶有插入錨點的新增內容。直接複製並貼上到您的系統提示字元中。 → GitHub PR:取得系統提示字元檔案的可提交建議註釋。一鍵應用修復,無需切換上下文。 這是 LLM 安全性中缺少的一環。每個工具都會告訴你哪裡出了問題,但沒有一個工具會告訴你如何準確修復,直到現在。

來自推特
免責聲明:以上內容僅為作者觀點,不代表Followin的任何立場,不構成與Followin相關的任何投資建議。
喜歡
收藏
評論