Turnittoglory的想法

02-16

本文為機器翻譯

展示原文

ZeroLeaks 重大更新：首個不僅能發現提示漏洞，還能自動修復漏洞的 AI 紅隊平台。隆重推出自動提示符號加強功能。工作原理如下： 1. 您對系統提示字元執行安全掃描 2. ZeroLeaks 使用 250 多種對抗性技術對其進行攻擊 3. 如果發現漏洞，它將生成加強後的提示符，可直接部署工作原理：我們的多智能體系統（策略師 → 攻擊者 → 評估者 → 修改器）能夠精確識別哪些攻擊向量成功攻擊了您的提示符號。然後，一個專門的安全工程師代理程式會在保持產品原有行為的前提下，重寫存在漏洞的部分。您將獲得： - 要新增的確切程式碼行 - 新增位置（行號 + 上下文） - 無需猜測兩種使用方式： → 控制面板：線上查看帶有插入錨點的新增內容。直接複製並貼上到您的系統提示字元中。 → GitHub PR：取得系統提示字元檔案的可提交建議註釋。一鍵應用修復，無需切換上下文。這是 LLM 安全性中缺少的一環。每個工具都會告訴你哪裡出了問題，但沒有一個工具會告訴你如何準確修復，直到現在。

來自推特

免責聲明：以上內容僅為作者觀點，不代表Followin的任何立場，不構成與Followin相關的任何投資建議。

喜歡

評論