Turnittoglory

Turnittoglory

44個推特粉絲

關注

Deep Trench Warfare to the Victor's we write history. Even if it is untrue.

動態

ZeroLeaks 即將免費開放給開源專案。如果您維護的開源軟體倉庫符合特定要求（例如星標數、活躍度、貢獻者數量），您將可以免費使用 ZeroLeaks 對您的 AI 代理程式和提示進行安全掃描。我目前正在建立一個維護者等候名單，希望他們能儘早獲得訪問權限。如果您維護一個開源專案並希望加入等候名單，請私訊與我聯絡。

如果 $X1XHLOL 贏得 10 萬美元獎金，我將讓社群決定如何將獎金的百分比分配給代幣（分紅機器人、BagsAMM、複合流動性…）

WE'RE GIVING AWAY $100,000 IN CASH TO THE PROJECT WITH THE HIGHEST MARKET CAP USING AT LEAST ONE APP FROM THE BAGS APP STORE. THE COUNTDOWN BEGINS NOW 👇 https://bags.fm/drops?=v1

ZeroLeaks 重大更新：首個不僅能發現提示漏洞，還能自動修復漏洞的 AI 紅隊平台。隆重推出自動提示符號加強功能。工作原理如下： 1. 您對系統提示字元執行安全掃描 2. ZeroLeaks 使用 250 多種對抗性技術對其進行攻擊 3. 如果發現漏洞，它將生成加強後的提示符，可直接部署工作原理：我們的多智能體系統（策略師 → 攻擊者 → 評估者 → 修改器）能夠精確識別哪些攻擊向量成功攻擊了您的提示符號。然後，一個專門的安全工程師代理程式會在保持產品原有行為的前提下，重寫存在漏洞的部分。您將獲得： - 要新增的確切程式碼行 - 新增位置（行號 + 上下文） - 無需猜測兩種使用方式： → 控制面板：線上查看帶有插入錨點的新增內容。直接複製並貼上到您的系統提示字元中。 → GitHub PR：取得系統提示字元檔案的可提交建議註釋。一鍵應用修復，無需切換上下文。這是 LLM 安全性中缺少的一環。每個工具都會告訴你哪裡出了問題，但沒有一個工具會告訴你如何準確修復，直到現在。

我剛剛用 ZeroLeaks 對 @OpenClaw（原名 Clawdbot）進行了測試。得分 2/100。提取率 84%。注入攻擊成功率 91%。系統提示符在第一回合就洩露了。這意味著，如果你使用 Clawdbot，任何與你的代理交互的人都可以訪問並操縱你的完整系統提示符、內部工具配置、內存文件……你輸入到 http:/SOUL.md、http:/AGENTS.md 中的所有內容，你的技能，所有這些都可以被訪問，並面臨提示符注入的風險。對於處理敏感工作流程或私有數據的代理來說，這是一個真正的問題。抄送 @steipete 完整分析：zeroleaks.ai/reports/openclaw-...…

-- 到底啦 --