Turnittoglory

Turnittoglory

44个推特粉丝

关注

Deep Trench Warfare to the Victor's we write history. Even if it is untrue.

动态

ZeroLeaks 即将免费开放给开源专案。如果您维护的开源软体仓库符合特定要求（例如星标数、活跃度、贡献者数量），您将可以免费使用 ZeroLeaks 对您的 AI 代理程式和提示进行安全扫描。我目前正在建立一个维护者等候名单，希望他们能尽早获得访问权限。如果您维护一个开源专案并希望加入等候名单，请私讯与我联络。

如果 $X1XHLOL 赢得 10 万美元奖金，我将让社群决定如何将奖金的百分比分配给代币（分红机器人、BagsAMM、复合流动性…）

WE'RE GIVING AWAY $100,000 IN CASH TO THE PROJECT WITH THE HIGHEST MARKET CAP USING AT LEAST ONE APP FROM THE BAGS APP STORE. THE COUNTDOWN BEGINS NOW 👇 https://bags.fm/drops?=v1

ZeroLeaks 重大更新：首个不仅能发现提示漏洞，还能自动修复漏洞的 AI 红队平台。隆重推出自动提示符号加强功能。工作原理如下： 1. 您对系统提示字元执行安全扫描 2. ZeroLeaks 使用 250 多种对抗性技术对其进行攻击 3. 如果发现漏洞，它将生成加强后的提示符，可直接部署工作原理：我们的多智能体系统（策略师 → 攻击者 → 评估者 → 修改器）能够精确识别哪些攻击向量成功攻击了您的提示符号。然后，一个专门的安全工程师代理程式会在保持产品原有行为的前提下，重写存在漏洞的部分。您将获得： - 要新增的确切程式码行 - 新增位置（行号 + 上下文） - 无需猜测两种使用方式： → 控制面板：线上查看带有插入锚点的新增内容。直接复制并贴上到您的系统提示字元中。 → GitHub PR：取得系统提示字元档案的可提交建议注释。一键应用修复，无需切换上下文。这是 LLM 安全性中缺少的一环。每个工具都会告诉你哪里出了问题，但没有一个工具会告诉你如何准确修复，直到现在。

我刚刚用 ZeroLeaks 对 @OpenClaw（原名 Clawdbot）进行了测试。得分 2/100。提取率 84%。注入攻击成功率 91%。系统提示符在第一回合就泄露了。这意味着，如果你使用 Clawdbot，任何与你的代理交互的人都可以访问并操纵你的完整系统提示符、内部工具配置、内存文件……你输入到 http:/SOUL.md、http:/AGENTS.md 中的所有内容，你的技能，所有这些都可以被访问，并面临提示符注入的风险。对于处理敏感工作流程或私有数据的代理来说，这是一个真正的问题。抄送 @steipete 完整分析：zeroleaks.ai/reports/openclaw-...…

-- 到底啦 --