akar5h/agentred

GitHub: akar5h/agentred

一个开源的 AI 红队演练框架，通过 MUZZLE 迭代攻击循环自动化探测和测试各类 AI 代理的安全边界。

Stars: 1 | Forks: 0

# Agentred 一个开源、与代理无关的 AI 红队演练框架，实现了 [MUZZLE](https://arxiv.org/abs/2602.09222) 迭代攻击循环。基于 [DeepAgents](https://github.com/langchain-ai/deepagents) 构建。可攻击任何 AI 代理 —— HTTP API、LangGraph 代理或浏览器 UI —— 且无需修改受害目标。 ## 功能 - **探测**：使用良性任务探索受害目标，映射其暴露的攻击面 - **嫁接**：将发现的攻击面整合为排序后的攻击载体候选 - **重放**：重放受害目标自身的披露信息，提炼精确的对抗目标 - **执行**：实施双层攻击战役：首先是预构建目录，其次是 LLM 自适应的缺口合成 - **记忆**：跨周期记录发现结果，以收敛到高置信度的攻击向量 ## 状态 TRD（技术需求文档）已完成。实现正在进行中。请参阅 [`docs/TRD/`](docs/TRD/) 查看完整规范。 ## 许可证 Apache 2.0 — 详见 [LICENSE](LICENSE)。

标签：Agent-agnostic, AI安全, AI红队, API安全, C2, Chat Copilot, DeepAgents, IP 地址批量处理, JSON输出, LangChain, LangGraph, MUZZLE攻击循环, TGT, 大模型安全, 密码管理, 对抗攻击, 攻防演练, 敏感信息检测, 智能体安全, 网络安全, 网络靶场, 自动化攻击, 轻量级, 逆向工具, 配置审计, 隐私保护