akar5h/agentred
GitHub: akar5h/agentred
一个开源的 AI 红队演练框架,通过 MUZZLE 迭代攻击循环自动化探测和测试各类 AI 代理的安全边界。
Stars: 0 | Forks: 0
# Agentred
一个开源、与代理无关的 AI 红队演练框架,实现了 [MUZZLE](https://arxiv.org/abs/2602.09222) 迭代攻击循环。
基于 [DeepAgents](https://github.com/langchain-ai/deepagents) 构建。可攻击任何 AI 代理 —— HTTP API、LangGraph 代理或浏览器 UI —— 且无需修改受害目标。
## 功能
- **探测**:使用良性任务探索受害目标,映射其暴露的攻击面
- **嫁接**:将发现的攻击面整合为排序后的攻击载体候选
- **重放**:重放受害目标自身的披露信息,提炼精确的对抗目标
- **执行**:实施双层攻击战役:首先是预构建目录,其次是 LLM 自适应的缺口合成
- **记忆**:跨周期记录发现结果,以收敛到高置信度的攻击向量
## 状态
TRD(技术需求文档)已完成。实现正在进行中。
请参阅 [`docs/TRD/`](docs/TRD/) 查看完整规范。
## 许可证
Apache 2.0 — 详见 [LICENSE](LICENSE)。
标签:Agent-agnostic, AI安全, AI红队, API安全, C2, Chat Copilot, DeepAgents, IP 地址批量处理, JSON输出, LangChain, LangGraph, MUZZLE攻击循环, TGT, 大模型安全, 密码管理, 对抗攻击, 攻防演练, 敏感信息检测, 智能体安全, 网络安全, 网络靶场, 自动化攻击, 轻量级, 逆向工具, 配置审计, 隐私保护