scott-lydon/adversary
GitHub: scott-lydon/adversary
自主对LLM驱动产品进行红队测试的多智能体对抗性AI安全平台,解决静态测试列表过时和手动渗透测试覆盖不足的问题。
Stars: 0 | Forks: 0
# 对抗方
多智能体对抗性 AI 安全平台。通过以下方式自主对 LLM 驱动的产品进行红队测试:
1. 通过动态攻击生成**发现**漏洞
2. 使用独立的 Judge 智能体进行**评估**
3. 将漏洞利用**记录**为可复现的漏洞报告
4. 针对未来的目标构建版本,对每个已确认的漏洞利用进行**回归测试**
## 为什么存在这个项目
静态越狱列表会过时。手动渗透测试通常发现一个漏洞就停止了。Adversary
可以持续运行,对部分成功的攻击进行变异,并将每个已确认的
漏洞利用纳入回归测试套件,在每次目标部署时运行。
## 当前状态
Gauntlet AI 第 3 周交付成果。旨在通过
`TargetAdapter` 接口在不同产品间实现复用。
## 当前目标
位于 `http://5.161.253.237` 的 Clinical Co-Pilot(第 1-2 周分叉的 OpenEMR)。
## 快速开始
```
pip install -e .
adversary scan --target http://5.161.253.237 \
--campaigns prompt_injection,data_exfiltration,state_corruption \
--budget-usd 5
```
参见 `ARCHITECTURE.md`、`THREAT_MODEL.md`、`USERS.md`。
## 许可证
MIT。
标签:AI漏洞扫描器, AI评估, AI靶场, C2, CISA项目, OpenEMR, PyRIT, Python安全工具, 人工智能安全, 动态攻击生成, 医疗网络安全, 合规性, 多智能体系统, 安全合规, 密码管理, 对抗性AI, 提示注入, 数据渗出, 权限管理, 模型越狱, 漏洞回归测试, 网络代理, 网络安全测试工具, 自动化渗透测试, 自动化红队, 逆向工具, 集群管理