ghabrielrodrigues-vt/vt-agent-redteam-poc
GitHub: ghabrielrodrigues-vt/vt-agent-redteam-poc
针对LiveKit AI代理的红队安全测试工具。
Stars: 0 | Forks: 0
# vt-agent-redteam — POC (Promptfoo 版本)
针对 LiveKit 托管的 K–12 AI 代理的对抗性红队工具。包含 **Promptfoo** 场景生成、**PyRIT** 多轮攻击和用于 Nerdy Tutor API 测试的 **HTTP 审查运行器** 的原型。
**仓库地址:** https://github.com/ghabrielrodrigues-vt/vt-agent-redteam-poc
## 从这里开始
**阅读 [`docs/GUIDE.md`](docs/GUIDE.md)** 获取综合 POC 指南。
对于领导层准备就绪的操作方案,请阅读
[`docs/12-livekit-redteam-hardening-solution.md`](docs/12-livekit-redteam-hardening-solution.md).
| 如果你需要… | 打开 |
|--------------|------|
| 一切都在一个地方 | [`docs/GUIDE.md`](docs/GUIDE.md) |
| 步骤-by-步骤本地设置 | [`SETUP.md`](SETUP.md) |
| 组件状态 | [`STATUS.md`](STATUS.md) |
| LiveKit 部署/重用方案 | [`docs/12-livekit-redteam-hardening-solution.md`](docs/12-livekit-redteam-hardening-solution.md) |
| 12 工具安全性比较 | [`docs/08-tooling-dossier.md`](docs/08-tooling-dossier.md) |
| 真实代理生命周期证明 | [`docs/10-livekit-real-agent-proof.md`](docs/10-livekit-real-agent-proof.md) |
| 16 LiveKit 代理 + MVP 优先级 | [`docs/11-agent-coverage-matrix.md`](docs/11-agent-coverage-matrix.md) |
| Promptfoo 生成器 | [`promptfoo/README.md`](promptfoo/README.md) |
`docs/` 目录下的其他文件为可选的深入探讨。
## 一目了然的有效性验证
- **195 个场景**(125 个精选 + 69 个 Promptfoo + 1 个 PyRIT)/ 22 个类别
- **45/45 pytest** 绿色;Postgres 写入验证
- 针对 `/api/nerd-tutor/moderate-text` 的 **HTTP 审查运行器**
- 在本地 LiveKit 上的真实 `livekit-agents` 工作员生命周期
- **PyRIT Crescendo** — 目标拒绝 3 轮 PII 升级
详细信息和方法:[`docs/GUIDE.md`](docs/GUIDE.md) §3–9。
## 布局
```
├── docs/GUIDE.md ← start here
├── SETUP.md ← run locally
├── STATUS.md ← build status
├── prototype/ ← vt_agent_redteam Python package
├── promptfoo/ ← scenario generator
├── pyrit/ ← multi-turn attacks
└── livekit-local/ ← Docker + mock agent
```
## 较轻的兄弟仓库
https://github.com/ghabrielrodrigues-vt/poc-moderation-red-team — 以文档为首要的 spike,没有 Promptfoo/PyRIT 目录。
## 安全性
永远不要提交 `.env.local` 或 API 密钥。请参阅 [`docs/GUIDE.md`](docs/GUIDE.md) §14。
## 许可证
专有 — Varsity Tutors 内部使用。
标签:日志审计, 请求拦截, 逆向工具