ghabrielrodrigues-vt/vt-agent-redteam-poc

GitHub: ghabrielrodrigues-vt/vt-agent-redteam-poc

针对LiveKit AI代理的红队安全测试工具。

Stars: 0 | Forks: 0

# vt-agent-redteam — POC (Promptfoo 版本) 针对 LiveKit 托管的 K–12 AI 代理的对抗性红队工具。包含 **Promptfoo** 场景生成、**PyRIT** 多轮攻击和用于 Nerdy Tutor API 测试的 **HTTP 审查运行器** 的原型。 **仓库地址:** https://github.com/ghabrielrodrigues-vt/vt-agent-redteam-poc ## 从这里开始 **阅读 [`docs/GUIDE.md`](docs/GUIDE.md)** 获取综合 POC 指南。 对于领导层准备就绪的操作方案,请阅读 [`docs/12-livekit-redteam-hardening-solution.md`](docs/12-livekit-redteam-hardening-solution.md). | 如果你需要… | 打开 | |--------------|------| | 一切都在一个地方 | [`docs/GUIDE.md`](docs/GUIDE.md) | | 步骤-by-步骤本地设置 | [`SETUP.md`](SETUP.md) | | 组件状态 | [`STATUS.md`](STATUS.md) | | LiveKit 部署/重用方案 | [`docs/12-livekit-redteam-hardening-solution.md`](docs/12-livekit-redteam-hardening-solution.md) | | 12 工具安全性比较 | [`docs/08-tooling-dossier.md`](docs/08-tooling-dossier.md) | | 真实代理生命周期证明 | [`docs/10-livekit-real-agent-proof.md`](docs/10-livekit-real-agent-proof.md) | | 16 LiveKit 代理 + MVP 优先级 | [`docs/11-agent-coverage-matrix.md`](docs/11-agent-coverage-matrix.md) | | Promptfoo 生成器 | [`promptfoo/README.md`](promptfoo/README.md) | `docs/` 目录下的其他文件为可选的深入探讨。 ## 一目了然的有效性验证 - **195 个场景**(125 个精选 + 69 个 Promptfoo + 1 个 PyRIT)/ 22 个类别 - **45/45 pytest** 绿色;Postgres 写入验证 - 针对 `/api/nerd-tutor/moderate-text` 的 **HTTP 审查运行器** - 在本地 LiveKit 上的真实 `livekit-agents` 工作员生命周期 - **PyRIT Crescendo** — 目标拒绝 3 轮 PII 升级 详细信息和方法:[`docs/GUIDE.md`](docs/GUIDE.md) §3–9。 ## 布局 ``` ├── docs/GUIDE.md ← start here ├── SETUP.md ← run locally ├── STATUS.md ← build status ├── prototype/ ← vt_agent_redteam Python package ├── promptfoo/ ← scenario generator ├── pyrit/ ← multi-turn attacks └── livekit-local/ ← Docker + mock agent ``` ## 较轻的兄弟仓库 https://github.com/ghabrielrodrigues-vt/poc-moderation-red-team — 以文档为首要的 spike,没有 Promptfoo/PyRIT 目录。 ## 安全性 永远不要提交 `.env.local` 或 API 密钥。请参阅 [`docs/GUIDE.md`](docs/GUIDE.md) §14。 ## 许可证 专有 — Varsity Tutors 内部使用。
标签:日志审计, 请求拦截, 逆向工具