Azcerate/ai-red-team-orchestrator

GitHub: Azcerate/ai-red-team-orchestrator

AI红队编排器与合规报告生成器，用于测试和评估AI系统的安全性。

Stars: 0 | Forks: 0

# airt — AI 红队编排器与合规报告生成器测试 LLM 聊天机器人、RAG 助手和 AI 功能，针对提示注入、越狱、数据泄露、RAG/金丝雀数据提取、过度授权、不安全输出、上下文溢出和速率限制弱点进行测试，然后生成 **OWASP LLM Top 10 (2025) / MITRE ATLAS / NIST CSF 2.0** 映射报告和 **CI 回归门**。 ## 功能 - **探测引擎：** 基于代码的攻击探测（非静态 CSV），通过 *变异器* 自动扩展（一个有效载荷 → base64/rot13/leet/… 变体）。运行 `airt probes list`。 - **互操作性：** 摄入外部运行器 — `airt import-garak` 将 NVIDIA garak 报告映射到同一管道。 - **可插拔的裁判：** 本地 `ollama`（默认）或托管 `anthropic` / `openai`（无需 GPU）。 - **两阶段检测：** 确定性短语/金丝雀检查 + LLM 裁决；金丝雀命中是真实情况。 - **可防御的评分：** ASR 与明确的分母；低置信度发现被限制，而不是膨胀。 - **框架映射：** OWASP LLM 2025、MITRE ATLAS、NIST CSF 2.0。 - **客户端级报告：** Markdown + HTML（+ 通过 WeasyPrint 的 PDF）。 - **回归门：** 基线差异 + 阈值 + CI 退出代码。 - **裁判验证（工作流程）：** 标记一个黄金集 → 在引用任何可靠性数字之前测量精确度 / 召回率 / F1 / Cohen 的 κ。 ## 架构 ``` orchestrator/ core · config · corpus · runners · judges · scoring · frameworks · evidence · reporting · gates · validation · storage · cli.py config/ target/campaign/judge/scoring/gate/report YAML corpus/ id,technique,prompt CSVs (category set per-campaign; technique doubles as canary phrase) ``` ## 许可证 MIT — 查看 [LICENSE](LICENSE）。由 Anthony N. Saunders（MSCS、CISM、CISA）构建。

标签：AI漏洞检测, AI红队工具, Cloudflare, CSV数据, HTML报告, LLM安全测试, Markdown报告, MITRE ATLAS, MITRE ATT&CK, NIST CSF 2.0, OWASP LLM Top 10, PDF报告, YAML配置, 两阶段检测, 互操作性, 人工智能安全, 代码攻击探测, 可防御评分, 合规性, 命令行界面, 回归测试门, 存储管理, 安全合规, 安全报告生成, 插件式评分, 框架映射, 法官验证, 网络代理, 请求拦截, 逆向工具