josephManzambi/arbiter

GitHub: josephManzambi/arbiter

一个衡量AI代理在进攻性网络安全任务中能力的红队基准框架,核心解决评估与复现问题。

Stars: 0 | Forks: 0

# ARBITER Agentic Red-team Benchmark for Intelligence, Tactics, Evaluation and Resilience. 衡量前沿 AI 模型在进攻性网络安全任务中的能力 — 在沙箱环境中自主使用真实工具完成。 ## ARBITER 评估内容 - **代理是否解决问题?**(pass@1,pass@k) - **进展到哪一步?**(针对 Practitioner+ 难度的子任务评分) - **效率如何?**(已用令牌数与预算对比) - **云上下文挑战?** — ARBITER 的差异化:需要 利用配置错误的云部署,而不仅仅是目标系统。 ## 难度等级 与英国 AI 安全机构(UK AI Security Institute)的网络评估方法论对齐。 | 等级 | 人类首次解决 | 示例 | |---|---|---| | Apprentice | < 30 分钟 | 直接旗标的 SQL 注入 | | Practitioner | 30 分钟 – 4 小时 | 多步骤 Web 渗透 | | Expert | > 4 小时 | 二进制利用 + 云跳板 | ## 设计原则 - **可复现性** — 每个结果包含沙箱哈希、模型版本、令牌预算、完整代理轨迹。 - **诚实性** — pass@1 是主要指标。n 始终与分数一同报告。 - **主权性** — 本地 Docker 沙箱,本地 Ollama 运行的 LLM,无遥测。 - **云上下文差异化** — 每个发布版本至少包含一个需要 利用云部署上下文(IAM、S3、元数据服务)的挑战。 详见 [`VISION.md`](./VISION.md) 获取完整设计论述。 ## 安装 需要 Python ≥ 3.12、[uv](https://docs.astral.sh/uv/) 和 Docker。 ``` git clone https://github.com/{GITHUB_HANDLE}/arbiter.git cd arbiter uv sync ``` ## 许可证 Apache 2.0。参见 [`LICENSE`](./LICENSE)。 ## 作者 Joseph Manzambi — 云与人工智能安全,马拉加。 姊妹项目:[LANCE](https://github.com/{GITHUB_HANDLE}/lance) — 针对已部署代理系统的红队框架。
标签:Agentic Red-team Benchmark, AI风险缓解, Apache 2.0许可, ARBITER, ATT&CK评估, Docker容器, IAM权限绕过, Ollama本地大模型, pass@1评测, Python工具链, S3存储桶探测, UK AI Security Institute, Web渗透测试, 二进制漏洞利用, 云安全评估, 云部署上下文攻击, 令牌效率, 元数据服务利用, 前沿AI模型评测, 可重现性, 多步攻击链, 子任务评分, 开源安全工具, 攻击面发现, 横向移动, 沙箱环境, 红队框架, 编程规范, 自主AI代理, 请求拦截, 进攻性网络安全, 逆向工具, 逆向工程平台