Arikatakur/aegis-ai

GitHub: Arikatakur/aegis-ai

一个本地优先的自治式 LLM 红队评估平台，支持多攻击类别自动化测试并输出 OWASP 映射的专业报告。

Stars: 1 | Forks: 0

# Aegis AI

![Aegis AI 演示](https://static.pigsec.cn/wp-content/uploads/repos/2026/05/bbde651896092538.png) ![Python](https://img.shields.io/badge/Python-3.11%2B-blue) ![FastAPI](https://img.shields.io/badge/API-FastAPI-green) ![CLI](https://img.shields.io/badge/CLI-Typer%20%2B%20Rich-purple) ![License](https://img.shields.io/badge/License-Apache%202.0-red) ![Status](https://img.shields.io/badge/Status-v0.1.5-orange)

## 功能 - **基于 Agent 的架构** — 模块化攻击 Agent，支持越狱、提示注入、数据窃取、编码和上下文污染 - **OWASP LLM Top 10 映射** — 每项发现均映射至 LLM01–LLM10 类别 - **全异步** — 并发攻击执行，支持可配置的速率限制 - **多提供商** — 支持 OpenAI、Anthropic、Ollama 以及任何兼容 LiteLLM 的端点 - **本地优先** — 无云依赖；SQLite 持久化，本地报告生成 - **专业报告** — 支持 Markdown、JSON、TXT 导出并附带风险评分 - **内置 Mock 目标** — 可针对内置的易受攻击/安全的 LLM 服务器进行测试 - **REST API** — 基于 FastAPI 服务器提供编程式访问 ## 快速开始 ``` # 使用 uv 安装 pip install uv uv sync --all-extras # 启动 mock 目标（用于测试的漏洞模式） aegis mock-target --port 9000 --mode vulnerable # 运行 red-team 评估 aegis run --target http://localhost:9000/chat --mode standard # 或使用 Makefile make mock # starts mock target make run # runs assessment ``` ## CLI 命令 | 命令 | 描述 | |---------|-------------| | `aegis init` | 交互式配置向导 | | `aegis run` | 运行完整的红队评估 | | `aegis mock-target` | 启动本地 mock LLM 目标 | | `aegis validate-config` | 验证目标配置文件 | | `aegis report` | 为某个会话重新导出报告 | | `aegis replay` | 重放先前会话的攻击 | | `aegis list-sessions` | 列出数据库中的所有历史会话 | ### 关键选项 ``` aegis run --target http://localhost:9000/chat \ --mode deep \ --concurrency 10 \ --categories jailbreak,prompt_injection \ --format markdown \ --output ./my-reports ``` ## 架构 ``` Config ──► Session ──► Pipeline │ ┌────────────┼────────────┐ ▼ ▼ ▼ Recon Execute Validate Agent (async) (Rules + │ Batch LLM Judge) ▼ │ │ Attack ◄─────────┘ ▼ Planner Risk Score │ │ ▼ ▼ Attack Cases Report Builder (Jailbreak, (MD / JSON / TXT) Injection, Exfiltration, Encoding, Context Poison) ``` 详细组件说明请参见 [docs/architecture.md](docs/architecture.md)。 ## 攻击类别 | 类别 | OWASP | 描述 | |----------|-------|-------------| | 越狱 | LLM01 | 角色操纵、DAN 风格、指令冲突 | | 提示注入 | LLM01 | 忽略先前指令、上下文劫持、间接注入 | | 数据窃取 | LLM02, LLM07 | 系统提示提取、RAG 泄露 | | 编码 | LLM01 | Unicode 混淆、base64、间隔指令 | | 上下文污染 | LLM04 | 恶意文档、检索操纵 | ## 技术栈 - **CLI**: Typer + Rich - **HTTP**: httpx + asyncio - **LLM**: LiteLLM (多提供商) - **数据**: Pydantic + pydantic-settings - **DB**: SQLite + SQLAlchemy + Alembic - **报告**: Jinja2 + Markdown - **API**: FastAPI + uvicorn - **测试**: pytest + pytest-asyncio - **质量保证**: ruff + mypy + pre-commit - **打包**: uv + hatchling ## 开发 ``` make install # Install all dependencies make test # Run test suite make lint # Lint with ruff make format # Format with ruff make typecheck # Type check with mypy make clean # Clean build artifacts ``` 完整开发指南请参见 [docs/development.md](docs/development.md)。 ## 道德使用 ## 许可证 Apache License 2.0 — 详情请参见 [LICENSE](LICENSE)。

标签：AI安全, AI漏洞扫描, AI验证, Anthropic, AV绕过, Chat Copilot, CISA项目, CIS基准, FastAPI, LiteLLM, LLM红队, LLM评估, Ollama, OpenAI, OWASP LLM, Python, SQLite, Typer, XXE攻击, 上下文投毒, 内存规避, 反取证, 多模型支持, 大语言模型安全, 安全报告, 安全规则引擎, 安全评估, 密码管理, 异步编程, 数据窃取, 无后门, 智能体架构, 本地部署, 机密管理, 计算机取证, 运行时操纵, 逆向工具, 风险评分