realshawnnnn/mushroom-kingdom-ai-firewalll
GitHub: realshawnnnn/mushroom-kingdom-ai-firewalll
蘑菇王国 AI 防火墙是一个以像素游戏为主题的 LLM 红队评估平台,用于自动化测试和评估大语言模型应用的安全风险。
Stars: 0 | Forks: 0
# 蘑菇王国 AI 防火墙
一个受原创像素艺术启发的 LLM 红队评估平台,用于针对 prompt injection、越狱、数据泄露、不安全输出以及 RAG/工具滥用测试 AI 应用。该主题使用了有趣的城堡、管道、金币和星星的隐喻,不包含任天堂的图像、徽标或官方资产。
## 问题陈述
现代 AI 应用程序通常将 LLM 暴露给不受信任的用户、外部文档、工具调用和检索流水线。这带来了安全风险,例如系统 prompt 提取、间接 prompt injection、不安全的补全、敏感数据泄露和工具滥用。
Mushroom Kingdom AI Firewall 为安全团队提供了一个本地化的、适合作为作品集的实验室,用于发起可重复的红队模拟、对风险进行评分、将发现映射到 OWASP LLM 应用程序 Top 10,并导出对管理层友好的报告。
## 架构
```
React + TypeScript UI
Castle Security Map
Koopa Attack Simulator
Findings and Report pages
|
v
FastAPI backend
REST API
Attack modules
Evaluators
Risk scoring
Report generation
|
v
SQLite by default
PostgreSQL-ready through Docker Compose
```
## 核心功能
- 包含安全 KPI 的城堡安全地图仪表板
- 用于发起红队运行的 Koopa 攻击模拟器
- 模块化攻击:
- PromptInjectionAttack
- JailbreakAttack
- DataLeakageAttack
- ToolAbuseAttack
- RagPoisoningAttack
- 评估器:
- SecretDetector
- PolicyViolationDetector
- PromptInjectionSuccessDetector
- RiskScorer
- OWASP LLM Top 10 类别映射
- 以 JSON 和 Markdown 格式导出公主保护报告
- 用于演示的本地模拟 LLM 模式
- 可选的 OpenAI 兼容 API endpoint 支持
- Dockerized 本地部署
## 设置
### 本地后端
```
cd backend
python -m venv .venv
source .venv/bin/activate # Windows: .venv\Scripts\activate
pip install -r requirements.txt
uvicorn app.main:app --reload --port 8000
```
### 本地前端
```
cd frontend
npm install
npm run dev
```
打开 `http://localhost:5173`。
### Docker Compose
```
docker compose up --build
```
服务:
- 前端:`http://localhost:5173`
- 后端 API:`http://localhost:8000`
- API 文档:`http://localhost:8000/docs`
## 可选的 OpenAI 兼容模式
默认情况下,演示运行使用本地模拟 LLM。要将测试指向兼容 OpenAI 的 API:
```
export LLM_MODE=openai_compatible
export OPENAI_COMPATIBLE_BASE_URL=https://api.example.com/v1
export OPENAI_COMPATIBLE_API_KEY=your-key
export OPENAI_COMPATIBLE_MODEL=your-model
```
后端使用兼容 OpenAI 的 payload 调用 `/chat/completions`。
## 屏幕截图
在本地运行后添加屏幕截图:
- `docs/screenshots/castle-security-map.png`
- `docs/screenshots/koopa-attack-simulator.png`
- `docs/screenshots/princess-protection-report.png`
## API 概览
- `POST /api/targets` 创建目标模型或应用
- `GET /api/targets` 列出目标
- `POST /api/tests` 发起红队测试
- `GET /api/tests/{run_id}` 获取运行记录
- `GET /api/findings` 列出发现结果
- `GET /api/reports/{run_id}.json` 导出 JSON
- `GET /api/reports/{run_id}.md` 导出 Markdown
- `GET /api/dashboard` 获取仪表板指标
## 简历要点
- 使用 FastAPI、React、TypeScript、SQLite 和 Docker Compose 构建了一个全栈 AI 红队平台,以测试 LLM 应用程序的 OWASP LLM Top 10 风险。
- 为 prompt injection、越狱、数据泄露、工具滥用和 RAG 中毒设计了模块化攻击类,并配备了可重用的评估器和风险评分组件。
- 实现了报告生成、发现严重性映射以及本地模拟 LLM 模式,以支持在没有外部 API 依赖的情况下进行可重现的 AI 安全演示。
- 创建了一个适合作品集级别的 MLSecOps 仪表板,可将红队结果转化为可操作的风险指标和面向管理层的 Markdown/JSON 报告。
## 安全说明
本项目用于授权测试、教育和防御性验证。仅对您拥有或获得明确测试许可的系统进行评估。
标签:AI安全, AV绕过, Chat Copilot, DLL 劫持, FastAPI, React, Syscalls, Web安全, 大语言模型, 测试用例, 版权保护, 蓝队分析, 请求拦截, 逆向工具