boomerjrtv/RedPrompt
GitHub: boomerjrtv/RedPrompt
基于 WebGPU 在浏览器内端到端运行的 AI 红队 prompt injection 实战学习平台,无需服务器或 API 密钥即可完成攻防演练。
Stars: 0 | Forks: 0
# RedPrompt — 浏览器原生 AI 红队实验室
**通过实践学习 prompt injection 与 AI 红队测试。**
19 个关卡/案例研究 · 20 种攻击技术 — 全部通过 WebGPU **100% 在您的浏览器中**运行。
无需 API 密钥。无需服务器端 LLM。无追踪。可作为静态站点托管在任何地方。
## 🚀 快速开始
```
cd redprompt
node server.js # → http://localhost:3000
```
就是这样。首次加载时,RedPrompt 会在下载 Qwen 3.5 0.8B(约 0.6 GB)之前询问您。首次使用后,浏览器会对下载内容进行缓存。
## ✨ 功能
- **19 个渐进式关卡和案例研究** — 包含 13 个核心 prompt injection 关卡以及 6 个源于生产环境的场景
- **已知的入门话术** — 每个关卡都包含以解决问题为导向的入门 prompt
- **📚 技术库** — 20 种 prompt injection 技术,附带示例和防御方法
- **🎓 课程体系** — OWASP LLM Top 10、Prompt Injection 2.0 分类法、逼真的防御案例研究、防御架构
- **实时攻击检测** — 在您输入时即可看到您的 prompt 触发了哪类技术分支
- 进度**本地保存**在您的浏览器中
## 🏗️ 架构
```
redprompt/
├── server.js # tiny static file server (or skip it for hosting)
├── package.json
├── public/ # ★ this is the entire deployable bundle ★
│ ├── index.html
│ ├── llm.js # WebLLM (in-browser LLM via WebGPU)
│ ├── app.js # app logic
│ ├── styles.css
│ └── data/
│ ├── levels.json
│ └── techniques.json
```
浏览器会在运行时从 CDN 加载 WebLLM,将模型权重下载到浏览器缓存中,然后在客户端运行**所有内容**。您的静态主机仅用于提供文件服务,不执行其他任何操作。
## 🌃 部署
将 `public/` 部署到任何静态主机:
- **Netlify**:将 `public/` 文件夹拖放到 app.netlify.com/drop
- **Vercel**:`vercel --prod`(它会自动检测为静态站点)
- **GitHub Pages**:推送仓库,从 `/public` 提供服务或设置 GitHub Actions
- **Cloudflare Pages**:连接仓库,build command 留空,输出目录设为 `public`
- **您自己的服务器**:`nginx` / `caddy` / `python -m http.server` / `node server.js`
用于 LinkedIn / 个人作品集分享:部署到 Netlify 或 GitHub Pages,然后发布 URL。
## 🤖 模型
RedPrompt 使用一个本地浏览器模型:
| 模型 | 大小 | 支持关卡 | 备注 |
|---|---:|---:|---|
| Qwen 3.5 0.8B Instruct | ~0.6 GB | 1–19 | 完整实验室模型 |
这是能够运行完整实验室的最小 WebLLM 就绪模型。
## 🛡️ 环境要求
- 在配备真实 GPU 的台式机上使用**支持 WebGPU 的浏览器**(Chrome 113+、Edge 113+、Firefox 141+ 或最近的 Safari Tech Preview)
- 需约 0.6 GB 的可用磁盘空间用于本地模型缓存
- 现代操作系统(macOS、Windows 或 GPU 驱动保持最新版本的 Linux)
该工具会在加载时检测 WebGPU,如果不可用则会显示明确的错误提示。
## 🧠 您将学到什么
映射至 Prompt Injection 2.0 分类法:
- **传递向量**:直接注入、间接注入(通过已处理的内容)
- **攻击模态**:文本、编码(base64/ROT13/leetspeak)、混合(XSS+PI、P2SQL)
- **传播方式**:单轮提取 vs. 多轮渐进式泄露
- **防御层**:system prompt 加固、输出过滤、分隔符隔离、访问控制、结构化编码
此外还包含实践层面:迭代 prompt、特定模型行为,以及已知的入门 payload。
## 📜 许可证
MIT。
标签:DLL 劫持, MITM代理, WebGPU, 人工智能, 前端全栈, 大语言模型, 安全培训, 数据可视化, 用户模式Hook绕过, 红队靶场, 自定义脚本