boomerjrtv/RedPrompt

GitHub: boomerjrtv/RedPrompt

基于 WebGPU 在浏览器内端到端运行的 AI 红队 prompt injection 实战学习平台，无需服务器或 API 密钥即可完成攻防演练。

Stars: 0 | Forks: 0

# RedPrompt — 浏览器原生 AI 红队实验室 **通过实践学习 prompt injection 与 AI 红队测试。** 19 个关卡/案例研究 · 20 种攻击技术 — 全部通过 WebGPU **100% 在您的浏览器中**运行。无需 API 密钥。无需服务器端 LLM。无追踪。可作为静态站点托管在任何地方。 ## 🚀 快速开始 ``` cd redprompt node server.js # → http://localhost:3000 ``` 就是这样。首次加载时，RedPrompt 会在下载 Qwen 3.5 0.8B（约 0.6 GB）之前询问您。首次使用后，浏览器会对下载内容进行缓存。 ## ✨ 功能 - **19 个渐进式关卡和案例研究** — 包含 13 个核心 prompt injection 关卡以及 6 个源于生产环境的场景 - **已知的入门话术** — 每个关卡都包含以解决问题为导向的入门 prompt - **📚 技术库** — 20 种 prompt injection 技术，附带示例和防御方法 - **🎓 课程体系** — OWASP LLM Top 10、Prompt Injection 2.0 分类法、逼真的防御案例研究、防御架构 - **实时攻击检测** — 在您输入时即可看到您的 prompt 触发了哪类技术分支 - 进度**本地保存**在您的浏览器中 ## 🏗️ 架构 ``` redprompt/ ├── server.js # tiny static file server (or skip it for hosting) ├── package.json ├── public/ # ★ this is the entire deployable bundle ★ │ ├── index.html │ ├── llm.js # WebLLM (in-browser LLM via WebGPU) │ ├── app.js # app logic │ ├── styles.css │ └── data/ │ ├── levels.json │ └── techniques.json ``` 浏览器会在运行时从 CDN 加载 WebLLM，将模型权重下载到浏览器缓存中，然后在客户端运行**所有内容**。您的静态主机仅用于提供文件服务，不执行其他任何操作。 ## 🌃 部署将 `public/` 部署到任何静态主机： - **Netlify**：将 `public/` 文件夹拖放到 app.netlify.com/drop - **Vercel**：`vercel --prod`（它会自动检测为静态站点） - **GitHub Pages**：推送仓库，从 `/public` 提供服务或设置 GitHub Actions - **Cloudflare Pages**：连接仓库，build command 留空，输出目录设为 `public` - **您自己的服务器**：`nginx` / `caddy` / `python -m http.server` / `node server.js` 用于 LinkedIn / 个人作品集分享：部署到 Netlify 或 GitHub Pages，然后发布 URL。 ## 🤖 模型 RedPrompt 使用一个本地浏览器模型： | 模型 | 大小 | 支持关卡 | 备注 | |---|---:|---:|---| | Qwen 3.5 0.8B Instruct | ~0.6 GB | 1–19 | 完整实验室模型 | 这是能够运行完整实验室的最小 WebLLM 就绪模型。 ## 🛡️ 环境要求 - 在配备真实 GPU 的台式机上使用**支持 WebGPU 的浏览器**（Chrome 113+、Edge 113+、Firefox 141+ 或最近的 Safari Tech Preview） - 需约 0.6 GB 的可用磁盘空间用于本地模型缓存 - 现代操作系统（macOS、Windows 或 GPU 驱动保持最新版本的 Linux）该工具会在加载时检测 WebGPU，如果不可用则会显示明确的错误提示。 ## 🧠 您将学到什么映射至 Prompt Injection 2.0 分类法： - **传递向量**：直接注入、间接注入（通过已处理的内容） - **攻击模态**：文本、编码（base64/ROT13/leetspeak）、混合（XSS+PI、P2SQL） - **传播方式**：单轮提取 vs. 多轮渐进式泄露 - **防御层**：system prompt 加固、输出过滤、分隔符隔离、访问控制、结构化编码此外还包含实践层面：迭代 prompt、特定模型行为，以及已知的入门 payload。 ## 📜 许可证 MIT。

标签：DLL 劫持, MITM代理, WebGPU, 人工智能, 前端全栈, 大语言模型, 安全培训, 数据可视化, 用户模式Hook绕过, 红队靶场, 自定义脚本