boomerjrtv/RedPrompt

GitHub: boomerjrtv/RedPrompt

基于 WebGPU 在浏览器内端到端运行的 AI 红队 prompt injection 实战学习平台,无需服务器或 API 密钥即可完成攻防演练。

Stars: 0 | Forks: 0

# RedPrompt — 浏览器原生 AI 红队实验室 **通过实践学习 prompt injection 与 AI 红队测试。** 19 个关卡/案例研究 · 20 种攻击技术 — 全部通过 WebGPU **100% 在您的浏览器中**运行。 无需 API 密钥。无需服务器端 LLM。无追踪。可作为静态站点托管在任何地方。 ## 🚀 快速开始 ``` cd redprompt node server.js # → http://localhost:3000 ``` 就是这样。首次加载时,RedPrompt 会在下载 Qwen 3.5 0.8B(约 0.6 GB)之前询问您。首次使用后,浏览器会对下载内容进行缓存。 ## ✨ 功能 - **19 个渐进式关卡和案例研究** — 包含 13 个核心 prompt injection 关卡以及 6 个源于生产环境的场景 - **已知的入门话术** — 每个关卡都包含以解决问题为导向的入门 prompt - **📚 技术库** — 20 种 prompt injection 技术,附带示例和防御方法 - **🎓 课程体系** — OWASP LLM Top 10、Prompt Injection 2.0 分类法、逼真的防御案例研究、防御架构 - **实时攻击检测** — 在您输入时即可看到您的 prompt 触发了哪类技术分支 - 进度**本地保存**在您的浏览器中 ## 🏗️ 架构 ``` redprompt/ ├── server.js # tiny static file server (or skip it for hosting) ├── package.json ├── public/ # ★ this is the entire deployable bundle ★ │ ├── index.html │ ├── llm.js # WebLLM (in-browser LLM via WebGPU) │ ├── app.js # app logic │ ├── styles.css │ └── data/ │ ├── levels.json │ └── techniques.json ``` 浏览器会在运行时从 CDN 加载 WebLLM,将模型权重下载到浏览器缓存中,然后在客户端运行**所有内容**。您的静态主机仅用于提供文件服务,不执行其他任何操作。 ## 🌃 部署 将 `public/` 部署到任何静态主机: - **Netlify**:将 `public/` 文件夹拖放到 app.netlify.com/drop - **Vercel**:`vercel --prod`(它会自动检测为静态站点) - **GitHub Pages**:推送仓库,从 `/public` 提供服务或设置 GitHub Actions - **Cloudflare Pages**:连接仓库,build command 留空,输出目录设为 `public` - **您自己的服务器**:`nginx` / `caddy` / `python -m http.server` / `node server.js` 用于 LinkedIn / 个人作品集分享:部署到 Netlify 或 GitHub Pages,然后发布 URL。 ## 🤖 模型 RedPrompt 使用一个本地浏览器模型: | 模型 | 大小 | 支持关卡 | 备注 | |---|---:|---:|---| | Qwen 3.5 0.8B Instruct | ~0.6 GB | 1–19 | 完整实验室模型 | 这是能够运行完整实验室的最小 WebLLM 就绪模型。 ## 🛡️ 环境要求 - 在配备真实 GPU 的台式机上使用**支持 WebGPU 的浏览器**(Chrome 113+、Edge 113+、Firefox 141+ 或最近的 Safari Tech Preview) - 需约 0.6 GB 的可用磁盘空间用于本地模型缓存 - 现代操作系统(macOS、Windows 或 GPU 驱动保持最新版本的 Linux) 该工具会在加载时检测 WebGPU,如果不可用则会显示明确的错误提示。 ## 🧠 您将学到什么 映射至 Prompt Injection 2.0 分类法: - **传递向量**:直接注入、间接注入(通过已处理的内容) - **攻击模态**:文本、编码(base64/ROT13/leetspeak)、混合(XSS+PI、P2SQL) - **传播方式**:单轮提取 vs. 多轮渐进式泄露 - **防御层**:system prompt 加固、输出过滤、分隔符隔离、访问控制、结构化编码 此外还包含实践层面:迭代 prompt、特定模型行为,以及已知的入门 payload。 ## 📜 许可证 MIT。
标签:DLL 劫持, MITM代理, WebGPU, 人工智能, 前端全栈, 大语言模型, 安全培训, 数据可视化, 用户模式Hook绕过, 红队靶场, 自定义脚本