marianoavalostech-arch/anti-prompt-injection
GitHub: marianoavalostech-arch/anti-prompt-injection
一个在浏览器中100%本地运行的 Prompt Injection 检测工具,用于在将文档和文本送入 AI 处理前识别隐藏的恶意指令注入攻击。
Stars: 0 | Forks: 0
# Prompt Injection 检测器
用于检测文档和文本中 **prompt injection** 攻击的 Web 工具。100% 在浏览器中运行——不会向您的设备外发送任何数据。
[](https://anti-prompt-injection.netlify.app)
[](LICENSE)
[](#)
[](#)
## 演示
🔗 **[打开工具](https://anti-prompt-injection.netlify.app)**
## 检测内容
| 类别 | 严重程度 |
|---|---|
| 覆盖指令 (ignora/forget) | 🔴 高 |
| 角色操纵 (act as, DAN, jailbreak) | 🔴 高 |
| 提取系统 prompt | 🔴 高 |
| 冒充权限 (系统标签) | 🔴 高 |
| 间接或隐藏注入 (不可见字符, CSS) | 🔴 高 |
| 数据渗出 | 🔴 高 |
| 解锁有害内容 | 🔴 高 |
| 已知越狱 (DAN, GODMODE, evil confidant…) | 🔴 高 |
| 结构化注入 (JSON/YAML/XML) | 🔴 高 |
| 高级混淆 (leetspeak, ROT13, 倒序文本) | 🔴 高 |
| 其他语言的注入 (FR, DE, PT, IT, ZH, RU, AR, JA, KO…) | 🔴 高 |
| 语义控制指示 | 🔴 高 |
| 语义重写 (ES) | 🔴 高 |
| 解析器操纵 (诱导假阴性 · 通过相似度) | 🔴 高 |
| 文档中的隐藏指令 (RAG 攻击) | 🔴 高 |
| AI 智能体攻击 (pipelines, 工具, orchestrators) | 🔴 高 |
| 工具滥用 (email, browser, code exec, DB) | 🔴 高 |
| 推理劫持 (思维链) | 🔴 高 |
| 代码 / 模板注入 | 🟡 中 |
| 可疑的编码内容 | 🟡 中 |
| 上下文逃逸 | 🟡 中 |
| 对话操纵 | 🟡 中 |
| 社会工程学 | 🟢 低 |
## 功能特点
- 分析 **PDF, DOCX, TXT, MD, HTML, JSON, CSV, XML, YAML** 和粘贴的文本
- **增强的 URL 分析** — 并行触发 4 个 CORS 代理 (`Promise.any`) 并使用第一个响应的代理(最多约 12 秒,而不是长达 60 秒);仅提取 HTML 中的可见文本以减少干扰;自动解开代理的 JSON 响应;当所有代理失败时,提供包含原因和解决方案的描述性错误消息
- 检测混淆:同形字、零宽字符、不可见的 Unicode、Base64、URL 编码、数字 HTML 实体
- 在扫描之前对文本进行规范化,以防止遗漏混淆的变体
- **基于相似度的检测** — 额外的层级,使用基于词元双元组的 Jaccard 相似度,将文本与包含 792 个已知示例的数据库进行比较
- **匹配置信度系统**(已确认 / 很可能 / 可能误报),带有可隐藏的过滤器
- **精准的假阳性过滤器**(针对每条规则的 `postFilter`),适用于现代网站:排除外部 `