marianoavalostech-arch/anti-prompt-injection

GitHub: marianoavalostech-arch/anti-prompt-injection

一个在浏览器中100%本地运行的 Prompt Injection 检测工具，用于在将文档和文本送入 AI 处理前识别隐藏的恶意指令注入攻击。

Stars: 0 | Forks: 0

# Prompt Injection 检测器用于检测文档和文本中 **prompt injection** 攻击的 Web 工具。100% 在浏览器中运行——不会向您的设备外发送任何数据。 [![在线演示](https://img.shields.io/badge/demo-live-brightgreen)](https://anti-prompt-injection.netlify.app) [![MIT 许可证](https://img.shields.io/badge/licencia-MIT-blue)](LICENSE) [![无需服务器](https://img.shields.io/badge/sin%20servidor-100%25%20local-purple)](#) [![版本](https://img.shields.io/badge/versión-v2.7.0-blue)](#) ## 演示 🔗 **[打开工具](https://anti-prompt-injection.netlify.app)** ## 检测内容 | 类别 | 严重程度 | |---|---| | 覆盖指令 (ignora/forget) | 🔴 高 | | 角色操纵 (act as, DAN, jailbreak) | 🔴 高 | | 提取系统 prompt | 🔴 高 | | 冒充权限 (系统标签) | 🔴 高 | | 间接或隐藏注入 (不可见字符, CSS) | 🔴 高 | | 数据渗出 | 🔴 高 | | 解锁有害内容 | 🔴 高 | | 已知越狱 (DAN, GODMODE, evil confidant…) | 🔴 高 | | 结构化注入 (JSON/YAML/XML) | 🔴 高 | | 高级混淆 (leetspeak, ROT13, 倒序文本) | 🔴 高 | | 其他语言的注入 (FR, DE, PT, IT, ZH, RU, AR, JA, KO…) | 🔴 高 | | 语义控制指示 | 🔴 高 | | 语义重写 (ES) | 🔴 高 | | 解析器操纵 (诱导假阴性 · 通过相似度) | 🔴 高 | | 文档中的隐藏指令 (RAG 攻击) | 🔴 高 | | AI 智能体攻击 (pipelines, 工具, orchestrators) | 🔴 高 | | 工具滥用 (email, browser, code exec, DB) | 🔴 高 | | 推理劫持 (思维链) | 🔴 高 | | 代码 / 模板注入 | 🟡 中 | | 可疑的编码内容 | 🟡 中 | | 上下文逃逸 | 🟡 中 | | 对话操纵 | 🟡 中 | | 社会工程学 | 🟢 低 | ## 功能特点 - 分析 **PDF, DOCX, TXT, MD, HTML, JSON, CSV, XML, YAML** 和粘贴的文本 - **增强的 URL 分析** — 并行触发 4 个 CORS 代理 (`Promise.any`) 并使用第一个响应的代理（最多约 12 秒，而不是长达 60 秒）；仅提取 HTML 中的可见文本以减少干扰；自动解开代理的 JSON 响应；当所有代理失败时，提供包含原因和解决方案的描述性错误消息 - 检测混淆：同形字、零宽字符、不可见的 Unicode、Base64、URL 编码、数字 HTML 实体 - 在扫描之前对文本进行规范化，以防止遗漏混淆的变体 - **基于相似度的检测** — 额外的层级，使用基于词元双元组的 Jaccard 相似度，将文本与包含 792 个已知示例的数据库进行比较 - **匹配置信度系统**（已确认 / 很可能 / 可能误报），带有可隐藏的过滤器 - **精准的假阳性过滤器**（针对每条规则的 `postFilter`），适用于现代网站：排除外部 `