rushi378-blip/LLM-Prompt-Injection-Scanner

GitHub: rushi378-blip/LLM-Prompt-Injection-Scanner

一个用于对自研 LLM 应用进行提示词注入探测和越狱评判的红队测试工具。

Stars: 0 | Forks: 0

# LLM 提示词注入扫描器一个小型 **CLI + Web 仪表板**，用于授权的红队测试：对目标运行 **提示词注入探测**（内置的 Gemini "受害目标"或您自己的 HTTP API），然后再次使用 **Gemini** 作为 **LLM 评判器**来标记回复为可能的 **越狱/违规** 或否。 **仅用于您拥有或明确允许测试的系统。** 这是一个学习和防御工具，不是针对第三方服务的攻击工具包。 ## 功能 - **默认载荷库** 加上可选的 **Gemini 生成** 探测（`--generate`）。 - **内置目标**：Gemini 配合示例"安全助手"系统提示词（适合演示）。 - **HTTP 目标**：向您的应用 `POST` JSON（`--http-url`、`--http-field`，可选 `--http-response-key`）。 - **SQLite** 存储运行记录、完整文本和评判输出。 - **Web UI** 位于 `/`，包含运行列表和每次尝试的详情；JSON 位于 `/api/runs` 和 `/api/runs/{id}`。 ## 设置 1. **Python 3.10+** 2. 创建虚拟环境并安装： python -m venv .venv .venv\Scripts\activate pip install -e . 3. **API 密钥**（[Google AI Studio](https://aistudio.google.com/apikey)）： copy .env.example .env 编辑 `.env` 并设置 `GEMINI_API_KEY`。可选：`GEMINI_MODEL`、`GEMINI_JUDGE_MODEL`（默认使用 `gemini-2.0-flash`；您可以设置 `gemini-1.5-pro` 或您的账户支持的其他更新版本）。 4. 初始化数据库（可选；首次运行时也会自动创建）： pis init-db ## 用法 **运行扫描**（内置 Gemini 受害目标 + 默认载荷）： ``` pis run ``` **仅前 N 个载荷**： ``` pis run --limit 5 ``` **额外的 Gemini 生成载荷**： ``` pis run --generate 5 ``` **自定义受害目标策略**（文本文件用作内置目标的系统指令）： ``` pis run --policy-file my_policy.txt ``` **HTTP 目标**（默认 body 为 `{"message": ""}`）： ``` pis run --http --http-url http://127.0.0.1:8080/chat --policy-file my_policy.txt ``` **Web 仪表板**（浏览 SQLite DB；仅 `pis run` 需要 API 密钥）： ``` pis serve ``` 打开 [http://127.0.0.1:8000](http://127.0.0.1:8000)。 ## 推送到 GitHub 仓库：[github.com/rushi378-blip/LLM-Prompt-Injection-Scanner](https://github.com/rushi378-blip/LLM-Prompt-Injection-Scanner)。要克隆并在本地工作： ``` git clone https://github.com/rushi378-blip/LLM-Prompt-Injection-Scanner.git cd LLM-Prompt-Injection-Scanner ``` 如果您 fork 或创建另一个仓库，在推送前将 `origin` 设置为您的 URL。 3. **永远不要提交** `.env` 或 API 密钥（`.gitignore` 已排除 `.env`）。 ## 注意事项 - 评判输出是 **启发式的**（另一个 LLM）。用它来优先排序审查，而不是作为法律证据。 - `google.generativeai` 包可能会显示 **弃用** 通知；未来版本可能迁移到 `google.genai`。 ## 许可证如果您想要在 GitHub 上添加明确的许可证，请添加一个 `LICENSE` 文件（例如 MIT）。

标签：AIGC安全, AI安全, Chat Copilot, ChatGPT安全, CodeQL, Gemini, IP 地址批量处理, Jailbreak检测, Python, REST API, SQLite, Web Dashboard, 大语言模型安全, 安全评估工具, 对抗性测试, 提示注入, 文档结构分析, 无后门, 机密管理, 网络安全, 逆向工具, 防御性安全, 隐私保护, 集群管理