rushi378-blip/LLM-Prompt-Injection-Scanner

GitHub: rushi378-blip/LLM-Prompt-Injection-Scanner

一个用于对自研 LLM 应用进行提示词注入探测和越狱评判的红队测试工具。

Stars: 0 | Forks: 0

# LLM 提示词注入扫描器 一个小型 **CLI + Web 仪表板**,用于授权的红队测试:对目标运行 **提示词注入探测**(内置的 Gemini "受害目标"或您自己的 HTTP API),然后再次使用 **Gemini** 作为 **LLM 评判器**来标记回复为可能的 **越狱/违规** 或否。 **仅用于您拥有或明确允许测试的系统。** 这是一个学习和防御工具,不是针对第三方服务的攻击工具包。 ## 功能 - **默认载荷库** 加上可选的 **Gemini 生成** 探测(`--generate`)。 - **内置目标**:Gemini 配合示例"安全助手"系统提示词(适合演示)。 - **HTTP 目标**:向您的应用 `POST` JSON(`--http-url`、`--http-field`,可选 `--http-response-key`)。 - **SQLite** 存储运行记录、完整文本和评判输出。 - **Web UI** 位于 `/`,包含运行列表和每次尝试的详情;JSON 位于 `/api/runs` 和 `/api/runs/{id}`。 ## 设置 1. **Python 3.10+** 2. 创建虚拟环境并安装: python -m venv .venv .venv\Scripts\activate pip install -e . 3. **API 密钥**([Google AI Studio](https://aistudio.google.com/apikey)): copy .env.example .env 编辑 `.env` 并设置 `GEMINI_API_KEY`。可选:`GEMINI_MODEL`、`GEMINI_JUDGE_MODEL`(默认使用 `gemini-2.0-flash`;您可以设置 `gemini-1.5-pro` 或您的账户支持的其他更新版本)。 4. 初始化数据库(可选;首次运行时也会自动创建): pis init-db ## 用法 **运行扫描**(内置 Gemini 受害目标 + 默认载荷): ``` pis run ``` **仅前 N 个载荷**: ``` pis run --limit 5 ``` **额外的 Gemini 生成载荷**: ``` pis run --generate 5 ``` **自定义受害目标策略**(文本文件用作内置目标的系统指令): ``` pis run --policy-file my_policy.txt ``` **HTTP 目标**(默认 body 为 `{"message": ""}`): ``` pis run --http --http-url http://127.0.0.1:8080/chat --policy-file my_policy.txt ``` **Web 仪表板**(浏览 SQLite DB;仅 `pis run` 需要 API 密钥): ``` pis serve ``` 打开 [http://127.0.0.1:8000](http://127.0.0.1:8000)。 ## 推送到 GitHub 仓库:[github.com/rushi378-blip/LLM-Prompt-Injection-Scanner](https://github.com/rushi378-blip/LLM-Prompt-Injection-Scanner)。 要克隆并在本地工作: ``` git clone https://github.com/rushi378-blip/LLM-Prompt-Injection-Scanner.git cd LLM-Prompt-Injection-Scanner ``` 如果您 fork 或创建另一个仓库,在推送前将 `origin` 设置为您的 URL。 3. **永远不要提交** `.env` 或 API 密钥(`.gitignore` 已排除 `.env`)。 ## 注意事项 - 评判输出是 **启发式的**(另一个 LLM)。用它来优先排序审查,而不是作为法律证据。 - `google.generativeai` 包可能会显示 **弃用** 通知;未来版本可能迁移到 `google.genai`。 ## 许可证 如果您想要在 GitHub 上添加明确的许可证,请添加一个 `LICENSE` 文件(例如 MIT)。
标签:AIGC安全, AI安全, Chat Copilot, ChatGPT安全, CodeQL, Gemini, IP 地址批量处理, Jailbreak检测, Python, REST API, SQLite, Web Dashboard, 大语言模型安全, 安全评估工具, 对抗性测试, 提示注入, 文档结构分析, 无后门, 机密管理, 网络安全, 逆向工具, 防御性安全, 隐私保护, 集群管理