rushi378-blip/LLM-Prompt-Injection-Scanner
GitHub: rushi378-blip/LLM-Prompt-Injection-Scanner
一个用于对自研 LLM 应用进行提示词注入探测和越狱评判的红队测试工具。
Stars: 0 | Forks: 0
# LLM 提示词注入扫描器
一个小型 **CLI + Web 仪表板**,用于授权的红队测试:对目标运行 **提示词注入探测**(内置的 Gemini "受害目标"或您自己的 HTTP API),然后再次使用 **Gemini** 作为 **LLM 评判器**来标记回复为可能的 **越狱/违规** 或否。
**仅用于您拥有或明确允许测试的系统。** 这是一个学习和防御工具,不是针对第三方服务的攻击工具包。
## 功能
- **默认载荷库** 加上可选的 **Gemini 生成** 探测(`--generate`)。
- **内置目标**:Gemini 配合示例"安全助手"系统提示词(适合演示)。
- **HTTP 目标**:向您的应用 `POST` JSON(`--http-url`、`--http-field`,可选 `--http-response-key`)。
- **SQLite** 存储运行记录、完整文本和评判输出。
- **Web UI** 位于 `/`,包含运行列表和每次尝试的详情;JSON 位于 `/api/runs` 和 `/api/runs/{id}`。
## 设置
1. **Python 3.10+**
2. 创建虚拟环境并安装:
python -m venv .venv
.venv\Scripts\activate
pip install -e .
3. **API 密钥**([Google AI Studio](https://aistudio.google.com/apikey)):
copy .env.example .env
编辑 `.env` 并设置 `GEMINI_API_KEY`。可选:`GEMINI_MODEL`、`GEMINI_JUDGE_MODEL`(默认使用 `gemini-2.0-flash`;您可以设置 `gemini-1.5-pro` 或您的账户支持的其他更新版本)。
4. 初始化数据库(可选;首次运行时也会自动创建):
pis init-db
## 用法
**运行扫描**(内置 Gemini 受害目标 + 默认载荷):
```
pis run
```
**仅前 N 个载荷**:
```
pis run --limit 5
```
**额外的 Gemini 生成载荷**:
```
pis run --generate 5
```
**自定义受害目标策略**(文本文件用作内置目标的系统指令):
```
pis run --policy-file my_policy.txt
```
**HTTP 目标**(默认 body 为 `{"message": ""}`):
```
pis run --http --http-url http://127.0.0.1:8080/chat --policy-file my_policy.txt
```
**Web 仪表板**(浏览 SQLite DB;仅 `pis run` 需要 API 密钥):
```
pis serve
```
打开 [http://127.0.0.1:8000](http://127.0.0.1:8000)。
## 推送到 GitHub
仓库:[github.com/rushi378-blip/LLM-Prompt-Injection-Scanner](https://github.com/rushi378-blip/LLM-Prompt-Injection-Scanner)。
要克隆并在本地工作:
```
git clone https://github.com/rushi378-blip/LLM-Prompt-Injection-Scanner.git
cd LLM-Prompt-Injection-Scanner
```
如果您 fork 或创建另一个仓库,在推送前将 `origin` 设置为您的 URL。
3. **永远不要提交** `.env` 或 API 密钥(`.gitignore` 已排除 `.env`)。
## 注意事项
- 评判输出是 **启发式的**(另一个 LLM)。用它来优先排序审查,而不是作为法律证据。
- `google.generativeai` 包可能会显示 **弃用** 通知;未来版本可能迁移到 `google.genai`。
## 许可证
如果您想要在 GitHub 上添加明确的许可证,请添加一个 `LICENSE` 文件(例如 MIT)。
标签:AIGC安全, AI安全, Chat Copilot, ChatGPT安全, CodeQL, Gemini, IP 地址批量处理, Jailbreak检测, Python, REST API, SQLite, Web Dashboard, 大语言模型安全, 安全评估工具, 对抗性测试, 提示注入, 文档结构分析, 无后门, 机密管理, 网络安全, 逆向工具, 防御性安全, 隐私保护, 集群管理