nevidomskii8/prompt-injection-scanner
GitHub: nevidomskii8/prompt-injection-scanner
一个教育用途的LLM应用提示注入攻击扫描器,通过运行攻击库自动检测目标模型的防御绕过情况。
Stars: 0 | Forks: 0
# Prompt Injection 扫描器
一个用于 prompt injection 的训练扫描器。它通过目标
LLM 应用(Gandalf 的本地克隆版)运行一系列攻击库,并报告哪些技术成功绕过了防御。
## 安装
```
python -m venv .venv && source .venv/bin/activate
pip install -e .
cp .env.example .env
```
## 启动
```
python main.py run # calls the API and saves the results to results/raw.json
python main.py eval # saves the data and prints a report (without an API)
python main.py # both in a row
```
## 架构
- `target.py` — 用途:System prompt + API 调用
- `attacks.py` — 攻击库(id、category、payload、check)
- `engine.py` — 运行 + 将原始数据保存到磁盘
- `evaluator.py` — 评估策略管理器(exact / normalized)
- `reporter.py` — 控制台日志
- `main.py` — 串联,分离运行/评估阶段
## 已知的评估限制
- `exact` 仅匹配整个 token。
- `normalized` 匹配空格,但不匹配标点符号、Base64 或表情符号。
- 任何策略都可能返回错误的“失败”结果。
标签:AI安全, Chat Copilot, DLL 劫持, Python, 大语言模型, 无后门, 逆向工具