nevidomskii8/prompt-injection-scanner

GitHub: nevidomskii8/prompt-injection-scanner

一个教育用途的LLM应用提示注入攻击扫描器,通过运行攻击库自动检测目标模型的防御绕过情况。

Stars: 0 | Forks: 0

# Prompt Injection 扫描器 一个用于 prompt injection 的训练扫描器。它通过目标 LLM 应用(Gandalf 的本地克隆版)运行一系列攻击库,并报告哪些技术成功绕过了防御。 ## 安装 ``` python -m venv .venv && source .venv/bin/activate pip install -e . cp .env.example .env ``` ## 启动 ``` python main.py run # calls the API and saves the results to results/raw.json python main.py eval # saves the data and prints a report (without an API) python main.py # both in a row ``` ## 架构 - `target.py` — 用途:System prompt + API 调用 - `attacks.py` — 攻击库(id、category、payload、check) - `engine.py` — 运行 + 将原始数据保存到磁盘 - `evaluator.py` — 评估策略管理器(exact / normalized) - `reporter.py` — 控制台日志 - `main.py` — 串联,分离运行/评估阶段 ## 已知的评估限制 - `exact` 仅匹配整个 token。 - `normalized` 匹配空格,但不匹配标点符号、Base64 或表情符号。 - 任何策略都可能返回错误的“失败”结果。
标签:AI安全, Chat Copilot, DLL 劫持, Python, 大语言模型, 无后门, 逆向工具