pranjalik2004/llm-prompt-defense-backend

GitHub: pranjalik2004/llm-prompt-defense-backend

基于 FastAPI 的 LLM 安全防护后端，通过风险评分与威胁检测机制防止 prompt injection 及各类滥用输入。

Stars: 0 | Forks: 0

LLM Prompt Injection 与滥用处理系统 # 概述一个由 AI 驱动的安全模块，旨在检测并防止大型语言模型（LLM）应用中的 prompt injection 攻击、越狱尝试、指令覆盖、prompt 泄露和滥用输入。本项目基于 Python 和 FastAPI，提供了一个安全的后端框架，用于将 guardrails 和威胁分析集成到 AI 系统中。 # 功能 - Prompt Injection 检测 - 滥用与毒性处理 - 越狱尝试检测 - 指令覆盖检测 - Prompt 泄露预防 - 风险评分引擎 - 输入净化 - 威胁分类 - 安全响应控制 - FastAPI 后端集成 - 基于 JSON 的安全分析 ## ⚙️ 技术栈 | 技术 | 用途 | | --- | --- | | Python | 后端开发 | | FastAPI | API 框架 | | Pydantic | 数据验证 | | Uvicorn | ASGI 服务器 | | JSON | 结构化响应 | | Regex / 规则引擎 | 威胁检测 | # 项目结构 # 安装说明 ## 克隆仓库 ## 导航至项目 ## 创建虚拟环境 ## 激活虚拟环境 ### Windows ### Linux / Mac ## 安装依赖 ## ▶️ 运行项目 ### 启动 FastAPI 服务器 ### Swagger 文档打开： ## 🔍 威胁检测示例 ### 输入 ### 输出 ### 测试用例 | 测试类型 | 预期结果 | | --- | --- | | 安全 Prompt | 允许 | | Prompt Injection | 拒绝 | | 越狱尝试 | 拒绝 / 标记 | | 有毒内容 | 拒绝 | | SQL Injection 模式 | 标记 | | 数据泄露请求 | 拒绝 | ## 安全工作流 1. 用户提交输入 2. 开始输入验证 3. 分析威胁模式 4. 生成风险评分 5. 净化恶意内容 6. 决定最终操作： - 允许 - 标记 - 拒绝 7. 返回安全响应 # 未来增强功能 - 基于 Machine Learning 的威胁检测 - 实时监控仪表板 - 高级 Prompt 模式分析 - 数据库日志集成 - AI 模型响应过滤 - 多模型安全层 # 应用场景 - AI 聊天机器人 - 面试评估系统 - AI 助手 - 基于 LLM 的平台 - 安全的 AI API - 企业级 AI 系统

标签：AI安全, AMSI绕过, AV绕过, Chat Copilot, FastAPI, Homebrew安装, LLM应用防火墙, Python, 威胁检测, 提示词注入防护, 无后门, 逆向工具