romiisromie/llm-honeypot

GitHub: romiisromie/llm-honeypot

LLM蜜罐，用于检测和防御LLM攻击。

Stars: 7 | Forks: 0

# 🪤 大型语言模型蜜罐随着LLM在企业系统中得到广泛应用，攻击者正在积极开发新的方法来利用它们。防御工具仍然极为稀缺。本项目旨在填补这一空白。 ## 🎯 它的功能一个伪装成企业AI助手的网络服务，但实际上是针对恶意行为者的陷阱： - 🔍 **检测** 提示注入、越狱和系统提示泄露尝试 - 🎭 通过返回真实但虚假的“秘密数据”来**欺骗**攻击者 - 📝 记录每一次攻击，以提供完整的上下文用于威胁情报 ## 🧠 它是如何工作的 1. 通过REST API或内置聊天界面接受用户提示 2. 分类器（启发式 → DistilBERT）检查提示是否存在恶意意图 3. 如果检测到攻击——返回令人信服的虚假凭证和令牌 4. 记录攻击者的IP、提示、匹配模式和时间戳 ## 🚀 快速开始 ``` # 克隆仓库 git clone https://github.com/romiisromie/llm-honeypot.git cd llm-honeypot # 安装依赖 pip install fastapi uvicorn # 运行服务器 uvicorn main:app --reload ```

标签：API 安全, AV绕过, DistilBERT, FastAPI, Jailbreak, LLM 安全, 人工智能安全, 企业安全, 合规性, 威胁情报, 安全日志, 安全防护, 开发者工具, 网络资产管理, 蜜罐技术, 逆向工具