AbdulahadIltaf/kingsguard

GitHub: AbdulahadIltaf/kingsguard

一个专为 CrewAI 自主智能体设计的五层纵深防御安全框架,通过语义筛选、VAE 异常检测、因果仲裁、贝叶斯监控和沙箱隔离来防御 Prompt 注入和零日利用等威胁。

Stars: 0 | Forks: 0

## 标题: KingsGuard emoji: 🛡️ colorFrom: blue colorTo: indigo sdk: docker pinned: false # 🛡️ KingsGuard:五层代理安全框架 **KingsGuard** 是一个数学上严谨的纵深防御安全框架,专为自主智能体系统(如 CrewAI)设计。它通过独特的多层架构来防止 Prompt Injections、Zero-Day Exploits、Sleeper Agents 和 Telemetry Poisoning。 ## 🏛️ 架构概述 KingsGuard 并非依赖简单的关键词过滤,而是实现了五个截然不同的安全层来控制每一个智能体动作: 1. **第 1 层:语义筛选器 (ProtectAI DeBERTa)** * 分析用户输入的原始语义意图。 * 检测已知的 Prompt Injection 模式和恶意的越狱尝试。 * **自适应困惑度过滤器**:检测高困惑度的对抗性伪装。 2. **第 2 层:VAE 异常分析器** * 使用 **变分自编码器 (VAE)** 构建预期智能体行为的“良性流形”。 * 通过计算认证重构误差来检测 Zero-Day 异常。 3. **第 3 层:因果仲裁器 (竞争委员会)** * 采用由“竞争委员会”(如 Llama 3.1 和 Qwen 等 LLMs)独立评判有风险的动作。 * **结构因果模型 (SCM)**:使用因果发现来阻断不可接受的逻辑路径。 4. **第 4 层:贝叶斯守卫** * 使用 **贝叶斯在线变点检测 (BOCPD)** 随时间监控智能体行为。 * 如果行为漂移至高风险领域,则触发“信任悬崖”撤销机制。 5. **第 5 层:守卫沙箱** * 在隔离的 Docker 容器或受限制的子进程中执行所有工具动作。 * 执行 **对抗性回滚** 影子测试以验证配置更新。 ## 🚀 入门指南 ### 前置条件 * Python 3.10+ * Docker(可选,用于第 5 层守卫) * Groq API Key(用于第 3 层委员会) ### 安装说明 1. 克隆仓库: git clone https://github.com/AbdulahadIltaf/kingsguard.git cd kingsguard 2. 安装依赖: pip install -r requirements.txt # 或者如果使用 uv uv sync 3. 设置环境变量: 创建一个 `.env` 文件: GROQ_API_KEY=your_key_here ### 运行 Dashboard 启动实时安全 Pipeline 和 Dashboard: ``` python app.py ``` 访问 `http://localhost:5000` 以查看实时安全遥测数据。 ## 🛠️ 技术栈 * **核心**:Python, Flask, CrewAI * **ML/AI**:PyTorch, Transformers (HuggingFace), Scikit-Learn * **安全**:ProtectAI DeBERTa, VAE 分析, Causal Learn * **数据库**:SQLite ## ⚖️ 许可证 本项目基于 MIT 许可证授权 - 详情请参见 LICENSE 文件。
标签:AI安全, Autonomous Agents, Chat Copilot, CISA项目, CrewAI, DeBERTa, DLL 劫持, Docker, LLM, NLP, PyRIT, Python, Unmanaged PE, VAE, Zero-Day Exploit, 人工智能, 凭据扫描, 变分自编码器, 因果推断, 在线变点检测, 多智能体系统, 大模型安全, 大语言模型, 安全围栏, 安全防御评估, 密钥泄露防护, 对抗性攻击防御, 异常检测, 异常行为监控, 搜索语句(dork), 无后门, 机器学习安全, 深度防御, 用户模式Hook绕过, 系统调用监控, 结构因果模型, 网络安全, 请求拦截, 贝叶斯推断, 逆向工具, 隐私保护, 零日漏洞防御