AbdulahadIltaf/kingsguard
GitHub: AbdulahadIltaf/kingsguard
一个专为 CrewAI 自主智能体设计的五层纵深防御安全框架,通过语义筛选、VAE 异常检测、因果仲裁、贝叶斯监控和沙箱隔离来防御 Prompt 注入和零日利用等威胁。
Stars: 0 | Forks: 0
## 标题: KingsGuard
emoji: 🛡️
colorFrom: blue
colorTo: indigo
sdk: docker
pinned: false
# 🛡️ KingsGuard:五层代理安全框架
**KingsGuard** 是一个数学上严谨的纵深防御安全框架,专为自主智能体系统(如 CrewAI)设计。它通过独特的多层架构来防止 Prompt Injections、Zero-Day Exploits、Sleeper Agents 和 Telemetry Poisoning。
## 🏛️ 架构概述
KingsGuard 并非依赖简单的关键词过滤,而是实现了五个截然不同的安全层来控制每一个智能体动作:
1. **第 1 层:语义筛选器 (ProtectAI DeBERTa)**
* 分析用户输入的原始语义意图。
* 检测已知的 Prompt Injection 模式和恶意的越狱尝试。
* **自适应困惑度过滤器**:检测高困惑度的对抗性伪装。
2. **第 2 层:VAE 异常分析器**
* 使用 **变分自编码器 (VAE)** 构建预期智能体行为的“良性流形”。
* 通过计算认证重构误差来检测 Zero-Day 异常。
3. **第 3 层:因果仲裁器 (竞争委员会)**
* 采用由“竞争委员会”(如 Llama 3.1 和 Qwen 等 LLMs)独立评判有风险的动作。
* **结构因果模型 (SCM)**:使用因果发现来阻断不可接受的逻辑路径。
4. **第 4 层:贝叶斯守卫**
* 使用 **贝叶斯在线变点检测 (BOCPD)** 随时间监控智能体行为。
* 如果行为漂移至高风险领域,则触发“信任悬崖”撤销机制。
5. **第 5 层:守卫沙箱**
* 在隔离的 Docker 容器或受限制的子进程中执行所有工具动作。
* 执行 **对抗性回滚** 影子测试以验证配置更新。
## 🚀 入门指南
### 前置条件
* Python 3.10+
* Docker(可选,用于第 5 层守卫)
* Groq API Key(用于第 3 层委员会)
### 安装说明
1. 克隆仓库:
git clone https://github.com/AbdulahadIltaf/kingsguard.git
cd kingsguard
2. 安装依赖:
pip install -r requirements.txt
# 或者如果使用 uv
uv sync
3. 设置环境变量:
创建一个 `.env` 文件:
GROQ_API_KEY=your_key_here
### 运行 Dashboard
启动实时安全 Pipeline 和 Dashboard:
```
python app.py
```
访问 `http://localhost:5000` 以查看实时安全遥测数据。
## 🛠️ 技术栈
* **核心**:Python, Flask, CrewAI
* **ML/AI**:PyTorch, Transformers (HuggingFace), Scikit-Learn
* **安全**:ProtectAI DeBERTa, VAE 分析, Causal Learn
* **数据库**:SQLite
## ⚖️ 许可证
本项目基于 MIT 许可证授权 - 详情请参见 LICENSE 文件。
标签:AI安全, Autonomous Agents, Chat Copilot, CISA项目, CrewAI, DeBERTa, DLL 劫持, Docker, LLM, NLP, PyRIT, Python, Unmanaged PE, VAE, Zero-Day Exploit, 人工智能, 凭据扫描, 变分自编码器, 因果推断, 在线变点检测, 多智能体系统, 大模型安全, 大语言模型, 安全围栏, 安全防御评估, 密钥泄露防护, 对抗性攻击防御, 异常检测, 异常行为监控, 搜索语句(dork), 无后门, 机器学习安全, 深度防御, 用户模式Hook绕过, 系统调用监控, 结构因果模型, 网络安全, 请求拦截, 贝叶斯推断, 逆向工具, 隐私保护, 零日漏洞防御