JackGM07/AegisSync
GitHub: JackGM07/AegisSync
通过代理层实时监控 AI Agent 的行为与原始任务意图的偏离程度,以纯数学方法检测并拦截潜在的 Prompt 注入和越权操作。
Stars: 0 | Forks: 0
# ⬡ AegisSync
### AI Agent 运行时防火墙
AI Agent 拥有对你的文件、API 和系统的真实访问权限——但在你的指令和结果之间,没有任何东西监视它们的行为。AegisSync 就填补了这一空白。
## 问题所在
当前的 AI 安全工具专注于你告诉 Agent 的内容。没有人监控 Agent 在运行时实际做了什么——它调用了哪些工具、读取了哪些文件、访问了哪些 API,以及这些行为是否与分配给它的任务相匹配。
一个被要求“研究 AI 论文”的 Agent 应该读取文件、搜索网络并进行总结。它不应该触碰凭证文件、向外发送数据,或调用与科研无关的工具。如果它这样做了,说明出了问题——无论是被篡改的内存文件、隐藏在工具结果中的 Prompt 注入,还是配置错误的 Agent。
## 愿景
**为每种任务类型指纹识别预期行为。在运行时进行监控。无需 AI。**
当任务开始时,AegisSync 会构建一个行为指纹:
- 该类任务预期会使用哪些工具
- 哪些文件和路径在范围内
- 请求的词汇和意图是什么样的
随后的每一个 Agent 动作都会与该指纹进行比对——在代理中确定性地进行,在任何内容被转发之前。偏差会被标记、记录,并可选择拦截。
无需 LLM 评判。无需概率评分。仅仅是:*这个动作是否符合该任务应有的样子?*
## 当前实现 (v0.1)
代理会拦截每一个 Anthropic API 调用,并:
- **锚定** 首条真实用户消息的会话目标
- **评分漂移** 使用锚点与 Agent 响应之间的余弦相似度——无需 AI,纯数学计算
- **检测循环** 使用速度检测和 Jaccard 相似度
- **重新锚定** 在确认漂移时,向系统 Prompt 中注入静默纠正
- **记录一切** —— 完整的请求/响应、工具调用、漂移分数,按会话记录
```
Your Agent → localhost:7777 (AegisSync) → api.anthropic.com
```
无需更改你的 Agent 代码。只需重定向 API Endpoint。
## 快速开始
```
git clone https://github.com/YOUR_USERNAME/aegissync
cd aegissync
pip install -r requirements.txt
cp .env.example .env # add your ANTHROPIC_API_KEY
python proxy.py
```
打开 `http://localhost:7777` 访问仪表板。
## 演示场景
**任务:** “研究最新的 AI 安全论文并总结前 3 篇。”
**攻击:** Agent 内存文件中的一条隐藏指令导致其发生偏转——在完成研究后,它试图通过将 API Key 和文件结构发送到外部服务来“贴心地备份你的工作区文件”。
AegisSync 捕捉到这一点,并非通过识别恶意 Payload——而是因为 Agent 的行为不再符合研究任务的指纹。它偏离了既定轨道。检测到漂移。会话已被标记。
## 技术栈
- **FastAPI** + **Uvicorn** — 代理服务器
- **httpx** — 异步转发
- **Vanilla JS** — 仪表板 UI
## 构建于
OpenClaw x Imperial 黑客马拉松 · 2026 年 3 月
标签:Agent防火墙, AI代理监控, AI安全, Anthropic, API代理, Chat Copilot, CIDR扫描, CIS基准, Linux系统监控, Naabu, RAG安全, Red Canary, Streamlit, 上下文窗口监控, 余弦相似度, 内容安全, 工具调用监控, 恶意行为检测, 提示词注入检测, 模型安全, 漂移检测, 确定性安全, 网络安全, 行为指纹, 访问控制, 越狱防护, 运行时操纵, 运行时防火墙, 逆向工具, 隐私保护