JackGM07/AegisSync

GitHub: JackGM07/AegisSync

通过代理层实时监控 AI Agent 的行为与原始任务意图的偏离程度,以纯数学方法检测并拦截潜在的 Prompt 注入和越权操作。

Stars: 0 | Forks: 0

# ⬡ AegisSync ### AI Agent 运行时防火墙 AI Agent 拥有对你的文件、API 和系统的真实访问权限——但在你的指令和结果之间,没有任何东西监视它们的行为。AegisSync 就填补了这一空白。 ## 问题所在 当前的 AI 安全工具专注于你告诉 Agent 的内容。没有人监控 Agent 在运行时实际做了什么——它调用了哪些工具、读取了哪些文件、访问了哪些 API,以及这些行为是否与分配给它的任务相匹配。 一个被要求“研究 AI 论文”的 Agent 应该读取文件、搜索网络并进行总结。它不应该触碰凭证文件、向外发送数据,或调用与科研无关的工具。如果它这样做了,说明出了问题——无论是被篡改的内存文件、隐藏在工具结果中的 Prompt 注入,还是配置错误的 Agent。 ## 愿景 **为每种任务类型指纹识别预期行为。在运行时进行监控。无需 AI。** 当任务开始时,AegisSync 会构建一个行为指纹: - 该类任务预期会使用哪些工具 - 哪些文件和路径在范围内 - 请求的词汇和意图是什么样的 随后的每一个 Agent 动作都会与该指纹进行比对——在代理中确定性地进行,在任何内容被转发之前。偏差会被标记、记录,并可选择拦截。 无需 LLM 评判。无需概率评分。仅仅是:*这个动作是否符合该任务应有的样子?* ## 当前实现 (v0.1) 代理会拦截每一个 Anthropic API 调用,并: - **锚定** 首条真实用户消息的会话目标 - **评分漂移** 使用锚点与 Agent 响应之间的余弦相似度——无需 AI,纯数学计算 - **检测循环** 使用速度检测和 Jaccard 相似度 - **重新锚定** 在确认漂移时,向系统 Prompt 中注入静默纠正 - **记录一切** —— 完整的请求/响应、工具调用、漂移分数,按会话记录 ``` Your Agent → localhost:7777 (AegisSync) → api.anthropic.com ``` 无需更改你的 Agent 代码。只需重定向 API Endpoint。 ## 快速开始 ``` git clone https://github.com/YOUR_USERNAME/aegissync cd aegissync pip install -r requirements.txt cp .env.example .env # add your ANTHROPIC_API_KEY python proxy.py ``` 打开 `http://localhost:7777` 访问仪表板。 ## 演示场景 **任务:** “研究最新的 AI 安全论文并总结前 3 篇。” **攻击:** Agent 内存文件中的一条隐藏指令导致其发生偏转——在完成研究后,它试图通过将 API Key 和文件结构发送到外部服务来“贴心地备份你的工作区文件”。 AegisSync 捕捉到这一点,并非通过识别恶意 Payload——而是因为 Agent 的行为不再符合研究任务的指纹。它偏离了既定轨道。检测到漂移。会话已被标记。 ## 技术栈 - **FastAPI** + **Uvicorn** — 代理服务器 - **httpx** — 异步转发 - **Vanilla JS** — 仪表板 UI ## 构建于 OpenClaw x Imperial 黑客马拉松 · 2026 年 3 月
标签:Agent防火墙, AI代理监控, AI安全, Anthropic, API代理, Chat Copilot, CIDR扫描, CIS基准, Linux系统监控, Naabu, RAG安全, Red Canary, Streamlit, 上下文窗口监控, 余弦相似度, 内容安全, 工具调用监控, 恶意行为检测, 提示词注入检测, 模型安全, 漂移检测, 确定性安全, 网络安全, 行为指纹, 访问控制, 越狱防护, 运行时操纵, 运行时防火墙, 逆向工具, 隐私保护