FIND-Lab/AgentWard

GitHub: FIND-Lab/AgentWard

AgentWard 是一个为 AI 代理构建的全栈安全操作系统，通过异构纵深防御保障代理从启动到执行的可信与可控。

Stars: 62 | Forks: 8

# AgentWard · 玄甲OS **AgentWard (玄甲)** 是一个专为可信、可扩展 AI 代理部署而构建的全栈安全操作系统，具备对 OpenClaw 的原生代码适配能力。AgentWard 在统一的安全架构中整合了代理入职、安全推理和可信执行，并即将原生支持其他主流代理框架。其异构纵深防御设计将代理工作流重构为五个协同的安全层，覆盖启动、感知、记忆、决策和执行阶段，并通过动态跨阶段保护验证基础完整性、阻断对抗性欺骗、阻止内存篡改并验证每个自主决策和高风险命令——实现从“出生可信、过程可控、结果可靠”的端到端闭环安全承诺。 ## 为何选择 AgentWard - 🛡️ **全面的风险覆盖** — 异构纵深防御（DiD）架构提供全范围的代理安全保证，阻断整个代理攻击面上的多样化攻击向量。 - ⚡ **一键式部署** — 插件原生设计将安全无缝编织进完整的代理生命周期。通过非侵入式集成一键启用全面代理安全，保证与 OpenClaw 的无缝且快速版本适配。 - 🔒 **确定性的系统级控制** — 提供可确定、可完全审计的代码强制安全机制，性能优于依赖内生安全的手动解决方案，并具备原生的大规模部署和生产就绪能力。 - 🌐 **开放且可扩展的安全标准** — 社区驱动、透明且可审计的开源标准，采用模块化架构设计以支持扩展。构建了完整的框架-算法解耦，便于先进检测算法的无缝集成，并规划支持通用代理系统。 ## 快速开始 1. ⚡ **安装或更新** # 运行安装脚本 bash /path/to/agent-ward/setup.sh 2. ✅ **验证安装** openclaw plugins list 然后享受增强的 OpenClaw 安全性！ ## 系统化架构 **AgentWard** 已原生深度集成到 OpenClaw 平台，并将原生安全能力嵌入 AI 代理的完整生命周期工作流。其异构纵深防御架构将孤立的单点安全检查重构为一个闭环、协调的系统级保护系统，为 AI 代理从启动到执行提供端到端、全链条的可信保障。 ![AgentWard 蓝图](https://static.pigsec.cn/wp-content/uploads/repos/2026/04/e7d93e7e89152317.png) ### 五个协同防御层 AgentWard 通过五个紧密集成的层提供**系统级安全**，将孤立的检查转换为统一的端到端保护系统。 | 层 | 重点 | | --- | --- | | 🏗️ 基础扫描层 | 供应链信任与基线完整性 | | 🧼 输入净化层 | 提示注入与越狱检测 | | 🧠 认知保护层 | 内存中毒与上下文漂移 | | 🎯 决策对齐层 | 行动前的意图一致性 | | 🔧 执行控制层 | 高风险操作护栏 | ### 🚨 威胁响应与缓解 - 📢 检测到威胁时通过即时通讯发送告警 - 🛑 自动阻断危险操作，无需人工干预 - 📝 提供清晰的警告描述以帮助理解风险 ### ⚙️ 灵活配置 - 🎚️ 各保护层可独立启用/禁用 - 👁️ 支持“仅检测”模式以减少误报影响 - 📋 部分层支持自定义规则以满足特定场景需求 ## 防御可视化 ### 🏗️ 第 1 层：基础扫描确保代理从可信基础启动。

英文版本

中文版本

### 🧼 第 2 层：输入净化在输入传播到代理之前识别对抗性输入。

英文版本

中文版本

### 🧠 第 3 层：认知保护保护长期记忆与上下文连续性免受中毒影响。

英文版本

中文版本

### 🎯 第 4 层：决策对齐保持代理决策与授权用户意图一致。

英文版本

中文版本

### 🔧 第 5 层：执行控制在执行点实施安全边界。

英文版本

中文版本

## 路线图 ### 🏆 全栈端到端安全系统我们的路线图围绕分层防御架构构建，旨在保护整个代理生命周期，从配置和输入处理到认知、决策和执行。 #### 📐 系统基础设施框架 - ✅ 插件原生模块化架构 - ✅ 基础适配器套件 - ✅ 核心检测引擎 - ✅ 基于启发式的规则检测模块 - ✅ 意图风险评估系统 - 🚀 信任感知风险评估能力 - 🚀 异构操作系统支持 - ✅ Linux - 🚀 macOS - 🚀 Windows #### 🏗️ 基础扫描层 - ✅ 全局与插件级配置安全检查 - ✅ 语义化恶意技能检测 - 🚀 技能来源验证 - 🚀 插件依赖分析 - 🚀 混合自然语言与代码漏洞检测 #### 🧼 输入净化层 - ✅ 基于规则的注入与越狱检测 - ✅ 用户输入的语义一致性分析 - ✅ 碎片化恶意指令检测 - 🚀 多轮隐蔽攻击检测 - 🚀 安全恶意内容重写与替换 - 🚀 多模态注入攻击检测 #### 🧠 认知保护层 - ✅ 内存一致性评估与校准 - 🚀 恶意内存语料构建与威胁匹配 - 🚀 内存向量化与异常检测 - 🚀 检查点式内存恢复 - 🚀 上下文漂移检测与修正 #### 🎯 决策对齐层 - ✅ 代理决策与用户意图一致性验证 - 🚀 静态规则过滤与合规性验证 - 🚀 多步轨迹推理审计 - 🚀 风险自适应动态权限分配 - 🚀 高风险动作识别与安全重写 #### 🔧 执行控制层 - ✅ 实时拦截与阻断高风险系统指令 - ✅ 行为意图分析与风险评估 - 🚀 身份感知动态权限控制与访问限制 - 🚀 执行前代理动作安全验证 - 🚀 异常执行状态的自动回滚与恢复 - 🚀 eBPF 驱动的系统级可观测性 - 🚀 实时资源监控与自适应限制 - 🚀 网络负载审计与异常检测 #### 🤝 跨层协作 - ✅ 全局信息聚合与风险发现 - 🚀 基于历史行为的信任画像 - 🚀 角色感知风险评分与动态权限分配 - 🚀 污点传播与端到端系统审计 *Legend: ✅ 已完成 | 🚀 进行中* **作者：** [李奇](https://sites.google.com/site/qili2012), [邓晓浩](https://xinhao-deng.github.io/), 张义翔, 贾庆武, 岳潇, 邱仁凯, 邹若恒, 白嘉祺, 宋佳兴, 徐可

标签：AgentWard, AI代理安全, OpenClaw, SEO: AgentWard, SEO: AI代理安全操作系统, SEO: OpenClaw安全, SEO: 玄甲OS, 全栈安全, 内存安全, 内存篡改防护, 决策安全, 功能: 内存防护, 功能: 决策审计, 功能: 跨阶段验证, 动态交叉阶段保护, 可信执行, 可扩展安全, 启动安全, 基础完整性验证, 大规模部署, 安全操作系统, 完整性验证, 对抗欺骗防护, 开源安全标准, 异构纵深防御, 感知安全, 执行安全, 技术栈: 安全架构, 技术栈: 异构防御, 插件原生集成, 框架算法解耦, 模块化架构, 玄甲OS, 生产级就绪, 确定性控制, 社区驱动, 端到端安全闭环, 系统级审计, 自主决策验证, 自动化攻击, 跨阶段保护, 防御在深度, 非侵入式集成, 高风险命令校验