FIND-Lab/AgentWard
GitHub: FIND-Lab/AgentWard
AgentWard 是一个为 AI 代理构建的全栈安全操作系统,通过异构纵深防御保障代理从启动到执行的可信与可控。
Stars: 36 | Forks: 5
# AgentWard · 玄甲OS
**AgentWard (玄甲)** 是一个专为可信、可扩展 AI 代理部署而构建的全栈安全操作系统,具备对 OpenClaw 的原生代码适配能力。AgentWard 在统一的安全架构中整合了代理入职、安全推理和可信执行,并即将原生支持其他主流代理框架。其异构纵深防御设计将代理工作流重构为五个协同的安全层,覆盖启动、感知、记忆、决策和执行阶段,并通过动态跨阶段保护验证基础完整性、阻断对抗性欺骗、阻止内存篡改并验证每个自主决策和高风险命令——实现从“出生可信、过程可控、结果可靠”的端到端闭环安全承诺。
## 为何选择 AgentWard
- 🛡️ **全面的风险覆盖** — 异构纵深防御(DiD)架构提供全范围的代理安全保证,阻断整个代理攻击面上的多样化攻击向量。
- ⚡ **一键式部署** — 插件原生设计将安全无缝编织进完整的代理生命周期。通过非侵入式集成一键启用全面代理安全,保证与 OpenClaw 的无缝且快速版本适配。
- 🔒 **确定性的系统级控制** — 提供可确定、可完全审计的代码强制安全机制,性能优于依赖内生安全的手动解决方案,并具备原生的大规模部署和生产就绪能力。
- 🌐 **开放且可扩展的安全标准** — 社区驱动、透明且可审计的开源标准,采用模块化架构设计以支持扩展。构建了完整的框架-算法解耦,便于先进检测算法的无缝集成,并规划支持通用代理系统。
## 快速开始
1. ⚡ **安装或更新**
# 运行安装脚本
bash /path/to/agent-ward/setup.sh
2. ✅ **验证安装**
openclaw plugins list
然后享受增强的 OpenClaw 安全性!
## 系统化架构
**AgentWard** 已原生深度集成到 OpenClaw 平台,并将原生安全能力嵌入 AI 代理的完整生命周期工作流。其异构纵深防御架构将孤立的单点安全检查重构为一个闭环、协调的系统级保护系统,为 AI 代理从启动到执行提供端到端、全链条的可信保障。

### 五个协同防御层
AgentWard 通过五个紧密集成的层提供**系统级安全**,将孤立的检查转换为统一的端到端保护系统。
| 层 | 重点 |
| --- | --- |
| 🏗️ 基础扫描层 | 供应链信任与基线完整性 |
| 🧼 输入净化层 | 提示注入与越狱检测 |
| 🧠 认知保护层 | 内存中毒与上下文漂移 |
| 🎯 决策对齐层 | 行动前的意图一致性 |
| 🔧 执行控制层 | 高风险操作护栏 |
### 🚨 威胁响应与缓解
- 📢 检测到威胁时通过即时通讯发送告警
- 🛑 自动阻断危险操作,无需人工干预
- 📝 提供清晰的警告描述以帮助理解风险
### ⚙️ 灵活配置
- 🎚️ 各保护层可独立启用/禁用
- 👁️ 支持“仅检测”模式以减少误报影响
- 📋 部分层支持自定义规则以满足特定场景需求
## 防御可视化
### 🏗️ 第 1 层:基础扫描
确保代理从可信基础启动。
### 🧼 第 2 层:输入净化
在输入传播到代理之前识别对抗性输入。
### 🧠 第 3 层:认知保护
保护长期记忆与上下文连续性免受中毒影响。
### 🎯 第 4 层:决策对齐
保持代理决策与授权用户意图一致。
### 🔧 第 5 层:执行控制
在执行点实施安全边界。
## 路线图
### 🏆 全栈端到端安全系统
我们的路线图围绕分层防御架构构建,旨在保护整个代理生命周期,从配置和输入处理到认知、决策和执行。
#### 📐 系统基础设施框架
- ✅ 插件原生模块化架构
- ✅ 基础适配器套件
- ✅ 核心检测引擎
- ✅ 基于启发式的规则检测模块
- ✅ 意图风险评估系统
- 🚀 信任感知风险评估能力
- 🚀 异构操作系统支持
- ✅ Linux
- 🚀 macOS
- 🚀 Windows
#### 🏗️ 基础扫描层
- ✅ 全局与插件级配置安全检查
- ✅ 语义化恶意技能检测
- 🚀 技能来源验证
- 🚀 插件依赖分析
- 🚀 混合自然语言与代码漏洞检测
#### 🧼 输入净化层
- ✅ 基于规则的注入与越狱检测
- ✅ 用户输入的语义一致性分析
- ✅ 碎片化恶意指令检测
- 🚀 多轮隐蔽攻击检测
- 🚀 安全恶意内容重写与替换
- 🚀 多模态注入攻击检测
#### 🧠 认知保护层
- ✅ 内存一致性评估与校准
- 🚀 恶意内存语料构建与威胁匹配
- 🚀 内存向量化与异常检测
- 🚀 检查点式内存恢复
- 🚀 上下文漂移检测与修正
#### 🎯 决策对齐层
- ✅ 代理决策与用户意图一致性验证
- 🚀 静态规则过滤与合规性验证
- 🚀 多步轨迹推理审计
- 🚀 风险自适应动态权限分配
- 🚀 高风险动作识别与安全重写
#### 🔧 执行控制层
- ✅ 实时拦截与阻断高风险系统指令
- ✅ 行为意图分析与风险评估
- 🚀 身份感知动态权限控制与访问限制
- 🚀 执行前代理动作安全验证
- 🚀 异常执行状态的自动回滚与恢复
- 🚀 eBPF 驱动的系统级可观测性
- 🚀 实时资源监控与自适应限制
- 🚀 网络负载审计与异常检测
#### 🤝 跨层协作
- ✅ 全局信息聚合与风险发现
- 🚀 基于历史行为的信任画像
- 🚀 角色感知风险评分与动态权限分配
- 🚀 污点传播与端到端系统审计
*Legend: ✅ 已完成 | 🚀 进行中*
**作者:** [李奇](https://sites.google.com/site/qili2012), [邓晓浩](https://xinhao-deng.github.io/), 张义翔, 贾庆武, 岳潇, 邱仁凯, 邹若恒, 白嘉祺, 宋佳兴, 徐可
英文版本 |
中文版本 |
英文版本 |
中文版本 |
英文版本 |
中文版本 |
英文版本 |
中文版本 |
英文版本 |
中文版本 |
标签:AgentWard, AI代理安全, OpenClaw, SEO: AgentWard, SEO: AI代理安全操作系统, SEO: OpenClaw安全, SEO: 玄甲OS, 全栈安全, 内存安全, 内存篡改防护, 决策安全, 功能: 内存防护, 功能: 决策审计, 功能: 跨阶段验证, 动态交叉阶段保护, 可信执行, 可扩展安全, 启动安全, 基础完整性验证, 大规模部署, 安全操作系统, 完整性验证, 对抗欺骗防护, 开源安全标准, 异构纵深防御, 感知安全, 执行安全, 技术栈: 安全架构, 技术栈: 异构防御, 插件原生集成, 框架算法解耦, 模块化架构, 玄甲OS, 生产级就绪, 确定性控制, 社区驱动, 端到端安全闭环, 系统级审计, 自主决策验证, 自动化攻击, 跨阶段保护, 防御在深度, 非侵入式集成, 高风险命令校验