ztothez/aegisops-ai
GitHub: ztothez/aegisops-ai
基于四智能体协作的紫队检测 Copilot,将 MITRE ATT&CK 威胁情报自动转化为 Sigma 检测规则、SOC 响应指南和验证评分,大幅缩短紫队演练周期并保障数据本地化。
Stars: 0 | Forks: 0
## title: AegisOps AI
emoji: 🛡️
colorFrom: indigo
colorTo: red
sdk: docker
app_port: 7860
pinned: false
license: mit
# AegisOps AI
### MITRE 到检测的 Copilot
AegisOps AI 是一个多智能体 AI 系统,能够将 MITRE ATT&CK 技术和已知的攻击者行为转化为可用于生产环境的防御工件——Sigma 检测规则、实时 SIEM/EDR 告警逻辑、SOC 响应指南以及验证评分。该公共 Space 以可靠的演示模式运行;实时推理路径专为在 AMD Developer Cloud 上使用 ROCm 运行的 vLLM 设计。
[](https://huggingface.co/spaces/ztothez/aegisops-ai)
[](https://www.amd.com)
[](https://rocm.docs.amd.com/)
[](https://langchain-ai.github.io/langgraph/)
[](https://attack.mitre.org/)

## 问题所在
安全团队面临一个关键缺口:将威胁情报转化为可操作的检测规则过程缓慢、成本高昂,并且需要同时具备攻防安全领域专业知识的稀缺人才。
- 一次典型的紫队演练成本在 **$20,000 到 $50,000** 之间,耗时 **2 到 3 周**
- 无法使用云端 AI —— 敏感的基础设施数据不能离开本机
- 通用的威胁情报只会生成通用、低精度的检测规则
- 蓝队并不了解红队实际是如何执行这些技术的
**结果:** 大多数组织针对已知攻击者行为的检测覆盖率都不完整。
## 解决方案
AegisOps AI 运行一个 **4 智能体流水线**,只需接收一个 MITRE ATT&CK 技术 ID,即可在几分钟内(而非数周)生成一套完整的防御就绪方案。在演示模式下,预计算的工件使得评审可靠;在实时模式下,相同的流水线会调用一个 OpenAI 兼容的 vLLM 端点,该端点专为在支持 ROCm 的 AMD Developer Cloud 上运行而设计。
```
User Input (MITRE Technique ID or APT Group)
↓
Red/Threat Agent → High-fidelity authorized simulation artifacts
↓
Detection Agent → Sigma rules targeting exact observables
↓
Response Agent → SOC triage, containment, and escalation guidance
↓
Validation Agent → Coverage score, gaps, and quality check
↓
Final Output → UI + JSON + PDF report
```
**核心洞察:** 高保真度的模拟能够实现高精度的防御。检测智能体会消费威胁智能体产生的准确命令模式、进程谱系、事件 ID、文件路径、注册表项以及网络指标——从而生成与真实攻击者行为相匹配的检测规则,而非泛泛的通用模式。
## 核心功能
### 4 种模拟模式
**单一技术**
输入任何 MITRE ATT&CK 技术 ID(例如 T1059.001)。4 智能体流水线将生成:
- 具有代表性命令模式的授权紫队模拟
- 进程谱系、事件 ID、文件/注册表/网络指标
- 针对精确可观测数据的 Sigma 样式检测规则
- 实时 SIEM/EDR 流式告警逻辑
- SOC 响应指南:分流、遏制、狩猎、升级
- 包含覆盖率百分比和缺口分析的验证评分
**APT 组织模式**
输入威胁行为者名称(例如 APT28、Lazarus、Cozy Bear)。系统将:
- 从 MITRE ATT&CK v14 中获取归因于该组织的所有技术
- 对每种技术按顺序运行完整的 4 智能体流水线
- 生成包含多技术检测覆盖率的完整攻击者画像
- 导出用于 SOC 交接的组合 PDF 报告
**杀伤链模式**
输入一个起始技术,系统会自动链接后续技术:
- T1566.001 → T1204.002 → T1059.001 (网络钓鱼 → 用户执行 → PowerShell)
- 每一跳都运行完整的 4 智能体流水线
- 显示完整攻击序列的可视化链路流程
- 跨越整个链路的组合检测与响应指南
**狩猎 —— 拓扑实验室**
展示横向移动如何转化为实时检测的可视化沙箱环境:
- 7 节点沙箱网络拓扑
- 3 条可选攻击路径:
- 从网络钓鱼到 PowerShell 到 C2
- 从合法账户到域凭据访问
- 从公共应用漏洞利用到 Web Shell 再到数据窃取
- 逐跳遥测映射,附带预估反应时间(平均约 15 秒)
- 每一跳的流式 SIEM/EDR 告警条件
- 映射路径上的 100% 检测覆盖率
## 架构
```
┌─────────────────────────────────────────────────────┐
│ AegisOps AI │
│ │
│ ┌──────────────┐ ┌──────────────────────────┐ │
│ │ FastAPI + │ │ │ │
│ │ HuggingFace │ │ LangGraph Graph │ │
│ │ Spaces │───▶│ │ │
│ │ SOC Console │ │ Red/Threat Agent │ │
│ │ 4 Modes │ │ ↓ │ │
│ └──────────────┘ │ Detection/Blue Agent │ │
│ │ ↓ │ │
│ ┌──────────────┐ │ Response Agent │ │
│ │ MITRE ATT&CK │ │ ↓ │ │
│ │ v14 Local │───▶│ Validation Agent │ │
│ │ enterprise- │ │ (Qwen verifier sidecar) │ │
│ │ attack.json │ └──────────────────────────┘ │
│ └──────────────┘ ↓ │
│ ┌──────────────────────────┐ │
│ │ vLLM + ROCm │ │
│ │ AMD MI300X (192GB) │ │
│ │ Llama 3.3 70B │ │
│ └──────────────────────────┘ │
└─────────────────────────────────────────────────────┘
```
**智能体角色:**
| 智能体 | 输入 | 输出 |
|-------|-------|--------|
| 红/威胁智能体 | 技术 ID + MITRE 上下文 | 模拟工件、可观测数据、遥测信息 |
| 检测智能体 | 红队智能体输出 | Sigma 规则,实时告警逻辑 |
| 响应智能体 | 检测输出 | SOC 分流、遏制、狩猎、升级 |
| 验证智能体 | 红队 + 检测输出 | 六维度覆盖率评分,通过/警告/失败 |
## 为什么选择 AMD + 本地推理
安全团队无法将敏感的基础设施数据发送到云端 AI API。内部网络拓扑、真实的 CVE 上下文以及活跃的事件数据过于敏感,不宜对外暴露。
**为什么 AMD Developer Cloud + ROCm 对实时路径至关重要:**
- MI300X 级别的内存适合用于服务大型开源模型,例如 Llama 70B。
- ROCm 上的 vLLM 为 LangGraph 智能体流水线提供了与 OpenAI 兼容的 API。
- AMD Developer Cloud 为对安全敏感的 SOC 工作流提供了私有推理端点。
- 该架构的设计使得敏感的拓扑和事件上下文能够保留在操作员受控的环境内。
### ROCm 利用率(可验证,绝非空谈)
AegisOps AI 使用 ROCm 作为实时推理的 AMD GPU 运行时层:
```
FastAPI + HuggingFace Spaces UI
→ LangGraph agent pipeline
→ ChatOpenAI-compatible client
→ vLLM OpenAI API server
→ ROCm container
→ AMD Instinct MI300X
```
SOC 控制台 UI 在每次流水线运行的顶部都会展示真实的 ROCm 证明:
- 带有测量延迟的实时 `/v1/models` 健康探测(可达时显示绿色 `LIVE` 标签)。
- 每个威胁 → 检测 → 响应 → 验证跳转的逐智能体延迟以及 prompt/completion token 计数。
- 指向从实时 MI300X 捕获的捆绑证据文件的直接链接。
在 AMD Developer Cloud 上复现这些证据:
```
# 在 MI300X 上启动 vLLM,并将 rocm-smi + vllm 版本捕获到 ./assets/ 中
./start_vllm.sh
# 记录来自真实并发请求的 p50 / p95 延迟和 tokens-per-second
python scripts/rocm_benchmark.py --requests 12 --concurrency 4
```
提交至仓库的证据文件:
- [`assets/rocm_smi.json`](assets/rocm_smi.json) — 机器可读的 ROCm GPU 快照
- [`assets/rocm_smi.txt`](assets/rocm_smi.txt) — 人类可读的 `rocm-smi` 快照
- [`assets/vllm_info.txt`](assets/vllm_info.txt) — vLLM 版本、模型、端点、捕获时间戳
- [`assets/rocm_benchmark.json`](assets/rocm_benchmark.json) — p50: 4723ms,p95: 4892ms,吞吐量: 89.09 tok/s
- [`assets/README.md`](assets/README.md) — 每个证据文件的完整描述
当未配置 AMD/vLLM 密钥时,演示模式在 Hugging Face Spaces 上依然可用,以便进行可靠的公开评审。UI 在演示模式下仍会展示捆绑的 ROCm 证据,因此评委总能看到 AMD 来源证明。
## 技术栈
| 组件 | 技术 | 原因 |
|-----------|-----------|-----|
| 智能体编排 | LangGraph | 具有顺序执行能力的有状态多智能体图 |
| 推理 | ROCm 上的 vLLM | 具有 OpenAI 兼容 API 的实时 AMD 端点 |
| 模型 | Llama 3.3 70B + Qwen2.5-3B | 生成 + 验证辅助角色,在 ROCm 上有良好记录 |
| GPU | AMD Instinct MI300X | AMD Developer Cloud 上的实时推理硬件 |
| 威胁情报 | MITRE ATT&CK v14 | 本地 enterprise-attack.json,无外部 API 调用 |
| 前端 | FastAPI + HuggingFace Spaces | SOC 控制台 UI,Docker 部署 |
| 导出 | ReportLab | 用于 SOC 交接的 PDF 报告生成 |
## 商业价值
**目标客户:**
- MSSP —— 大规模为客户运行紫队演练
- 企业 SOC 团队 —— 无需双重红/蓝队专业知识即可进行持续检测验证
- 检测工程团队 —— 从威胁情报自动生成 Sigma 规则
- 红队咨询公司 —— 自动生成专业报告
**ROI:**
- 典型的紫队演练:$20,000–$50,000,2-3 周,2-3 名高级顾问
- AegisOps AI:每种技术仅需几分钟,一名操作员,无云端依赖
**收入模型:**
- SaaS:每个 SOC 团队 $500–2,000/月
- 针对企业数据主权需求的本地 AMD GPU 部署
**市场:**
- 全球渗透测试市场:$1.7B(2023年),年增长率 13%
- 随着组织向持续安全验证转型,紫队是增长最快的细分市场
- TAM:$340M(需要本地 AI 的 MSSP + 企业 SOC 团队)
## 安全与范围
AegisOps AI 在明确界定的范围内运行:
**范围内:**
- 已知的 MITRE ATT&CK 行为模拟
- 带有占位符的、对检测有用的命令模式
- 分层的 Sigma/SIEM 检测逻辑
- 响应和遏制指南
- 六维度验证评分
**范围外:**
- 零日漏洞利用生成
- 新型恶意软件创建
- 针对真实目标的漏洞利用说明
- 无限制的攻击性自动化
所有模拟工件均使用专业的占位符(``、``、``),并被构建为已授权的紫队验证工件。
## 快速入门
### 前置条件
- Python 3.10+
- Docker
- 拥有 MI300X 访问权限的 AMD Developer Cloud 账户(或 Together.ai 用于测试)
- 拥有 Llama 3.3 70B 访问权限的 HuggingFace token
### 本地开发
```
git clone https://github.com/ztothez/aegisops-ai
cd aegisops-ai
python3 -m venv venv
source venv/bin/activate
pip install -r requirements.txt
cp .env.example .env
```
### 配置 `.env`
```
VLLM_BASE_URL=http://your-amd-instance-ip:8000/v1
VLLM_API_KEY=your_key
MODEL_NAME=meta-llama/Llama-3.3-70B-Instruct
```
### 本地运行 (FastAPI + uvicorn)
```
uvicorn app:app --host 0.0.0.0 --port 7860 --reload
```
### 使用 Docker 运行
```
docker build -t aegisops-ai .
docker run -p 7860:7860 --env-file .env aegisops-ai
```
### AMD/ROCm 实时推理路径
```
# 在使用 ROCm/vLLM 镜像创建 MI300X 实例后
./start_vllm.sh
```
启动脚本:
1. 开放端口 `8000`
2. 使用 `rocm-smi` 验证 ROCm GPU 访问权限
3. 在 ROCm 容器内启动 vLLM
4. 使用 AMD Developer Cloud 端点更新 `.env`
### 演示模式(无需 GPU)
当未配置 `VLLM_BASE_URL` 时,应用会使用预计算的工件以演示模式运行。在 Hugging Face Spaces 上,演示模式是默认的公开路径。AMD 来源证明通过 `assets/` 中捆绑的证据文件得以保留。
## 演示流程
1. 打开 AegisOps AI。系统状态显示为 `LIVE - vLLM on ROCm | MI300X | Llama-3.3-70B-Instruct`(绿色)或带有捆绑 AMD 证据的 `OFFLINE - DEMO FALLBACK ACTIVE`(琥珀色)。
2. 使用 `T1059.001` 运行 **单一技术**。实时监视器流式传输智能体事件。完成时会渲染每个智能体的延迟卡片。
3. 检查 **告警** —— 红队 / 蓝队并排展示:左侧是 Office 谱系模拟,右侧是分层检测策略。
4. 检查 **案例** —— SOC 响应指南和带有六维度分数的流水线验证 JSON。
5. 检查 **报告** —— 覆盖率 97%,判定通过,安全通过,由 Qwen Validator 审核。下载 PDF。
6. 检查 **导出** —— Sigma YAML、Splunk SPL、SOC Playbook、VECTR JSON、Validation JSON、PDF 包。
7. 切换到 **狩猎** —— 拓扑实验室:7 个节点,3 跳,100% 检测覆盖率,平均反应时间约 15 秒。
总运行时间:5 分钟以内。
## 提交资产
- **封面图片 (16:9)**:[`assets/cover.png`](assets/cover.png)
- **幻灯片 PDF**:[`docs/AegisOps_AI_Slides.pdf`](docs/AegisOps_AI_Slides.pdf)
- **视频脚本**:[`docs/video_script.md`](docs/video_script.md)
- **提交表单副本**:[`SUBMISSION.md`](SUBMISSION.md)
-公开 GitHub 仓库**:https://github.com/ztothez/aegisops-ai
- **在线演示**:https://huggingface.co/spaces/ztothez/aegisops-ai
## 路线图
- **SIEM 集成** —— 直接将 Sigma 规则部署到 Splunk/Elastic/Sentinel
- **EDR 连接器** —— CrowdStrike,Defender for Endpoint
- **样本日志测试** —— 针对合成日志夹具验证检测结果
- **微调检测模型** —— 在 AMD GPU 上基于 MITRE + Sigma 语料库训练的特定领域模型
- **ATT&CK 覆盖热力图** —— 按战术/技术的可视化覆盖率仪表板
- **持续验证** —— 随着 ATT&CK 知识库更新而计划重新运行
- **APT 组织模拟模式** —— 具有多技术检测覆盖率的完整攻击者画像
## 赛道
**AMD Developer Hackathon 2026 — AI Agents & Agentic Workflows**
AegisOps AI 展示了复杂的智能体行为:4 个协调的 LangGraph 智能体,具有有状态的顺序传递、工具使用(MITRE ATT&CK v14 本地数据集)、结构化输出验证以及多模式编排。公开演示托管在 Hugging Face Spaces 上;实时推理路径通过 AMD Developer Cloud 上基于 ROCm 的 vLLM 运行在 AMD Instinct MI300X 上,并且可复现的证据已通过 [`start_vllm.sh`](start_vllm.sh) 和 [`scripts/rocm_benchmark.py`](scripts/rocm_benchmark.py) 捕获到 [`assets/`](assets/) 中。
标签:AI安全助手, AMD MI300X, CISA项目, Cloudflare, EDR, Hugging Face, IP 地址批量处理, LangGraph, LLM, MITRE ATT&CK, PyRIT, ROCm, SecOps, Sigma规则, SOC响应指南, Unmanaged PE, vLLM, Web报告查看器, 云安全架构, 告警逻辑, 多智能体系统, 大模型推理, 威胁情报, 安全运营, 开发者工具, 扫描框架, 攻击模拟, 无线安全, 本地部署, 目标导入, 紫队, 网络安全, 网络安全审计, 脆弱性评估, 请求拦截, 逆向工具, 防御自动化, 隐私保护, 驱动签名利用