as-7/Project-2---Incident-Response
GitHub: as-7/Project-2---Incident-Response
一个基于多 Agent 协作的 AI 驱动事件响应指挥中心,通过自动化的分诊、调查和修复流水线提升安全运营效率。
Stars: 0 | Forks: 0
# AI 事件响应指挥中心
一个利用多 Agent 流水线自动对事件进行分诊、调查和修复的 AI 驱动系统。
## 工作原理
当告警接入时,三个 AI Agent 会进行端到端的处理:
1. **分诊 Agent** — 对告警进行去重,并分类其严重程度 (P0–P3)、类别和影响范围。
2. **调查 Agent** — 针对 P0/P1 级别事件,拉取实时服务健康指标和部署历史记录以诊断根本原因。
3. **修复 Agent** — 从向量数据库中检索相似的 Runbook,并生成逐步修复计划。
最终报告通过 WebSocket 广播到实时仪表板。
```
Monitoring Source
│ REST (Webhook)
▼
┌──────────────────────────────────────────────────────┐
│ FastAPI Backend (port 8080) │
│ │
│ Ingestion API → Agent Orchestrator │
│ │ │
│ Triage Agent ─────────────── MCP Server 1 │
│ │ (incident_db :8010) │
│ ┌────┴────┐ │
│ P0/P1 P2/P3 │
│ │ │ │
│ A2A Remediation Agent ───── ChromaDB (:8000) │
│ │ │ │
└────┼─────────┼──────────────────────────────────────┘
│ │
Investigator │ ← MCP Server 2 (infra_metrics :8011)
Agent │
(:8001) │
│ │
└────┬────┘
│ WebSocket
▼
Frontend Dashboard (:5173)
│
Human Operator
```
## 技术栈
- **后端**: FastAPI + PostgreSQL + Redis
- **AI**: Claude (主要) → Gemini (备用)。如果未配置 API 密钥,则回退到基于规则的逻辑。
- **向量搜索**: ChromaDB,使用本地 `sentence-transformers/all-MiniLM-L6-v2` 嵌入
- **协议**: MCP (Agent ↔ 数据工具), A2A (编排器 ↔ 调查器), WebSocket + SSE (后端 ↔ 前端)
- **前端**: React + Vite
- **基础设施**: 使用 Docker Compose 完全容器化
## 快速开始
### 1. 配置环境
```
cp .env.example .env
```
如果你希望使用实时 LLM 模式,请添加你的 API 密钥。如果留空,将运行在演示模式下(基于规则的 Agent,无外部调用)。
```
ANTHROPIC_API_KEY=sk-ant-...
GEMINI_API_KEY=AIza...
DEMO_MODE=false
```
### 2. 启动所有服务
```
docker-compose build
docker-compose up -d
```
### 3. 初始化数据库
```
docker-compose run --rm seed
```
将服务、历史事件和 Runbook 嵌入填充到 ChromaDB 中。
### 4. 打开仪表板
[http://localhost:5173](http://localhost:5173)
## 服务端口
| 服务 | 端口 |
|---|---|
| 前端 | `5173` |
| 后端 API | `8080` |
| A2A 调查器服务器 | `8001` |
| MCP 服务器 — incident_db | `8010` |
| MCP 服务器 — infra_metrics | `8011` |
| ChromaDB | `8000` |
| PostgreSQL | `5433` |
| n8n | `5678` |
## 模拟事件
要使用 75 个预构建事件测试完整流水线:
```
bash seeds/simulate_incidents.sh
```
## 文档
| 文件 | 内容 |
|---|---|
| [`architecture.md`](./architecture.md) | 系统架构、组件描述、协议图、Agent 设计 |
| [`agents.md`](./agents.md) | Agent 规范 — 模式、工具、输入/输出、故障处理 |
标签:AIOps, AI智能体, AV绕过, ChromaDB, DLL 劫持, FastAPI, IT运维, MCP, PyRIT, Python, RAG, Socks5代理, SRE, WebSocket, 人工智能, 依赖分析, 偏差过滤, 向量数据库, 告警分类, 告警去重, 多智能体系统, 大语言模型, 搜索引擎查询, 故障排查, 无后门, 智能体编排, 智能运维, 根因分析, 测试用例, 用户模式Hook绕过, 自动修复, 自动化应急响应, 请求拦截, 软件架构, 运维仪表盘, 运维自动化, 逆向工具