rushikethana-28/incident-response-agent
GitHub: rushikethana-28/incident-response-agent
基于 AI 的生产事件分类与复盘助手,能解析日志、关联跨服务错误、匹配 Runbook 并自动起草免责复盘报告。
Stars: 0 | Forks: 0
# 事件响应 Agent
一款能够从日志中对生产事件进行分类、跨服务关联错误、匹配 Runbook 并起草免责复盘的 AI Agent。专为 gitagent Hackathon 构建。
## 快速开始
```
npm install -g @open-gitagent/gitagent
npm install gitclaw
npx @open-gitagent/gitagent validate
npx @open-gitagent/gitagent info
```
## 使用方法
### 从日志中对事件进行分类
```
import { createAgent } from 'gitclaw';
const agent = await createAgent('./');
const result = await agent.run(
`We have an incident. Here are the logs from api-gateway and auth-service
in the last 30 minutes: `
);
```
## 仓库结构
```
incident-response-agent/
├── agent.yaml
├── SOUL.md
├── RULES.md
├── skills/
│ ├── parse-logs/SKILL.md
│ ├── correlate-errors/SKILL.md
│ ├── query-runbooks/SKILL.md
│ ├── suggest-remediation/SKILL.md
│ └── draft-postmortem/SKILL.md
├── runbooks/
└── postmortems/
```
## 添加 Runbook
将 `.md` 文件放入 `runbooks/` 目录,遵循以下命名规范:
`-.md`
`query-runbooks` 技能将自动查找并匹配它们。
示例:`runbooks/auth-service-cascade-failure.md`
## 关键设计决策
- **默认免责** — RULES.md 禁止在复盘中点名个人
- **破坏性操作需人工介入** — 所有不可逆步骤均标记为 `[CONFIRM]`
- **推理透明** — Agent 会区分已确认的发现与假设
- **Git 原生** — 复盘提交至 `postmortems/`,Runbook 存放于仓库中
标签:AIOps, API集成, Blameless, Git原生, GNU通用公共许可证, MITM代理, Node.js, Runbook, SRE, 事后复盘, 人工智能, 偏差过滤, 可观测性, 安全运营, 扫描框架, 故障排查, 暗色界面, 生产事故, 用户模式Hook绕过, 站点可靠性工程, 运维自动化, 错误关联, 防御加固, 黑客松项目