rushikethana-28/incident-response-agent

GitHub: rushikethana-28/incident-response-agent

基于 AI 的生产事件分类与复盘助手,能解析日志、关联跨服务错误、匹配 Runbook 并自动起草免责复盘报告。

Stars: 0 | Forks: 0

# 事件响应 Agent 一款能够从日志中对生产事件进行分类、跨服务关联错误、匹配 Runbook 并起草免责复盘的 AI Agent。专为 gitagent Hackathon 构建。 ## 快速开始 ``` npm install -g @open-gitagent/gitagent npm install gitclaw npx @open-gitagent/gitagent validate npx @open-gitagent/gitagent info ``` ## 使用方法 ### 从日志中对事件进行分类 ``` import { createAgent } from 'gitclaw'; const agent = await createAgent('./'); const result = await agent.run( `We have an incident. Here are the logs from api-gateway and auth-service in the last 30 minutes: ` ); ``` ## 仓库结构 ``` incident-response-agent/ ├── agent.yaml ├── SOUL.md ├── RULES.md ├── skills/ │ ├── parse-logs/SKILL.md │ ├── correlate-errors/SKILL.md │ ├── query-runbooks/SKILL.md │ ├── suggest-remediation/SKILL.md │ └── draft-postmortem/SKILL.md ├── runbooks/ └── postmortems/ ``` ## 添加 Runbook 将 `.md` 文件放入 `runbooks/` 目录,遵循以下命名规范: `-.md` `query-runbooks` 技能将自动查找并匹配它们。 示例:`runbooks/auth-service-cascade-failure.md` ## 关键设计决策 - **默认免责** — RULES.md 禁止在复盘中点名个人 - **破坏性操作需人工介入** — 所有不可逆步骤均标记为 `[CONFIRM]` - **推理透明** — Agent 会区分已确认的发现与假设 - **Git 原生** — 复盘提交至 `postmortems/`,Runbook 存放于仓库中
标签:AIOps, API集成, Blameless, Git原生, GNU通用公共许可证, MITM代理, Node.js, Runbook, SRE, 事后复盘, 人工智能, 偏差过滤, 可观测性, 安全运营, 扫描框架, 故障排查, 暗色界面, 生产事故, 用户模式Hook绕过, 站点可靠性工程, 运维自动化, 错误关联, 防御加固, 黑客松项目