mturac/incident
GitHub: mturac/incident
一款 Claude Code 插件,将生产环境事件响应中的分诊、根因诊断、修复生成与事后复盘整合为结构化的 AI 辅助工作流。
Stars: 1 | Forks: 0
# 事件
一个用于生产环境事件响应的 Claude Code 插件。当生产环境出现故障时,此插件可帮助您快速分诊、深入诊断、正确修复并完善文档。
支持 Sentry、Datadog、CloudWatch 日志或纯堆栈跟踪。无需外部服务——只需粘贴您的日志即可开始。
## 安装
```
/plugin install incident@mturac
```
## 命令
| 命令 | 描述 |
|---------|-------------|
| `/incident-start` | 开始分诊:收集信号、检查近期变更、生成事件卡片 |
| `/incident-diagnose` | 深入诊断:追踪调用堆栈、测试假设、获取特定的日志查询 |
| `/incident-fix` | 针对已确认的根本原因生成修复程序和测试 |
| `/incident-postmortem` | 撰写完整的不指责式复盘 |
## 工作原理
### `/incident-start`
收集故障内容、发生时间、严重程度及受影响范围。检查近期的提交和部署。要求您提供错误信号(Sentry 链接、堆栈跟踪或原始日志)。输出结构化的 **事件卡片**,可直接粘贴到 Slack 中。
```
Claude: What broke? Severity? When?
You: checkout API, P1, started 14:23 UTC
Claude: Checking recent deploys...
Found: v2.14.3 deployed at 14:19 UTC (4 min before incident)
Please paste the error/stack trace or Sentry link.
You: [pastes stack trace]
Claude: 🔴 Incident Card — Checkout 5xx Spike
Severity: P1 | Status: Investigating
Probable cause: NullPointerException in checkout.ts:84 (high confidence)
Triggered by: deploy v2.14.3
Next steps: 1. Diagnose with /incident-diagnose 2. Rollback if needed
```
### `/incident-diagnose`
追踪调用堆栈,生成带有特定 Datadog/CloudWatch/grep 日志查询的假设,并输出精确的 RCA 声明。
```
Claude: Tracing checkout.ts:84...
Call chain: POST /checkout → CheckoutHandler → CartService.validate → user.address.city
Hypothesis 1 (High confidence): Null dereference
address became optional in schema migration PR #4821
Confirm with Datadog:
service:checkout-api status:error "Cannot read properties of undefined (reading 'city')"
Root cause: The address field became nullable in the User schema
but checkout handler was not updated to handle null addresses.
```
### `/incident-postmortem`
撰写包含 5-Why RCA、检测差距分析、不指责式框架和 SMART 行动项的完整复盘。
## 可选:Sentry + Datadog MCP 集成
实现直接 API 访问,无需复制粘贴:
```
cd server && npm install && npm run build
export INCIDENT_SERVER_PATH="$(pwd)"
```
设置环境变量:
```
export SENTRY_TOKEN=
export SENTRY_ORG=
export DATADOG_API_KEY=
export DATADOG_APP_KEY=
```
`INCIDENT_SERVER_PATH` 指向 `dist/index.js` 所在的 `server/` 目录。然后 Claude 可以直接调用 `sentry_get_recent_issues`、`sentry_get_issue_details`、`datadog_get_events` 和 `datadog_get_monitors`。
## 独特优势
- 无需外部服务即可运行——粘贴日志,获取分析
- 基于假设的诊断,包含可证伪、可测试的声明
- 为 Datadog、CloudWatch 和 grep 提供可直接复制粘贴的日志查询
- 回滚安全性:始终优先检查数据库迁移
- 包含 5-Why 和 SMART 行动项的不指责式复盘
标签:AI辅助编程, Claude插件, Datadog, MITM代理, Sentry, SOC Prime, 后端开发, 开发工具, 故障排查, 运维监控