mturac/incident

GitHub: mturac/incident

一款 Claude Code 插件,将生产环境事件响应中的分诊、根因诊断、修复生成与事后复盘整合为结构化的 AI 辅助工作流。

Stars: 1 | Forks: 0

# 事件 一个用于生产环境事件响应的 Claude Code 插件。当生产环境出现故障时,此插件可帮助您快速分诊、深入诊断、正确修复并完善文档。 支持 Sentry、Datadog、CloudWatch 日志或纯堆栈跟踪。无需外部服务——只需粘贴您的日志即可开始。 ## 安装 ``` /plugin install incident@mturac ``` ## 命令 | 命令 | 描述 | |---------|-------------| | `/incident-start` | 开始分诊:收集信号、检查近期变更、生成事件卡片 | | `/incident-diagnose` | 深入诊断:追踪调用堆栈、测试假设、获取特定的日志查询 | | `/incident-fix` | 针对已确认的根本原因生成修复程序和测试 | | `/incident-postmortem` | 撰写完整的不指责式复盘 | ## 工作原理 ### `/incident-start` 收集故障内容、发生时间、严重程度及受影响范围。检查近期的提交和部署。要求您提供错误信号(Sentry 链接、堆栈跟踪或原始日志)。输出结构化的 **事件卡片**,可直接粘贴到 Slack 中。 ``` Claude: What broke? Severity? When? You: checkout API, P1, started 14:23 UTC Claude: Checking recent deploys... Found: v2.14.3 deployed at 14:19 UTC (4 min before incident) Please paste the error/stack trace or Sentry link. You: [pastes stack trace] Claude: 🔴 Incident Card — Checkout 5xx Spike Severity: P1 | Status: Investigating Probable cause: NullPointerException in checkout.ts:84 (high confidence) Triggered by: deploy v2.14.3 Next steps: 1. Diagnose with /incident-diagnose 2. Rollback if needed ``` ### `/incident-diagnose` 追踪调用堆栈,生成带有特定 Datadog/CloudWatch/grep 日志查询的假设,并输出精确的 RCA 声明。 ``` Claude: Tracing checkout.ts:84... Call chain: POST /checkout → CheckoutHandler → CartService.validate → user.address.city Hypothesis 1 (High confidence): Null dereference address became optional in schema migration PR #4821 Confirm with Datadog: service:checkout-api status:error "Cannot read properties of undefined (reading 'city')" Root cause: The address field became nullable in the User schema but checkout handler was not updated to handle null addresses. ``` ### `/incident-postmortem` 撰写包含 5-Why RCA、检测差距分析、不指责式框架和 SMART 行动项的完整复盘。 ## 可选:Sentry + Datadog MCP 集成 实现直接 API 访问,无需复制粘贴: ``` cd server && npm install && npm run build export INCIDENT_SERVER_PATH="$(pwd)" ``` 设置环境变量: ``` export SENTRY_TOKEN= export SENTRY_ORG= export DATADOG_API_KEY= export DATADOG_APP_KEY= ``` `INCIDENT_SERVER_PATH` 指向 `dist/index.js` 所在的 `server/` 目录。然后 Claude 可以直接调用 `sentry_get_recent_issues`、`sentry_get_issue_details`、`datadog_get_events` 和 `datadog_get_monitors`。 ## 独特优势 - 无需外部服务即可运行——粘贴日志,获取分析 - 基于假设的诊断,包含可证伪、可测试的声明 - 为 Datadog、CloudWatch 和 grep 提供可直接复制粘贴的日志查询 - 回滚安全性:始终优先检查数据库迁移 - 包含 5-Why 和 SMART 行动项的不指责式复盘
标签:AI辅助编程, Claude插件, Datadog, MITM代理, Sentry, SOC Prime, 后端开发, 开发工具, 故障排查, 运维监控