JithendraNara/incident-agent-platform

GitHub: JithendraNara/incident-agent-platform

生产级AIOps事件响应代理平台,解决事件信号摄入、分诊与高风险操作审批的自动化与可靠性问题。

Stars: 0 | Forks: 0

# incident-agent-platform 生产级 AIOps 事件响应代理平台,具备编排、审批门控和评估工作流。 ## 本平台的功能 - 从日志、指标和部署上下文中摄取事件信号。 - 运行代理式分诊以生成假设和推荐的修复措施。 - 对高风险操作强制执行人工审批门控。 - 通过可重复的场景评估来衡量质量与可靠性。 ## 架构 1. **控制平面** 编排事件工作流状态。 2. **适配器** 将外部数据源标准化为稳定内部契约。 3. **分诊代理** 构建排序假设和操作计划。 4. **审批引擎** 在人工决策前阻止有风险修复。 5. **评估套件** 回放规范场景并报告指标。 详见 `ARCHITECTURE.md`。 ## 快速启动 ``` npm install npm run check npm run eval ``` ## 仓库结构 ``` . ├── src/ │ ├── adapters/ │ ├── agents/ │ └── control-plane/ ├── scripts/ ├── evals/ ├── tests/ ├── ARCHITECTURE.md ├── RUNBOOK.md ├── EVALS.md └── DEMO.md ``` ## 路线图 - 添加真实适配器集成(Datadog、Prometheus、CloudWatch、Kubernetes) - 添加策略驱动的修复剧本 - 添加临时/持久执行引擎集成 - 添加基准仪表板导出
标签:AIOps, API集成, CloudWatch, Datadog, GNU通用公共许可证, MITM代理, Node.js, npm, SEO: AIOps 平台, SEO: 智能事件响应, SEO: 自动化修复平台, SRE, 临时执行引擎, 事件驱动, 人类审批, 代理智能分类, 仪表板, 修复建议, 假设生成, 偏差过滤, 可观测性, 可重复评估, 可靠性评估, 告警信号, 场景回放, 审批流程, 工作流管理, 指标评估, 控制平面, 日志指标, 智能运维, 生产级, 监控集成, 策略即代码, 编排引擎, 聊天机器人安全, 自动化攻击, 自动化编排, 评估工作流, 质量度量, 适配器, 部署上下文, 风险管控