JithendraNara/incident-agent-platform
GitHub: JithendraNara/incident-agent-platform
生产级AIOps事件响应代理平台,解决事件信号摄入、分诊与高风险操作审批的自动化与可靠性问题。
Stars: 0 | Forks: 0
# incident-agent-platform
生产级 AIOps 事件响应代理平台,具备编排、审批门控和评估工作流。
## 本平台的功能
- 从日志、指标和部署上下文中摄取事件信号。
- 运行代理式分诊以生成假设和推荐的修复措施。
- 对高风险操作强制执行人工审批门控。
- 通过可重复的场景评估来衡量质量与可靠性。
## 架构
1. **控制平面** 编排事件工作流状态。
2. **适配器** 将外部数据源标准化为稳定内部契约。
3. **分诊代理** 构建排序假设和操作计划。
4. **审批引擎** 在人工决策前阻止有风险修复。
5. **评估套件** 回放规范场景并报告指标。
详见 `ARCHITECTURE.md`。
## 快速启动
```
npm install
npm run check
npm run eval
```
## 仓库结构
```
.
├── src/
│ ├── adapters/
│ ├── agents/
│ └── control-plane/
├── scripts/
├── evals/
├── tests/
├── ARCHITECTURE.md
├── RUNBOOK.md
├── EVALS.md
└── DEMO.md
```
## 路线图
- 添加真实适配器集成(Datadog、Prometheus、CloudWatch、Kubernetes)
- 添加策略驱动的修复剧本
- 添加临时/持久执行引擎集成
- 添加基准仪表板导出
标签:AIOps, API集成, CloudWatch, Datadog, GNU通用公共许可证, MITM代理, Node.js, npm, SEO: AIOps 平台, SEO: 智能事件响应, SEO: 自动化修复平台, SRE, 临时执行引擎, 事件驱动, 人类审批, 代理智能分类, 仪表板, 修复建议, 假设生成, 偏差过滤, 可观测性, 可重复评估, 可靠性评估, 告警信号, 场景回放, 审批流程, 工作流管理, 指标评估, 控制平面, 日志指标, 智能运维, 生产级, 监控集成, 策略即代码, 编排引擎, 聊天机器人安全, 自动化攻击, 自动化编排, 评估工作流, 质量度量, 适配器, 部署上下文, 风险管控