eugenyefimov/Project-Azure-Production-Ready-Infrastructure---Incident-Response-Platform
GitHub: eugenyefimov/Project-Azure-Production-Ready-Infrastructure---Incident-Response-Platform
一个展示 Azure 生产环境中端到端事件响应流程与基础设施运营体系的参考项目。
Stars: 0 | Forks: 0
# Azure 基础设施与事件响应平台
## 如何浏览此项目
在将本平台作为一个操作系统进行审查时,请遵循以下路径:
1. **架构与运营模型**
- `docs/handbook/README.md`
- `docs/handbook/architecture.md`
- `docs/handbook/operations.md`
2. **实时事件流(端到端可追溯性)**
- `docs/handbook/incidents.md`
- `incident-postmortem.md`
- `incident-complex.md`
- `corrective-actions.md`
3. **信号与证据链**
- `monitoring.md`
- `evidence/README.md`
- `evidence/log-analytics-query-results.md`
4. **可靠性成果**
- `operations-metrics.md`
- `slo-error-budget.md`
- `slo-month-analysis.md`
- `telemetry-trends.md`
快速面试演练:
- 从 `incident-postmortem.md` 开始,并跟随从告警 -> 日志 -> 修复 -> 后续事项的链接。
- 与 `evidence/README.md` 交叉核对以获取制品。
- 在 `operations-metrics.md` 和 SLO 文档中确认结果。
## 手册导航
主要文档整合于以下位置:
- `docs/handbook/README.md`
- `docs/handbook/architecture.md`
- `docs/handbook/operations.md`
- `docs/handbook/governance.md`
- `docs/handbook/incidents.md`
## 支持参考
- CI/CD 实现:`docs/terraform-github-actions.md`
- 事件与执行证据:`evidence/README.md`
- 运维手册:`runbooks/`
- 特定模块的技术说明:`modules/*/README.md`
标签:Azure, DevSecOps, EC2, ECS, GitHub Actions, IaC, IT治理, Log Analytics, SLO, SRE, Terraform, 上游代理, 云基础设施, 偏差过滤, 多云管理, 安全事故复盘, 安全运营, 扫描框架, 架构设计, 监控告警, 端到端追踪, 系统可靠性工程, 自动化运维, 自动笔记, 运行手册, 错误预算, 防御运维