eugenyefimov/Project-Azure-Production-Ready-Infrastructure---Incident-Response-Platform

GitHub: eugenyefimov/Project-Azure-Production-Ready-Infrastructure---Incident-Response-Platform

一个展示 Azure 生产环境中端到端事件响应流程与基础设施运营体系的参考项目。

Stars: 0 | Forks: 0

# Azure 基础设施与事件响应平台 ## 如何浏览此项目 在将本平台作为一个操作系统进行审查时,请遵循以下路径: 1. **架构与运营模型** - `docs/handbook/README.md` - `docs/handbook/architecture.md` - `docs/handbook/operations.md` 2. **实时事件流(端到端可追溯性)** - `docs/handbook/incidents.md` - `incident-postmortem.md` - `incident-complex.md` - `corrective-actions.md` 3. **信号与证据链** - `monitoring.md` - `evidence/README.md` - `evidence/log-analytics-query-results.md` 4. **可靠性成果** - `operations-metrics.md` - `slo-error-budget.md` - `slo-month-analysis.md` - `telemetry-trends.md` 快速面试演练: - 从 `incident-postmortem.md` 开始,并跟随从告警 -> 日志 -> 修复 -> 后续事项的链接。 - 与 `evidence/README.md` 交叉核对以获取制品。 - 在 `operations-metrics.md` 和 SLO 文档中确认结果。 ## 手册导航 主要文档整合于以下位置: - `docs/handbook/README.md` - `docs/handbook/architecture.md` - `docs/handbook/operations.md` - `docs/handbook/governance.md` - `docs/handbook/incidents.md` ## 支持参考 - CI/CD 实现:`docs/terraform-github-actions.md` - 事件与执行证据:`evidence/README.md` - 运维手册:`runbooks/` - 特定模块的技术说明:`modules/*/README.md`
标签:Azure, DevSecOps, EC2, ECS, GitHub Actions, IaC, IT治理, Log Analytics, SLO, SRE, Terraform, 上游代理, 云基础设施, 偏差过滤, 多云管理, 安全事故复盘, 安全运营, 扫描框架, 架构设计, 监控告警, 端到端追踪, 系统可靠性工程, 自动化运维, 自动笔记, 运行手册, 错误预算, 防御运维