Mohan006007/aiops-platform-aws

GitHub: Mohan006007/aiops-platform-aws

基于AWS的生产级AIOps平台参考架构,融合Kubernetes、机器学习异常检测与事件驱动自动化,实现从实时监控到智能自愈的全链路可观测性。

Stars: 0 | Forks: 0

基于 AWS 构建的生产级 AIOps 平台,使用 Kubernetes (EKS)、Prometheus、Grafana 和 SageMaker。 功能: - 部署在 EKS 上的容器化微服务 - 使用 Prometheus + Grafana 进行实时监控 - 使用 SageMaker (Random Cut Forest) 进行基于机器学习的异常检测 - 使用 Kinesis 和 Lambda 构建的事件驱动 pipeline - 通过 SNS 和 chatbot 集成实现自动化告警 - 使用 GitHub Actions 的 CI/CD pipeline - 使用 AWS Cost Explorer API 进行成本异常检测 - 使用 Route53 实现多区域故障转移 旨在模拟真实的 DevOps/SRE 工作流,具备 AI 驱动的可观测性与自动化能力。 从指标到智能:构建自愈型云系统。
标签:AIOps平台, Apex, API集成, AWS, AWS Cost Explorer, AWS Kinesis, AWS Lambda, ChatOps, DPI, EKS, GitHub Actions, Grafana, NIDS, Route53, SageMaker, SNS, SRE, WSL, 事件驱动架构, 云成本管理, 偏差过滤, 可观测性, 多区域容灾, 子域名突变, 容器化, 异常检测, 微服务架构, 成本优化, 智能化运维, 机器学习, 自动化告警, 自动化运维, 自动笔记, 自定义请求头, 自愈系统, 请求拦截, 逆向工具, 随机森林截断算法(RCF), 高可用架构