kratosvil/sao-platform
GitHub: kratosvil/sao-platform
SAO Platform 是一个在 AWS VPC 内完全闭环的 AI 驱动事件响应平台,通过知识图谱与大模型推理实现从告警到修复的自动化闭环。
Stars: 0 | Forks: 0
# SAO Platform — 主权代理操作
面向 AWS 基础设施的 AI 驱动自动化事件响应。
零出站流量。知识图谱上下文。始终由人工介入。
## 功能
当 CloudWatch 警报触发时,SAO 会:
1. 读取**数字孪生上下文映射**(基于 Terraform state 构建的基础设施图谱)
2. 结合完整的上下文进行推理——拓扑、指标、日志、历史记录和约束条件
3. 提供包含确切命令的修复建议
4. 通过 Slack 等待人工审批
5. 执行已批准的操作并更新图谱
**成本:** 每次事件约 $0.09–$0.19。**时间:** 从检测到修复不到 10 分钟。
## 系统架构
```
CloudWatch Alarm
→ Lambda Collector (builds context from tfstate + CloudWatch)
→ MCP Server (queries graph + calls Bedrock)
→ Claude Sonnet (reasons, proposes fix)
→ HITL Gateway (Slack approval)
→ MCP Server (executes via boto3/kubectl/terraform)
→ Graph Store (updates precedents)
```
## 模块
| 模块 | 描述 |
|--------|-------------|
| `mcp-server/` | FastMCP 服务器 — 编排器 |
| `lambda-collector/` | 基于 tfstate + CloudWatch 填充数字孪生 |
| `terraform/` | SAO 平台自身的基础设施 |
| `docs/` | 数字孪生 schema 与架构文档 |
## 许可证
[商业源代码许可证 1.1](LICENSE) — 供内部/非商业用途免费使用。
商业用途需要获取授权:kratosvill@gmail.com
标签:AIOps, AI自动化, AI运维, Amazon Bedrock, Amazon Web Services, AWS, boto3, Claude Sonnet, CloudWatch, DevSecOps, DLL 劫持, DPI, EC2, ECS, FastMCP, HITL, IaC, kubectl, Lambda, MCP Server, Pandas, PrivateLink, Python, Serverless, Slack集成, SRE, Terraform, VPC隔离, Zero-egress, 上游代理, 人机协同, 偏差过滤, 告警处理, 大语言模型, 成本优化, 数字孪生, 无后门, 模块化设计, 自主事件响应, 自动化修复, 逆向工具, 零出口网络