roshancodingwala/AI-CloudGuard
GitHub: roshancodingwala/AI-CloudGuard
这是一个基于强化学习的交互式仿真环境,旨在训练 AI 智能体自动应对云基础设施中的故障与安全攻击。
Stars: 0 | Forks: 0
## title: AI CloudGuard
emoji: 🛡️
colorFrom: indigo
colorTo: cyan
sdk: docker
pinned: false
license: mit
short_description: 基于 RL 的自主云事件管理
# 🛡️ AI CloudGuard v2.0
**基于强化学习的自主云事件管理**
🔴 **Live Demo:** [https://ai-cloudguard.vercel.app/](https://ai-cloudguard.vercel.app/)
AI CloudGuard 是一个交互式 RL 环境,用于模拟真实世界的云基础设施事件。一个训练好的 agent 可以学会响应高 CPU、内存压力、DDoS 攻击和服务故障——所有这些都在实时仪表板中可视化。
## ✨ 功能
- 📊 **实时指标仪表板** — CPU、Memory、Network I/O、Latency、Req/sec、Disk I/O
- 🤖 **AI Auto-Agent** — RL agent 实时自主解决事件
- 💥 **攻击模拟** — 注入 DDoS 攻击和 CPU 峰值
- 📋 **事件历史** — 所有事件和 agent 响应的完整日志
- 🎯 **3 种难度模式** — Easy / Medium / Hard 任务目标
- 📈 **Live Chart** — 具有 35 点滚动窗口的实时 CPU 和 Memory 图表
## 🎮 Agent Actions
| Action | Description | Reward |
|--------|-------------|--------|
| `scale_server` | 将 CPU 负载降低 30 个单位 | +1.0 |
| `restart_server` | 将系统转换到恢复模式 | +0.5 |
| `ignore` | 未采取任何操作 | -1.0 |
## 🏆 任务
| Difficulty | Objective | Starting CPU |
|------------|-----------|-------------|
| Easy | 将 CPU 降低到 60% 以下 | 80% |
| Medium | 从事件状态恢复 | 75% |
| Hard | 恢复并将 CPU 降低到 40% 以下 | 90% |
## 🏗️ 架构
```
AI-CloudGuard/
├── backend/
│ ├── app.py # Flask API server
│ ├── environment.py # RL environment (CloudIncidentEnv)
│ ├── agent.py # RL agent logic
│ ├── grader.py # Task grading
│ └── tasks.py # Task definitions
├── frontend/
│ ├── index.html # Dashboard UI
│ ├── style.css # Styling
│ └── script.js # Frontend logic & API calls
├── Dockerfile # HF Spaces / Docker deployment
└── requirements.txt
```
## 📡 API 端点
| Method | Endpoint | Description |
|--------|----------|-------------|
| GET | `/state` | 当前环境状态 |
| GET | `/reset?task=easy` | 重置环境 |
| POST | `/step` | 执行一个动作 |
| GET | `/incidents` | 事件历史 |
| POST | `/simulate/ddos` | 模拟 DDoS 攻击 |
| POST | `/simulate/spike` | 模拟 CPU 峰值 |
| POST | `/auto-agent/start` | 启动 AI auto-agent |
| GET | `/auto-agent/status` | Agent 状态与日志 |
标签:AIOps, Apex, DDoS防御, DNS解析, Docker, Flask, NIDS, RL环境, 云计算, 人工智能, 多模态安全, 安全防御评估, 实时仪表盘, 容器化, 开源项目, 强化学习, 攻击模拟, 故障自愈, 数据可视化, 智能运维, 机器学习, 用户模式Hook绕过, 网络安全, 自动化运维, 规则引擎, 请求拦截, 逆向工具, 隐私保护, 驱动签名利用