roshancodingwala/AI-CloudGuard

GitHub: roshancodingwala/AI-CloudGuard

这是一个基于强化学习的交互式仿真环境,旨在训练 AI 智能体自动应对云基础设施中的故障与安全攻击。

Stars: 0 | Forks: 0

## title: AI CloudGuard emoji: 🛡️ colorFrom: indigo colorTo: cyan sdk: docker pinned: false license: mit short_description: 基于 RL 的自主云事件管理 # 🛡️ AI CloudGuard v2.0 **基于强化学习的自主云事件管理** 🔴 **Live Demo:** [https://ai-cloudguard.vercel.app/](https://ai-cloudguard.vercel.app/) AI CloudGuard 是一个交互式 RL 环境,用于模拟真实世界的云基础设施事件。一个训练好的 agent 可以学会响应高 CPU、内存压力、DDoS 攻击和服务故障——所有这些都在实时仪表板中可视化。 ## ✨ 功能 - 📊 **实时指标仪表板** — CPU、Memory、Network I/O、Latency、Req/sec、Disk I/O - 🤖 **AI Auto-Agent** — RL agent 实时自主解决事件 - 💥 **攻击模拟** — 注入 DDoS 攻击和 CPU 峰值 - 📋 **事件历史** — 所有事件和 agent 响应的完整日志 - 🎯 **3 种难度模式** — Easy / Medium / Hard 任务目标 - 📈 **Live Chart** — 具有 35 点滚动窗口的实时 CPU 和 Memory 图表 ## 🎮 Agent Actions | Action | Description | Reward | |--------|-------------|--------| | `scale_server` | 将 CPU 负载降低 30 个单位 | +1.0 | | `restart_server` | 将系统转换到恢复模式 | +0.5 | | `ignore` | 未采取任何操作 | -1.0 | ## 🏆 任务 | Difficulty | Objective | Starting CPU | |------------|-----------|-------------| | Easy | 将 CPU 降低到 60% 以下 | 80% | | Medium | 从事件状态恢复 | 75% | | Hard | 恢复并将 CPU 降低到 40% 以下 | 90% | ## 🏗️ 架构 ``` AI-CloudGuard/ ├── backend/ │ ├── app.py # Flask API server │ ├── environment.py # RL environment (CloudIncidentEnv) │ ├── agent.py # RL agent logic │ ├── grader.py # Task grading │ └── tasks.py # Task definitions ├── frontend/ │ ├── index.html # Dashboard UI │ ├── style.css # Styling │ └── script.js # Frontend logic & API calls ├── Dockerfile # HF Spaces / Docker deployment └── requirements.txt ``` ## 📡 API 端点 | Method | Endpoint | Description | |--------|----------|-------------| | GET | `/state` | 当前环境状态 | | GET | `/reset?task=easy` | 重置环境 | | POST | `/step` | 执行一个动作 | | GET | `/incidents` | 事件历史 | | POST | `/simulate/ddos` | 模拟 DDoS 攻击 | | POST | `/simulate/spike` | 模拟 CPU 峰值 | | POST | `/auto-agent/start` | 启动 AI auto-agent | | GET | `/auto-agent/status` | Agent 状态与日志 |
标签:AIOps, Apex, DDoS防御, DNS解析, Docker, Flask, NIDS, RL环境, 云计算, 人工智能, 多模态安全, 安全防御评估, 实时仪表盘, 容器化, 开源项目, 强化学习, 攻击模拟, 故障自愈, 数据可视化, 智能运维, 机器学习, 用户模式Hook绕过, 网络安全, 自动化运维, 规则引擎, 请求拦截, 逆向工具, 隐私保护, 驱动签名利用