Nani-Pasupuleti/cloud-incident-response-env
GitHub: Nani-Pasupuleti/cloud-incident-response-env
基于 OpenEnv 框架构建的云事件响应仿真环境,用于训练和评估 AI 智能体处理服务崩溃、磁盘故障及安全入侵等 SRE 问题的能力。
Stars: 0 | Forks: 0
# 云事件响应环境
**开发者:** Nani Pasupuleti
该项目是专为 Meta PyTorch OpenEnv Hackathon 设计的云服务器事件真实模拟。它挑战 AI 智能体扮演站点可靠性工程师 (SRE),以解决关键基础设施问题。
## 场景
1. **简单:** Nginx Web 服务器崩溃恢复。
2. **中等:** 磁盘压力导致数据库故障(需要多步解决)。
3. **困难:** 安全漏洞及恶意进程(需要识别与修补)。
## 技术栈
- **框架:** OpenEnv
- **逻辑:** Python / Pydantic
- **部署:** Docker / Hugging Face Spaces
- **智能体:** LLM 驱动的推理脚本 (Llama-3.1-70B)
## 设置与本地测试
1. `pip install -r requirements.txt`
2. 启动环境:`python -m uvicorn server.app:app --host 0.0.0.0 --port 8000`
3. 运行 AI 智能体:`python inference.py`
标签:AIOps, CISA项目, DLL 劫持, Docker, HTTP工具, Llama-3, Meta, Nginx, OpenEnv, Python, PyTorch, Site Reliability Engineering, SRE, 人工智能, 偏差过滤, 大语言模型, 安全漏洞, 安全防御评估, 强化学习, 恶意进程检测, 故障模拟, 无后门, 服务崩溃, 用户模式Hook绕过, 磁盘管理, 系统恢复, 网络安全审计, 请求拦截, 运维自动化, 逆向工具, 黑客马拉松