Deepakdeepak100/SRE---Copilot
GitHub: Deepakdeepak100/SRE---Copilot
SRE Copilot 是一款基于 Flask 和 Gemini API 构建的 Web 应用,通过实时系统指标监控、事件检测与 AI 故障排查帮助 DevOps/SRE 团队快速定位和解决基础设施问题。
Stars: 0 | Forks: 0
# SRE Copilot – AI 驱动的基础设施监控与事件响应助手
SRE Copilot 是一款专注于现代 DevOps/SRE 的 Web 应用程序,旨在监控系统健康状况、分析日志、检测事件,并利用 Gemini API 提供 AI 驱动的故障排除建议。
## 简历亮点
- **Linux 监控与 DevOps:** 实时跟踪系统指标(CPU、RAM、磁盘、网络)。
- **事件检测:** 基于阈值的自动化监控,用于识别资源激增。
- **日志分析:** 模拟 syslog 摄入,解析关键和警告事件。
- **AI 辅助故障排除:** 集成 Gemini API (`models/gemma-3-1b-it`),提供即时的根本原因分析和缓解步骤。
- **现代架构:** 采用 Python 3、Flask、SQLite、Docker 以及 Glassmorphism UI。
## 截图

*带有动态指标的实时监控仪表板。*

*基于 Gemini 的根本原因分析面板。*
## 架构图
```
graph TD
A[Frontend Dashboard] <-->|REST API| B(Flask Backend)
B --> C[psutil System Metrics]
B --> D[Log Reader]
B --> E[(SQLite Database)]
B <--> F[Gemini AI Assistant]
G[Background Scheduler] -->|Evaluates Thresholds| E
```
## 安装与设置
1. **克隆/导航至项目:**
确保您位于 `sre-copilot` 文件夹中。
2. **API Key 设置:**
已包含一个带有您的 `GEMINI_API_KEY` 的 `.env` 文件。如果需要更改,只需更新 `.env` 文件即可。
3. **本地运行(不使用 Docker):**
pip install -r requirements.txt
python app.py
*访问 http://localhost:5000 查看仪表板*
4. **使用 Docker 运行:**
docker-compose up --build
*访问 http://localhost:5000 查看仪表板*
## 功能列表
- **实时仪表板:** 使用 Chart.js 图表展示实时指标。
- **事件引擎:** 当 CPU > 80%、RAM > 85% 或磁盘 > 90% 时自动标记。
- **日志查看器:** 流式传输最近的日志并过滤出错误。
- **AI 故障排除:** 一个专用面板,将当前状态上下文发送给 Gemini AI,以接收可操作的 bash 命令和步骤。
标签:AI助手, Docker, Flask, SRE, 偏差过滤, 安全防御评估, 请求拦截, 运维, 逆向工具