Deepakdeepak100/SRE---Copilot

GitHub: Deepakdeepak100/SRE---Copilot

SRE Copilot 是一款基于 Flask 和 Gemini API 构建的 Web 应用,通过实时系统指标监控、事件检测与 AI 故障排查帮助 DevOps/SRE 团队快速定位和解决基础设施问题。

Stars: 0 | Forks: 0

# SRE Copilot – AI 驱动的基础设施监控与事件响应助手 SRE Copilot 是一款专注于现代 DevOps/SRE 的 Web 应用程序,旨在监控系统健康状况、分析日志、检测事件,并利用 Gemini API 提供 AI 驱动的故障排除建议。 ## 简历亮点 - **Linux 监控与 DevOps:** 实时跟踪系统指标(CPU、RAM、磁盘、网络)。 - **事件检测:** 基于阈值的自动化监控,用于识别资源激增。 - **日志分析:** 模拟 syslog 摄入,解析关键和警告事件。 - **AI 辅助故障排除:** 集成 Gemini API (`models/gemma-3-1b-it`),提供即时的根本原因分析和缓解步骤。 - **现代架构:** 采用 Python 3、Flask、SQLite、Docker 以及 Glassmorphism UI。 ## 截图 ![Dashboard](https://static.pigsec.cn/wp-content/uploads/repos/2026/06/f32693e5f9013540.png) *带有动态指标的实时监控仪表板。* ![AI Assistant](https://static.pigsec.cn/wp-content/uploads/repos/2026/06/dca9228cf7013547.png) *基于 Gemini 的根本原因分析面板。* ## 架构图 ``` graph TD A[Frontend Dashboard] <-->|REST API| B(Flask Backend) B --> C[psutil System Metrics] B --> D[Log Reader] B --> E[(SQLite Database)] B <--> F[Gemini AI Assistant] G[Background Scheduler] -->|Evaluates Thresholds| E ``` ## 安装与设置 1. **克隆/导航至项目:** 确保您位于 `sre-copilot` 文件夹中。 2. **API Key 设置:** 已包含一个带有您的 `GEMINI_API_KEY` 的 `.env` 文件。如果需要更改,只需更新 `.env` 文件即可。 3. **本地运行(不使用 Docker):** pip install -r requirements.txt python app.py *访问 http://localhost:5000 查看仪表板* 4. **使用 Docker 运行:** docker-compose up --build *访问 http://localhost:5000 查看仪表板* ## 功能列表 - **实时仪表板:** 使用 Chart.js 图表展示实时指标。 - **事件引擎:** 当 CPU > 80%、RAM > 85% 或磁盘 > 90% 时自动标记。 - **日志查看器:** 流式传输最近的日志并过滤出错误。 - **AI 故障排除:** 一个专用面板,将当前状态上下文发送给 Gemini AI,以接收可操作的 bash 命令和步骤。
标签:AI助手, Docker, Flask, SRE, 偏差过滤, 安全防御评估, 请求拦截, 运维, 逆向工具