Nasir-ux1/ai-sre-agent
GitHub: Nasir-ux1/ai-sre-agent
AI-SRE:自动化Linux故障排除代理
Stars: 1 | Forks: 0
# AI-SRE:自主Linux故障排除代理 🛡️
AI-SRE 是一个高信号、高端、本地运行的诊断代理,它自动化事件响应、诊断系统故障,并推荐安全、经过审核的 Bash 解决脚本。
## 🚀 关键特性
* **结构化诊断工具:** 执行真实系统分析的 Python 工具(磁盘指标、Systemd 循环、网络套接字绑定、进程消耗者)。
* **API & 模拟推理循环:** 使用 **Google Gemini** 或 **OpenAI** API 运行实时代理链,或使用 **模拟交互式 SRE 模式** 离线执行。
* **惊人的界面:** 美丽的交互式 Streamlit Web 仪表板和多彩的命令行界面 (`rich` 渲染的 CLI)。
## 🏗️ 架构设计
```
graph TD
User([User Issue Query]) --> UI[Streamlit / CLI UI]
UI --> Agent[AI-SRE Reasoning Agent]
Agent --> Mock[Interactive Mock Simulator]
Agent --> LLM[Google Gemini / OpenAI Client]
Agent --> Registry[SRE Tools Registry]
Registry --> Disk[Disk Audit df -h]
Registry --> Systemd[Systemctl Services failed]
Registry --> Port[Socket Listeners ss/netstat]
Agent --> Analysis[Root Cause & Safe Bash Fix]
Analysis --> User
```
## 🛠️ 入门指南
### 1. 安装依赖项
```
pip install -r requirements.txt
```
### 2. 配置环境(可选,用于 API 密钥)
在根目录中创建一个 `.env` 文件:
```
GEMINI_API_KEY=your_gemini_key
# 或者
OPENAI_API_KEY=your_openai_key
```
### 3. 启动界面
* **运行 Streamlit Web UI:**
streamlit run app.py
* **运行交互式 CLI:**
python cli.py
标签:API集成, Kubernetes, Linux系统, Python开发, Rich CLI, SRE, Streamlit, 交互式界面, 人工智能, 偏差过滤, 可观测性, 故障响应, 故障诊断, 用户模式Hook绕过, 系统分析, 系统分析, 系统性能, 网络分析, 网络分析, 脚本自动化, 自动化运维, 访问控制, 逆向工具