Nasir-ux1/ai-sre-agent

GitHub: Nasir-ux1/ai-sre-agent

AI-SRE:自动化Linux故障排除代理

Stars: 1 | Forks: 0

# AI-SRE:自主Linux故障排除代理 🛡️ AI-SRE 是一个高信号、高端、本地运行的诊断代理,它自动化事件响应、诊断系统故障,并推荐安全、经过审核的 Bash 解决脚本。 ## 🚀 关键特性 * **结构化诊断工具:** 执行真实系统分析的 Python 工具(磁盘指标、Systemd 循环、网络套接字绑定、进程消耗者)。 * **API & 模拟推理循环:** 使用 **Google Gemini** 或 **OpenAI** API 运行实时代理链,或使用 **模拟交互式 SRE 模式** 离线执行。 * **惊人的界面:** 美丽的交互式 Streamlit Web 仪表板和多彩的命令行界面 (`rich` 渲染的 CLI)。 ## 🏗️ 架构设计 ``` graph TD User([User Issue Query]) --> UI[Streamlit / CLI UI] UI --> Agent[AI-SRE Reasoning Agent] Agent --> Mock[Interactive Mock Simulator] Agent --> LLM[Google Gemini / OpenAI Client] Agent --> Registry[SRE Tools Registry] Registry --> Disk[Disk Audit df -h] Registry --> Systemd[Systemctl Services failed] Registry --> Port[Socket Listeners ss/netstat] Agent --> Analysis[Root Cause & Safe Bash Fix] Analysis --> User ``` ## 🛠️ 入门指南 ### 1. 安装依赖项 ``` pip install -r requirements.txt ``` ### 2. 配置环境(可选,用于 API 密钥) 在根目录中创建一个 `.env` 文件: ``` GEMINI_API_KEY=your_gemini_key # 或者 OPENAI_API_KEY=your_openai_key ``` ### 3. 启动界面 * **运行 Streamlit Web UI:** streamlit run app.py * **运行交互式 CLI:** python cli.py
标签:API集成, Kubernetes, Linux系统, Python开发, Rich CLI, SRE, Streamlit, 交互式界面, 人工智能, 偏差过滤, 可观测性, 故障响应, 故障诊断, 用户模式Hook绕过, 系统分析, 系统分析, 系统性能, 网络分析, 网络分析, 脚本自动化, 自动化运维, 访问控制, 逆向工具