navy14-code/AeroSRE---Autonomous-Incident-Response-Swarm

GitHub: navy14-code/AeroSRE---Autonomous-Incident-Response-Swarm

AeroSRE 是一个基于多智能体协作的自动化 SRE 系统,能够从监控告警出发自主完成日志摄取、根因分析与代码补丁生成,帮助运维团队加速故障响应和修复流程。

Stars: 0 | Forks: 0

# 🚀 AeroSRE - 自主事件响应集群 AeroSRE 是一个实验性的多智能体 AI 系统,旨在自动化 Site Reliability Engineering (SRE) 任务。它能够自主摄取生产日志,识别根本原因,编写补丁,并在沙盒环境中对它们进行验证。 ## 🧠 核心架构 - **Agent A (Observer):** 挂钩到 Datadog/Prometheus 流。 - **Agent B (Contextualizer):** 基于 RAG 的 GitHub 仓库上下文检索。 - **Agent C (Fixer):** 使用 LLM 生成并验证代码补丁。 ## ⚙️ 快速入门 \`\`\`bash pip install -r requirements.txt cp .env.example .env # 将你的 API 密钥 (MiMo, Datadog, GitHub) 添加到 .env 中 python agent_orchestrator.py \`\`\`
标签:AIOps, AI智能体, API集成, Datadog, DLL 劫持, IT运维, LLM, PyRIT, Python, RAG, Socks5代理, SRE, Unmanaged PE, 人工智能, 代码补丁, 偏差过滤, 可观测性, 多智能体系统, 大语言模型, 开源框架, 异常检测, 持续集成, 故障自愈, 无后门, 根因分析, 检索增强生成, 沙箱测试, 用户模式Hook绕过, 站点可靠性工程, 自动修复, 自动化运维, 自定义请求头, 逆向工具