redis-applied-ai/redis-sre-agent

GitHub: redis-applied-ai/redis-sre-agent

基于LangGraph的Redis运维AI助手,结合知识库与实时监控数据实现智能故障分诊和运维问答

Stars: 3 | Forks: 3

# 🧑‍🚒 Redis SRE Agent 一个基于 LangGraph 的 Redis SRE Agent,用于智能基础设施监控和事件响应。 📖 欲了解更多详情,请查阅我们的[文档](https://redis-applied-ai.github.io/redis-sre-agent/)。 ## 概述 Redis SRE Agent 是 Redis 运维的 AI 队友。它利用您的知识库回答问题,并主动对实时的 Redis 问题进行分诊。它可以轻松定制以适应您的监控和可观测性系统。 - 利用您的 Runbook 和 Redis 文档回答问题 - 通过从指标、日志和诊断工具收集信号,对 Redis 实例的问题进行分诊,并推荐修复方案 - 完全异步:作为通过 CLI/API 触发或按计划运行的异步任务执行 - 集成:通过提供商(Prometheus、Grafana、Loki 等)接入您自己的监控/工单系统 ## 架构 **流程**:API/CLI → 后台任务 → LangGraph Agent → SRE Tools → Redis/监控系统 → 大语言模型 → 响应作为任务结果 ## 快速开始 ### 前置条件 - Python 3.12+, Redis 8+ 或带有 RediSearch 模块的 7.x,`uv` 包管理器 - OpenAI API 密钥或兼容 OpenAI 的代理 - 可选:用于监控集成的 Prometheus、Loki 和 Grafana 访问权限 ### 开发环境设置 ``` # Clone 和 setup git clone cd redis-sre-agent # Install dependencies uv sync # Environment setup cp .env.example .env # 编辑 .env 填入 API keys 和 configuration # 启动 Redis 8 docker run -d -p 7843:6379 redis:8-alpine # 启动 worker uv run redis-sre-agent worker # 启动 API uv run uvicorn redis_sre_agent.api.app:app --host 0.0.0.0 --port 8000 --reload ``` ### 使用方法 **API**: ``` # Detailed health check curl http://localhost:8000/api/v1/health # 提交 triage request (返回 task_id 和 thread_id) curl -X POST http://localhost:8000/api/v1/tasks \\ -H "Content-Type: application/json" \\ -d '{"message": "Check Redis cluster health and memory usage", "context": {"instance_id": ""}}' # Check task status curl http://localhost:8000/api/v1/tasks/{task_id} ``` ## SRE Tools 该 Agent 使用**可扩展的工具系统**,为不同的 SRE 能力提供接口。 有关添加集成和自定义提供商的详细信息,请参阅 [Tool Providers](docs/how-to/tool-providers.md)。 ## 项目状态 🚧 **开发中** - 核心基础设施和基础 Agent 工作流正在进行中。 基于 FastAPI、LangGraph、RedisVL 和 Docket 构建,实现可靠的 SRE 自动化。 ## 许可证 本软件受以下任一许可证管辖: the Redis Source Available License v2 (RSALv2);或 the Server Side Public License v1 (SSPLv1);或 the GNU Affero General Public License v3 (AGPLv3)。详情请参阅 [LICENSE.txt](LICENSE.txt)。
标签:AIOps, API服务, API集成, DLL 劫持, Docker, Grafana, LangGraph, Loki, PE 加载器, Python, RAG, Redis, Runbook自动化, SRE, 偏差过滤, 可观测性, 告警分流, 基础设施监控, 大语言模型, 安全防御评估, 异步任务, 搜索引擎查询, 故障诊断, 数据库运维, 无后门, 智能运维, 知识库问答, 站点可靠性工程, 自定义请求头, 请求拦截, 运维机器人, 逆向工具