whonikz/sre-oncall-copilot

GitHub: whonikz/sre-oncall-copilot

基于本地 RAG 架构的运维事件响应助手，帮助 on-call 工程师从团队 runbook 中快速检索并生成故障修复方案。

Stars: 0 | Forks: 0

# SRE On-call Copilot 一款面向 on-call 工程师的本地、基于 RAG 的突发事件响应助手。向它询问生产突发事件，它会检索相关的 runbook，并基于您自己的文档生成简明的修复计划。完全在本地运行，无需任何 API 密钥。 ## 技术栈 - **LangGraph** — 负责编排工作流（检索 -> 生成） - **Ollama** — 本地推理：llama3.1:8b（对话）+ nomic-embed-text（embedding） - **Qdrant** — 用于对 runbook 进行语义搜索的向量数据库 ## 工作原理 1. **摄入** — 将 markdown 格式的 runbook 拆分为多个部分，进行 embedding，并存储在 Qdrant 中。 2. **检索** — 对用户的问题进行 embedding，并通过余弦相似度找到最接近的 runbook 文本块。 3. **生成** — 将检索到的上下文传递给 LLM，由其编写有事实依据的回答。 ## 设置 ``` ollama pull llama3.1:8b ollama pull nomic-embed-text docker run -d -p 6333:6333 --name qdrant qdrant/qdrant python3 -m venv .venv source .venv/bin/activate pip install -r requirements.txt ``` ## 用法 ``` PYTHONPATH=src python3 -m copilot.cli ingest PYTHONPATH=src python3 -m copilot.cli ask "our payments service is very slow" ``` ## 项目结构 ``` src/copilot/ llm.py Ollama wrapper (embed + chat) vectorstore.py Qdrant wrapper ingest.py load and chunk runbooks graph.py LangGraph workflow cli.py command-line interface data/runbooks/ the knowledge base ```

标签：AI风险缓解, LangGraph, LLM评估, Ollama, Qdrant, RAG, SRE, 偏差过滤, 本地知识库, 请求拦截, 运维, 逆向工具