redevops-io/edge-sentinel

GitHub: redevops-io/edge-sentinel

Edge Sentinel 是一个基于 OpenTelemetry 与 LLM agent 的开源边缘运维平台,旨在通过自主关联遥测信号、推理根因并执行可审计修复操作来缩短故障恢复时间。

Stars: 0 | Forks: 0

# Edge Sentinel ## 定位三要素 **痛点** — 边缘运维团队淹没在 dashboard、告警和 runbook 中。故障始于边缘,但需要人工关联日志、指标和 trace 才能采取行动。 **传统方案** — 现有的可观测性技术栈收集遥测数据,但止步于可视化。它们将诊断-决策-修复的闭环留给了运维人员,这既缓慢、容易出错,又无法规模化。 **reDevOps** — Edge Sentinel 闭环了这一流程。它将开源的遥测核心与由 LLM 驱动的 agent 层相结合,在边缘进行观察、推理和修复。 ## Edge Sentinel 的作用 Edge Sentinel 是一个 open-core 运维平台,用于监控您的边缘基础设施,结合上下文理解故障,并采取安全、可审计的操作。它将原始遥测数据转化为运维决策,且无需替换您正在使用的现有工具。 ## 价值主张 1. **通过自主分诊缩短 MTTR** — agent 会关联跨日志、指标和 trace 的信号,比人工调查更快地定位根本原因。 2. **减少告警疲劳** — 语义过滤和推理能够抑制噪声,仅针对可执行的问题进行升级处理。 3. **在边缘运行** — 轻量级组件在靠近工作负载的地方运行,即使在连接不稳定时也能做出决策。 4. **安全、可审计的自动化** — 每一个计划、审批和操作都会被记录并可供审查。 5. **基于开放标准构建** — OSS 核心使用 OpenTelemetry,确保您保留数据所有权并避免供应商锁定。 ## 架构 ``` ┌─────────────────────────────────────────────┐ │ Agent Layer (Edge Sentinel) │ │ Planner ──► Critic ──► Actor ──► Memory │ │ LLM (OpenAI-compatible) │ └───────────────────────┬─────────────────────┘ │ control / events ┌───────────────────────▼─────────────────────┐ │ OSS Core (OpenTelemetry) │ │ Collector ──► Store ──► Alerting rules │ └─────────────────────────────────────────────┘ ``` **OSS 核心**是一个 OpenTelemetry pipeline:collector 接收遥测数据,store 将其持久化,告警规则用于呈现异常。**agent 层**会处理这些异常,规划修复步骤,对其安全性进行审查,执行已批准的操作,并将结果记录到 memory 中。 ## 快速开始 ``` # 1. Clone 并进入 repo git clone https://github.com/example/edge-sentinel.git cd edge-sentinel # 2. 复制并编辑环境变量 cp .env.example .env # 使用你的 LLM credentials 和 OpenTelemetry endpoints 编辑 .env # 3. 启动 stack make up # 4. 运行 test suite make test # 5. 查看 logs make logs ``` ## 许可证 请参阅 [LICENSE](./LICENSE)。
标签:Metaprompt, OPNsense, 告警关联, 智能运维, 本地大模型, 用户代理, 系统分析, 网络分析, 自动化响应, 边缘计算