redevops-io/edge-sentinel
GitHub: redevops-io/edge-sentinel
Edge Sentinel 是一个基于 OpenTelemetry 与 LLM agent 的开源边缘运维平台,旨在通过自主关联遥测信号、推理根因并执行可审计修复操作来缩短故障恢复时间。
Stars: 0 | Forks: 0
# Edge Sentinel
## 定位三要素
**痛点** — 边缘运维团队淹没在 dashboard、告警和 runbook 中。故障始于边缘,但需要人工关联日志、指标和 trace 才能采取行动。
**传统方案** — 现有的可观测性技术栈收集遥测数据,但止步于可视化。它们将诊断-决策-修复的闭环留给了运维人员,这既缓慢、容易出错,又无法规模化。
**reDevOps** — Edge Sentinel 闭环了这一流程。它将开源的遥测核心与由 LLM 驱动的 agent 层相结合,在边缘进行观察、推理和修复。
## Edge Sentinel 的作用
Edge Sentinel 是一个 open-core 运维平台,用于监控您的边缘基础设施,结合上下文理解故障,并采取安全、可审计的操作。它将原始遥测数据转化为运维决策,且无需替换您正在使用的现有工具。
## 价值主张
1. **通过自主分诊缩短 MTTR** — agent 会关联跨日志、指标和 trace 的信号,比人工调查更快地定位根本原因。
2. **减少告警疲劳** — 语义过滤和推理能够抑制噪声,仅针对可执行的问题进行升级处理。
3. **在边缘运行** — 轻量级组件在靠近工作负载的地方运行,即使在连接不稳定时也能做出决策。
4. **安全、可审计的自动化** — 每一个计划、审批和操作都会被记录并可供审查。
5. **基于开放标准构建** — OSS 核心使用 OpenTelemetry,确保您保留数据所有权并避免供应商锁定。
## 架构
```
┌─────────────────────────────────────────────┐
│ Agent Layer (Edge Sentinel) │
│ Planner ──► Critic ──► Actor ──► Memory │
│ LLM (OpenAI-compatible) │
└───────────────────────┬─────────────────────┘
│ control / events
┌───────────────────────▼─────────────────────┐
│ OSS Core (OpenTelemetry) │
│ Collector ──► Store ──► Alerting rules │
└─────────────────────────────────────────────┘
```
**OSS 核心**是一个 OpenTelemetry pipeline:collector 接收遥测数据,store 将其持久化,告警规则用于呈现异常。**agent 层**会处理这些异常,规划修复步骤,对其安全性进行审查,执行已批准的操作,并将结果记录到 memory 中。
## 快速开始
```
# 1. Clone 并进入 repo
git clone https://github.com/example/edge-sentinel.git
cd edge-sentinel
# 2. 复制并编辑环境变量
cp .env.example .env
# 使用你的 LLM credentials 和 OpenTelemetry endpoints 编辑 .env
# 3. 启动 stack
make up
# 4. 运行 test suite
make test
# 5. 查看 logs
make logs
```
## 许可证
请参阅 [LICENSE](./LICENSE)。
标签:Metaprompt, OPNsense, 告警关联, 智能运维, 本地大模型, 用户代理, 系统分析, 网络分析, 自动化响应, 边缘计算