0xSaksham/cf_ai_aura-ops
GitHub: 0xSaksham/cf_ai_aura-ops
一个基于 Cloudflare 边缘原生架构的原子化事件检测与调试协动引擎,解决分布式日志的实时分析与快速修复问题。
Stars: 0 | Forks: 0
# Aura-Ops: 边缘原生事件协程
**Aura-Ops** 是一个有状态、边缘原生的事件检测与调试引擎。完全基于 **Cloudflare Workers** 和 **Durable Objects** 构建,它将可观测性从集中式、高延迟的模型转变为边缘端的原子化、近零延迟架构。
## ⚡ 30 秒快速体验(实时演示)
在不触碰终端的情况下,查看 **Durable Object** 状态协调与 **Workers AI** 分析的实际效果:
1. **触发事件:** [**点击此处模拟 auth-api 的 6 次错误故障**](https://cf_ai_aura-ops.sakshamgupta-ai.workers.dev/simulate/auth-api)
* **逻辑:** 该程序会发送 6 条日志,触发异常阈值,并立即调用 AI SRE 分析。
2. **与引擎对话:** 使用聊天端点向协程询问系统状态:
```bash
curl -X POST https://cf_ai_aura-ops.sakshamgupta-ai.workers.dev/chat/auth-api \
-H "Content-Type: application/json" \
-d '{"message": "auth-api 发生了什么?我该如何修复?"}'
```
## 🏗️ 架构
Aura-Ops 避免了“与 PDF 聊天”的陷阱,将 AI 视为分布式系统中的*确定性组件*。
```
graph TD
A[Logs API Ingest] -->|Route to DO| B(Incident Engine - Durable Object)
B -->|State Management| C{Anomaly Detector}
C -->|Trigger| D[Workers AI - Llama 3.1]
D -->|Contextual Analysis| E[Active Incident State]
E -->|API / Chat| F[Aura-Ops Copilot]
```
### 核心创新
* **原子化状态协调:** 使用 **Durable Objects** 维护每个服务的独立事件状态。这确保了日志聚合的一致性,即使在全局分布式环境中也避免了竞态条件。
* **边缘原生智能:** 逻辑与 AI 推理在与传入日志相同的 Cloudflare 边缘节点(PoP)内完成,消除了跨区域出口延迟。
* **类型严格的基础设施:** 采用严格的 TypeScript 契约(无 `any`),体现了生产级系统工程的严谨性。
## 🛠️ 概念验证(PoC)
该引擎通过接收原始日志、执行异常检测,并触发 Workers AI 协程以提供可操作的修复方案,实现实时事件处理。
### 1. 事件检测与分析

### 2. 上下文感知 AI 聊天(RAG)
通过 Bruno 发送(请参见 `tests/` 文件夹中的集合):

## 🚀 快速开始
1. **安装依赖:**
```bash
bun install
```
2. **部署:**
```bash
bun run deploy
```
3. **项目文档:**
* **[工程日志与 AI 提示词](./PROMPTS.md)**:包含架构决策、AI 提示词及调试难题(如 TLS 握手不匹配、流消费修复)的详细记录。
## 🛤️ 路线图与未来改进
Aura-Ops 是一个高性能的概念验证(PoC)。未来的架构升级包括:
1. **持久化存储钩子:** 集成 **R2** 以归档事件快照,便于长期审计追踪。
2. **告警集成:** 构建专用的 `webhooks` 服务,将 `active` 告警推送到 Slack/PagerDuty。
3. **向量存储集成:** 利用 **Vectorize** 对历史日志执行 RAG,实现长期模式识别。
## ⚖️ 技术栈
- **Cloudflare Workers**(计算)
- **Durable Objects**(有状态内存)
- **Workers AI**(Llama 3.1-8b-instruct)
- **Hono**(路由)
- **TypeScript**(安全性)
由 [Saksham Gupta](https://github.com/0xsaksham) 倾情构建 ❤️
标签:AI 辅助调试, Durable Objects, SEO 事件调试, SEO 无服务器, SEO 边缘计算, SRE 工具, TypeScript, Workers AI, 事件检测, 低延迟架构, 全局状态, 分布式系统, 原子操作, 响应大小分析, 在线演示, 安全插件, 实时异常检测, 日志聚合, 状态协调, 程序员工具, 类型安全, 聊天接口, 自动化攻击, 边缘 AI 推理, 边缘原生, 边缘计算