ddelvalfraire/parakeet

GitHub: ddelvalfraire/parakeet

基于 Amazon Nova 多智能体协作的端到端事件响应平台,自动完成从告警分流、根因分析到修复建议与复盘报告的全流程。

Stars: 0 | Forks: 0

# Parakeet AI 驱动的事件响应系统,利用 Amazon Nova 智能体自动对生产事件进行分流、调查、诊断和修复。 **在线演示:** [parakeet.daves-wave.dev](https://parakeet.daves-wave.dev) ## 功能介绍 Parakeet 将五个专门的 AI 智能体串联成一个端到端的事件响应流水线: 1. **分流 (Triage)** — 根据严重程度 (P1-P4)、类别和标签对警报进行分类 2. **调查 (Investigation)** — 分析日志,绘制影响范围,估算用户影响 3. **根因分析 (Root Cause Analysis)** — 识别可能原因并给出置信度评分,检查类似的历史事件 4. **修复 (Remediation)** — 提出排序后的修复选项(回滚、热修复、缓解措施)并进行风险评估;可选开启一个包含修复的 GitHub PR 5. **复盘 (Retrospective)** — 在解决后生成无责备的事后分析报告 该流水线异步运行,并通过 WebSocket 提供实时更新,因此操作人员可以在浏览器中实时查看每个阶段的完成情况。在采取任何行动之前,人机交互审批步骤会对修复操作进行把关。 ## 技术栈 | 层级 | 技术 | |-------|-----------| | **后端** | Python, FastAPI, SQLAlchemy (async), SQLite | | **AI 智能体** | LangChain, OpenAI SDK, Amazon Nova 2 Lite via OpenRouter | | **相似性搜索** | Sentence Transformers (all-MiniLM-L6-v2), 余弦相似度 | | **前端** | React 19, React Router 7, Tailwind CSS 4, shadcn/ui, Recharts | | **实时通信** | WebSocket 支持自动重连 | | **部署** | Docker Compose, nginx 反向代理, Coolify | ## 系统架构 ``` Browser (React SPA) │ ├── REST API ──► FastAPI ──► Agent Pipeline │ │ │ │ │ ├── Triage Agent │ │ ├── Investigation Agent │ │ ├── Root Cause Agent │ │ ├── Remediation Agent (+ GitHub PR) │ │ └── Retro Agent │ │ └── WebSocket ◄────┘ (live stage updates) │ ├── SQLite (incidents, timeline, embeddings) └── GitHub API (demo PR creation) ``` ## 演示系统 来自 [Online Boutique](https://github.com/GoogleCloudPlatform/microservices-demo) 复刻分支的三个预设错误场景: | 场景 | 服务 | 语言 | 错误 | |----------|---------|----------|-----| | 统一运费 | shippingservice | Go | 传递给报价计算器的硬编码值为 0 | | 货币转换 | currencyservice | Node.js | 缺少验证导致 NaN 传播 | | 推荐服务崩溃 | recommendationservice | Python | `random.sample` 超出池大小 | 每个演示都会启动完整的流水线,如果配置了 GitHub 集成,修复智能体会读取代码仓库,找到错误,并开启一个包含修复的 PR。 ## 本地运行 ### 前置条件 - Python 3.12+, Node 22+, Poetry - OpenRouter API 密钥(或使用模拟模式) ### 后端 ``` cd api cp .env.example .env # add your OPENROUTER_API_KEY poetry install poetry run uvicorn app.main:app --reload ``` ### 前端 ``` cd frontend npm install npm run dev ``` ### 模拟模式(无 LLM 成本) 在 `.env` 中设置 `PARAKEET_MOCK_AGENTS=true`。模拟流水线返回具有现实延迟的、确定性的且上下文感知的响应。 ### Docker Compose ``` docker compose up --build ``` ## 项目结构 ``` api/ app/ agents/ # 5 LangChain agents with structured tools models/ # SQLAlchemy ORM (incidents, timeline, embeddings) routes/ # REST + WebSocket endpoints schemas/ # Pydantic request/response models services/ # Pipeline orchestration, GitHub, similarity search fixtures/ # Demo scenarios + seed data Dockerfile frontend/ src/ pages/ # Landing, Dashboard, IncidentDetail, Retrospective components/ # Incident cards, timeline, demo launcher hooks/ # WebSocket, polling api/ # HTTP + mock clients lib/ # Design tokens, utilities Dockerfile nginx.conf docker-compose.yml ``` ## 关键设计决策 - **每阶段一智能体架构** — 每个智能体都有单一职责和类型化的工具输出,使流水线可调试且可独立测试 - **事件溯源 (Event sourcing)** — 每个智能体决策都存储为不可变的时间轴事件,创建完整的审计追踪 - **模拟/真实双重性** — 通过单个环境变量,流水线可在模拟(确定性)和真实(LLM)智能体之间切换,从而在没有 token 消耗的情况下进行前端开发 - **基于 Embedding 的相似性** — 已解决的事件通过语义 embedding 进行索引,以便根因智能体可以参考类似的过去事件 - **人机交互 (Human-in-the-loop)** — 修复在采取任何行动之前需要操作员的明确批准
标签:AIOps, Amazon Nova, AV绕过, Docker, FastAPI, LangChain, Python, React, Syscalls, WebSocket, 事后复盘, 人工智能, 人机协同, 依赖分析, 告警分流, 安全防御评估, 故障诊断, 无后门, 智能修复, 根因分析, 生产事故, 用户模式Hook绕过, 自动化攻击, 自动化运维, 请求拦截, 轻量级, 逆向工具