Soumipal56/AlertForge

GitHub: Soumipal56/AlertForge

一个面向现代 SRE 团队的 AI 驱动型事件响应编排平台,通过实时协作作战室和智能复盘功能帮助企业更快解决故障。

Stars: 1 | Forks: 1

# 🛡️ AlertForge ### **铸就韧性。自动化响应。更快解决问题。** [![Hackathon](https://img.shields.io/badge/Hackathon-2026-blueviolet?style=for-the-badge&logo=react)](https://github.com/Soumipal56/AlertForge) [![构建状态](https://img.shields.io/badge/Status-Production--Grade-success?style=for-the-badge)](https://github.com/Soumipal56/AlertForge) [![技术栈](https://img.shields.io/badge/Stack-MERN%20+%20AI-cyan?style=for-the-badge)](https://github.com/Soumipal56/AlertForge) **AlertForge** 是一个生产级的 incident 管理与响应编排平台。专为现代工程团队设计,它弥合了基础设施监控与可操作性解决方案之间的鸿沟。凭借 AI 驱动的 postmortem、实时协作的“War Room”以及多渠道通知,AlertForge 确保您的团队将更少的时间花在慌乱搜索上,而将更多的时间用于解决问题。
## 🚀 核心功能 ### 🧠 **AI 驱动的 Postmortem (LangGraph)** 停止手动编写 incident 后报告。AlertForge 使用最先进的 **LangGraph pipeline** 来提取 incident 时间线、聊天记录和外部技术见解,从而在问题解决时自动生成高保真、无幻觉的 postmortem。 ### ⚔️ **实时“War Room”** 在实时且专用的环境中进行协作。功能包括: - **实时聊天与任务清单**:通过 Socket.IO 在所有响应者之间保持同步。 - **在线状态追踪**:实时查看究竟有谁正在进行调查。 - **自动时间线**:每个操作都会自动记录到不可变的审计跟踪中。 ### 📡 **多渠道 Alert 编排** 绝不错过任何关键脉搏。将 alert 动态路由至: - **Telegram** 和 **Discord** Webhook。 - **WhatsApp**(通过 Twilio)。 - **Email**(SMTP/Nodemailer)。 - 用于外部集成的 **Custom Webhook**。 ### 🏢 **企业级多租户支持** 严格的组织级别数据隔离。在一个统一的 dashboard 下管理多个团队、服务和环境,并配备强大的 Role-Based Access Control (RBAC)。 ### 📊 **Service Health Registry** 基础设施的统一目录。实时监控正常运行时间百分比,并查看 incident 对下游服务的级联影响。 ## 🛠️ 技术栈 ### **Frontend** - **核心**:React 19 + Vite(超快 HMR) - **样式**:Tailwind CSS 4 + Shadcn UI - **动画**:Framer Motion + GSAP(打造优质、交互式的 UI) - **认证**:Clerk(安全的用户管理) - **状态/数据**:Axios + Socket.io-client ### **Backend** - **服务器**:Node.js + Express 5 - **数据库**:MongoDB (Mongoose) + Redis (ioredis) - **实时通信**:Socket.IO 与 Redis Adapter(支持水平扩展) - **AI/ML**:LangChain + LangGraph + Mistral AI - **队列**:BullMQ,用于可靠的后台处理 ## 🏗️ 系统架构 AlertForge 遵循严格的**分层架构**,以确保可维护性和生产环境的稳定性。 ``` flowchart TD Client["User/SDK Client"] -- HTTP/Socket --> Auth["smartAuth Middleware"] Auth -- Verified --> RBAC["RBAC Middleware"] RBAC -- Authorized --> Controller["Controller Layer"] Controller -- Validate & Call --> Service["Service Layer (Orchestration)"] subgraph "The Orchestration Layer" Service -- Transactional --> DAO["DAO Layer"] DAO -- Query --> DB[("MongoDB")] Service -- Side Effect --> Timeline["Timeline Service"] Service -- Side Effect --> Socket["Socket Service (Real-time)"] Service -- Side Effect --> Notify["Notification Service"] Service -- Side Effect --> AI["LangGraph Postmortem"] end Service -- Response --> Controller Controller -- ApiResponse --> Client ``` ## 🚦 快速开始 ### **前置条件** - Node.js(v18+) - MongoDB 实例 - Redis 实例(推荐 Upstash) - API Key:Mistral AI, Twilio, Clerk, Tavily ### **安装说明** 1. **克隆仓库** git clone https://github.com/Soumipal56/AlertForge.git cd AlertForge/AlertForge/AlertForge 2. **设置 Backend** cd Backend npm install cp .env.example .env # 更新你的变量 npm run dev 3. **设置 Frontend** cd ../Frontend npm install cp .env.example .env # 更新你的变量 npm run dev ## 🛡️ 安全与性能 - **双模式认证**:在 Dashboard(Cookie)和 SDK(API Key)认证之间无缝切换。 - **分布式黑名单**:基于 Redis 的 JWT 失效机制,实现即时会话终止。 - **数据库索引**:优化的复合索引,实现 O(1) 级别的 dashboard 聚合。 - **原子操作**:MongoDB 事务确保了跨 incident 和时间线的数据完整性。 ## 📄 许可证 基于 ISC 许可证分发。更多信息请参见 `LICENSE`。
由 **Team AlertForge** 为 Hackathon 用 ❤️ 构建
“铸就 SRE 工具的未来。”
标签:AI智能体, AI生成报告, AI辅助, Discord集成, IT运维, LangGraph, MERN技术栈, MITM代理, Nodemailer, Socket.IO, Socks5代理, SRE, Telegram集成, Twilio, Webhook, WhatsApp集成, 事件管理, 事后分析, 企业级, 作战室, 偏差过滤, 力导向图, 告警编排, 告警路由, 多渠道告警, 安全生产, 实时协作, 审计追踪, 搜索引擎查询, 故障排除, 无线安全, 状态追踪, 站点可靠性工程, 自动化响应, 自定义脚本