Soumipal56/AlertForge
GitHub: Soumipal56/AlertForge
一个面向现代 SRE 团队的 AI 驱动型事件响应编排平台,通过实时协作作战室和智能复盘功能帮助企业更快解决故障。
Stars: 1 | Forks: 1
# 🛡️ AlertForge
### **铸就韧性。自动化响应。更快解决问题。**
[](https://github.com/Soumipal56/AlertForge)
[](https://github.com/Soumipal56/AlertForge)
[](https://github.com/Soumipal56/AlertForge)
**AlertForge** 是一个生产级的 incident 管理与响应编排平台。专为现代工程团队设计,它弥合了基础设施监控与可操作性解决方案之间的鸿沟。凭借 AI 驱动的 postmortem、实时协作的“War Room”以及多渠道通知,AlertForge 确保您的团队将更少的时间花在慌乱搜索上,而将更多的时间用于解决问题。
## 🚀 核心功能
### 🧠 **AI 驱动的 Postmortem (LangGraph)**
停止手动编写 incident 后报告。AlertForge 使用最先进的 **LangGraph pipeline** 来提取 incident 时间线、聊天记录和外部技术见解,从而在问题解决时自动生成高保真、无幻觉的 postmortem。
### ⚔️ **实时“War Room”**
在实时且专用的环境中进行协作。功能包括:
- **实时聊天与任务清单**:通过 Socket.IO 在所有响应者之间保持同步。
- **在线状态追踪**:实时查看究竟有谁正在进行调查。
- **自动时间线**:每个操作都会自动记录到不可变的审计跟踪中。
### 📡 **多渠道 Alert 编排**
绝不错过任何关键脉搏。将 alert 动态路由至:
- **Telegram** 和 **Discord** Webhook。
- **WhatsApp**(通过 Twilio)。
- **Email**(SMTP/Nodemailer)。
- 用于外部集成的 **Custom Webhook**。
### 🏢 **企业级多租户支持**
严格的组织级别数据隔离。在一个统一的 dashboard 下管理多个团队、服务和环境,并配备强大的 Role-Based Access Control (RBAC)。
### 📊 **Service Health Registry**
基础设施的统一目录。实时监控正常运行时间百分比,并查看 incident 对下游服务的级联影响。
## 🛠️ 技术栈
### **Frontend**
- **核心**:React 19 + Vite(超快 HMR)
- **样式**:Tailwind CSS 4 + Shadcn UI
- **动画**:Framer Motion + GSAP(打造优质、交互式的 UI)
- **认证**:Clerk(安全的用户管理)
- **状态/数据**:Axios + Socket.io-client
### **Backend**
- **服务器**:Node.js + Express 5
- **数据库**:MongoDB (Mongoose) + Redis (ioredis)
- **实时通信**:Socket.IO 与 Redis Adapter(支持水平扩展)
- **AI/ML**:LangChain + LangGraph + Mistral AI
- **队列**:BullMQ,用于可靠的后台处理
## 🏗️ 系统架构
AlertForge 遵循严格的**分层架构**,以确保可维护性和生产环境的稳定性。
```
flowchart TD
Client["User/SDK Client"] -- HTTP/Socket --> Auth["smartAuth Middleware"]
Auth -- Verified --> RBAC["RBAC Middleware"]
RBAC -- Authorized --> Controller["Controller Layer"]
Controller -- Validate & Call --> Service["Service Layer (Orchestration)"]
subgraph "The Orchestration Layer"
Service -- Transactional --> DAO["DAO Layer"]
DAO -- Query --> DB[("MongoDB")]
Service -- Side Effect --> Timeline["Timeline Service"]
Service -- Side Effect --> Socket["Socket Service (Real-time)"]
Service -- Side Effect --> Notify["Notification Service"]
Service -- Side Effect --> AI["LangGraph Postmortem"]
end
Service -- Response --> Controller
Controller -- ApiResponse --> Client
```
## 🚦 快速开始
### **前置条件**
- Node.js(v18+)
- MongoDB 实例
- Redis 实例(推荐 Upstash)
- API Key:Mistral AI, Twilio, Clerk, Tavily
### **安装说明**
1. **克隆仓库**
git clone https://github.com/Soumipal56/AlertForge.git
cd AlertForge/AlertForge/AlertForge
2. **设置 Backend**
cd Backend
npm install
cp .env.example .env # 更新你的变量
npm run dev
3. **设置 Frontend**
cd ../Frontend
npm install
cp .env.example .env # 更新你的变量
npm run dev
## 🛡️ 安全与性能
- **双模式认证**:在 Dashboard(Cookie)和 SDK(API Key)认证之间无缝切换。
- **分布式黑名单**:基于 Redis 的 JWT 失效机制,实现即时会话终止。
- **数据库索引**:优化的复合索引,实现 O(1) 级别的 dashboard 聚合。
- **原子操作**:MongoDB 事务确保了跨 incident 和时间线的数据完整性。
## 📄 许可证
基于 ISC 许可证分发。更多信息请参见 `LICENSE`。
由 **Team AlertForge** 为 Hackathon 用 ❤️ 构建
“铸就 SRE 工具的未来。”
“铸就 SRE 工具的未来。”
标签:AI智能体, AI生成报告, AI辅助, Discord集成, IT运维, LangGraph, MERN技术栈, MITM代理, Nodemailer, Socket.IO, Socks5代理, SRE, Telegram集成, Twilio, Webhook, WhatsApp集成, 事件管理, 事后分析, 企业级, 作战室, 偏差过滤, 力导向图, 告警编排, 告警路由, 多渠道告警, 安全生产, 实时协作, 审计追踪, 搜索引擎查询, 故障排除, 无线安全, 状态追踪, 站点可靠性工程, 自动化响应, 自定义脚本