ajafri-123/ai-ops-copilot
GitHub: ajafri-123/ai-ops-copilot
一个多租户 AI 智能运维平台,将分散告警关联聚合为事件并利用 GPT-4o-mini 实时生成根因分析和修复建议,帮助值班工程师快速定位和解决问题。
Stars: 0 | Forks: 0
# AI 运维 Copilot
[](https://ai-ops-copilot-eta.vercel.app)
[](https://nextjs.org)
[](https://react.dev)
[](https://fastapi.tiangolo.com)
[](https://python.org)
[](LICENSE)
## 🚀 实时演示
**▶ [ai-ops-copilot-eta.vercel.app](https://ai-ops-copilot-eta.vercel.app)**
点击 **"Launch live demo"** —— 无需注册。部署的构建版本运行着一个自包含的 **演示模式**:
告警和事件会在客户端进行预加载,一个模拟的 WebSocket 会实时流式传输新事件,并且
AI 分析由一个确定性的 mock 服务提供 —— 因此无需后端即可获得完整体验。
## 核心功能
值班工程师往往会浪费时间,因为告警是孤立到达的,并且必须在压力下拼凑出
根本原因。AI Ops Copilot 能够:
- **接收**来自任何通过 REST 发送告警的源(模拟的 CloudWatch、Datadog、Sentry、Kubernetes、GitHub Actions、Slack)。
- **关联**将相关告警通过时间窗口 + 共享服务引擎整合为一个单一事件。
- **分析**使用 GPT-4o-mini 分析每个事件 —— 可能的根本原因、重构的时间线、置信度得分以及修复步骤(未设置 API key 时提供确定性的 mock 作为后备)。
- **流式传输**通过 WebSocket 实时将每一次变更推送到所有 dashboard。
- **隔离租户** —— 每条记录都限定在某个组织范围内,并在每次请求时进行强制验证。
## 核心亮点
| | |
|---|---|
| **任务控制 UI** | 独特的暗色设计系统(琥珀色 = 告警热度,靛蓝色 = AI),配有标志性的动态信号波形,使用 Space Grotesk / Inter / JetBrains Mono 字体,支持移动端响应式布局 |
| **⌘K 命令面板** | 可从任意位置快速跳转到任何事件、页面或操作 |
| **AI 根本原因面板** | 为每个事件提供根本原因、时间线、置信度以及修复清单 |
| **服务依赖图** | 交互式节点链接图(React Flow),展示爆炸半径 |
| **独立演示模式** | `NEXT_PUBLIC_DEMO_MODE` 在种子数据上运行整个前端 —— 为 Vercel 演示提供支持 |
## 技术栈
**前端** — Next.js 15 (App Router) · React 19 · TypeScript · Tailwind CSS · @xyflow/react · Jest + RTL
**后端** — FastAPI · async SQLAlchemy 2 · PostgreSQL · Celery + Redis · JWT auth · OpenAI · pytest
## 本地运行(全栈)
```
git clone https://github.com/ajafri-123/ai-ops-copilot.git
cd ai-ops-copilot
cp .env.example .env # optional — sensible defaults provided
docker compose up --build # frontend :3000 · API :8000 · Flower :5555
```
然后打开 **http://localhost:3000** 并登录:
| Email | Password |
|---|---|
| `demo@example.com` | `demo1234` |
演示账户、告警和事件会在首次启动时被注入。无需 OpenAI key ——
mock 分析器会生成真实的输出。在 dashboard 上触发一个 **Simulate** 场景,即可观看
关联引擎和 AI 分析的实时运行情况。
## 部署说明
公开演示是运行在 **Vercel** 上的 `frontend/` 应用(Root Directory 设置为 `frontend`,无环境变量 ——
`NEXT_PUBLIC_DEMO_MODE` 在生产环境中默认开启)。Docker stack 运行完整的后端;在
公开暴露之前,请设置强 `SECRET_KEY`、真实的 `CORS_ORIGINS`、TLS 以及 Alembic migrations。
## License
[MIT](LICENSE)
*这是一个展示全栈工程能力的作品集项目:包含 FastAPI、Next.js 15、async SQLAlchemy、Celery、实时 WebSocket 以及 OpenAI 工具调用。*
标签:AI辅助分析, AV绕过, FastAPI, 事故响应, 告警关联, 搜索引擎查询, 测试用例, 请求拦截, 运维监控, 逆向工具