Hanan-Aref03/Nexus-AI
GitHub: Hanan-Aref03/Nexus-AI
NexusAI 是一个 AI 原生的云可观测性平台,旨在将分布式系统的遥测数据转化为自动化的根因分析、异常检测和成本优化建议,解决现代云基础设施运维中数据分散与排障效率低的问题。
Stars: 0 | Forks: 0
# NexusAI
面向 AWS 和 Kubernetes 运维的 AI 原生云可观测性与智能平台。
该平台将遥测数据转化为可执行的发现、根因分析、安全信号、成本建议以及预测性可靠性指导。简报中部分地方使用了 NexusIQ 这一名称;本仓库目前将 NexusAI 作为当前的工作项目名称。
## 当前重心
阶段 1 是遥测基础:
- 带有 `GET /health` 和 `GET /ready` 的 FastAPI 后端
- OpenTelemetry 优先的 tracing
- 归一化的遥测数据接入
- 带有本地开发支持的 PostgreSQL 存储引导
- 为未来的 CloudWatch 和 OpenObserve 工作预留的适配器接口
- 模块化单体后端设计,确保在任何拆分合理化之前,安全和租户策略保持集中化
- 阶段 1.5 的安全和治理强化正在进行中,包括 CORS、签名 bearer 认证、租户级持久化、脱敏处理、Vault 接口以及 guardrail/评估接口
## 仓库结构
- `backend/` - FastAPI 服务、数据接入、分析和集成
- `frontend/` - Next.js 仪表板和调查体验
- `infra/` - Docker、部署和基础设施定义
- `docs/phases/` - 各路线图阶段的说明文档
- `docs/adr/` - 架构决策记录和系统级原理说明
- `tests/` - 标准的单元、集成和 e2e 测试套件
- `.planning/` - 项目记忆、需求、路线图和状态
## 工作协议
- 将实现工作保持在小型、可审查的 PR 中。
- 倾向于垂直切片,而不是大型的水平层。
- 确保每个阶段可构建、可测试且易于解释。
- 优先使用免费/本地依赖项,然后通过适配器接口逐步接入实时连接器。
- 在安全、认证和租户边界证明需要拆分之前,将后端视为模块化单体。
## 本地开发
1. 如果你想直接在机器上运行后端,请将 `.env.example` 复制为 `.env`。
2. 使用 `docker compose -f infra/docker/docker-compose.yml up --build` 启动 PostgreSQL 和后端栈。
3. 从仓库根目录运行 `pytest`,以执行后端归一化和冒烟测试。
4. 使用 `backend/app/domains/telemetry/sample_data.py` 中的示例批次进行离线演示。
5. Alembic 迁移会在后端启动期间自动应用,因此 schema 版本始终由单一事实来源驱动。
## 阶段文档
- [阶段 1 - 遥测基础](docs/phases/phase-1-telemetry-foundation.md)
- [阶段 2 - 检测核心](docs/phases/phase-2-detection-core.md)
- [阶段 3 - 调查 UX](docs/phases/phase-3-investigation-ux.md)
- [阶段 4 - 告警和 Copilot](docs/phases/phase-4-alerts-and-copilot.md)
- [阶段 5 - FinOps 和预测性可靠性](docs/phases/phase-5-finops-and-predictive-reliability.md)
标签:API集成, AV绕过, FastAPI, GET参数, OpenTelemetry, 云计算运维, 人工智能, 可观测性, 安全规则引擎, 异常检测, 测试用例, 用户代理, 用户模式Hook绕过, 请求拦截, 逆向工具