rohioffl/AIREX-AI
GitHub: rohioffl/AIREX-AI
AIREX-AI是一款基于AI的事件响应自动化平台,旨在提高事件响应效率和安全性。
Stars: 0 | Forks: 0
# AIREX — 自主AI事件响应与解决平台
[](https://github.com/rohioffl/AIREX-AI/actions/workflows/ci.yml)
[](LICENSE)
[](https://airex.ankercloud.com/)
[](#verification-commands)
[](#architecture-overview)
AIREX代表**自主事件解决引擎执行Xecution**。它是一个以安全意识为核心的事件自动化平台,能够接收警报、调查受影响的系统、生成AI辅助建议、应用策略和审批规则、执行确定性的修复操作,并验证结果。
## 目录
- [为什么存在](#why-it-exists)
- [AIREX做什么](#what-airex-does)
- [架构概述](#architecture-overview)
- [安全原则](#safety-principles)
- [本地开发](#local-development)
- [验证命令](#verification-commands)
- [部署说明](#deployment-notes)
- [文档地图](#documentation-map)
## 为什么存在
AIREX旨在在不牺牲控制的前提下,降低操作事件的平均解决时间。它结合了确定性的后端规则、可审计的状态转换、云调查工作流程和审批门控的AI辅助,以便操作员可以更快地行动,同时不放弃安全性。
## AIREX做什么
1. 从Site24x7和通用webhook发送者等来源接收警报。
2. 通过严格的后端状态机创建和跟踪事件。
3. 在云和系统表面运行调查探针。
4. 通过LiteLLM生成结构化的AI建议。
5. 当策略要求时需要审批,并阻止不安全的执行路径。
6. 通过受控的工作流程执行白名单修复操作。
7. 验证操作后的健康状态,并保持可审计的事件时间线。
## 架构概述
### 单一仓库布局
```
services/
airex-core/ Shared Python package (models, services, schemas, actions, cloud, llm, rag)
airex-api/ FastAPI service — 23 API routers + Dockerfile
airex-worker/ ARQ worker service — 6 background tasks + Dockerfile
litellm/ LiteLLM container config
langfuse/ Langfuse deployment notes
apps/web/ React 19 + Vite 7 frontend — 19 pages, 165 tests + Dockerfile
database/ Alembic migrations (21 applied) + standalone migration image
tests/ Backend pytest suite (525 tests passing)
e2e/ Playwright end-to-end tests
deployment/ ECS Terraform + CodePipeline + CodeBuild assets
infra/ Prometheus, Grafana, and AI platform config
docs/ Architecture, skills, and runbooks
```
### 核心服务
- **airex-core** — API和worker运行时使用的共享Python包
- **airex-api** — FastAPI运行时;所有REST操作的入口点
- **airex-worker** — ARQ异步worker,用于后台调查和执行任务
- **apps/web** — 用于事件审查、审批、证据和健康仪表板的操作UI
- **database** — 使用Alembic的独立迁移管道
### 运行时依赖
| 组件 | 目的 |
|-----------|---------|
| PostgreSQL + pgvector | 应用数据 + 向量检索(RAG) |
| Redis | ARQ队列、pub/sub、运行时协调 |
| LiteLLM | 模型路由 + 外部AI提供商访问 |
| Prometheus + Grafana | 可观察性 + 警报 |
### 事件生命周期(11个状态)
```
RECEIVED → INVESTIGATING → RECOMMENDATION_READY → AWAITING_APPROVAL → EXECUTING → VERIFYING → RESOLVED
```
失败状态:`FAILED_ANALYSIS`(可重试)、`FAILED_EXECUTION`、`FAILED_VERIFICATION`(可重试)、`REJECTED`
## 安全原则
| 原则 | 实现 |
|-----------|---------------|
| 仅执行确定性操作 | ACTION_REGISTRY中的12个白名单操作 — 无来自LLM输出的任意shell |
| 状态机是法律 | 所有状态更改都通过`transition_state(...)`进行,具有不可变的审计跟踪 |
| 零信任云 | 没有存储的凭据 — 仅IAM角色/Workload Identity |
| 策略优先执行 | 基于置信度的自动审批,并设置高级审批门控 |
| 租户隔离 | 每行都通过`tenant_id`进行RLS范围限制 |
| 结构化日志 | JSON日志,跨所有后端流程具有关联ID |
## 本地开发
### 后端
```
cd services/airex-api
python3 -m venv .venv && source .venv/bin/activate
pip install -r requirements.txt
uvicorn app.main:app --reload
```
### Worker
```
cd services/airex-worker
python3 -m venv .venv && source .venv/bin/activate
pip install -r requirements.txt
arq app.core.worker.WorkerSettings
```
### 前端
```
cd apps/web
npm install && npm run dev
```
### 完整本地堆栈
```
docker-compose up -d
# 前端:http://localhost:5173
# API:http://localhost:8000
# 可观测性:包含 Prometheus + Grafana
```
## 验证命令
```
# 后端 — 525 测试
cd tests && pytest
# 前端 — 165 测试
cd apps/web && npm run test -- --run
# 代码风格检查 + 类型检查
pip install ruff mypy
ruff check services/
mypy services/airex-core/airex_core/ --ignore-missing-imports
```
## 部署说明
### 生产环境
| 服务 | URL |
|---------|-----|
| 前端 / API | https://airex.ankercloud.com/ |
| Langfuse | https://airex-langfuse.ankercloud.com/ |
| LiteLLM | https://airex-litellm.ankercloud.com/ |
### 基础设施
- 通过Terraform的ECS Fargate (`deployment/ecs/`)
- CodePipeline + CodeBuild用于CI/CD
- 前端由S3 + CloudFront提供
## 文档地图
| 文档 | 目的 |
|-----|---------|
| [AGENTS.md](AGENTS.md) | 仓库工作流程规则和验证命令 |
| [TECH_STACK.md](TECH_STACK.md) | 扩展技术参考 |
| [docs/architecture.md](docs/architecture.md) | 更广泛的架构说明 |
| [docs/backend_skill.md](docs/backend_skill.md) | 后端实现规则 |
| [docs/frontend_skill.md](docs/frontend_skill.md) | 前端实现规则 |
| [CHANGELOG.md](CHANGELOG.md) | 版本历史 |
| [SECURITY.md](SECURITY.md) | 漏洞披露政策 |
## 所有权
AIREX由Ankercloud的Rohit P T维护为一个专有项目。
有关使用限制,请参阅[LICENSE](LICENSE)。
标签:AIOps, AI辅助决策, AV绕过, C2, FastAPI, LLM, pgvector, React, SRE, Syscalls, Unmanaged PE, 云服务, 人工智能, 人工智能安全, 修复验证, 偏差过滤, 合规性, 安全原则, 安全执行, 审核跟踪, 搜索引擎查询, 故障处理, 模块化设计, 流程自动化, 测试用例, 状态机, 用户模式Hook绕过, 自动化修复, 自动化平台, 自定义请求头