Kirill140992/ai-inference-platform
GitHub: Kirill140992/ai-inference-platform
一个基于Kubernetes的企业级AI推理平台,集成DevSecOps、零信任与IaC,解决安全可控的AI服务部署难题。
Stars: 1 | Forks: 0
# Kubernetes 上的 AI 推理平台
基于 Kubernetes、Go 和 Qdrant 构建的企业级自托管 AI 知识库平台。
本项目全面展示了现代 **DevSecOps**、**零信任架构** 和 **基础设施即代码(IaC)** 实践。
## 项目文档
该仓库被划分为不同的架构领域。点击下方任意部分以深入了解技术细节、配置和仪表板:
* **[架构与 RAG 实现](./docs/architecture.md)**
基于 Go 的 API、Qdrant 向量数据库集成以及 AI 推理管道逻辑的概述。
* **[DevSecOps 与边缘安全](./docs/security.md)**
安全态势的全面概述,包括 CI/CD 左移门禁、基础设施加固以及 Cloudflare 边缘防护。
* **[基础设施即代码](./docs/infrastructure.md)**
使用 Terraform 配置 AWS 环境以及 Kubernetes 集群配置的说明。
* **[可观测性与监控](./docs/monitoring.md)**
使用 Prometheus、Grafana 和 Falco 进行指标、日志记录和运行时安全告警。
## 技术栈
- **基础设施:** AWS、Kubernetes(k3s)、Terraform
- **应用与 AI:** Go、vLLM、Qdrant 向量数据库
- **安全:** Cloudflare(WAF/机器人管理)、Checkov、Trivy、Semgrep、SonarQube、SOPS
- **可观测性:** Prometheus、Grafana
*维护者:Kirill Cheremushkin*
标签:AI向量检索, API集成, AWS, Bot管理, Cloudflare WAF, DevSecOps, DPI, EC2, ECS, EVTX分析, Falco, Go语言, Grafana, IaC, k3s, Qdrant向量数据库, RAG, Semgrep, SEO, Shift-Left安全, SonarQube, SOPS, Terraform, vLLM, WordPress安全扫描, 上游代理, 企业AI推理平台, 可观测性, 子域名突变, 安全硬化, 敏感词过滤, 日志审计, 监控, 知识库平台, 程序破解, 自定义请求头, 自托管AI, 边缘安全, 零信任架构