JaeHoYun/vcf-private-ai-series
GitHub: JaeHoYun/vcf-private-ai-series
面向 VMware Cloud Foundation 9.1 平台的私有 AI 实战指南系列,系统性地覆盖了从基础设施、向量数据库、模型服务到 RAG 集成、安全治理与规模成本规划的完整落地路径。
Stars: 0 | Forks: 0
# VCF 私有 AI 指南系列
这是一套面向 **VMware Cloud Foundation (VCF)** **9.1** 的公开实战指南合集(共 6 篇),旨在按照 **基础设施 → 数据 → 服务 → 集成 (RAG)** 的流程,探讨基于该平台的 **Private AI** —— **PAIF**(Private AI Foundation with NVIDIA)/ **PAIS**(Private AI Services),并将 **安全与治理** 以及 **规模规划、容量与成本** 作为贯穿所有层面的核心考量。
本指南专为希望在数据不离开企业内部的环境中,从零开始完成 LLM、RAG 和 Agent 服务的 **构建、运营、防护与评估** 的基础设施团队、MLOps 和应用开发者编写,旨在提供实战现场参考。文中所有的数值与版本均以撰写时(2026-06)的 Broadcom 官方发布说明为基准,建议在实际应用前再次查阅官方文档。
## 本系列的视角 —— 支撑 Private AI 的底层基础
本系列不探讨如何选择 LLM 或如何编写提示词。我们关注的是如何让这些模型 **在企业内部、在不泄露数据的前提下** 运行起来的 **底层基础**。
私有 AI 的本质问题不在于“使用什么模型”,而在于 **“如何在我们自己的数据中心内,打造一个安全且高效地运行该模型的基础”**。这个基础便是以下几个层级:
- **VCF** —— 私有云平台。整合了计算、存储、网络以及 Kubernetes (VKS) 的底座。
- **PAIF** —— AI 基础设施层。在 VCF 之上对 GPU、驱动、模型和 RAG 进行标准化。
- **PAIS** —— 服务层。以托管形式提供模型服务、RAG、Agent (Agent Builder) 以及 MCP 管理。
- **Agents · MCP** —— 执行层。模型通过标准接口与企业内部的数据和工具连接,从而执行实际任务。
因此,本系列的每一篇内容 —— 无论是数据、服务、RAG,还是安全、治理、规模规划与成本 —— 最终都是 **“如何构建、运营、防护并评估支撑 Private AI 的底层基础”** 这一核心问题的不同切面。其中 ①–④ 是搭建该基础的构建流程,而 ⑤·⑥ 则是横向贯穿整个基础的安全与成本考量。
## 指南列表
| 篇 | 指南 | 层级 | 涵盖领域 |
|----|--------|------|-------------|
| ① | [vcf-private-ai-guide](https://github.com/JaeHoYun/vcf-private-ai-guide) | 基础设施·运营 | PAIF/PAIS 构建、开发与运营全貌,GPU·架构,What's New (9.1),行业场景 |
| ② | [vcf-dsm-vectordb-guide](https://github.com/JaeHoYun/vcf-dsm-vectordb-guide) | 数据 | 面向 RAG 的企业级向量数据库 (DSM PostgreSQL + pgvector),部署与运维手册 |
| ③ | [vcf-paif-serving-api-guide](https://github.com/JaeHoYun/vcf-paif-serving-api-guide) | 服务 | OpenAI 兼容的模型服务 API,推理与 Agent endpoint,认证·MCP·可观测性 |
| ④ | [vcf-rag-reference-architecture](https://github.com/JaeHoYun/vcf-rag-reference-architecture) | 集成 | 贯穿 ②③ 的端到端 RAG 参考架构 |
| ⑤ | [vcf-private-ai-security-governance](https://github.com/JaeHoYun/vcf-private-ai-security-governance) | 安全·治理 | 威胁模型·隔离·访问控制·供应链·数据治理·审计(贯穿所有层级) |
| ⑥ | [vcf-private-ai-sizing-cost](https://github.com/JaeHoYun/vcf-private-ai-sizing-cost) | 规模·容量·成本 | 工作负载·GPU·VKS 规模规划,容量计划,TCO(贯穿所有层级) |
## 阅读顺序
- **首次引入** → ① 全篇 → ② → ③ → ④
- **已有基础设施,仅需部署 RAG** → 以 ④ 为中心,参考 ②③
- **应用开发者** → 重点关注 ③ + ④ 中的应用集成内容
- **优先考虑安全与合规** → ⑤ 全篇(与 ①–④ 各篇交叉参考)
- **评估规模与预算** → ⑥ 全篇(特别是 GPU、VKS 集群规模规划与 TCO)
- **升级至 9.1** → ① 中的 What's New (00)
## 基础版本 (摘要)
| 分类 | 版本 |
|------|------|
| VMware Cloud Foundation | 9.1 (GA 2026-05) |
| Private AI Foundation with NVIDIA (PAIF) | 9.1 |
| Private AI Services (PAIS) | 2.1 |
| PostgreSQL / pgvector (DSM 9.1) | 16.8 / 0.8.0 (PAIS 验证组合) |
## 关键主题
`VCF` · `PAIF` · `PAIS` · `VKS` · `vSAN` · `NSX` · `DLVM` · `vLLM` · `RAG` · `VectorDB` · `pgvector` · `Model Serving` · `MCP` · `Agent Builder` · `Security` · `Governance` · `Sizing` · `TCO`
## 许可证
本系列的所有文档均基于 [CC BY 4.0](https://creativecommons.org/licenses/by/4.0/) 提供。欢迎自由使用,但请注明出处。
## 免责声明
**非官方文档** —— 不代表 Broadcom、NVIDIA 等供应商的官方立场。在生产环境应用前,请务必查阅官方文档。文中的性能与成本数据均基于供应商的发布信息,实际效果因工作负载与环境而异,需进一步验证。文中提及的产品名称与商标均为各自所有者的资产。
标签:AI基础设施, RAG, VMware, 向量数据库, 大语言模型服务, 测试用例, 私有云, 运维指南