JaeHoYun/vcf-private-ai-series

GitHub: JaeHoYun/vcf-private-ai-series

面向 VMware Cloud Foundation 9.1 平台的私有 AI 实战指南系列,系统性地覆盖了从基础设施、向量数据库、模型服务到 RAG 集成、安全治理与规模成本规划的完整落地路径。

Stars: 0 | Forks: 0

# VCF 私有 AI 指南系列 这是一套面向 **VMware Cloud Foundation (VCF)** **9.1** 的公开实战指南合集(共 6 篇),旨在按照 **基础设施 → 数据 → 服务 → 集成 (RAG)** 的流程,探讨基于该平台的 **Private AI** —— **PAIF**(Private AI Foundation with NVIDIA)/ **PAIS**(Private AI Services),并将 **安全与治理** 以及 **规模规划、容量与成本** 作为贯穿所有层面的核心考量。 本指南专为希望在数据不离开企业内部的环境中,从零开始完成 LLM、RAG 和 Agent 服务的 **构建、运营、防护与评估** 的基础设施团队、MLOps 和应用开发者编写,旨在提供实战现场参考。文中所有的数值与版本均以撰写时(2026-06)的 Broadcom 官方发布说明为基准,建议在实际应用前再次查阅官方文档。 ## 本系列的视角 —— 支撑 Private AI 的底层基础 本系列不探讨如何选择 LLM 或如何编写提示词。我们关注的是如何让这些模型 **在企业内部、在不泄露数据的前提下** 运行起来的 **底层基础**。 私有 AI 的本质问题不在于“使用什么模型”,而在于 **“如何在我们自己的数据中心内,打造一个安全且高效地运行该模型的基础”**。这个基础便是以下几个层级: - **VCF** —— 私有云平台。整合了计算、存储、网络以及 Kubernetes (VKS) 的底座。 - **PAIF** —— AI 基础设施层。在 VCF 之上对 GPU、驱动、模型和 RAG 进行标准化。 - **PAIS** —— 服务层。以托管形式提供模型服务、RAG、Agent (Agent Builder) 以及 MCP 管理。 - **Agents · MCP** —— 执行层。模型通过标准接口与企业内部的数据和工具连接,从而执行实际任务。 因此,本系列的每一篇内容 —— 无论是数据、服务、RAG,还是安全、治理、规模规划与成本 —— 最终都是 **“如何构建、运营、防护并评估支撑 Private AI 的底层基础”** 这一核心问题的不同切面。其中 ①–④ 是搭建该基础的构建流程,而 ⑤·⑥ 则是横向贯穿整个基础的安全与成本考量。 ## 指南列表 | 篇 | 指南 | 层级 | 涵盖领域 | |----|--------|------|-------------| | ① | [vcf-private-ai-guide](https://github.com/JaeHoYun/vcf-private-ai-guide) | 基础设施·运营 | PAIF/PAIS 构建、开发与运营全貌,GPU·架构,What's New (9.1),行业场景 | | ② | [vcf-dsm-vectordb-guide](https://github.com/JaeHoYun/vcf-dsm-vectordb-guide) | 数据 | 面向 RAG 的企业级向量数据库 (DSM PostgreSQL + pgvector),部署与运维手册 | | ③ | [vcf-paif-serving-api-guide](https://github.com/JaeHoYun/vcf-paif-serving-api-guide) | 服务 | OpenAI 兼容的模型服务 API,推理与 Agent endpoint,认证·MCP·可观测性 | | ④ | [vcf-rag-reference-architecture](https://github.com/JaeHoYun/vcf-rag-reference-architecture) | 集成 | 贯穿 ②③ 的端到端 RAG 参考架构 | | ⑤ | [vcf-private-ai-security-governance](https://github.com/JaeHoYun/vcf-private-ai-security-governance) | 安全·治理 | 威胁模型·隔离·访问控制·供应链·数据治理·审计(贯穿所有层级) | | ⑥ | [vcf-private-ai-sizing-cost](https://github.com/JaeHoYun/vcf-private-ai-sizing-cost) | 规模·容量·成本 | 工作负载·GPU·VKS 规模规划,容量计划,TCO(贯穿所有层级) | ## 阅读顺序 - **首次引入** → ① 全篇 → ② → ③ → ④ - **已有基础设施,仅需部署 RAG** → 以 ④ 为中心,参考 ②③ - **应用开发者** → 重点关注 ③ + ④ 中的应用集成内容 - **优先考虑安全与合规** → ⑤ 全篇(与 ①–④ 各篇交叉参考) - **评估规模与预算** → ⑥ 全篇(特别是 GPU、VKS 集群规模规划与 TCO) - **升级至 9.1** → ① 中的 What's New (00) ## 基础版本 (摘要) | 分类 | 版本 | |------|------| | VMware Cloud Foundation | 9.1 (GA 2026-05) | | Private AI Foundation with NVIDIA (PAIF) | 9.1 | | Private AI Services (PAIS) | 2.1 | | PostgreSQL / pgvector (DSM 9.1) | 16.8 / 0.8.0 (PAIS 验证组合) | ## 关键主题 `VCF` · `PAIF` · `PAIS` · `VKS` · `vSAN` · `NSX` · `DLVM` · `vLLM` · `RAG` · `VectorDB` · `pgvector` · `Model Serving` · `MCP` · `Agent Builder` · `Security` · `Governance` · `Sizing` · `TCO` ## 许可证 本系列的所有文档均基于 [CC BY 4.0](https://creativecommons.org/licenses/by/4.0/) 提供。欢迎自由使用,但请注明出处。 ## 免责声明 **非官方文档** —— 不代表 Broadcom、NVIDIA 等供应商的官方立场。在生产环境应用前,请务必查阅官方文档。文中的性能与成本数据均基于供应商的发布信息,实际效果因工作负载与环境而异,需进一步验证。文中提及的产品名称与商标均为各自所有者的资产。
标签:AI基础设施, RAG, VMware, 向量数据库, 大语言模型服务, 测试用例, 私有云, 运维指南