garrytan/gstack

GitHub: garrytan/gstack

Gstack 是 YC 总裁 Garry Tan 开源的一套 Claude Code 技能库，通过 15 个专家角色的斜杠命令将 AI 助手转化为完整虚拟工程团队，实现从产品构思到代码发布的全流程自动化。

Stars: 24154 | Forks: 2871

# gstack 嗨，我是 [Garry Tan](https://x.com/garrytan)。我是 [Y Combinator](https://www.ycombinator.com/) 的总裁兼 CEO，在这里我与数千家初创公司合作过，包括 Coinbase、Instacart 和 Rippling——当它们的创始人还只是车库里的两个人时——这些公司现在价值数百亿美元。在加入 YC 之前，我设计了 Palantir 的 Logo，并且是那里最早的工程经理/产品经理/设计师之一。我联合创办了 Posterous，一个后来出售给 Twitter 的博客平台。我在 2013 年构建了 Bookface，YC 的内部社交网络。作为设计师、产品经理和工程经理，我构建产品已经很长时间了。而现在，我正处在一个感觉完全是新时代的进程中。在过去的 60 天里，我编写了 **超过 600,000 行生产环境代码**——35% 是测试——我每天能完成 **10,000 到 20,000 行可用代码**，这只是我日常工作中兼职的一部分，同时我还履行着 YC CEO 的所有职责。这不是打字错误。我最近 3 个项目的 `/retro`（过去 7 天的开发者统计）：**新增 140,751 行，362 次提交，约 115k 净 LOC**。模型每周都在显著变强。我们正处于某种真实事物的黎明——一个人以前所未有的规模发布产品，而这过去需要一个二十人的团队。 **2026 年——1,237 次贡献且仍在增加：** ![GitHub contributions 2026 — 1,237 contributions, massive acceleration in Jan-Mar](https://static.pigsec.cn/wp-content/uploads/repos/2026/03/212046d68f091251.png) **2013 年——当我在 YC 构建 Bookface 时（772 次贡献）：** ![GitHub contributions 2013 — 772 contributions building Bookface at YC](https://static.pigsec.cn/wp-content/uploads/repos/2026/03/0593f38bed091301.png) 同一个人。不同的时代。区别在于工具。 **gstack 是我如何做到这一点的。** 它是我的开源软件工厂。它将 Claude Code 变成一个你真正管理的虚拟工程团队——一个重新思考产品的 CEO，一个锁定架构的工程经理，一个捕捉 AI slop 的设计师，一个发现生产环境 Bug 的偏执审查者，一个打开真实浏览器并点击你的应用程序的 QA 负责人，以及一个发布 PR 的发布工程师。十五个专家，全部作为斜杠命令，全部是 Markdown，**全部免费，MIT 许可证，现在即可使用。** 我正在学习如何达到 Agentic 系统（截至 2026 年 3 月）能力的极限，这是我的实时实验。我分享它是因为我希望全世界都能和我一起踏上这段旅程。复刻它。改进它。让它成为你的。不要嫉妒，去欣赏。 **这是给谁的：** - **创始人和 CEO**——尤其是那些仍然想亲自发布产品的技术型创始人。这就是你如何像一个二十人的团队那样构建产品。 - **Claude Code 首次用户**——gstack 是最好的起点。结构化的角色而不是空白的提示。 - **技术负责人和 Staff 工程师**——为每个 PR 带来严格的审查、QA 和发布自动化 ## 快速开始：你的前 10 分钟 1. 安装 gstack（30 秒——见下文） 2. 运行 `/office-hours`——描述你正在构建什么。它会在你编写一行代码之前重新构建问题。 3. 对任何功能想法运行 `/plan-ceo-review` 4. 对任何有更改的分支运行 `/review` 5. 在你的预发布 URL 上运行 `/qa` 6. 到此为止。你会知道这是否适合你。在任何已经设置好测试的仓库上，预计在 5 分钟内完成首次有用的运行。 **如果你只再读一个部分，请读这一个。** ## 安装——只需 30 秒 **要求：**[Claude Code](https://docs.anthropic.com/en/docs/claude-code)，[Git](https://git-scm.com/)，[Bun](https://bun.sh/) v1.0+ ### 第 1 步：在你的机器上安装打开 Claude Code 并粘贴这个。Claude 会完成剩下的工作。 ### 第 2 步：添加到你的仓库以便队友使用（可选）真实文件会被提交到你的仓库（不是子模块），所以 `git clone` 就可以正常工作。所有内容都在 `.claude/` 内。不会触碰你的 PATH 或在后台运行任何东西。 ## 看看它是如何工作的 ``` You: I want to build a daily briefing app for my calendar. You: /office-hours Claude: [asks about the pain — specific examples, not hypotheticals] You: Multiple Google calendars, events with stale info, wrong locations. Prep takes forever and the results aren't good enough... Claude: I'm going to push back on the framing. You said "daily briefing app." But what you actually described is a personal chief of staff AI. [extracts 5 capabilities you didn't realize you were describing] [challenges 4 premises — you agree, disagree, or adjust] [generates 3 implementation approaches with effort estimates] RECOMMENDATION: Ship the narrowest wedge tomorrow, learn from real usage. The full vision is a 3-month project — start with the daily briefing that actually works. [writes design doc → feeds into downstream skills automatically] You: /plan-ceo-review [reads the design doc, challenges scope, runs 10-section review] You: /plan-eng-review [ASCII diagrams for data flow, state machines, error paths] [test matrix, failure modes, security concerns] You: Approve plan. Exit plan mode. [writes 2,400 lines across 11 files. ~8 minutes.] You: /review [AUTO-FIXED] 2 issues. [ASK] Race condition → you approve fix. You: /qa https://staging.myapp.com [opens real browser, clicks through flows, finds and fixes a bug] You: /ship Tests: 42 → 51 (+9 new). PR: github.com/you/app/pull/42 ``` 你说“每日简报应用”。Agent 说“你正在构建一个 AI 参谋长”——因为它倾听的是你的痛点，而不是你的功能请求。然后它挑战你的前提，生成三种方法，推荐最窄的切入点，并编写一份设计文档，该文档会输送到每个下游技能。八个命令。那不是副驾驶。那是一个团队。 ## Sprint gstack 是一个流程，而不是工具的集合。这些技能按照 Sprint 运行的方式排序： **思考 → 计划 → 构建 → 审查 → 测试 → 发布 → 复盘** 每个技能都输入到下一个。`/office-hours` 编写的设计文档会被 `/plan-ceo-review` 读取。`/plan-eng-review` 编写的测试计划会被 `/qa` 使用。`/review` 捕获的 Bug 会由 `/ship` 验证是否已修复。没有什么会遗漏，因为每一步都知道之前发生了什么。一个 Sprint，一个人，一个功能——使用 gstack 大约需要 30 分钟。但改变一切的是：你可以并行运行 10-15 个这样的 Sprint。不同的功能，不同的分支，不同的 Agent——全部同时进行。这就是我如何在做好我的本职工作的同时每天发布 10,000+ 行生产环境代码。 | 技能 | 你的专家 | 他们做什么 | |-------|----------------|--------------| | `/office-hours` | **YC Office Hours** | 从这里开始。六个强制性问题，在你编写代码之前重新构建你的产品。反驳你的框架，挑战前提，生成实施替代方案。设计文档会输送到每个下游技能。 | | `/plan-ceo-review` | **CEO / 创始人** | 重新思考问题。找到隐藏在请求中的 10 星级产品。四种模式：扩展、选择性扩展、保持范围、缩减。 | | `/plan-eng-review` | **Eng Manager** | 锁定架构、数据流、图表、边缘情况和测试。强制将隐藏的假设公开化。 | | `/plan-design-review` | **高级设计师** | 对每个设计维度进行 0-10 评分，解释 10 分是什么样的，然后编辑计划以达到目标。AI Slop 检测。交互式——每个设计选择一个 AskUserQuestion。 | | `/design-consultation` | **设计合作伙伴** | 从头开始构建完整的设计系统。了解格局，提出创造性的风险，生成逼真的产品模型。设计是所有其他阶段的核心。 | | `/review` | **Staff 工程师** | 找到那些通过 CI 但会在生产环境中爆炸的 Bug。自动修复明显的 Bug。标记完整性差距。 | | `/debug` | **调试器** | 系统性的根因调试。铁律：没有调查就没有修复。追踪数据流，测试假设，在 3 次修复失败后停止。 | | `/design-review` | **懂代码的设计师** | 与 /plan-design-review 相同的审计，然后修复发现的问题。原子提交，前后截图。 | | `/qa` | **QA 负责人** | 测试你的应用程序，发现 Bug，通过原子提交修复它们，重新验证。为每个修复自动生成回归测试。 | | `/qa-only` | **QA 报告员** | 与 /qa 方法相同，但仅报告。当你想要没有代码更改的纯 Bug 报告时使用。 | | `/ship` | **发布工程师** | 同步 main，运行测试，审计覆盖率，推送，打开 PR。如果你没有测试框架，会引导设置。一个命令。 | | `/document-release` | **技术文档工程师** | 更新所有项目文档以匹配你刚刚发布的内容。自动捕获过时的 README。 | | `/retro` | **Eng Manager** | 团队感知的每周复盘。每人细分，发布连续性，测试健康趋势，成长机会。 | | `/browse` | **QA 工程师** | 给 Agent 眼睛。真正的 Chromium 浏览器，真正的点击，真正的截图。每个命令约 100ms。 | | `/setup-browser-cookies` | **Session Manager** | 将你真实浏览器（Chrome、Arc、Brave、Edge）中的 Cookie 导入到 Headless Session 中。测试已验证的页面。 | **[每个技能的深入解析，包含示例和理念 →](docs/skills.md)** ## 有什么新内容以及为什么重要 **`/office-hours` 在你编写代码之前重新构建你的产品。** 你说“每日简报应用”。它倾听你真正的痛点，反驳你的框架，告诉你你实际上是在构建一个个人 AI 参谋长，挑战你的前提，并生成三种带有工作量估算的实施方法。它编写的设计文档直接输入到 `/plan-ceo-review` 和 `/plan-eng-review`——所以每个下游技能都从真正的清晰度开始，而不是一个模糊的功能请求。 **设计是核心。** `/design-consultation` 不仅仅是挑选字体。它研究你领域中的现有产品，提出安全的选择和创造性的风险，生成你实际产品的逼真模型，并编写 `DESIGN.md`——然后 `/design-review` 和 `/plan-eng-review` 会读取你选择的内容。设计决策流经整个系统。 **`/qa` 是一个巨大的解锁。** 它让我从 6 个并行 Worker 增加到 12 个。Claude Code 说*“我看到问题了”*，然后真正修复它，生成回归测试，并验证修复——这改变了我的工作方式。Agent 现在有眼睛了。 **智能审查路由。** 就像在一家运营良好的初创公司一样：CEO 不必查看基础设施 Bug 修复，后端更改不需要设计审查。gstack 跟踪运行了哪些审查，弄清楚什么是合适的，然后只做聪明的事情。审查准备情况仪表盘告诉你发布前的状态。 **测试一切。** 如果你的项目没有测试框架，`/ship` 会从头开始引导设置。每次 `/ship` 运行都会生成覆盖率审计。每个 `/qa` Bug 修复都会生成回归测试。100% 的测试覆盖率是目标——测试让 Vibe Coding 变得安全，而不是 Yolo Coding。 **`/document-release` 是你从未有过的工程师。** 它读取你项目中的每个文档文件，与 diff 进行交叉引用，并更新所有漂移的内容。README、ARCHITECTURE、CONTRIBUTING、CLAUDE.md、TODOS——全部自动保持最新。 ## 10-15 个并行 Sprint gstack 在一个 Sprint 中就很强大。在十个同时运行时，它是变革性的。 [Conductor](https://conductor.build) 并行运行多个 Claude Code Session——每个都在自己独立的工作空间中。一个 Session 对新想法运行 `/office-hours`，另一个对 PR 进行 `/review`，第三个实现一个功能，第四个在 Staging 环境运行 `/qa`，还有六个在其他分支上。全部同时进行。我通常运行 10-15 个并行 Sprint——这是目前的实际上限。 Sprint 结构是使并行性工作的原因。没有流程，十个 Agent 就是十个混乱的来源。有了流程——思考、计划、构建、审查、测试、发布——每个 Agent 都确切知道该做什么以及何时停止。你像 CEO 管理团队一样管理它们：检查重要的决策，让其余的运行。 ## 来乘风破浪这是**免费、MIT 许可、开源、现在可用。**没有高级版。没有候补名单。没有附加条件。我开源了我的开发方式，我正在这里积极升级我自己的软件工厂。你可以复刻它并让它成为你自己的。这就是全部意义。我希望每个人都能踏上这段旅程。同样的工具，不同的结果——因为 gstack 给你结构化的角色和审查关卡，而不是通用的 Agent 混乱。这种治理是快速发布和鲁莽发布之间的区别。模型正在快速变好。那些现在弄清楚如何与它们合作的人——真正地合作，而不仅仅是浅尝辄止——将拥有巨大的优势。这就是那个窗口。我们走吧。十五个专家。全部是斜杠命令。全部是 Markdown。全部免费。**[github.com/garrytan/gstack](https://github.com/garrytan/gstack)**——MIT 许可证 ## 文档 | 文档 | 涵盖内容 | |-----|---------------| | [技能深入解析](docs/skills.md) | 每个技能的理念、示例和工作流（包括 Greptile 集成） | | [架构](ARCHITECTURE.md) | 设计决策和系统内部 | | [浏览器参考](BROWSER.md) | `/browse` 的完整命令参考 | | [贡献](CONTRIBUTING.md) | 开发设置、测试、贡献者模式和开发模式 | | [更新日志](CHANGELOG.md) | 每个版本的新内容 | ## 故障排除 **技能没有显示？** `cd ~/.claude/skills/gstack && ./setup` **`/browse` 失败？** `cd ~/.claude/skills/gstack && bun install && bun run build` **安装过时？** 运行 `/gstack-upgrade`——或在 `~/.gstack/config.yaml` 中设置 `auto_upgrade: true` **Claude 说它看不到技能？** 确保你项目的 `CLAUDE.md` 有一个 gstack 部分添加这个： ``` ## gstack Use /browse from gstack for all web browsing. Never use mcp__claude-in-chrome__* tools. Available skills: /office-hours, /plan-ceo-review, /plan-eng-review, /plan-design-review, /design-consultation, /review, /ship, /browse, /qa, /qa-only, /design-review, /setup-browser-cookies, /retro, /debug, /document-release. ``` ## 许可证 MIT。永远免费。去构建点什么吧。

标签：AI 智能体, AI 编程, Claude Code, DLL 劫持, DNS解析, Garry Tan, Linux 内核安全, LLM 应用, QA 测试, Y Combinator, 代码审查, 代码生成, 大语言模型, 威胁情报, 开发者工具, 开源项目, 技术架构, 渗透测试工具, 生产力工具, 网络安全研究, 自动化攻击, 虚拟工程团队, 软件工厂, 软件开发, 防御加固, 项目管理