garrytan/gstack
GitHub: garrytan/gstack
Gstack 是 YC 总裁 Garry Tan 开源的一套 Claude Code 技能库,通过 15 个专家角色的斜杠命令将 AI 助手转化为完整虚拟工程团队,实现从产品构思到代码发布的全流程自动化。
Stars: 24154 | Forks: 2871
# gstack
嗨,我是 [Garry Tan](https://x.com/garrytan)。我是 [Y Combinator](https://www.ycombinator.com/) 的总裁兼 CEO,在这里我与数千家初创公司合作过,包括 Coinbase、Instacart 和 Rippling——当它们的创始人还只是车库里的两个人时——这些公司现在价值数百亿美元。在加入 YC 之前,我设计了 Palantir 的 Logo,并且是那里最早的工程经理/产品经理/设计师之一。我联合创办了 Posterous,一个后来出售给 Twitter 的博客平台。我在 2013 年构建了 Bookface,YC 的内部社交网络。作为设计师、产品经理和工程经理,我构建产品已经很长时间了。
而现在,我正处在一个感觉完全是新时代的进程中。
在过去的 60 天里,我编写了 **超过 600,000 行生产环境代码**——35% 是测试——我每天能完成 **10,000 到 20,000 行可用代码**,这只是我日常工作中兼职的一部分,同时我还履行着 YC CEO 的所有职责。这不是打字错误。我最近 3 个项目的 `/retro`(过去 7 天的开发者统计):**新增 140,751 行,362 次提交,约 115k 净 LOC**。模型每周都在显著变强。我们正处于某种真实事物的黎明——一个人以前所未有的规模发布产品,而这过去需要一个二十人的团队。
**2026 年——1,237 次贡献且仍在增加:**

**2013 年——当我在 YC 构建 Bookface 时(772 次贡献):**

同一个人。不同的时代。区别在于工具。
**gstack 是我如何做到这一点的。** 它是我的开源软件工厂。它将 Claude Code 变成一个你真正管理的虚拟工程团队——一个重新思考产品的 CEO,一个锁定架构的工程经理,一个捕捉 AI slop 的设计师,一个发现生产环境 Bug 的偏执审查者,一个打开真实浏览器并点击你的应用程序的 QA 负责人,以及一个发布 PR 的发布工程师。十五个专家,全部作为斜杠命令,全部是 Markdown,**全部免费,MIT 许可证,现在即可使用。**
我正在学习如何达到 Agentic 系统(截至 2026 年 3 月)能力的极限,这是我的实时实验。我分享它是因为我希望全世界都能和我一起踏上这段旅程。
复刻它。改进它。让它成为你的。不要嫉妒,去欣赏。
**这是给谁的:**
- **创始人和 CEO**——尤其是那些仍然想亲自发布产品的技术型创始人。这就是你如何像一个二十人的团队那样构建产品。
- **Claude Code 首次用户**——gstack 是最好的起点。结构化的角色而不是空白的提示。
- **技术负责人和 Staff 工程师**——为每个 PR 带来严格的审查、QA 和发布自动化
## 快速开始:你的前 10 分钟
1. 安装 gstack(30 秒——见下文)
2. 运行 `/office-hours`——描述你正在构建什么。它会在你编写一行代码之前重新构建问题。
3. 对任何功能想法运行 `/plan-ceo-review`
4. 对任何有更改的分支运行 `/review`
5. 在你的预发布 URL 上运行 `/qa`
6. 到此为止。你会知道这是否适合你。
在任何已经设置好测试的仓库上,预计在 5 分钟内完成首次有用的运行。
**如果你只再读一个部分,请读这一个。**
## 安装——只需 30 秒
**要求:**[Claude Code](https://docs.anthropic.com/en/docs/claude-code),[Git](https://git-scm.com/),[Bun](https://bun.sh/) v1.0+
### 第 1 步:在你的机器上安装
打开 Claude Code 并粘贴这个。Claude 会完成剩下的工作。
### 第 2 步:添加到你的仓库以便队友使用(可选)
真实文件会被提交到你的仓库(不是子模块),所以 `git clone` 就可以正常工作。所有内容都在 `.claude/` 内。不会触碰你的 PATH 或在后台运行任何东西。
## 看看它是如何工作的
```
You: I want to build a daily briefing app for my calendar.
You: /office-hours
Claude: [asks about the pain — specific examples, not hypotheticals]
You: Multiple Google calendars, events with stale info, wrong locations.
Prep takes forever and the results aren't good enough...
Claude: I'm going to push back on the framing. You said "daily briefing
app." But what you actually described is a personal chief of
staff AI.
[extracts 5 capabilities you didn't realize you were describing]
[challenges 4 premises — you agree, disagree, or adjust]
[generates 3 implementation approaches with effort estimates]
RECOMMENDATION: Ship the narrowest wedge tomorrow, learn from
real usage. The full vision is a 3-month project — start with
the daily briefing that actually works.
[writes design doc → feeds into downstream skills automatically]
You: /plan-ceo-review
[reads the design doc, challenges scope, runs 10-section review]
You: /plan-eng-review
[ASCII diagrams for data flow, state machines, error paths]
[test matrix, failure modes, security concerns]
You: Approve plan. Exit plan mode.
[writes 2,400 lines across 11 files. ~8 minutes.]
You: /review
[AUTO-FIXED] 2 issues. [ASK] Race condition → you approve fix.
You: /qa https://staging.myapp.com
[opens real browser, clicks through flows, finds and fixes a bug]
You: /ship
Tests: 42 → 51 (+9 new). PR: github.com/you/app/pull/42
```
你说“每日简报应用”。Agent 说“你正在构建一个 AI 参谋长”——因为它倾听的是你的痛点,而不是你的功能请求。然后它挑战你的前提,生成三种方法,推荐最窄的切入点,并编写一份设计文档,该文档会输送到每个下游技能。八个命令。那不是副驾驶。那是一个团队。
## Sprint
gstack 是一个流程,而不是工具的集合。这些技能按照 Sprint 运行的方式排序:
**思考 → 计划 → 构建 → 审查 → 测试 → 发布 → 复盘**
每个技能都输入到下一个。`/office-hours` 编写的设计文档会被 `/plan-ceo-review` 读取。`/plan-eng-review` 编写的测试计划会被 `/qa` 使用。`/review` 捕获的 Bug 会由 `/ship` 验证是否已修复。没有什么会遗漏,因为每一步都知道之前发生了什么。
一个 Sprint,一个人,一个功能——使用 gstack 大约需要 30 分钟。但改变一切的是:你可以并行运行 10-15 个这样的 Sprint。不同的功能,不同的分支,不同的 Agent——全部同时进行。这就是我如何在做好我的本职工作的同时每天发布 10,000+ 行生产环境代码。
| 技能 | 你的专家 | 他们做什么 |
|-------|----------------|--------------|
| `/office-hours` | **YC Office Hours** | 从这里开始。六个强制性问题,在你编写代码之前重新构建你的产品。反驳你的框架,挑战前提,生成实施替代方案。设计文档会输送到每个下游技能。 |
| `/plan-ceo-review` | **CEO / 创始人** | 重新思考问题。找到隐藏在请求中的 10 星级产品。四种模式:扩展、选择性扩展、保持范围、缩减。 |
| `/plan-eng-review` | **Eng Manager** | 锁定架构、数据流、图表、边缘情况和测试。强制将隐藏的假设公开化。 |
| `/plan-design-review` | **高级设计师** | 对每个设计维度进行 0-10 评分,解释 10 分是什么样的,然后编辑计划以达到目标。AI Slop 检测。交互式——每个设计选择一个 AskUserQuestion。 |
| `/design-consultation` | **设计合作伙伴** | 从头开始构建完整的设计系统。了解格局,提出创造性的风险,生成逼真的产品模型。设计是所有其他阶段的核心。 |
| `/review` | **Staff 工程师** | 找到那些通过 CI 但会在生产环境中爆炸的 Bug。自动修复明显的 Bug。标记完整性差距。 |
| `/debug` | **调试器** | 系统性的根因调试。铁律:没有调查就没有修复。追踪数据流,测试假设,在 3 次修复失败后停止。 |
| `/design-review` | **懂代码的设计师** | 与 /plan-design-review 相同的审计,然后修复发现的问题。原子提交,前后截图。 |
| `/qa` | **QA 负责人** | 测试你的应用程序,发现 Bug,通过原子提交修复它们,重新验证。为每个修复自动生成回归测试。 |
| `/qa-only` | **QA 报告员** | 与 /qa 方法相同,但仅报告。当你想要没有代码更改的纯 Bug 报告时使用。 |
| `/ship` | **发布工程师** | 同步 main,运行测试,审计覆盖率,推送,打开 PR。如果你没有测试框架,会引导设置。一个命令。 |
| `/document-release` | **技术文档工程师** | 更新所有项目文档以匹配你刚刚发布的内容。自动捕获过时的 README。 |
| `/retro` | **Eng Manager** | 团队感知的每周复盘。每人细分,发布连续性,测试健康趋势,成长机会。 |
| `/browse` | **QA 工程师** | 给 Agent 眼睛。真正的 Chromium 浏览器,真正的点击,真正的截图。每个命令约 100ms。 |
| `/setup-browser-cookies` | **Session Manager** | 将你真实浏览器(Chrome、Arc、Brave、Edge)中的 Cookie 导入到 Headless Session 中。测试已验证的页面。 |
**[每个技能的深入解析,包含示例和理念 →](docs/skills.md)**
## 有什么新内容以及为什么重要
**`/office-hours` 在你编写代码之前重新构建你的产品。** 你说“每日简报应用”。它倾听你真正的痛点,反驳你的框架,告诉你你实际上是在构建一个个人 AI 参谋长,挑战你的前提,并生成三种带有工作量估算的实施方法。它编写的设计文档直接输入到 `/plan-ceo-review` 和 `/plan-eng-review`——所以每个下游技能都从真正的清晰度开始,而不是一个模糊的功能请求。
**设计是核心。** `/design-consultation` 不仅仅是挑选字体。它研究你领域中的现有产品,提出安全的选择和创造性的风险,生成你实际产品的逼真模型,并编写 `DESIGN.md`——然后 `/design-review` 和 `/plan-eng-review` 会读取你选择的内容。设计决策流经整个系统。
**`/qa` 是一个巨大的解锁。** 它让我从 6 个并行 Worker 增加到 12 个。Claude Code 说*“我看到问题了”*,然后真正修复它,生成回归测试,并验证修复——这改变了我的工作方式。Agent 现在有眼睛了。
**智能审查路由。** 就像在一家运营良好的初创公司一样:CEO 不必查看基础设施 Bug 修复,后端更改不需要设计审查。gstack 跟踪运行了哪些审查,弄清楚什么是合适的,然后只做聪明的事情。审查准备情况仪表盘告诉你发布前的状态。
**测试一切。** 如果你的项目没有测试框架,`/ship` 会从头开始引导设置。每次 `/ship` 运行都会生成覆盖率审计。每个 `/qa` Bug 修复都会生成回归测试。100% 的测试覆盖率是目标——测试让 Vibe Coding 变得安全,而不是 Yolo Coding。
**`/document-release` 是你从未有过的工程师。** 它读取你项目中的每个文档文件,与 diff 进行交叉引用,并更新所有漂移的内容。README、ARCHITECTURE、CONTRIBUTING、CLAUDE.md、TODOS——全部自动保持最新。
## 10-15 个并行 Sprint
gstack 在一个 Sprint 中就很强大。在十个同时运行时,它是变革性的。
[Conductor](https://conductor.build) 并行运行多个 Claude Code Session——每个都在自己独立的工作空间中。一个 Session 对新想法运行 `/office-hours`,另一个对 PR 进行 `/review`,第三个实现一个功能,第四个在 Staging 环境运行 `/qa`,还有六个在其他分支上。全部同时进行。我通常运行 10-15 个并行 Sprint——这是目前的实际上限。
Sprint 结构是使并行性工作的原因。没有流程,十个 Agent 就是十个混乱的来源。有了流程——思考、计划、构建、审查、测试、发布——每个 Agent 都确切知道该做什么以及何时停止。你像 CEO 管理团队一样管理它们:检查重要的决策,让其余的运行。
## 来乘风破浪
这是**免费、MIT 许可、开源、现在可用。**没有高级版。没有候补名单。没有附加条件。
我开源了我的开发方式,我正在这里积极升级我自己的软件工厂。你可以复刻它并让它成为你自己的。这就是全部意义。我希望每个人都能踏上这段旅程。
同样的工具,不同的结果——因为 gstack 给你结构化的角色和审查关卡,而不是通用的 Agent 混乱。这种治理是快速发布和鲁莽发布之间的区别。
模型正在快速变好。那些现在弄清楚如何与它们合作的人——真正地合作,而不仅仅是浅尝辄止——将拥有巨大的优势。这就是那个窗口。我们走吧。
十五个专家。全部是斜杠命令。全部是 Markdown。全部免费。**[github.com/garrytan/gstack](https://github.com/garrytan/gstack)**——MIT 许可证
## 文档
| 文档 | 涵盖内容 |
|-----|---------------|
| [技能深入解析](docs/skills.md) | 每个技能的理念、示例和工作流(包括 Greptile 集成) |
| [架构](ARCHITECTURE.md) | 设计决策和系统内部 |
| [浏览器参考](BROWSER.md) | `/browse` 的完整命令参考 |
| [贡献](CONTRIBUTING.md) | 开发设置、测试、贡献者模式和开发模式 |
| [更新日志](CHANGELOG.md) | 每个版本的新内容 |
## 故障排除
**技能没有显示?** `cd ~/.claude/skills/gstack && ./setup`
**`/browse` 失败?** `cd ~/.claude/skills/gstack && bun install && bun run build`
**安装过时?** 运行 `/gstack-upgrade`——或在 `~/.gstack/config.yaml` 中设置 `auto_upgrade: true`
**Claude 说它看不到技能?** 确保你项目的 `CLAUDE.md` 有一个 gstack 部分添加这个:
```
## gstack
Use /browse from gstack for all web browsing. Never use mcp__claude-in-chrome__* tools.
Available skills: /office-hours, /plan-ceo-review, /plan-eng-review, /plan-design-review,
/design-consultation, /review, /ship, /browse, /qa, /qa-only, /design-review,
/setup-browser-cookies, /retro, /debug, /document-release.
```
## 许可证
MIT。永远免费。去构建点什么吧。
标签:AI 智能体, AI 编程, Claude Code, DLL 劫持, DNS解析, Garry Tan, Linux 内核安全, LLM 应用, QA 测试, Y Combinator, 代码审查, 代码生成, 大语言模型, 威胁情报, 开发者工具, 开源项目, 技术架构, 渗透测试工具, 生产力工具, 网络安全研究, 自动化攻击, 虚拟工程团队, 软件工厂, 软件开发, 防御加固, 项目管理