zelinewang/dev-orchestrator
GitHub: zelinewang/dev-orchestrator
一款 Claude Code 元编排插件,通过 10 阶段流水线和强制验证机制,将 AI 编程助手转变为可自我约束的完整开发团队。
Stars: 0 | Forks: 0
# /dev — AI 开发编排器
**一条命令。任意任务类型。自我强制执行。**
`/dev` 将您的 AI 编码代理转变为完整的开发团队 —— 用于代码、研究和基础设施任务。用自然语言描述您的需求 —— 编排器会进行分类、调查、规划、执行、验证和交付。您只需审查两次:计划和交付物。其他一切都将自动化并强制执行。
```
You: /dev "add user authentication with JWT and refresh tokens"
AI: ┌─ P1: INVESTIGATE ───────────────────────
│ Status: DONE | Sources: 5 (memory, code, specs, git, web)
│ Next: P2 CLASSIFY
└─────────────────────────────────────────
┌─ P2: CLASSIFY ─────────────────────────
│ Status: DONE
│ Task: DEVELOP | Tier: STANDARD
│ Next: P3 BRAINSTORM
└─────────────────────────────────────────
[Brainstorm → Specs → Plan...]
🛑 CHECKPOINT 1: Review specs? [looks good]
You: looks good
AI: [Worktree → TDD task 1/12 → ... → 12/12 ✓]
[47/47 tests passing. 0 regressions.]
[PR #142 created]
🛑 CHECKPOINT 2: Review PR?
You: approved
AI: ✓ Specs archived. Memory saved. Done.
```
## v2 新增功能
v2 源于一次自我审计,该审计揭示了在真实会话中仅有 **16% 的协议合规性**。协议设计良好但缺乏自我强制执行能力 —— AI 可以在不产生任何后果的情况下静默跳过阶段。
### 关键变更
| 功能 | v1 | v2 |
|---------|----|----|
| **任务类型** | 仅代码 | DEVELOP + RESEARCH + CICD |
| **强制执行** | 文本建议 | 强制阶段状态块 |
| **阶段跳过** | 静默(无痕迹) | SKIP 需记录原因 |
| **头脑风暴** | “阶段 1 前”(可跳过) | P3:强制执行 |
| **阶段命名** | 混乱(阶段 1 前,阶段 0) | 清晰的 P0-P10 |
| **计划模式** | 工作流冲突 | /dev 优先 |
| **验证** | 仅代码测试 | +研究覆盖率 +CICD 密钥扫描 |
| **覆盖标志** | 4 个 | 6 个 (+--research/--cicd) |
## 问题
如今的 AI 编码是“氛围编码” —— 您聊天,AI 写代码,但是:
- **需求分散** 在聊天记录中,并在上下文填满时消失
- **无验证纪律** —— AI 说“完成了”,但测试实际上并没有通过
- **回归盲区** —— 修复一件事会静默破坏另一件事
- **工具过载** —— 有 40 多种技能/工具可用,但您必须记住何时调用哪个
- **跨会话失忆** —— 开始新聊天,丢失之前所有的上下文
- **不支持非代码任务** —— 研究、CICD 和文档任务被强行塞入代码工作流
## 解决方案
`/dev` 是一个元编排器,它将您现有的工具通过结构化强制执行链接成一个端到端的流水线。它不替换您的工具 —— 而是像指挥乐团一样指挥它们。
```
Developer: /dev "description"
│
▼
┌── P1: INVESTIGATE (5 min, read-only) ───────────────────────┐
│ Search memory → Read code → Check specs → Web research │
│ → Evidence-based classification + tier recommendation │
└────────────┬────────────────────┬───────────────────────────┘
│ │
┌────────▼─────────┐ ┌─────▼─────────────────────────────┐
│ P2: CLASSIFY │ │ Task Types │
│ DEVELOP/RESEARCH │ │ ┌─ DEVELOP: Full TDD + PR │
│ /CICD + Tier │ │ ├─ RESEARCH: Investigate + report │
│ │ │ └─ CICD: Dry-run + rollback verify │
└────────┬─────────┘ └───────────────────────────────────┘
│
┌────────▼────────────────────────────────┐
│ QUICK STANDARD / DEEP │
│ │
│ Root cause 1. Brainstorm (mandatory) │
│ → TDD fix 2. Specs / proposal │
│ → Verify 3. Plan → you review │
│ → Commit 4. Setup (worktree/clone) │
│ → Memory 5. Execute (TDD/research) │
│ 6. Double-verify │
│ 7. Ship → you review │
│ 8. Archive + memory │
└─────────────────────────────────────────┘
```
### 三种任务类型(自动分类)
| 类型 | 何时 | 关键差异 |
|------|------|----------------|
| **DEVELOP** | 需要更改代码(功能、错误、重构) | 完整 TDD + worktree + PR |
| **RESEARCH** | 调查、记录、分析、学习 | 无 TDD/worktree,保留 brainstorm/verify/wrapup |
| **CICD** | 流水线、基础设施、部署、配置更改 | 无 TDD,增加 dry-run + rollback 验证 |
### 三个层级(自动检测)
| 层级 | 何时 | 发生什么 | 时间 |
|------|------|--------------|------|
| **QUICK** | 错误修复、小改动 | 根本原因 → TDD 修复 → 验证 → 提交 | 5-15 分钟 |
| **STANDARD** | 新功能、行为变更 | 完整 P0-P10 阶段,所有关卡 | 30-120 分钟 |
| **DEEP** | 架构、多模块、根本原因不明 | 完整阶段 + Agent Teams + CI 等待 + /wrapup | 2-8 小时 |
**检测基于调查而非关键字。** 编排器在决定之前会花 5 分钟阅读您的代码库。
## 自我强制执行
每个阶段输出一个强制状态块 —— 不允许静默跳过:
```
┌─ P: ────────────────────────────────
│ Status: DONE | SKIP | ADAPT
│ Task: | Tier:
│ Key actions:
│ Next: P
└────────────────────────────────────────────────
```
这是 v2 的核心创新:阶段在结构上可见,不可静默跳过。
## 7 条验证规则
内置於每个阶段,因此您永远不需要提醒 AI:
1. **双重验证** — 每一个“完成”都有带计数的新证据支持
2. **审计驱动** — 测试失败?首先检查测试是否错误
3. **根本原因** — 不要修补症状。找到设计层面的问题
4. **回归偏执** — 每次更改后运行完整测试套件
5. **CICD 意识** — “完成” = 本地通过 且 CI 通过
6. **闭环** — 每个循环自行闭环
7. **跨会话** — 开始前搜索记忆,结束后保存知识
## 需求
### 必需
- [Claude Code](https://claude.ai/claude-code) v1.0.33+
- [superpowers](https://github.com/obra/superpowers) 插件 — TDD、调试、规划、验证、git 工作流
### 推荐
- [OpenSpec](https://github.com/Fission-AI/OpenSpec) v1.2.0+ — 规范驱动开发 (`npm install -g @fission-ai/openspec@latest`)
- [feature-dev](https://github.com/anthropics/claude-code-plugins) 插件 — code-explorer、code-architect、code-reviewer 代理
- [claudemem](https://github.com/zelinewang/claudemem) — 跨会话持久化内存
- [commit-commands](https://github.com/anthropics/claude-code-plugins) 插件 — git commit/push/PR 工作流
### 可选
- Agent Teams 实验性功能(用于 DEEP 层级竞争假设调试)
## 安装
### 选项 A:插件安装(推荐)
```
# 从 GitHub(发布时)
claude plugins install dev-orchestrator
# 或者从本地目录
claude --plugin-dir /path/to/dev-orchestrator
```
### 选项 B:手动安装
```
# 复制 skill + scripts
mkdir -p ~/.claude/skills/dev-orchestrator ~/.claude/scripts
cp skills/dev-orchestrator/SKILL.md ~/.claude/skills/dev-orchestrator/
cp scripts/verify-dev.sh ~/.claude/scripts/
chmod +x ~/.claude/scripts/verify-dev.sh
# 复制命令
cp commands/dev.md ~/.claude/commands/
# 可选:启用 Agent Teams
# 添加到 ~/.claude/settings.json 的 "env" 下:
# "CLAUDE_CODE_EXPERIMENTAL_AGENT_TEAMS": "1"
```
重启 Claude Code 以加载新技能。
### 选项 C:按项目安装
```
cd your-project
mkdir -p .claude/skills/dev-orchestrator .claude/scripts
cp skills/dev-orchestrator/SKILL.md .claude/skills/dev-orchestrator/
cp scripts/verify-dev.sh .claude/scripts/
cp commands/dev.md .claude/commands/
```
## 用法
### 任意开发任务
```
/dev "add dark mode with system preference detection"
```
### 研究任务
```
/dev --research "investigate how our auth system handles token rotation"
```
### CICD 任务
```
/dev --cicd "add staging environment to GitHub Actions pipeline"
```
### 覆盖层级
```
/dev --quick "fix typo in error message"
/dev --deep "redesign payment processing pipeline"
```
### 跳过规范或 PR
```
/dev --no-spec "refactor auth module to reduce duplication"
/dev --no-pr "fix CSS alignment on login page"
```
## 工作原理
### 分阶段(所有任务类型共享相同结构)
| 阶段 | DEVELOP | RESEARCH | CICD |
|-------|---------|----------|------|
| **P0 预检查** | Git + OpenSpec + CLAUDE.md | 仅 Git 警告 | Git + CI 配置 |
| **P1 调查** | 内存 + 代码 + 文档 | 内存 + 网络 + 仓库 | 内存 + 流水线 |
| **P2 分类** | → DEVELOP | → RESEARCH | → CICD |
| **P3 头脑风暴** | 意图 + 设计权衡 | 交付物范围 | 影响 + 回滚 |
| **P4 规范** | OpenSpec 规范 | 研究提案 | 变更规范 |
| **P5 计划** | TDD 任务(每个 2-5 分钟) | 问题 + 来源 | 步骤 + dry-run |
| **P6 设置** | Git worktree + 基线 | 如需要克隆仓库 | 备份配置 |
| **P7 执行** | 按任务 TDD + 子代理 | 调查 + 笔记 | 实施 + dry-run |
| **P8 验证** | 测试套件 + verify-dev.sh | 覆盖率检查 | 基础设施 + 回滚测试 |
| **P9 交付** | 代码审查 + PR | 提交报告 + 笔记 | 应用 + 监控 |
| **P10 归档** | OpenSpec 归档 + 内存 | claudemem + /wrapup | 笔记 + 运维手册 |
### 验证脚本
阻止不良交付的自动化关卡:
```
# 用于代码任务
bash ~/.claude/scripts/verify-dev.sh
# 用于研究任务
bash ~/.claude/scripts/verify-dev.sh --research "search-term" /path/to/report.md
# 用于 CICD 任务(检查泄露的 secrets)
bash ~/.claude/scripts/verify-dev.sh --cicd
```
## 自定义
### 适配您的技术栈
编排器读取您项目的 `openspec/config.yaml` 以获取上下文:
```
schema: spec-driven
context: |
Tech stack: Python, FastAPI, PostgreSQL
Testing: pytest + httpx
Style: async by default
rules:
specs:
- Use Given/When/Then format
tasks:
- Each task < 5 minutes
```
### 适配您的工作流
该技能通过名称调用其他技能来工作。编辑 SKILL.md 以引用您偏好的工具。
## 路线图
- [x] v0.1.0 — 具备 3 个层级 + 7 条规则的核心编排器
- [x] v2.0.0 — TDD 协议 + verify-dev.sh 强制执行
- [x] **v2.1.0 — 任务路由 (DEVELOP/RESEARCH/CICD) + 阶段状态块 + 自我强制执行**
- [ ] v2.2.0 — 合规性检查清单(如果状态块被证明不足)
- [ ] v3.0.0 — Cursor/Windsurf 跨工具支持
- [ ] v4.0.0 — 稳定 API,提交至 Anthropic 市场
## 许可证
MIT
标签:AI编程助手, Claude插件, LLM Agent, TDD, 代码审查, 代码生成, 开发流程编排, 智能体团队, 测试驱动开发, 渗透测试工具, 研发效能, 网络安全研究, 自动化开发, 自然语言编程, 规范驱动开发, 软件开发生命周期, 项目脚手架